Anthropic rivela che l’80% del nuovo codice produttivo è stato scritto da Claude: come le aziende possono tenere il passo
Dario Amodei, fondatore e CEO di Anthropic, aveva anticipato la tendenza, ma la transizione ha raggiunto un livello significativo. Oltre l’80% del codice incluso nella base produttiva di Anthropic nel maggio 2026 non è stato scritto da esseri umani, ma da Claude, il modello autonomo sviluppato dall’azienda stessa. Questo cambiamento ha aumentato di otto volte il volume di codice prodotto per ingegnere al trimestre rispetto al benchmark 2021–2025. Cioè, anche quando il codice non è redatto direttamente da persone, richiede comunque verifica.
Per dirigenti tecnici aziendali, questo non è una curiosità limitata di ricerca; rappresenta il nuovo livello competitivo in atto. Se laboratori avanzati in AI possono consegnare la maggior parte del proprio output ingegneristico a agenti autonomi, allora le aziende di altri comparti dovrebbero chiedersi come automatizzare una parte sempre maggiore dello sviluppo software interno. Tuttavia, Anthropic è tra i principali creatori della rivoluzione AI, quindi non è sorprendente l’elevata padronanza tecnologica. Le aziende interessate ad aumentare l’uso di agenti autonomi per gestire codice e flussi di lavoro dovranno seguire piani chiari, come quelli delineati nell’ultimo post ufficiale di Anthropic.
La roadmap di Anthropic che altre aziende possono seguire
L’evoluzione da code-writing manuale all’orchestrazione automatica richiede una comprensione del potenziale evolutivo degli agenti autonomi. Anthropic ha tracciato una timeline precisa, che altre imprese possono applicare alla propria digitalizzazione:
2021–2023 (Scrittura Manuale):
Gli ingegneri generavano codice e documentazione direttamente nei propri editor di testo.
2023–2025 (Asistenza Chatbot):
Sviluppatori usavano modelli primordiali per generare breve codice, copiando e incollando manulamente.
2025–2026 (Agenti di Scrittura):
Agenti autonomi in grado di modificare autonomamente file interi, con supervisione limitata.
Present Day (Agenti Autonomi):
Modello in grado di eseguire codice, debugging in ambiente live e delegare task complessi a sub-agenti.
L’evoluzione tecnologica è confermata anche da test esterni. Framework standard come SWE-bench, che valutavano risoluzione di bug reali nel codice open-source, hanno saturi i loro criteri. Benchmarks lungimiranti di durata mostrano che modelli come Claude Opus 4.6 mantengono stabilità in 12 ore, mentre Claude Mythos Preview gestisce 16 ore consecutive di risoluzione problemi.
Internamente, i progressi sono clamorosi. Sulle problemiche complesse senza specifiche iniziali, Claude raggiunge il 76% di successo nel maggio 2026, un aumento di 50 punti da sei mesi precedenti. Su un modello di ottimizzazione isolato, Claude Opus Mythos ha accelerato 52 volte i tempi in tempo di training AI. Per paragone, un developer esperto richiede da 4 a 8 ore di lavoro manuale per ottenere un raddoppio di velocità.
Pianificazione a 3 tappe per automazione completa di codice produttivo
Per replicare i 80% di Anthropic, le aziende devono abbandonare la mentalità "assistente al programmatore" per adottare l’architettura "factory autonomo". Questo cambiamento tocca gestionale, operativo e sviluppo:
-
Spostamento da Esecuzione a Architettura:
Quando il costo umano per generare codice tende a zero, il ruolo centrale passa a specificare obiettivi e validare prodotti. Manager devono requalificare i developers come architetti e giudici.
-
Superare il Collo di Bottiglia di Verifica:
L'iniezione di grandi quantità di codice autonomo genera sfide logiche. Secondo la Legge di Amdahl, i bottlenecks seriali limitano il miglioramento globale. Anthropic ha risolto il problema introducendo un reviewer autonomo Claude in CI/CD pipeline. Altri tool come Qodo aiutano le aziende a verificare automaticamente vulnerabilità o problemi architetturali.
-
Focus su Dette Operativi:
Molte aziende faticano con debt tecnico e codebase legacy. Gli agenti non devono scrivere nuove features, ma risolvere errori ripetitivi o manutenzione ripetitiva. Ad esempio, un modello autonomo ha generato 800 fix in un mese, eliminando errori API per un fattore 1000. Un developer umano avrebbe impiegato quattro anni a completare lo stesso lavoro.
Considerazioni per operare codice basato su AI
Lavorare in ambienti dove il codice prodotto è per lo più autonomo richiede controlli legali e di sicurezza. A differenza di modelli open-source, i propri codebase su infrastrutture AI richiedono compliance ai termini del vendor. L’uso di agenti autonomi richiede rigorosi protocolli verificativi a ogni livello:
-
Qualità e Sostenibilità:
I dati interni di Anthropic mostrano che anche se il codice generato da AI era inizialmente peggiore rispetto alle produzioni umane nell’anno 2025, entro metà 2026 le performance erano paritari, con una superiorità prevista a breve termine su livelli medi.
-
Scalabilità Sicurezza:
Volume elevato di codice richiede scoperta automatica di vulnerabilità. Il progetto Glasswing (basato su Mythos Preview) ha identificato 10.000+ problemi gravi su infrastrutture globali in appena alcune settimane. La sfida non è più individuare i problemi, ma la velocità di correzione.
-
Rischio di Cascate di Malallineamento:
Bisogna mantenere controlli rigorosi. Se un sistema autonomo modifica continuamente il proprio software interno, errori o malfunzioni possono accumularsi in cascata. Le decisioni di governance devono anticipare queste possibilità.