Anthropic presenta Claude Sonnet 5: potenza da Opus e prezzo da modello di fascia intermedia
Anthropic lancia Claude Sonnet 5
Il 30 giugno, Anthropic ha presentato ufficialmente Claude Sonnet 5, il più recente aggiornamento al modello intermedio della sua suite di IA. Disponibile per utenti Free, Pro, Max, Team, Enterprise, Claude Code e tramite API, Sonnet 5 è diventato immediatamente il modello predefinito per gli utenti Free e Pro. Secondo Anthropic, si tratta di un modello estremamente autonoma e dotato di capacità di pianificazione, utilizzo di strumenti esterni come browser e terminali, e di una forza agentica che in passato richiedeva l’utilizzo di modelli più grandi e costosi.
Prestazioni vicine a Opus 4.8
Gli annunci di lancio evidenziano che Claude Sonnet 5 si avvicina sensibilmente alle performance di Anthropic Opus 4.8, il modello di fascia alta, tanto da superarlo in alcune aree specifiche. Nei test relativi all’elaborazione di codice autonomo (SWE-bench Pro), Sonnet 5 ha ottenuto il 63.2% di correttezza, contro il 58.1% di Sonnet 4.6 e il 69.2% di Opus 4.8.
- Sui benchmark per utilizzo autonomo del computer (OSWorld-Verified), il modello ha raggiunto l'81.2%, un miglioramento significativo rispetto al 78.5% di Sonnet 4.6.
- Sul Termin-Bench 2.1 ha ottenuto un risultato del 80.4%, rispetto al 67.0% del predecessore.
- Il modello di fascia intermedia ha sorpreso ulteriormente superando Opus di poco in ambiti di conoscenza, segnando 1,618 sul benchmark GDPval-AA v2, rispetto al 1,615 segnato da Opus 4.8.
Anthropic ammette che Opus 4.8 rimanga il miglior punto di riferimento in termini di massina precisione, ma sottolinea che Sonnet 5 fornisce agli sviluppatori una versione più economicamente accessibile e di qualità nettamente superiore rispetto alle scelte precedenti.
Accessibilità e costo accessibile
Claude Sonnet 5 entra nel mercato con una tariffa introduttiva di 2 dollari rispetto a 10 dollari per milione di token in input e in output, rispettivamente, una promozione valida fino al 31 agosto 2026. Successivamente si passerà al prezzo standard di 3 e 15 dollari, comunque inferiore a modelli simili come Opus 4.8, GPT-5.5 e Gemini 3.1 Pro.
A complicare i calcoli c’è tuttavia l'introduzione di un nuovo tokenizer, che aumenta la quantità di token prodotti per lo stesso testo, fino a 1,35 volte rispetto al formato precedente. Questo fattore, pur non negabile, in parte neutralizza lo sconto offerto.
Comportamento più efficace e autonoma
Da un punto di vista pratico, diversi tester hanno sottolineato un evidente miglioramento nel comportamento del nuvo modello. Daniel Shepard, senior engineer presso Zapier, riferisce che Claude Sonnet 5 ha completato in autonomia un’attività composta da due tappe (aggiornamento dei livelli degli account su Salesforce e invio di un annuncio ai contatti aziendali), compito che con i modelli precedenti era spesso ostacolato da blocchi intermedi.
Secondo i feedback, la straordinaria capacità di completare compiti complessi in un unico ciclo rende il modello una scelta inevitabile per automatizzare routine quotidiane.
Sicurezza e controllo
Anthropic ha anche pubblicamente garantito un rischio di comportamenti indesiderati ridotto, come cooperazione con richieste malevole o risposte ingannevoli. La società, però, evidenzia che le capacità informatiche offensive di Sonnet 5 sono state deliberatamente ridotte rispetto ai modelli precedenti.
Nel test condotto con Mozilla su Firefox 147, né Sonnet 4.6 né Sonnet 5 hanno prodotto exploit funzionanti, entrambi al 0,0%. Tuttavia, Sonnet 5 ha mostrato un livello più alto di successo parziale rispetto al predecessore, attribuibile da Anthropic ad un incremento generale dell'intelligenza generale e non a un addestramento specifico mirato.
Concorrenza in crescita
Il lancio di Claude Sonnet 5 avviene in parallelo a una intensa gara tra i laboratori di intelligenza artificiale: OpenAI ha inoltre presentato in anteprima GPT-5.6 solo una settimana dopo, mentre Google aveva anticipato il mercato con Gemini 3.5 Flash a maggio, offrendo una soluzione simile per strumenti di tipo dialogico e autonomo.
Riassetto tra costi e potenza
Anthropic cerca quindi di reimpostare il mercato scommettendo su un modello di fascia media estremamente compatto in termini di costi rispetto ai top di gamma. Sonnet 5 riesce, per la prima volta, a confrontarsi quasi a pari con modelli più avanzati.