Anthropic Pubblica Claude Opus 4.8 Come Aggiornamento Discreto Ma Avvertito

The Decoder (DE) 28 maggio 2026

Anthropic ha lanciato il nuovo modello linguistico Claude Opus 4.8, che, stando alle dichiarazioni dell’azienda, supera la maggior parte degli altri modelli di intelligenza artificiale come OpenAIs GPT-5.5 e comunica in modo più onesto i propri errori. L’aggiornamento introduce nuove funzionalità, come i flussi di lavoro dinamici, offrendo ai suoi utenti una maggiore trasparenza e controllo.

Opus 4.8 è stato progettato per offrire un miglioramento significativo rispetto al predecessore Opus 4.7. Il modello mostra prestazioni elevate in diversi test, compresi quelli per la codifica (SWE-Bench Pro), dove ha raggiunto un punteggio del 69,2 percento, rispetto al 64,3 percento del predecessore e al 58,6 percento di GPT-5.5. Nei test di ragionamento multi-disciplinare (Humanity’s Last Exam), Opus 4.8 ha ottenuto il 49,8 percento senza strumenti e il 57,9 percento con l’uso degli stessi, risultati superiori a quelli dell’intera categoria comparativa.

Un modello più onesto

Uno degli aspetti più rilevanti dell'aggiornamento riguarda l’inserimento della maggiore onestà del modello. Anthropic ha evidenziato che il problema comune degli strumenti di AI è trarre conclusioni affrettate e formulare affermazioni che vengono rivedute o ritratte in seguito. Con Opus 4.8, la frequenza con cui vengono espresse affermazioni non fondate si riduce notevolmente: le valutazioni interne indicano che il modello ora segnala i propri errori circa quattro volte più frequentemente rispetto alle versioni precedenti.

Proattività e nuove funzioni

Anthropic ha incluso nuove funzionalità che potrebbero rivoluzionare l’uso di Claude, tra cui i flussi di lavoro dinamici. Questa funzione permette al modello di pianificare e avviare centinaia di agenti paralleli all’interno di una sessione. Per i clienti aziendali, il modello Code di Claude 4.8 potrebbe gestire modifiche su codice esteso su migliaia di righe, dall’analisi iniziale al completamento con merge, in modo automatico e coordinato.

Un’altra funzionalità introdotta è la “Steuerung Effort,” un controllo avanzato che permette agli utenti di scegliere il livello di impegno che Claude dedicherà rispondendo a una query. Maggiori livelli di sforzo portano a un miglioramento della qualità dell’output, mentre una riduzione innesca una risposta più veloce, mantenendo la capacità di non esaurire troppo rapidamente i limiti di token.

La scala effettiva del Fast Mode

Per quanto riguarda il costo, Anthropic non ha modificato i prezzi dell’API rispetto a prima dell’aggiornamento, mantenendo il prezzo di 5 dollari per un milione di token in input e 25 dollari per un milione in output. Il Fast Mode, che funziona a una velocità 2,5 volte maggiore, è stato dimezzato di costo: adesso costa 10 dollari per un milione di token in input e 50 dollari per un milione in output.

Benchmarks e vantaggi

Per quanto riguarda i benchmark, Opus 4.8 sembra offrire una serie di vantaggi pratici in termini di risparmio monetario. Secondo un report di Artificial Analysis, il modello richiede il 15 percento in meno di iterazioni per ogni compito e il 35 percento di risparmio in token di output rispetto al predecessore Opus 4.7. Questo potrebbe tradursi in risparmi concreti per gli utenti. Il modello ha anche ottenuto un punteggio più alto nel benchmark GDPval-AA rispetto a GPT-5.5 e Opus 4.7.

Prospettive per il mercato

Questo potenziale risparmio potrebbe incentivare i clienti a trasferirsi da GPT-5.5 a Opus 4.8, benché siano necessari ulteriori dati di test e di utilizzo reale per confermare questa prospettiva. Tuttavia, Anthropic continua a concentrarsi sulla sua missione: fornire strumenti KI trasparenti, pro-sociali e rispettosi degli utenti. Gli utenti di Claude potranno beneficiare delle caratteristiche "pro-sociali" integrate nel modello, che promuovono la protezione della privacy, la libertà di scelta e il consenso.

Progetti futuri

I primi modelli della classe "Mythos" saranno resi disponibili in estate, una volta completati gli aggiustamenti finali per garantire la sicurezza e il rispetto delle policy. Questi modelli mirano ad espandere ulteriormente le capacità di Claude, rendendolo una piattaforma più completa per i lavori tecnologici, creativi e di analisi.

Un’altra interessante prospettiva riguarda il costo operativo. Benché Opus 4.8 costi di più rispetto a GPT-5.5, in termini di token utilizzati, i dati suggeriscono che il risparmio in termini di iterazioni, risorse e risultati migliorati possa superare qualsiasi prezzo inizialmente percepibile come elevato.

Promozione e abbonamento

Anthropic ha incluso una nota sull’importanza di fornire informazioni KI senza il solito eccesso di marketing. Per sostenere un approccio più equilibrato e informativo, l’azienda offre un abbonamento The-Decoder, che permette agli utenti di accedere a notizie gratuite, a un’ampia community e a eventi esclusivi come il KI Pro-Event. Gli abbonati ricevono inoltre newsletter settimanali e accesso ad archivi di notizie per dieci anni.

Leggi l'articolo originale →

← Torna alle news