Home Fondamenti Token Modelli AI Deep Learning Tecniche RAG MCP Orchestrazione Prompt Engineering Usare l'AI ChipsBot News

Anthropic presenta Claude Opus 4.8: tre volte più economico in modalità rapida e livello di allineamento pressoché paragonabile a Mythos

VentureBeat AI 28 maggio 2026

Il 28 maggio 2026, Anthropic ha annunciato la disponibilità di Claude Opus 4.8, l'aggiornamento al modello principale della compagnia, che arriva ai prezzi della versione precedente di Opus, accompagnato da una modalità di esecuzione molto più economica e da nuove funzioni dedicate alla scalabilità di lavoro su grandi codici.

Il modello, disponibile immediatamente attraverso i vari strumenti Anthropic (claude.ai, Claude Code, l'API e Cowork), offre lo stesso prezzo per token di Opus 4.7, ovvero 5 dollari per milione di token di input e 25 dollari per milione di token di output. Gli sviluppatori possono chiamare il modello come claude-opus-4-8.

Modalità rapida: tre volte più economica

Una delle principali novità di Claude Opus 4.8 è la cosiddetta modalità rapida (fast mode), che ha visto una riduzione significativa nei costi: 10 dollari per milione di token di input e 50 dollari per milione di token di output, rispetto ai precedenti 30 dollari di input e 150 dollari per Opus 4.7. Questo rappresenta una riduzione del 300% rispetto a modelli precedenti.

La modalità rapida è ora immediatamente accessibile in Claude Code utilizzando il comando /fast e l'accesso API sarà presto disponibile tramite un elenco d'attesa su claude.com/fast-mode.

Opus 4.8 vs. gli altri modelli sul mercato

Sul piano dei costi, Opus 4.8 continua a essere uno dei modelli principali più costosi, rimane però più economico rispetto a GPT-5.5 di OpenAI. Di seguito si mostra un confronto con alcuni altri modelli chiave:

    • MiMo-V2.5 Flash: 0.10 per input, 0.30$output, 40$ per input e output
    • MiniMax M2.7: 0.30$ per input, 1.20$ per output, 1.50$ totale
    • Gemini 3.1 Flash-Lite: 0.25$ per input, 1.50$ per output, 1.75$ totale
    • Kimi-K2.6: 0.95$ per input, 4.00$ per output, 4.95$ totale
    • Grok 4.3 (context limitato): 1.25$ per input, 2.50$ per output, 3.75$ totale
    • DeepSeek V4 Pro: 1.74$ per input, 3.48$ per output, 5.22$ totale
    • Claude Haiku 4.5: 1.00$ per input, 5.00$ per output, 6.00$ totale
    • Grok 4.3 (context esteso): 2.50$ per input, 5.00$ per output, 7.50$ totale
    • Qwen3.7-Max: 2.50$ per input, 7.50$ per output, 10.00$ totale
    • Gemini 3.5 Flash: 1.50$ per input, 9.00$ per output, 10.50$ totale
    • Gemini 3.1 Pro Preview (<=200K): 2.00$ per input, 12.00$ per output, 14.00$ totale
    • GPT-5.4: 2.50$ per input, 15.00$ per output, 17.50$ totale
    • Gemini 3.1 Pro Preview (>200K): 4.00$ per input, 18.00$ per output, 22.00$ totale
    • Claude Opus 4.7: 5.00$ per input, 25.00$ per output, 30.00$ totale
    • Claude Opus 4.8: 5.00$ per input, 25.00$ per output, 30.00$ totale
    • GPT-5.5: 5.00$ per input, 30.00$ per output, 35.00$ totale

Benchmark di Claude Opus 4.8

Su una serie di test e benchmark, Opus 4.8 mostra miglioramenti sensibili rispetto a Opus 4.7. Su SWE-bench Verified, ottiene 88.6% contro 87.6% del predecessore. Su SWE-bench Pro arriva a 69.2%, rispetto a 64.3%, e su Terminal-Bench 2.1 segna 74.6%, rispetto a 66.1%.

Antrhopic descrive il modello come "un miglioramento modesto quanto tangibile" rispetto alla precedente versione di Opus e si colloca al di sopra di GPT-5.5 nei test sul lavoro di knowledge, coding a livello di issue, utilizzo di strumenti agili e benchmark su contesti lunghi.

Prestazioni di Opus 4.8 vs. GPT-5.5

    • GPT-5.5 vincola su benchmark relativi al terminal/CLI e a sessioni web.
    • Claude Opus 4.8 mostra livelli paragonabili in ambito scientifico universitario.
    • La compagnia ha anche notato una crescita di capacità nei benchmark relativi al lavoro in agenzia (task management automatico).

Prestazioni interne di Anthropic: vicini a Mythos

Secondo Anthropic, Opus 4.8 rientra in una classe di capacità intermedia, situito tra Opus 4.7 e il modello più avanzato Claude Mythos Preview, utilizzato al momento per pochi partner selezionati nel Project Glasswing per la cyber-security.

Gli addetti ai lavori hanno riportato miglioramenti significativi. Databricks ha dichiarato che Opus 4.8 offre una scalabilità maggiore della sua agente Genie, con un costo ridotto del 61%. Hebbia ha sottolineato miglioramenti in precisione di citazione e di analisi su documenti finanziari. Cognition, azienda svilupa di Devin, ha segnalato correzioni di errori riguardanti commenti e utilizzo di strumenti.

Flusso dinamico: centinaia di sottoprocessi paralleli

Una novità del modello è il supporto ai cosiddetti flussi dinamici (dynamic workflows), presentato in preview di ricerca in Claude Code. La caratteristica consente ad Anthropic di suddividere

Leggi l'articolo originale →
← Torna alle news