Home Fondamenti Token Modelli AI Deep Learning Tecniche RAG MCP Orchestrazione Prompt Engineering Usare l'AI ChipsBot News

Claude Opus 4.8: perché il modello di intelligenza artificiale è più onesto – e Anthropic lo sostituirà presto con Mythos

t3n 30 maggio 2026

Anthropic ha annunciato una versione aggiornata del suo modello di intelligenza artificiale, Opus 4.8. La novità principale è una maggiore onestà del modello nella gestione delle informazioni. Inoltre, l'azienda ha promesso un modello simile a Mythos entro poco tempo.

Dopo aver annunciato il nuovo modello in un comunicato blog, Anthropic afferma che Opus 4.8 non solo è più potente rispetto alla versione precedente, ma anche più affidabile negli output. In un test definito “Agentic Code” basato su SWE Bench Pro, il nuovo modello ha raggiunto il 69,2%, mentre Opus 4.7 aveva totalizzato il 64,3%.

Il modello rivale GPT-5.5 ha però superato Opus 4.8 in un test specifico denominato “Agentic Terminal Coding”. Tuttavia, gli utenti che hanno provato il nuovo modello hanno segnalato miglioramenti visibili in termini di capacità di prendere decisioni ponderate, di formulare domande adeguate e di riconoscere gli errori.

Opus 4.8 è più onesto

La caratteristica più importante introdotta in Opus 4.8 è stata definita da Anthropic come “onestà”. I modelli di intelligenza artificiale vengono ora addestrati per comunicare apertamente quando non possono supportare determinate affermazioni. Gli sviluppatori del modello osservano che alcuni modelli tendono a formulare conclusioni affrettate o a dichiarare un progresso in assenza di prove sufficienti.

Anthropic conferma che i tester hanno notato, in Opus 4.8, una tendenza minore a formulare affermazioni non supportate e a evidenziare le incertezze. Per ottenere tale risultato, Anthropic ha incluso un training particolare all’interno del modello.

Usabilità e costi

Opus 4.8 è già disponibile in tutti i prodotti di Anthropic. Per utilizzare il modello di punta, tuttavia, è necessario sottoscrivere un abbonamento. Gli sviluppatori possono, tramite Claude Code, utilizzare un numero maggiore di token per migliorare i risultati. Questa impostazione è particolarmente utile per compiti complessi.

I limiti di token sono stati aumentati per compensare l’aumento di utilizzo nel nuovo modello. Anthropic consiglia l’uso di più token solo per compiti avanzati di programmazione.

I piani futuri di Anthropic

Anthropic ha anticipato che sta già lavorando su un modello equivalente a Opus, ma più economico, per migliorare l’efficienza energetica e la convenienza. Inoltre, l’azienda svilupperà presto un modello che supererà Opus 4.8 in termini di intelligenza e capacità.

Una piccola quantità di aziende partecipa già al programma preliminare “Claude Mythos Preview”, con il nome in codice “Project Glasswing”. Secondo Anthropic, il progresso nella sicurezza e nel controllo di questi modelli avanzati è avanzato bene. Il team prevede di distribuire un modello di livello Mythos presso i clienti già nei prossimi settimane.

Ecco le funzionalità principali di Opus 4.8

    • Maggiore onestà nel fornire informazioni non supportate
    • Capacità di riconoscere errori e di formulare domande appropriate
    • Migliorie nei test di programmazione SWE Bench Pro
    • Supporto ai developer con l'aumento dei token disponibili
    • Possibilità di accedere al modello solo tramite abbonamento

Pianificazione futura

Gli sviluppatori di Anthropic rifiutano di rivelare ulteriori dettagli su Mythos, ma sottolineano che la collaborazione con le aziende partner sta già procedendo. I test mirano a garantire massima sicurezza prima del lancio ufficiale. L’obiettivo è rendere disponibile Mythos in tempi rapidi, anche per clienti non esclusivi.

L’impatto sul mercato tech

Con l’evoluzione di Anthropic e con modelli come Opus 4.8 o futuri come Mythos, il mercato dell’intelligenza artificiale sta vivendo un cambiamento significativo. La trasparenza e l’onestà diventano valori centrali, insieme alle capacità tecniche. Gli utenti e le aziende si aspettano modelli che non solo siano bravi, ma che non nascondano i propri limiti.

Inoltre, l’attenzione all’efficienza energetica e al controllo degli output, combinata con la scalabilità, sta diventando sempre più rilevante per il settore. Opus 4.8 rappresenta un passo avanti in questa direzione.

Leggi l'articolo originale →
← Torna alle news