Per ridurre le allucinazioni, Anthropic insegna a Claude a dire «non lo so»

Siecle Digital 1 giugno 2026

Per ridurre le allucinazioni, Anthropic insegna a Claude a dire «non lo so»

Senza dubbio, questo cambiamento suona quasi come un’ammissione, ma rivela molto sull’evoluzione del settore. I grandi modelli di linguaggio hanno tutti lo stesso difetto: esprimono certezze senza possedere gli elementi per supportarle. Anthropic afferma di aver lavorato su questo punto con Opus 4.8, un modello che segnala molto più spesso i suoi dubbi e evita affermazioni che non può sostenere.

Quattro volte meno bug ignorati nel codice

Il dato principale messo in evidenza da Anthropic riguarda lo sviluppo informatico. Opus 4.8 lascerebbe passare fino a quattro volte meno difetti senza avvisarli rispetto alla versione precedente. Nei benchmark sull’onesta legati al codice, il modello quasi raggiunge il perfetto risultato, stando ai test interni del laboratorio. Curiosamente, Claude Mythos Preview, il modello riservato a pochi partner selezionati, viene superato da Opus 4.8.

Evidentemente, questi risultati provengono da Anthropic e meritano di essere confermati da test indipendenti. La promozione dell’onesta in un LLM deve essere affrontata con molta attenzione. Un'IA che dice «non lo so» è una buona notizia, ma dobbiamo verificare se questo comportamento si mantiene al di fuori delle condizioni controllate del laboratorio.

Dynamic workflows, l’arma per i progetti complessi

Claude Code acquisisce un’altra funzionalità sperimentale chiamata Dynamic workflows. Il modello può ora scomporre un progetto software in componenti, lanciare centinaia di sottocomponenti in parallelo e verificare da solo i risultati prima di consegnare il prodotto. Anthropic presenta l’esempio di una migrazione di centinaia di migliaia di righe di codice, che chiaramente indica una target enterprise.

Negli indicatori standard, i progressi restano moderati. Anthropic guadagna 4,9 punti su SWE-Bench Pro e 8,5 punti su Terminal-Bench. Non è un risultato straordinario, ma la posizione è comunque solida rispetto ai concorrenti. GPT-5.5 di OpenAI mantiene la prima posizione su Terminal-Bench, mentre Opus 4.8 è nettamente in vantaggio rispetto ai task su agenti di programmazione.

La questione spinosa dei token finalmente presa sul serio

Il grande cambiamento a favore dell’utente riguarda il cursore di sforzo. L’utente può ora decidere il livello di risorse allocate alla richiesta: veloce ed economico da un lato o lento e preciso dall’altro. L’impostazione predefinita rimane quella con sforzo elevato. In questa situazione, Anthropic risponde a una critica ricorrente: Opus 4.7 aveva una fama per bruciare token alla velocità folle.

La modalità rapida è anche notevolmente meno costosa. Costa ora 10 dollari per un milione di token in entrata e 50 in uscita, tre volte in meno rispetto alla precedente generazione.

Nel frattempo, Anthropic continua a tenere in sospeso il lancio ufficiale di Mythos. Modelli disponibili al pubblico derivati da questa tecnologia dovrebbero arrivare nelle prossime settimane.

Leggi l'articolo originale →

← Torna alle news