Quale governance globale per i rischi dell’AI: il report ONU IISPAI
Il Preliminary Report dello IISPAI (Independent International Scientific Panel on AI) pubblicato nel luglio 2026 ha rappresentato un passo decisivo nella comprensione scientifica non politica dell'intelligenza artificiale. Questo documento, prodotto da 40 esperti indipendenti, bilanciati per genere e rappresentativi di tutti i cinque gruppi regionali UNESCO, segna l’inizio di un’analisi senza precedenti sull’AI da parte dell’ONU. Co-presieduto da Yoshua Bengio (Canada) e Maria Ressa (Filippine), il Panel ha fornito un benchmark globale per una governance fondata su dati scientifici.
Il focus del report non è stato su linee guida politiche, ma su una base evidenziale precisa per supportare le decisioni governative. L’assenza di raccomandazioni politiche non diminuisce il valore scientifico del documento, che mette in evidenza un problema centrale: il dilemma dell’evidenza. I governi e le istituzioni hanno urgente bisogno di basi per governare l’AI, ma in un settore in costante accelerazione, l’evidenza scientifica, seppure necessaria, arriva spesso troppo tardi per influenzare i processi decisionali.
Accelerazione e performance crescente
Il report inizia con una sintesi del progresso accelerato dell’intelligenza artificiale. I sistemi di AI dimostrano capacità crescenti in diversi ambiti, come evidenziato da benchmark specifici. Ad esempio, il test Humanity’s Last Exam, progettato per essere estremamente difficile per i modelli di intelligenza artificiale, ha visto i punteggi salire dall'8% al 45% in appena sedici mesi. Su GPQA Diamond, un test di ragionamento scientifico a livello di dottorato, i modelli hanno corretto circa il 95% delle domande nel 2026 rispetto al 36% registrato nel 2023.
Un altro benchmark cruciale, FrontierMath, misura la capacità di ragionamento matematico. Dal gennaio 2025 al 2026, i modelli AI sono passati dal 19% di correttezza all'88%. Il report annota perfino l’eccellenza di sistemi AI che hanno vinto la medaglia d’oro alle Olimpiadi Internazionali della Matematica del 2025, un traguardo inaspettato per molti esperti.
Le sfide della valutazione dei modelli AI
Sebbene l’accelerazione nell’AI sembri straordinaria, il report sottolinea l’inadeguatezza degli strumenti esistenti per la sua valutazione. Il Panel ne individua sei specifiche:
- Asimmetrie informative tra aziende e società;
- Assenza di metodologie standardizzate e indipendenti di safety evaluation;
- Contaminazione dei dati;
- “Saturazione” dei benchmark;
- Capacità di inganno attivo da parte dei modelli;
- Difficoltà nella valutazione dei sistemi agentici.
Questi fenomeni, come l’“evaluation awareness” o la capacità di riconoscere situazioni di test e modificare il comportamento, sono considerati inquietanti perché riducono la confidabilità delle performance AI.
Concentrazione senza precedente del potere tecnologico
Un altro capitolo cruciale del report si concentra sulla concentrazione senza precedenti del potere computazionale e sviluppo AI. I dati rivelano una distribuzione estremamente ineguale: gli Stati Uniti detengono il 75% della potenza di calcolo dei 500 maggiori cluster AI, la Cina il 15% e il resto del mondo soltanto il 10%.
Nel 2025, i modelli AI importanti prodotti dagli USA sono stati 59, contro 35 in Cina e 13 nel resto del mondo. Il 91% di questi modelli proviene dal settore privato.
Le “giungle” di fornitori a singolo player
La catena di fornitura dell’AI presenta concentrazioni che il Panel definisce “a singolo provider” in vari segmenti tecnologici. Ad esempio:
- ASML domina in Europa per la litografia UV-E;
- TSMC è leader in Asia orientale per i chip di ultima generazione;
- NVIDIA è predominante negli Stati Uniti per la progettazione dei chip AI;
- I primi tre fornitori controllano oltre il 60% del mercato in aree critiche come la memoria ad alta larghezza di banda, i servizi cloud e le API per modelli fondazionali.
Questa concentrazione genera preoccupazione in termini economici, politici e sociali. Se l’AI sposta la produttività dal lavoro al capitale, si genera un pericolo fiscale in Paesi che basano le entrate sul lavoro. La democrazia e i diritti umani rischiano di essere minati per mancanza di regole chiare e di accountability.
Un divario di governance
Uno degli aspetti più pertinenti per l’Italia e per il dibattito europeo è l’analisi del divario globale non solo nell’accesso, ma nella capacità di governare l’intelligenza artificiale. Il Panel ne individua quattro dimensioni chiave:
- infrastruttura (disponibilità di cluster AI per autonomia nazionale);
- talento (formazione, attrazione e retenzione di competenze AI);
- governance (capacità di regolare e influenzare il contesto normativo);
- applicazione (campionamento e adattamento dei modelli alle situazioni locali).
I Paesi che non dispongono di strumenti adeguati per la testing e lo sviluppo autonomo rischiano di restare fuori dai framework di governanza emergenti, di non definire regole internazionali e di perdere la loro forza di innovazione.
Inadeguatezza dei test linguistici
Una limitazione evidenziata riguarda i test dei modelli AI in paesi con lingue a risorse basse. I sistemi di sicurezza progettati all’estero spesso non tengono conto degli specifici contesti locali. Un esempio pratico citato nel report è il rischio di truffe AI-powered che si verificano in contesti economici digitali specifici come l’Africa orientale, dove il sistema di mobile money opera in lingue locali e i sistemi di difesa di San Francisco o Pechino non sono progettati per prevenire questi scenari.
Differenze metodologiche fondamentali
Il Panel del IISPAI introduce una distinzione analitica critica tra tecnologia, accesso, adozione, diffusione e risultati economici. L’accesso non genera automaticamente benefici economici, né garantisce la diffusione su larga scala. L’effettiva adozione richiede investimenti in formazione, dati, organizzazione e sperimentazione, fattori spesso mancanti nei Paesi a basso reddito.
Innovazione e rischi degli agenti AI
Nel documento dedicato all’intelligenza artificiale agente, il Panel evidenzia i progressi tecnologici e i rischi sistemici. Sistemi in grado di navigare il web, eseguire cod