I ricercatori trovano migliaia di fonti KI inventate in articoli biomedicali, avvertono del rischio per le linee guida cliniche
La comunità scientifica sta affrontando un problema emergente: le fonti inventate generato da modelli di intelligenza artificiale sono ormai presenti sistematicamente nei lavori biomedici peer-reviewed. Secondo un'indagine condotta da ricercatori della Columbia University e pubblicata su The Lancet, la percentuale di citazioni inventate in questi articoli è cresciuta esponenzialmente negli ultimi anni.
Il lavoro, condotto da Maxim Topaz e il suo team, ha esaminato 2,47 milioni di articoli biomedicali pubblicati tramite PubMed Central. In totale sono stati analizzati quasi 97 milioni di riferimenti accademici, dei quali 4.046 sono stati classificati come inventati.
L'espansione incontrollata
Nel corso del 2023, la media di riferimenti inventati era di appena 4 per ogni 10.000 articoli. Tuttavia, a partire da metà 2024 si è osservato un netto aumento che ha raggiunto 51,3 citazioni inventate per ogni 10.000 articoli tra fine 2025 e le prime settimane del 2026. Questo è un aumento di più di 12 volte rispetto all'inizio del 2023.
I ricercatori hanno correlato l’aumento improvviso all'introduzione e all'uso crescente di modelli avanzati di intelligenza artificiale come ChatGPT, il cui utilizzo tra ricercatori e accademici ha iniziato a espandersi a partire da fine 2022. Essendo necessari generalmente 100-200 giorni tra la sottomissione di un articolo e la sua pubblicazione su PubMed, i primi articoli influenzati da modelli KI hanno iniziato a comparire su larga scala tra la metà e la fine del 2024.
I rischi reali
I riferimenti inventati si presentano come veri e attendibili: sono tematicamente coerenti con gli articoli in cui compaiono, scritti in stile e formattazione corretti e spesso attribuiti a studiosi reali. L’impossibilità di riconoscerli senza ausili esterni li rende pericolosi, soprattutto quando compaiono in rassegne di settore, spesso utilizzate come base per le linee guida cliniche.
Un esempio concreto riguarda un articolo di urologia nel quale su 30 citazioni esaminate ben 18 erano inventate. Queste non avevano solo titoli e argomenti pertinenti, ma anche autori e anni plausibili. Altri modelli sono emersi in lavori correlati alla CRISPR, diagnostiche avanzate e microbioma intestinale, segni di attività mirata di paper mill.
Le criticità strutturali
Secondo la ricerca, il problema colpisce in maniera particolare gli articoli “review”, che presentano una percentuale di citazioni inventate due volte e mezzo superiore a ogni altro tipo di lavoro. Questi ultimi costituiscono uno strumento fondamentale per redigere linee guida e protocolli diagnostici. Ogni articolo che citi un lavoro con fonti inventate compromette tutta la catena di evidenze su cui si basano le decisioni mediche.
Alcuni esempi specifici includono due autori che appaiono in 11 articoli dello stesso giurale chirurgico, con 15 riferimenti inventati complessi. La comparsa di modelli coerenti in articoli diversi suggerisce la mancanza di controllo nella struttura editoriale.
Come affrontare il problema
I ricercatori evidenziano la necessità di migliorare le infrastrutture accademiche per fronteggiare le fonti generate da KI. Hanno proposto una serie di iniziative mirate a mitigare il rischio:
- Implementare sistemi di verifica delle citazioni automatizzati prima della revisione tra pari.
- Includere metadati sull’integrità degli articoli, ad esempio con annotazioni digitali.
- Realizzare controlli dopo la pubblicazione, in particolare per articoli che mostrano modelli sospetti.
- Inserire una categoria specifica per le citazioni inventate all’interno delle database di integrità scientifica.
La maggior parte delle strategie si basa su tool tecnologici. Uno studio condotto su NeurIPS 2025 ha mostrato che persino quelle strutture di alto livello non riescono a eliminare completamente la proliferazione di riferimenti inventati.
CiteAudit e Arxiv
Alcune iniziative promettenti sono in marcia. CiteAudit, un sistema open source per la gestione e la verifica delle citazioni, è un passo corretto, anche se mostra i limiti delle tecnologie commerciali in termini di rilevamento.
Arxiv ha introdotto sanzioni per gli autori che pubblicano paper con fonti non verificate. Il sistema prevede espulsioni temporanee, un chiaro segnale del serio livello di minaccia delle pubblicazioni errate.
Conclusioni
L’uso di modelli linguistici a livello accademico sta generando un rischio sistematico per l’integrità scientifica. Le citazioni inventate stanno minando l’attendibilità delle fonti su cui si basano decisioni mediche vitali. È necessario che la comunità accademica reagisca con strumenti tecnologici, processi rigorosi e una maggiore consapevolezza da parte degli autori.
Il documento sottolinea l’urgenza di un dibattito aperto sull’uso e i limiti delle KI in seno alle struttura scientifiche. Se non si agisce con prontezza, le fonti inventate potrebbero compromettere la credibilità dell’intera scienza medica nel prossimo decennio.
Per ulteriori informazioni e dati completi, è possibile riferirsi all’articolo su The Lancet.