Un sito rivela se i modelli di intelligenza artificiale conoscono la tua identità
Il sito internet "In the Weights", lanciato da Joey Flynn e Thomas Dimson, entrambi ex lavoratori di OpenAI, offre la straordinaria possibilità di sapere se un modello di intelligenza artificiale ha memorizzato la nostra identità e a quale livello. I due sviluppatori hanno realizzato un'interfaccia dove è possibile digitare un nome e ottenere una rappresentazione dei dati memorizzati all'interno dei "pesi" del modello.
I cosiddetti "pesi" sono miliardi di valori numerici che gli algoritmi dell'IA utilizzano per codificare la conoscenza che essi stessi possiedono. Quando un modello incorpora con precisione il nome o i dati di una persona, significa che il modello ha considerato quella persona rilevante durante la fase di addestramento, tanto da memorizzarla senza dover ricorrere a strumenti come la ricerca in rete.
Il sito esegue query su diversi modelli di intelligenza artificiale per capire come vengono riconosciuti i dati biografici di una figura specifica, e presenta i risultati in un unico punteggio. Ad esempio, Matthias Bastian e suo collega Maximilian Schreiner hanno rispettivamente ottenuto punteggi di 175 e 262, con la scala che va fino a un massimo di 996.
Gli utenti che raggiungono i punteggi più alti appartengono a figure realmente eminenti, come Mozart, Shakespeare o Taylor Swift. Questo punteggio, detto di "fattore di importanza", dimostra quindi l'immensità e la rilevanza che quelle persone hanno nel dominio culturale o sociale che i modelli di intelligenza artificiale memorizzano ed elaborano.
I fondatori del progetto, Joey Flynn e Thomas Dimson, sottolineano chiaramente alcune limitazioni dei LLM. Essi ribadiscono che i modelli più piccoli hanno difficoltà nel produrre informazioni precise, e solo quelli con un numero estremamente elevato di parametri (come Meta's Llama) riescono davvero bene a "ricordare" informazioni dettagliate. Questo indica, da un lato, l'enorme mole di dati utilizzata per addestrare tali modelli, e, dall'altro, la dipendenza della capacità di memorizzazione dal numero di parametri di un modello.
I modelli di intelligenza artificiale però non sono perfetti. Come sottolineato negli stessi commenti del sito, questi potrebbero soffrire di alcuni problemi fondamentali. Ad esempio, i modelli possono generare informazioni inesatte sulla biografia di un individuo, i dati possono essere distorti per errori di tipografia e, in generale, i nomi troppo comuni tendono a produrre risultati peggiori in termini di precisione. Questi limiti mettono in discussione la capacità degli LLM di fornire informazioni rigorose, specialmente quando si tratta di individui o di dati troppo "diffusi".
Quanto sei rilevante ai occhi dell'intelligenza artificiale?
Un elemento interessante da considerare è che questa valutazione di rilevanza non si basa soltanto sulle informazioni disponibili in internet, bensì anche su come un modello ritiene che un'informazione o un'identità siano importanti per la sua funzionalità interna. La complessità con cui i dati vengono memorizzati all'interno delle matrici pesate non è trasparente per l'utente comune, ma questa iniziativa tenta di renderla più accessibile.
Un utente medio potrebbe non capire perché certe informazioni vengono memorizzate e altre no. I motivi di scarto possono essere molteplici: da una semplice mancanza di coperture nel training dataset, ad un'elevata ambiguità della personalità o dei dati biografici di una persona. Ad esempio, se un personaggio ha un nome comune e non è facilmente classificabile in un contesto storico o culturale univoco, è molto possibile che venga "dimenticato" nel processo di addestramento.
Il futuro e l'importanza del progetto
L'importanza di iniziative come "In the Weights" sta anche nel fatto che offrono una finestra aperta per capire meglio in che modo vengono costruiti e addestrati i sistemi di intelligenza artificiale. In un mondo dove queste tecnologie sono sempre più diffuse e utilizzate, capire il loro interno non è soltanto un interesse accademico, ma un aspetto cruciale per la trasparenza e l'etica dell'AI.
Sebbene il progetto nasca in un contesto sperimentale, potrebbe evolvere in una forma più strutturata, come un motore di valutazione per la rilevanza personale e istituzionale. Un'idea futura potrebbe essere quella di fornire una misura numerica, simile a quella usata da "In the Weights", non solo in ambito personale, ma anche per entità aziendali o organizzative.
In definitiva, il progetto "In the Weights" rappresenta un passo importante verso la trasparenza e l'analisi avanzata dei grandi modelli linguistici. Mentre i creatori continuano a perfezionare l'algoritmo e il sistema di query, l'utente comune può trarre vantaggio da un'esperienza interattiva e istruttiva, che si aggiunge al dibattito acceso sull'intelligenza artificiale e sulle sue implicazioni sociali.