L’AI Parla Tante Lingue Ma Non Quelle Africane: Il 98% Non Sono Supportate Dai Modelli Più Utilizzati
L’intelligenza artificiale sta abbattendo molte barriere linguistiche, ma rischia di crearne di nuove. A lanciare l’allarme è uno studio pubblicato nei
Manca un supporto linguistico completo
Un nuovo studio mette in luce come la mancata copertura di numerose lingue nel contesto africano rischia di alimentare ulteriormente il divario digitale.
Il problema numerico
Secondo il rapporto, il 98% delle oltre 2.000 lingue africane non è adeguatamente supportato dai grandi modelli linguistici. Solo quattro lingue: amarico, swahili, afrikaans e malgascio, hanno una copertura sufficiente. Questo dato sottolinea come la mancanza di supporto linguistico possa escludere milioni di persone da servizi digitali essenziali come l’istruzione, la sanità o l’amministrazione pubblica.
La questione dei dati
La principale ragione di questa lacuna sta nella scarsità di dati digitali disponibili in molte lingue africane. I grandi modelli linguistici come ChatGPT, Gemini o Claude dipendono da enormi quantità di testi online, ma molte lingue africane non hanno una fortissima presenza digitale. Roberto Navigli, professore di Natural Language Processing alla Sapienza Università di Roma, ha spiegato: «Le aziende che sviluppano i grandi modelli linguistici non sono interessate a investire sulle lingue per cui esistono meno contenuti sul web».
Un circolo vizioso
La scarsità di dati digitali genera modelli linguistici inaccurati, che a loro volta producono strumenti poco utili per le comunità che parlano quelle lingue. Questo processo non riguarda solo la traduzione, ma anche la capacità di catturare la ricchezza culturale delle lingue africane. La mancanza di modelli adeguati minaccia di perdere modi di dire, espressioni culturali o conoscenze locali, promuovendo un'omologazione globale che rischia di soffocare la diversità linguistica.
I segnali di cambiamento
Nonostante queste sfide, ci sono iniziativa promettenti in atto. Negli ultimi mesi sono aumentate le iniziative per sviluppare modelli di AI progettati direttamente in Africa e addestrati sulle lingue locali. Sono esempi significativi il progetto LugandaGPT e il programma African AI Language Models, che si concentrano sull’elaborazione tecnologie basate sulle diversità linguistiche africane.
Un impegno internazionale
L’impegno di alcuni grandi player tecnologici sta prendendo forma. Microsoft ha recentemente lanciato il programma LINGUA Africa, con l’obiettivo di finanziare ricerca, dati e capacità di calcolo per team africani. Questi progetti mirano a costruire un’AI più inclusiva, capace di rappresentare realmente le varietà linguistiche del continente.
L’importanza della localizzazione
Chenai Chair, direttrice del Masakhane African Languages Hub, ha ribadito che il futuro dell’intelligenza artificiale non può essere plasmato solo da coloro che vivono in paesi di lingua inglese o francese, ma deve riflettere le autentiche realtà delle comunità locali. Secondo lei: «L’AI deve essere creata pensando anche a chi non parla le lingue dominanti del mondo», al fine di rispondere effettivamente alle esigenze locali.
Un futuro più equo
La sfida non è solo di rendere l’AI più potente, ma anche di renderla più inclusiva. Una tecnologia che riesca a comprendere e rappresentare correttamente le lingue africane può ridurre il divario digitale piuttosto che espanderlo, garantendo un accesso equo a tecnologie fondamentali. È necessario sostenere ulteriormente la diversità linguistica, non solo per preservarla, ma per alimentare un progresso tecnologico equo e accessibile a tutti.