SubQ: cos'è realmente promesso da questa AI veloce 56 volte
Subquadratic, startup americana con sede a Miami, è uscita dall'anonimato con un'ambiziosa dichiarazione: il suo modello linguistico avanzato, chiamato SubQ, sarebbe 56 volte più veloce di gran parte delle altre grandi intelligenze artificiali. L'azienda sostiene di aver risolto un problema matematico che aveva frenato il progresso degli LLM (Large Language Models) da un decennio. Le promesse di velocità, efficienza energetica e costo ridotto non hanno mancato di suscitare interesse, nonostante un certo scetticismo tra gli esperti.
SubQ si posiziona come un concorrente potente rispetto agli altri modelli, in grado di gestire contesti fino a 12 volte più estesi rispetto alla media. Questa capacità si rivela molto utile in compiti che richiedono l'elaborazione di grandi quantità di dati, come ad esempio l’analisi di centinaia di documenti o intere basi di codice. Inoltre, SubQ raggiungerebbe prestazioni quasi paragonabili a quelle dei modelli migliori di aziende come Google Deepmind, OpenAI e Anthropic.
Token e lavoro computazionale
I modelli linguistici funzionano con un processo che inizia con un'analisi precisa del linguaggio in blocchi atomici chiamati token, che vengono successivamente tradotti in codice macchina per essere interpretati da un processore. Questo passaggio richiede un lavoro computazionale considerevole, che aumenta esponenzialmente con la dimensione del contesto.
Per il funzionamento corretto, i modelli LLM devono gestire le relazioni tra i token in base alla struttura contestuale. Questo ha portato, da anni, a un'architettura chiamata Transformer, la quale ha rivoluzionato l'elaborazione del linguaggio ma ha avuto un limite importante: la sua richiesta di lavoro computazionale cresce in modo quadratico. Questo rende gli LLM costosi e inefficienti quando i contesti diventano grandi.
Sparse Attention: il trucco di Subquadratic
Per superare questo limite, Subquadratic ha sviluppato una tecnica chiamata "Sparse Attention". Al posto di considerare tutte le relazioni tra token, Subquadratic seleziona quelle ritenute significative in base a criteri statistici avanzati, riducendo così drasticamente l'impiego di risorse. L’approccio non è del tutto nuovo: altre aziende hanno sperimentato con forme simili di attenzione sparsa, ma il dettaglio del come SubQ applica questa tecnica è considerato innovativo.
Secondo Subquadratic, "Il trucco sta nel capire qual è il token giusto da contare". Questo implica un’analisi non solo basata sull’identità dei token ma anche su come funzionano all'interno della struttura contestuale. In questo modo, il modello può mantenere le sue capacità linguistiche complete nonostante una quantità ridotta di calcoli.
Test velocità e prestazioni
Fino a poco tempo fa, l'unico modo di verificare le affermazioni di Subquadratic era attraverso i dati rilasciati in modo autonomo dall’azienda. Tuttavia, con il tempo, essa ha cominciato a fornire risultati di test condotti da enti esterni indipendenti. Questi hanno supportato in parte le affermazioni, mostrando una significativa riduzione di tempo di elaborazione rispetto ai modelli esistenti. Inoltre, l’azienda ha messo in luce un utilizzo energetico estremamente ridotto rispetto all'efficienza di SubQ.
Tuttavia, per una valutazione completa, rimarrebbe da testare realmente l’implementazione del modello in contesti reali. Attualmente, Subquadratic non rende pubblicamente accessibile il modello, e quindi i tecnici esterni non hanno potuto sperimentare con esso o replicare i test.
Una promessa ambiziosa, ma con riserve
Il fatto che Subquadratic presenti SubQ con grande enfasi e senza rendere immediatamente il modello disponibile, ha alimentato inquietudini tra le comunità accademiche ed industriali. Dan McAteer, un ingegnere esperto di intelligenza artificiale, ha espresso le preoccupazioni della comunità: "SubQ è o il più grande progresso dopo i Transformer o il 'Theranos della IA'".
La parallegia riferita a Theranos, una società tecnologica che aveva promesso un dispositivo rivoluzionario di analisi medica ma si era rivelata fraudolenta, non è casuale. Sembra un monito sottile, ma forte, al pubblico interessato a credere in un progresso estremo senza prove sufficientemente robuste.
Il futuro del modello SubQ
Nonostante lo scetticismo iniziale, la pubblicazione di dati verificabili da enti indipendenti ha fornito una base di fiducia iniziale. Tuttavia, il modello dovrà comprovarsi in contesti applicativi reali e confrontarsi non solo con aziende già consolidate, ma anche con modelli che stanno continuamente migliorando. Solo una maggiore apertura e test collaborativi con la comunità tecnica potranno veramente sostenere o sfatare la sua promessa.