Ricerca su IA: Andrej Karpathy sceglie Anthropic invece di OpenAI per ritornare alla ricerca su grandi modelli linguistici
Andrej Karpathy, uno dei ricercatori più noti nell'ambito dell'Intelligenza Artificiale, ha annunciato di aver firmato con Anthropic invece che con il suo ex datore OpenAI, per potersi concentrare nuovamente sulla ricerca di frontiera dei grandi modelli linguistici (Large Language Models o LLM). La sua decisione rappresenta una svolta importante per entrambi gli ambiti, e ha destato interesse tra i ricercatori del settore.
Il ruolo di Karpathy in Anthropic
Secondo fonti rivelate da Axios, Karpathy si unirà al team pretraining di Anthropic, il gruppo che si occupa dell’addestramento iniziale dei grandi modelli di intelligenza artificiale. Questo aspetto è cruciale, in quanto permette di costruire un modello base solido, che poi può essere affinato con tecniche come l’apprendimento rinforzato per compiti specifici come la codifica e la matematica.
Karpathy è incaricato di creare un team dedicato per accelerare la ricerca sull’allenamento iniziale utilizzando Claude, la piattaforma su cui si basa il lavoro di Anthropic. Secondo gli esperti, l’idea di un progresso esponenziale nell'IA dipende molto dal fatto che i modelli stessi possano aiutare ad migliorare se stessi.
La carriera di Karpathy
Karpathy ha una lunga storia presso OpenAI, dove ha giocato un ruolo chiave sin dai primi anni dell’organizzazione. Dopo aver contribuito allo sviluppo iniziale del team, ha trascorso un periodo presso Tesla, dove ha lavorato al sistema di guida automatica e all’Autopilot completo. Tornato a OpenAI, ha lasciato definitivamente l'organizzazione nel 2024.
La sua decisione di non tornare a OpenAI e scegliere Anthropic invece è vista come una perdita significativa per OpenAI, che ha perso uno dei suoi talenti principali.
Azioni recenti e motivazioni
Nel suo post su X, Karpathy ha espresso grande entusiasmo riguardo al ritorno alla ricerca e al sviluppo, definendo gli anni prossimi nei grandi modelli linguistici come “formative in modo speciale”. Ha anche espresso ammirazione per i progressi nell’IA “agente” nel campo della programmazione, un campo che aveva inizialmente liquidato solo pochi mesi prima.
Dopo i lavori a OpenAI e Tesla, Karpathy ha sperimentato un breve periodo di lavoro su progetti educativi attraverso la sua startup, Eureka Labs. Pur avendo definito questa area molto importante, ha ribadito di voler tornare alla programmazione e alla ricerca quando il momento lo permetterà.
Reazioni e prospettive
Karpathy ha annunciato il suo recente movimento su X, aggiornando i suoi follower con i dettagli della sua posizione. L’intero settore dell’IA si aspetta molto da lui, soprattutto in termini di innovazioni nella costruzione dei modelli linguistici.
Scegliendo Anthropic invece che OpenAI, Karpathy indica il forte potenziale che Anthropic potrebbe avere nei prossimi anni. La sua decisione sembra riflettere una volontà di avanzare tecnologie IA più solide e sostenibili, con un focus sui progressi di frontiera.
Conclusione
La scelta di Andrej Karpathy di unirsi ad Anthropic segna un passo significativo per la ricerca in materia di intelligenza artificiale e modelli linguistici di grandi dimensioni. La sua esperienza e le sue competenze potrebbero aprire nuove strade per lo sviluppo e l’applicazione di modelli IA avanzati. La situazione dimostra anche come il settore dell’IA stia diventando sempre più dinamico, con figure chiave che si spostano tra diverse organizzazioni per cercare nuovi orizzonti e sfide intellettuali.