Thinking Machines Lab lancia modelli AI real-time per assistenti vocali

AI News Italia 13 maggio 2026

Chiunque abbia usato un assistente vocale basato su intelligenza artificiale conosce bene quella pausa scomoda: si finisce di parlare, e poi si aspetta. A volte mezzo secondo, a volte di più, ma sempre abbastanza da ricordare che si sta parlando con una macchina. Questa interruzione nella fluidità del dialogo è stata a lungo un ostacolo all'adozione più ampia e alla percezione di naturalezza degli assistenti AI. Ora, una startup emergente sta puntando a eliminare completamente questo fastidioso intervallo, promettendo un futuro di interazioni con l'AI senza soluzione di continuità e in tempo reale.

Thinking Machines Lab e i nuovi "interaction models"

Thinking Machines Lab, la startup fondata dall’ex CTO di OpenAI, Mira Murati, si propone di superare definitivamente questa era delle interazioni intervallate da pause. La società ha recentemente presentato una nuova categoria di modelli AI, che chiama significativamente "interaction models". Questi sistemi sono specificamente progettati per ascoltare e rispondere in tempo reale, imitando la dinamica fluida e naturale che si verifica in una normale conversazione telefonica tra esseri umani. L'obiettivo è quello di rendere l'interazione con l'intelligenza artificiale così intuitiva e immediata da far dimenticare all'utente di non stare parlando con un'altra persona.

La tecnologia full-duplex: il cuore dell'innovazione

Il cuore pulsante di questa innovazione risiede in una tecnologia avanzata nota come full-duplex. A differenza dei sistemi esistenti, che spesso si affidano a un componente esterno – un "harness" – per rilevare quando l'utente ha terminato di parlare prima di formulare una risposta, il modello di Thinking Machines è intrinsecamente e nativamente progettato per percepire e rispondere nello stesso ciclo continuo. Questa capacità si estende attraverso diverse modalità, inclusi audio, video e testo, eliminando i confini artificiali tra un turno di parola e l'altro. L'approccio full-duplex consente al sistema di processare le informazioni e di generare risposte in modo simultaneo e interconnesso, proprio come avviene nelle conversazioni umane.

Il risultato pratico di questa architettura è notevole e tangibile: le conversazioni vengono elaborate in blocchi da 200 millisecondi, permettendo risposte rapide e precise in meno di 0,4 secondi. Questa velocità è particolarmente impressionante, come dimostrano i benchmark interni che vedono i modelli di Thinking Machines Lab superare persino il modello Gemini di Google in termini di reattività. Le implicazioni di una tale velocità vanno ben oltre la semplice efficienza. La capacità full-duplex non solo velocizza l'interazione, ma abilita anche interruzioni naturali, richieste di chiarimento e scambi bidirezionali che i sistemi attuali fanno fatica a gestire, aprendo nuove frontiere per le applicazioni pratiche dell'AI conversazionale.

Applicazioni rivoluzionarie in diversi settori

Le potenziali applicazioni di questa tecnologia sono vaste e promettenti, destinate a rivoluzionare diversi settori in cui l'interazione uomo-macchina è cruciale. Tra le aree che beneficeranno maggiormente degli "interaction models" figurano:

Customer service: La capacità di gestire conversazioni fluide e in tempo reale può trasformare radicalmente l'assistenza clienti, rendendola più efficace, meno frustrante e più personalizzata. Gli assistenti AI potranno comprendere e rispondere alle richieste dei clienti con una velocità e una naturalezza finora irraggiungibili.
Assistenti virtuali: Dagli assistenti personali sui dispositivi agli assistenti smart home, la reattività e la fluidità delle interazioni miglioreranno esponenzialmente l'esperienza utente, rendendo questi strumenti più integrati nella vita quotidiana.
Traduzione in tempo reale: La possibilità di elaborare e rispondere in modo full-duplex è un game-changer per la traduzione simultanea, permettendo conversazioni multilingue più naturali e meno interrotte, abbattendo barriere linguistiche con una fluidità senza precedenti.

Contesto di mercato e strategie competitive

Thinking Machines Lab non è solo una promessa tecnica; è anche una startup al centro di dinamiche di mercato molto accese, che ne evidenziano l'importanza strategica. Il Wall Street Journal aveva già riportato nell’agosto 2025 che Mark Zuckerberg aveva cercato attivamente di acquisire la società. Dopo il rifiuto di Murati, Meta aveva persino tentato di assumere più di una dozzina dei suoi dipendenti chiave. Nonostante il tentativo aggressivo, Meta è riuscita a portare a bordo solo parzialmente il personale desiderato, con sette membri fondatori di Thinking Machines Lab che sono poi passati alla divisione Meta Superintelligence Labs. Questo episodio sottolinea l'elevato valore del talento e della tecnologia che Thinking Machines Lab sta sviluppando, rendendola un obiettivo primario per i giganti tecnologici in cerca di innovazione nel campo dell'AI.

La startup ha risposto a queste pressioni di mercato consolidando il proprio team con assunzioni strategiche di alto profilo. Tra le nuove integrazioni spicca quella di Soumith Chintala, una figura di spicco nel panorama dell'intelligenza artificiale, noto per essere il creatore di PyTorch e un veterano di Meta. La sua nomina a CTO di Thinking Machines Lab rafforza notevolmente le capacità tecniche e la leadership innovativa della startup, segnalando una chiara intenzione di continuare a spingere i confini della ricerca e dello sviluppo nell'AI. Questa mossa strategica serve anche a solidificare la posizione dell'azienda come attore chiave nel settore, attirando talenti di alto livello e consolidando la sua visione a lungo termine.

Disponibilità e prospettive future

Per ora, gli "interaction models" di Thinking Machines Lab restano fuori dalla portata del grande pubblico. Tuttavia, la società ha annunciato che nei prossimi mesi aprirà una finestra di disponibilità limitata. Questo periodo sarà dedicato alla raccolta di feedback preziosi da un gruppo selezionato di utenti e partner, un passaggio cruciale per affinare la tecnologia e assicurare che soddisfi al meglio le esigenze del mercato. Un rilascio più ampio dei modelli è poi previsto entro la fine dell’anno, segnando un momento potenzialmente trasformativo per l'industria degli assistenti vocali e delle interazioni AI.

Se le promesse di Thinking Machines Lab reggeranno al confronto con la realtà delle applicazioni su larga scala, è ancora tutto da verificare. Tuttavia, l'idea fondamentale che l'interattività debba essere costruita nel cuore stesso di un modello AI, piuttosto che aggiunta dall'esterno come un componente secondario, segna un cambio di prospettiva che l'intero settore farà fatica a ignorare. L'approccio di Thinking Machines Lab, incentrato sulla creazione di un'esperienza conversazionale intrinsecamente fluida e umana, potrebbe benissimo ridefinire gli standard per le future interazioni con l'intelligenza artificiale. A riprova del suo crescente impatto, è emerso anche che Google ha stretto un accordo multimiliardario con la startup Thinking Machines Lab, garantendo alla startup l'accesso ai sistemi Google basati sulle sue avanzate tecnologie, un'ulteriore conferma della fiducia del mercato nelle sue innovazioni.

Leggi l'articolo originale →

← Torna alle news