Home Fondamenti Token Modelli AI Deep Learning Tecniche RAG MCP Orchestrazione Prompt Engineering Usare l'AI ChipsBot News

Thinking Machines rivela anteprima di conversazione AI in tempo quasi reale

VentureBeat AI 11 maggio 2026

La società di intelligenza artificiale Thinking Machines ha annunciato una preview di ricerca di modelli di interazione che possono trattare input e output simultanei. La tecnologia, chiamata TML-Interaction-Small, è in grado di rispondere in tempo reale e può essere utilizzata per applicazioni come la traduzione in tempo reale e la generazione di UI chart.

Il modello di interazione di Thinking Machines è stato progettato per superare i limiti delle attuali tecnologie di intelligenza artificiale, che richiedono un input completo prima di poter generare una risposta. Il modello di Thinking Machines, invece, può trattare input e output simultanei, consentendo una conversazione più naturale e fluida.

Il problema della "collaborazione bottleneck"

La società ha identificato il problema della "collaborazione bottleneck" come uno dei principali limiti delle attuali tecnologie di intelligenza artificiale. Il problema si verifica quando un utente deve attendere che il modello di intelligenza artificiale finisca di elaborare un input prima di poter fornire un nuovo input. Ciò può portare a una conversazione lenta e innaturale.

La soluzione di Thinking Machines

Per superare questo problema, Thinking Machines ha sviluppato un modello di interazione che può trattare input e output simultanei. Il modello utilizza una architettura "full-duplex" che consente di ascoltare, parlare e vedere in tempo reale. Ciò consente al modello di rispondere in tempo reale e di trattare input multipli simultaneamente.

Il modello di Thinking Machines utilizza un'architettura a due parti: il modello di interazione e il modello di background. Il modello di interazione è responsabile della gestione della conversazione e della risposta in tempo reale, mentre il modello di background è responsabile della elaborazione più approfondita e della generazione di risposte più complesse.

Risultati impressionanti sui benchmark

La società ha ottenuto risultati impressionanti sui benchmark di terze parti. Il modello di interazione di Thinking Machines ha ottenuto un tempo di risposta di 0,40 secondi, rispetto a 0,57 secondi per il modello Gemini-3.1-flash-live e 1,18 secondi per il modello GPT-realtime-2.0.

Inoltre, il modello di interazione di Thinking Machines ha ottenuto un punteggio di 77,8 sul benchmark FD-bench V1.5, rispetto a 46,8 per il modello GPT-realtime-2.0 e 54,3 per il modello Gemini-3.1-flash-live.

Applicazioni aziendali

La tecnologia di Thinking Machines potrebbe avere un impatto significativo sulle applicazioni aziendali. Il modello di interazione potrebbe essere utilizzato per applicazioni come la traduzione in tempo reale, la generazione di UI chart e la gestione di processi di produzione.

Inoltre, il modello di interazione di Thinking Machines potrebbe essere utilizzato per migliorare la customer service. Il modello potrebbe ascoltare i clienti e rispondere in tempo reale, fornendo una esperienza di customer service più naturale e personalizzata.

Conclusione

La tecnologia di Thinking Machines rappresenta un passo avanti significativo nella direzione di una conversazione più naturale e fluida tra umani e macchine. Il modello di interazione di Thinking Machines potrebbe avere un impatto significativo sulle applicazioni aziendali e potrebbe migliorare la customer service.

La società ha annunciato che il modello di interazione sarà disponibile per una preview di ricerca negli prossimi mesi, con una release più ampia prevista per il prossimo anno.

Di seguito sono riportati i risultati dei benchmark:

    • Turn-taking latency (s): 0,40
    • Interaction Quality (Avg): 77,8
    • IFEval (VoiceBench): 82,1
    • Harmbench (Refusal %): 99,0

La società ha anche annunciato che il modello di interazione sarà disponibile per una preview di ricerca negli prossimi mesi, con una release più ampia prevista per il prossimo anno.

La tecnologia di Thinking Machines rappresenta un passo avanti significativo nella direzione di una conversazione più naturale e fluida tra umani e macchine.

Leggi l'articolo originale →
← Torna alle news