Cos'è ReWOO? Un framework IBM per LLM più efficienti.

IBM 7 aprile 2026

Cos'è ReWOO? Un'innovazione di IBM per modelli linguistici più intelligenti ed efficienti

L'evoluzione dei grandi modelli linguistici (LLM) ha trasformato il panorama dell'intelligenza artificiale, portando capacità di ragionamento e comprensione del linguaggio sempre più sofisticate. Tuttavia, l'efficienza e l'accuratezza di questi sistemi, soprattutto in compiti di ragionamento complessi, rimangono aree di ricerca e sviluppo cruciali. È qui che entra in gioco ReWOO, un innovativo framework sviluppato da IBM, che promette di rendere gli LLM più redditizi e precisi in determinate applicazioni di ragionamento.

ReWOO, acronimo di "reasoning without observation" (ragionamento senza osservazione), rappresenta un passo avanti significativo nella progettazione di LLM. A differenza dei suoi predecessori, i modelli che utilizzano ReWOO si impegnano in un processo di ragionamento attorno a un problema prima di tentare di risolverlo. Questo approccio migliora notevolmente l'efficienza, la precisione e la robustezza, specialmente in situazioni in cui un tool esterno potrebbe fallire. David Zax, Staff Writer di IBM Think, ha approfondito le meccaniche e i vantaggi di questa nuova architettura.

L'evoluzione del ragionamento negli LLM

Per comprendere appieno l'importanza di ReWOO, è utile ripercorrere l'evoluzione dei modelli linguistici:

Primi LLM: Risposte dirette

I primi grandi modelli linguistici, come i modelli GPT-1 e GPT-2 di OpenAI, fornivano risposte dirette alle interrogazioni. Erano potenti nel generare testo coerente, ma mancavano di un meccanismo interno per "pensare" al problema prima di formulare una risposta.
Modelli a catena di pensiero (2022): Il "pensare ad alta voce"

A partire dal 2022, è emersa una nuova ondata di modelli a catena di pensiero, che ha introdotto un elemento di ragionamento esternalizzato. In pratica, questi modelli "pensavano ad alta voce" mentre giungevano a una risposta, migliorando significativamente la precisione e l'esplicabilità delle loro conclusioni.
Sistemi ALM e agenti IA: L'introduzione degli strumenti

Successivamente, è arrivata una generazione di modelli di linguaggio aumentati (noti come "sistemi ALM") e agenti IA, che hanno aggiunto capacità di richiamo di strumenti a questo processo di ragionamento. Framework ALM precoci, come ReAct, seguono uno schema di pensiero-azione-osservazione: il sistema osserva ciò che genera prima di ricominciare a rifletterci su. Sebbene generalmente efficaci, framework come ReAct possono registrare un elevato consumo di token. Ogni successiva chiamata a uno strumento deve includere tutta la cronologia della conversazione precedente, un costo che si accumula a ogni passo.

Come ReWOO si distingue: ragionamento senza osservazione

ReWOO si affranca dallo schema pensare-agire-osservare dissociando il ragionamento dalle osservazioni esterne. Questo approccio rivoluzionario permette al modello di pianificare internamente la sua catena di ragionamento prima di invocare selettivamente strumenti o recuperare informazioni. Questa separazione elimina inutili "andirivieni" e consente al modello di mantenere il suo piano coerente per tutta la durata del compito.

La chiave di ReWOO risiede nella sua capacità di elaborare un piano generale in anticipo. Invece di iterare costantemente tra pensiero e osservazione esterna, il modello ReWOO formula un piano completo basato sull'input iniziale. Solo dopo aver stabilito questa strategia interna, procede all'interazione con strumenti esterni, e lo fa in modo mirato e non iterativo per la fase di ragionamento. Questo significa che il "pensare" avviene una volta sola, in modo olistico, prima di eseguire le azioni necessarie.

La meccanica di ReWOO: tre moduli distinti

ReWOO utilizza tre moduli distinti che dividono e gestiscono compiti complessi in modo efficiente:

Modulo Planner

Questo modulo stabilisce un "progetto" o un piano direttore che indica come il modello si comporterà in base al prompt dell'utente. È la fase di pre-analisi e strategia, in cui il sistema decide quali passi logici e quali informazioni saranno necessari per risolvere il problema.
Modulo Worker

Il Worker esegue il piano stabilito dal Planner. Questo include la chiamata a strumenti esterni. La differenza cruciale qui è che il Worker non ripete le costose chiamate API LLM per "pensare" durante questa fase, come avviene invece in ReAct. Esegue semplicemente le azioni definite nel piano.
Modulo Solver

Infine, il Solver recupera i piani e le "prove" (i risultati delle chiamate agli strumenti) e sintetizza la risposta finale. Questo modulo è responsabile di assemblare tutti i pezzi del puzzle per fornire una soluzione coerente e completa all'utente.

Prestazioni rivoluzionarie: efficienza e precisione

Sebbene la differenza nell'approccio possa sembrare marginale, i risultati sono spettacolari. ReWOO si comporta in modo altrettanto efficace (o addirittura leggermente superiore) rispetto a ReAct su alcuni benchmark, pur utilizzando circa l'80% di token in meno. È importante ricordare che un token è un'unità semantica per i modelli di IA; più token vengono utilizzati, maggiore è il costo operativo.

Per esempio, sul dataset HotpotQA, una suite di domande utilizzata per valutare i sistemi di IA, ReWOO raggiunge una precisione del 42,4% utilizzando 2.000 token, mentre ReAct raggiunge una precisione del 40,8% con ben 10.000 token. Questo guadagno di efficienza nei token è fondamentale perché rende i modelli di ragionamento economicamente più sostenibili su larga scala.

ReAct e ReWOO: un esempio pratico

Per illustrare la differenza tra questi due comuni framework di IA generativa, consideriamo un caso d'uso specifico: un utente chiede aiuto per preparare i bagagli per un viaggio che include un volo tra New York e Chicago domani, e un viaggio in auto fino a Milwaukee il giorno successivo.

Sistema ReAct

Il sistema ReAct scompone il problema in tre cicli di pensiero-azione-osservazione prima di fornire la sua risposta finale. Nel primo ciclo, penserebbe: "Devo controllare il meteo per domani a New York", utilizzando la generazione aumentata dal recupero (RAG) per cercare queste informazioni (un'azione), e infine osservare il risultato. Questi risultati servono poi come punto di partenza per un altro ciclo di tre fasi riflettere-agire-osservare per il meteo a Chicago. In terzo luogo, farebbe lo stesso per il meteo a Milwaukee. Infine, raccoglierebbe le sue conclusioni in un output (ad esempio, "Prevedere più strati, poiché fa più freddo in ogni luogo"). Il problema è che ogni nuovo ciclo di pensiero deve includere l'intero contesto della conversazione fino a quel punto, consumando un numero considerevole di token.
Sistema ReWOO

Il sistema ReWOO, al contrario, guadagnerebbe efficienza effettuando tutta la pianificazione in anticipo. Per prima cosa, pianificherebbe come segue: "Ho bisogno di sapere il meteo di domani a New York, il meteo di domani a Chicago e il meteo a Milwaukee il giorno dopo." Successivamente, chiamerebbe le API meteo in una sequenza stretta (o potenzialmente in parallelo), senza "pensare" durante questa fase laboriosa. Infine, risolverebbe il problema raccogliendo le prove e producendo una risposta finale. La separazione del ragionamento dalle chiamate esterne è il fulcro di questa efficienza.

Vantaggi e svantaggi di ReWOO

Oltre all'economia di token, ReWOO dimostra un ulteriore vantaggio cruciale: la robustezza in caso di fallimento di un tool.

Vantaggi: Robustezza al fallimento

Se un tool non funziona sotto ReAct, ad esempio, il sistema può ritrovarsi in un ciclo infinito (poiché l'LLM interrogherebbe ripetutamente un database difettoso per ottenere il meteo a Chicago, ad esempio). ReWOO è più agile. Anche se un tool non restituisce l'elemento di prova richiesto, il piano generale è ancora in piedi: il modulo Worker può progredire, e il modulo Solver sarà in grado di fornire almeno una risposta parziale. Nell'esempio del meteo, invece di bloccarsi in un ciclo infinito o eccessivo interrogando un database sul meteo a Chicago, il modulo Solver restituirebbe almeno una risposta informando l'utente del meteo a New York e Milwaukee (supponendo che il modulo Worker sia in grado di recuperare questi elementi), il che potrebbe in ultima analisi essere sufficiente per soddisfare le esigenze dell'utente.
Svantaggi: Non è una soluzione universale

Nonostante i suoi vantaggi, ReWOO non è un framework assolutamente superiore; è semplicemente migliore per alcuni tipi di compiti, in particolare quando i tipi e le quantità di prove necessarie sono regolari e prevedibili. Dove ReWOO fallisce è di fronte a problemi meno prevedibili o meno strutturati che richiedono creatività, esplorazione o improvvisazione. Se eccelle in presenza di "incognite note", ReWOO fallisce di fronte alle "incognite sconosciute".

Per esempio, ReWOO non sarebbe una soluzione ottimale per il debug del codice Python, un processo esploratorio e iterativo in cui ogni correzione può generare nuovi errori e nuovi indizi, diventando rapidamente obsoleto. Un framework più adattabile come ReAct, sebbene meno economico in termini di token in astratto, sarebbe in definitiva più adatto a un problema del genere.

Come implementare ReWOO

Come per la maggior parte dei sistemi e framework di IA, sono disponibili diversi approcci per l'implementazione dei workflow ReWOO. Un'implementazione "ufficiale" del framework, descritta per la prima volta dal ricercatore Binfeng Xu e dai suoi colleghi nel 2023, è disponibile su Github. Framework di IA generativa come LangGraph (che chiama i suoi moduli "nodi") e LangChain, sono anche molto utilizzati.

Inoltre, un metodo di ragionamento a più fasi di tipo ReWOO è disponibile anche con IBM Granite. A livello concettuale, è possibile iniziare con ReWOO in qualsiasi ambiente LLM utilizzando un prompt ben progettato, che semplicemente incoraggi l'IA a elaborare un piano passo-passo per rispondere alle domande successive prima di passare a un input di un tool. Questa flessibilità permette agli sviluppatori e ai ricercatori di integrare i principi di ReWOO in una varietà di contesti e applicazioni, sfruttandone i vantaggi in termini di efficienza e robustezza.

Leggi l'articolo originale →

← Torna alle news