gli agenti AI aziendali continuano a fallire perché dimenticano ciò che hanno imparato
Le architetture RAG sono brave in una cosa: recuperare documenti semanticamente rilevanti. Ma è anche lì che si fermano. Un framework chiamato grafico di contesto decisionale affronta questo gap offrendo agli agenti una memoria strutturata, un ragionamento sensibile al tempo e una logica decisionale esplicita.
Rippletide, una startup che opera all’interno dell’ecosistema Neo4j, ha sviluppato questo tipo di framework. La sua caratteristica principale è rappresentata dagli agenti non regressivi, in grado di fissare sequenze di azioni validate e di costruirvi sopra nel tempo.
“Il punto chiave è la non regressività: come fai a garantire che quando l’agente genera qualcosa di nuovo possa costruirsi su scoperte precedenti?” ha dichiarato Yann Bilien, co-fondatore e chief scientific officer di Rippletide.
Perché RAG non basta
Il contesto aziendale è disperdente: si trova in strumenti ERP, log, database, archivi vettoriali e documenti di policy. Gli strumenti di AI generativa in grado di recuperare da questa massa di dati utilizzano la ricerca per keyword, query SQL o piene pipeline RAG – ma il recupero ha un limite.
Notoriamente, i dati recuperati potrebbero non essere rilevanti per la decisione in esame, causando allucinazioni; e anche quando gli agenti trovano le informazioni giuste, spesso mancano di guida per prendere decisioni basate su un forte fondamento logico.
RAG recupera documenti ma non contesto decisionale. “Tutti iniziano con RAG: recupera i documenti rilevanti, li inserisce nel prompt e lascia che il modello lo risolva,” ha detto Wyatt Mayham di Northwest AI Consulting.
Questo funziona bene per i chatbot, ma “cade immediatamente” quando gli agenti devono prendere decisioni e agire, ha chiarito. “Il problema più grande dietro la costruzione di agenti l’ha sempre riguardata il gap tra recupero e applicabilità,” ha ribadito.
Un documento recuperato non indica all’agente se è ancora valido, se è stato superato o se ci siano regole contraddittorie che hanno la precedenza, ha sottolineato Mayham. “Gli agenti hanno bisogno di contesto decisionale, non solo di informazioni.”
Esempi pratici
Nel mondo costruttivo umano, potrebbe significare capire che un'eccezione ai prezzi è scaduta, una policy di sicurezza si applica solo in giurisdizioni specifiche, o che una procedura operativa standard è stata aggiornata un mese fa. “Tralasciare uno di questi aspetti e l’agente agirà con decisione ma in modo sbagliato,” ha affermato Mayham.
Senza un contesto decisionale strutturato, gli agenti combinano regole incompatibili, inventano vincoli per colmare le lacune o si basano su “punti statistici casuali di dati illimitati,” come li chiama Bilien. Gli errori sono difficili da ricostruire perché i costruttori non hanno modo di capire perché l’agente ha preso una determinata scelta.
Il problema degli errori cumulativi esiste: un piccolo tasso di errore per passo diventa “catastrofico” lungo un flusso di lavoro multipasso. “Questo è il motivo principale per cui la maggior parte degli agenti aziendali non esce mai dalla fase di test,” ha aggiunto Mayham.
Come i grafici di contesto decisionale forniscono risposte pertinenti
Un grafico di contesto decisionale risolve queste problematiche offrendo una mappa strutturata di ciò che è applicabile, quali sono le regole e quando si applicano.
Il framework è ottimizzato per una domanda specifica: “Considerando questa situazione, qual contesto si applica in questo momento?” Il tempo viene trattato come una dimensione prioritaria; ogni regola, decisione ed eccezione è legata ad un periodo di validità.
“L’obiettivo è affrontare esplicitamente dati mancanti, incoerenti o contradditori quando costruiamo il grafico per evitare errori probabilistici una volta che l’agente è in esecuzione,” ha spiegato Bilien.
Il sistema è costruito intorno a tre principi:
- Applicabilità: la logica è codificata esplicitamente in modo che l’agente sappia che regole ricordare e applicare in una data situazione. Il contesto è restituito solo quando è rilevante per la situazione.
- Memoria sensibile al tempo: ogni regola, decisione ed eccezione ha un periodo in cui è scaduta. Ciò permette agli agenti di ragionare su “Cosa era vero allora rispetto a ciò che è vero adesso”, riprodurre o spiegare le decisioni prese.
- Percorsi decisionali: Il sistema può spiegare come è arrivato da A a B e il “perché” dietro il ragionamento logico (ad esempio, perché un pezzo di contesto è stato incluso e un altro no). Gli agenti ricevono esempi di percorsi decisionali per mostrare come sono stati gestiti casi simili in precedenza.
La struttura del conoscere
Alla configurazione iniziale, i dati non strutturati vengono elaborati e trasformati in un ontologia: qual è l’ente esistente, che regole si applicano, cosa costituisce un’eccezione. L’AI neuro-simbolica si occupa del riconoscimento dei pattern e codifica una logica formale, leggibile in maniera macchinale. Nel tempo, il sistema perfeziona la propria base di conoscenza man mano che vengono prese nuove decisioni.
“L’AI neuro-simbolica ha due componenti: una parte neurale che concede un'elevata autonomia agli agenti e una parte simbolica che riduce il numero di dati necessari e introduce controllo,” ha chiarito Bilien.
Gli agenti vengono testati all’inizio del ciclo di sviluppo (pre-produzione) per verificare i comportamenti o individuare miglioramenti. Questo riduce i rischi così come i bisogni computazionali durante l'elaborazione, ha sottolineato lui.
Gli agenti imparano piuttosto che regredire
Per quanto riguarda la non-regressione, l’elemento chiave è l’unione compattata tanto dell’intelligenza (modelli) quanto del sapere, che è condiviso tra gli agenti, ha sottolineato Bilien. È fondamentale che gli agenti siano in grado di esplorare; quando non sanno come completare un'attività possono provare diverse possibilità, di solito in un ambiente controllato o simulazione (ad esempio, un bot di supporto che tenta diversi schemi di risposta).
“Una volta valutata soddisfacente una soluzione, il grafico blocca quella sequenza di azioni,” ha chiarito Bilien. L’esplorazione futura inizierà da questa “base stabile di comportamenti validi” per evitare che nuove competenze sovrascrivano quelle precedentemente apprese.
Prima che un agente agisca o influenzi un cliente, effettua un controllo sul grafico: sta violando una reg