Architettura del contesto sta sostituendo il RAG man mano che gli agenti AI spingono al limite il recupero aziendale

VentureBeat AI 18 maggio 2026

Redis oggi non è più solo una soluzione per il caching, ma un attore chiave nell’architettura orientata al contesto destinata agli agenti di AI aziendali. Mentre il modello tradizionale di RAG (Retrieval-Augmented Generation) si mostra insufficiente per gestire il volume crescente di richieste generate dagli agenti, aziende come Redis stanno rispondendo con piattaforme che si concentrano sull’accesso al contesto in tempo reale e sull’ottimizzazione dell’accesso dati.

I problemi che Redis sta affrontando sono strutturali e derivano direttamente dagli agenti AI. Questi ultimi richiedono un numero d’ordini di grandezza maggiore di dati, rispetto agli utenti umani. La struttura attuale degli strati di recupero, però, non è costruita per gestire questa intensità. Secondo Rowan Trollope, CEO di Redis, “aziende avranno un numero d’ordini di grandezza maggiore di agenti rispetto agli esseri umani” e ciò comporterà inevitabilmente un aumento significativo del carico sugli sistemi backend.

Dal caching al contesto

Trollope fa un parallelo con l’epoca dei dispositivi mobili. Nel periodo in cui i sistemi legacy basati su database centrali avevano difficoltà a gestire milioni di accessi mobili, Redis fornì una soluzione esterna – una cache che riduceva la pressione sui backend. Oggi, però, la sfida è diversa. Gli agenti AI non possono creare da soli l’infrastruttura middleware necessaria. Devono, invece, trovare dati rilevanti in tempo reale attraverso interfacce predisposte e dedicate, oppure rischiano di bloccarsi.

Che cosa include Redis Iris

Redis Iris, annunciato lunedì, presenta cinque moduli integrati. Questi coprono diversi livelli dell’accesso al dato, comprese l’ingestione, la ricerca semantica, e la gestione della memoria:

Redis Data Integration (RDI): ora disponibile in produzione. Utilizza pipeline di change data capture per sincronizzare i dati in tempo reale da database relazionali, magazzini e document store, supportando piattaforme come Oracle, Snowflake, Databricks e Postgres.

Context Retriever: in fase di preview. Consente ai programmatori di definire modelli semantici con pydantic, permettendo a Redis di generare automaticamente strumenti MCP per gli agenti.

Agent Memory: anch’esso in preview. Permette di conservare lo stato a breve o lungo termine, fornendo contesto persistente per l’esecuzione degli agenti.

Redis Flex: un motore di storage riscritto che esegue il 99% dei dati su SSD e l’1% in RAM, garantendo recuperi a latenza sottomillisecondi.

Redis Search e LangCache: il backbone per la ricerca e il caching semantico. LangCache riduce le chiamate ridondanti ai modelli AI cachando le risposte al prompt.

Un mercato che evolve

Il mercato sta assistendo a una convergenza verso l’architettura orientata al contesto, una soluzione che supera il modello classico di RAG. I produttori di database tradizionali come Oracle e database vettoriali come Pinecone sono a loro volta aggiornando i loro sistemi con strati di contesto. Piattaforme indipendenti come Hindsight stanno ampliando il panorama esistente.

Insieme alle grandi aziende, gli analisti concordano sull’importanza di una gestione del contesto governata e ad alta velocità. Secondo Stephanie Walter di HyperFRAME Research, l’elemento chiave non è tanto il miglioramento del RAG quanto la necessità degli agenti di contesto reale, memoria e recuperi rapidi in tempo di esecuzione. “L’obiettivo degli strati vincenti non è solo migliorare il RAG ma rendere gli agenti più veloci, meno costosi e sicuri da utilizzare,” ha affermato Walter.

Redis Iris nella pratica

La piattaforma Iris, con le sue capacità di memorie dinamiche, trova un’applicazione diretta in casi complessi. Take, ad esempio, Mangoes.ai, azienda che ha costruito la propria architettura nativa da subito su Redis. Amit Lamba, fondatore e CEO, descrive come negli ambienti di salute il problema non è semplice da risolvere. “In una sessione di gruppo di un’ora di terapia, devi sapere esattamente chi ha detto cosa, quando, e fornire le giuste informazioni al terapeuta in tempo reale,” afferma Lamba.

La capacità di memorie dinamiche di Iris risponde direttamente a questa complessità. La piattaforma utilizza diversi agenti specializzati – uno per l’identificazione degli enti, uno per il ragionamento sulle relazioni ed uno per integrare la storia clinica. “La capacità di memorie dinamiche si adatta quasi perfettamente al problema che stiamo cercando di risolvere,” aggiunge Lamba.

Il cambiamento per le aziende

Per le aziende che hanno costruito le loro architetture intorno al modello RAG, il momento cruciale sta arrivando: non basta più depositare informazioni nell’agente prima di processarle. Ora, il modello opposto – agenti che richiamano dati in tempo reale attraverso tool call – sta diventando lo standard. Chi si dedica ancora alle ottimizzazioni delle pipeline RAG rischia di stare dietro rispetto a ciò che serve oggi.

L’ultima frontiera non è il volume delle informazioni, ma la loro disponibilità, governata, aggiornata e contestualizzabile al momento del bisogno. Secondo Walter, la governance rimane chiave: gli agenti devono diventare meno costosi, più sicuri e scalabili se desideriamo che si espandano a livello aziendale.

Leggi l'articolo originale →

← Torna alle news