Agenti gestiti da Claude: sogni, correzioni e lavoro distribuito
Anthropic ha annunciato l'estensione della sua piattaforma Managed Agents con tre primitive nuove: "dreaming", "outcomes" e "multiagent orchestration". Queste nuove funzionalità sono state progettate per rendere gli agenti più autonomi e efficienti, consentendo loro di gestire compiti complessi con minima supervisione.
La primitiva "dreaming" consente agli agenti di consolidare la memoria fra sessioni, eliminando i duplicati e le informazioni obsolete. Questo processo viene eseguito attraverso un algoritmo che rilegge le sessioni passate, estrae pattern ricorrenti e riorganizza la memoria. L'utente può poi approvare o scartare la nuova versione consolidata della memoria.
La seconda primitiva, "outcomes", consente all'utente di descrivere il risultato desiderato invece di specificare i passaggi da seguire. L'agente lavora quindi per raggiungere il risultato, e un grader separato valuta l'output rispetto ai criteri di successo stabiliti. Se il grader trova errori, l'agente fa un altro passaggio per correggerli.
La terza primitiva, "multiagent orchestration", consente a un agente principale di scomporre un compito in pezzi e affidarli a specialisti, ognuno con il proprio modello, prompt e strumenti. Gli agenti lavorano in parallelo su un filesystem condiviso e contribuiscono al contesto del lead.
I risultati delle prime adozioni di queste nuove primitive sono molto promettenti. Harvey, ad esempio, ha registrato un aumento del 600% nel completamento dei task grazie a "dreaming", mentre i benchmark interni di Anthropic hanno mostrato un miglioramento fino al 10% nella qualità dei file generati.
La combinazione di queste primitive consente agli agenti di lavorare in modo più autonomo e efficiente, ma richiede anche una maggiore attenzione alla gestione dei bias e degli errori sistemici. Un agente che impara dalle proprie sessioni può consolidare anche bias o errori sistemici, quindi è importante accoppiare la funzionalità "dreaming" con una review umana sensata sulle modifiche al memory store.
La primitiva "outcomes" lavora bene se la rubrica è scritta bene, ma una rubrica scritta male può produrre output che passa il grader ma fallisce nel mondo reale. Pertanto, è importante definire bene i criteri di successo e assicurarsi che la rubrica sia chiara e precisa.
La "multiagent orchestration" scala il lavoro ma scala anche i costi e la complessità di debug, quindi è importante usarla dove il task lo giustifica davvero, non come default.
In generale, le nuove primitive di Anthropic rappresentano un passo importante verso la creazione di agenti più autonomi e efficienti, ma richiedono anche una maggiore attenzione alla gestione dei bias e degli errori sistemici.
Conclusioni
Le nuove primitive di Anthropic rappresentano un passo importante verso la creazione di agenti più autonomi e efficienti. Tuttavia, è importante essere consapevoli dei limiti e delle sfide associate a queste tecnologie. Con una gestione attenta e una review umana sensata, gli agenti possono diventare strumenti potentissimi per aumentare la produttività e la qualità del lavoro.
Requisiti per l'adozione
Per adottare le nuove primitive di Anthropic, è importante avere una buona comprensione delle tecnologie sottostanti e dei requisiti di sistema. Inoltre, è importante definire bene i criteri di successo e assicurarsi che la rubrica sia chiara e precisa.
- Definire bene i criteri di successo
- Assicurarsi che la rubrica sia chiara e precisa
- Avere una buona comprensione delle tecnologie sottostanti
- Avere un sistema di gestione dei bias e degli errori sistemici
Con questi requisiti, le nuove primitive di Anthropic possono essere utilizzate per aumentare la produttività e la qualità del lavoro, e rappresentano un passo importante verso la creazione di agenti più autonomi e efficienti.