L'evoluzione dell'SDK per agenti di OpenAI: nuove funzionalità e sicurezza
In un passo significativo verso la democratizzazione e l'ottimizzazione dello sviluppo di agenti intelligenti, OpenAI ha annunciato l'introduzione di nuove e potenti capacità nell'Agents SDK. Questo aggiornamento mira a fornire agli sviluppatori un'infrastruttura standardizzata che sia non solo facile da utilizzare, ma anche correttamente costruita per sfruttare al meglio i modelli di OpenAI. Le innovazioni principali includono un *harness* nativo per i modelli, che consente agli agenti di operare efficacemente su file e strumenti all'interno di un computer, e un'esecuzione *sandbox* nativa, garantendo che tutto il lavoro venga svolto in un ambiente sicuro e controllato.
La necessità di queste funzionalità è evidente per gli sviluppatori che mirano a costruire agenti realmente utili. Non basta avere a disposizione i migliori modelli; è fondamentale disporre di sistemi che supportino il modo in cui gli agenti ispezionano file, eseguono comandi, scrivono codice e mantengono la continuità operativa attraverso molteplici passaggi. Per esempio, uno sviluppatore può ora dotare un agente di uno spazio di lavoro controllato, istruzioni esplicite e tutti gli strumenti necessari per esaminare prove o elaborare dati complessi.
Superare le limitazioni dei sistemi attuali
I sistemi attuali per la costruzione di agenti presentano spesso dei compromessi significativi quando i team passano dai prototipi alla produzione. I framework agnostici rispetto al modello, pur offrendo flessibilità, non sempre riescono a utilizzare appieno le capacità dei modelli più avanzati. Gli SDK forniti dai creatori dei modelli, sebbene più vicini al modello stesso, possono spesso mancare di una visibilità sufficiente sull'harness sottostante. Le API per agenti gestiti, d'altra parte, possono semplificare il deployment, ma tendono a vincolare gli ambienti in cui gli agenti possono essere eseguiti e il modo in cui accedono ai dati sensibili. OpenAI, ascoltando anche le esigenze dei clienti che hanno testato il nuovo SDK, ha risposto a queste sfide con soluzioni mirate.
Il nuovo harness dell'Agents SDK: potenza e precisione
Con l'ultima release, l'harness dell'Agents SDK diventa significativamente più capace per gli agenti che interagiscono con documenti, file e sistemi. Ora integra una memoria configurabile, un'orchestrazione consapevole della sandbox, strumenti di filesystem simili a Codex e integrazioni standardizzate con primitive che stanno diventando comuni nei sistemi di agenti più avanzati. Questo harness è stato progettato per sbloccare un maggiore potenziale dei modelli all'avanguardia, allineando l'esecuzione con il modo in cui questi modelli funzionano al meglio. Tale allineamento mantiene gli agenti più vicini al loro modello operativo naturale, migliorando notevolmente l'affidabilità e le prestazioni su compiti complessi, specialmente quando il lavoro è prolungato o coordinato attraverso un set diversificato di strumenti e sistemi.
OpenAI riconosce che ogni prodotto è unico e raramente si adatta perfettamente a uno stampo predefinito. Per questo motivo, l'Agents SDK è stato progettato per supportare questa diversità. Gli sviluppatori ottengono un harness che è sia "chiavi in mano" che flessibile, rendendolo facile da adattare al proprio stack specifico, includendo l'uso degli strumenti, la gestione della memoria e l'ambiente sandbox.
Esecuzione sandbox nativa per sicurezza e controllo
L'aggiornato Agents SDK supporta l'esecuzione sandbox nativamente, consentendo agli agenti di operare in ambienti informatici controllati con i file, gli strumenti e le dipendenze necessarie per un determinato compito. Molti agenti utili richiedono uno spazio di lavoro dove possano leggere e scrivere file, installare dipendenze, eseguire codice e utilizzare strumenti in modo sicuro. Il supporto nativo della sandbox offre agli sviluppatori questo livello di esecuzione pronto all'uso, evitando loro la necessità di assemblarlo da soli.
Gli sviluppatori hanno la flessibilità di utilizzare il proprio ambiente sandbox o di sfruttare il supporto integrato per diversi provider, tra cui Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop e Vercel. Questa varietà di opzioni assicura che gli sviluppatori possano scegliere l'ambiente più adatto alle loro esigenze specifiche.
L'astrazione Manifest: ambienti portatili e coerenti
Per rendere questi ambienti portatili tra i diversi provider, l'SDK introduce anche un'astrazione Manifest. Questa astrazione permette di descrivere lo spazio di lavoro dell'agente in modo standardizzato. Gli sviluppatori possono montare file locali, definire directory di output e importare dati da provider di storage come AWS S3, Google Cloud Storage, Azure Blob Storage e Cloudflare R2. Ciò offre agli sviluppatori un modo coerente per modellare l'ambiente dell'agente, dalla prototipazione locale al deployment in produzione. Fornisce inoltre al modello uno spazio di lavoro prevedibile: dove trovare gli input, dove scrivere gli output e come mantenere il lavoro organizzato durante un compito di lunga durata.
Sicurezza, durabilità e scalabilità avanzate
I sistemi di agenti devono essere progettati assumendo tentativi di prompt injection ed esfiltrazione dati. La separazione tra harness e computazione aiuta a mantenere le credenziali al di fuori degli ambienti in cui viene eseguito il codice generato dal modello. Questa architettura avanzata non solo rafforza la sicurezza ma abilita anche l'esecuzione durevole. Quando lo stato dell'agente è esternalizzato, la perdita di un contenitore sandbox non significa la perdita dell'esecuzione. Con funzionalità integrate di snapshotting e reidratazione, l'Agents SDK può ripristinare lo stato dell'agente in un nuovo contenitore e continuare dall'ultimo checkpoint se l'ambiente originale fallisce o scade.
Infine, queste nuove capacità rendono gli agenti più scalabili. Le esecuzioni degli agenti possono utilizzare una o più sandbox, invocarle solo quando necessario, instradare sotto-agenti ad ambienti isolati e parallelizzare il lavoro tra i contenitori per un'esecuzione più rapida ed efficiente. Questa scalabilità è cruciale per le applicazioni che richiedono l'elaborazione di grandi volumi di dati o l'esecuzione simultanea di molteplici compiti.
Disponibilità e roadmap futura
Le nuove capacità dell'Agents SDK sono ora generalmente disponibili per tutti i clienti tramite l'API e utilizzano il prezzo API standard, basato sui token e sull'uso degli strumenti. OpenAI si impegna a continuare a sviluppare l'Agents SDK, espandendo ciò che gli sviluppatori possono costruire con esso, rendendo più facile portare agenti più capaci in produzione con meno infrastrutture personalizzate, pur preservando la flessibilità e il controllo di cui gli sviluppatori hanno bisogno per adattare gli agenti ai propri ambienti.
Le nuove funzionalità di harness e sandbox saranno lanciate inizialmente in Python, con il supporto per TypeScript previsto per una futura release. OpenAI sta anche lavorando per portare ulteriori capacità degli agenti, inclusa la modalità codice e i sotto-agenti, sia a Python che a TypeScript. Inoltre, l'azienda mira a contribuire a riunire l'ecosistema più ampio degli agenti nel tempo, con il supporto per un maggior numero di provider sandbox, più integrazioni e più modi per gli sviluppatori di collegare l'SDK agli strumenti e ai sistemi che già utilizzano, promuovendo così un'innovazione collaborativa e diffusa nel campo degli agenti intelligenti.