Sviluppatori possono ora debuggare e valutare agenti AI in locale con il tool open source Workshop di Raindrop
Raindrop AI, startup attiva in ambito di osservabilità del software, ha annunciato oggi l'uscita di Workshop, uno strumento open source MIT licensed pensato espressamente per gli sviluppatori dell’area dei sistemi di agenti artificiali intelligenti.
Servizio di debug e valutazione locale
Il tool funziona come un demone locale e una UI che fornisce in tempo reale l’indicazione della traccia di ogni token, chiamata di strumento e decisione al momento in cui avviene. Visitando un localhost hostato tipicamente su localhost:5899, gli sviluppatori hanno a disposizione l’intera attività dell'agente, inclusi eventuali errori e problemi che possono emergere durante l'esecuzione.
Tutta l’informazione viene conservata in un unico file di database (.db), che occupa pochi megabyte, come affermato in un messaggio X ricevuto da VentureBeat da Ben Hylak, co-fondatore e CTO di Raindrop, ex ingegnere di Apple e SpaceX. Il sistema di tracciamento in tempo reale elimina i problemi di latenza legati ai metodi tradizionali e affronta le preoccupazioni di privacy relative al trasferimento delle tracce locali su server esterni.
Il tool è compatibile con macOS, Linux e Windows. L’installazione avviene attraverso un comando shell adatto per bash, zsh o fish che semplifica l'installazione manuale del software. Gli sviluppatori che preferiscono costruire il tool da zero potranno effettuare il download del repositorio su GitHub, utilizzando il runtime Bun.
Ciclo di auto-riparazione
Un elemento distintivo di Workshop è il cosiddetto "ciclo di auto-riparazione" (self-healing eval loop), che permette ad agenti specializzati, come Claude Code, di leggere le tracce, generare analisi valutative del codice e correggere autonomamente eventuali difetti.
Rappresentiamo tale ciclo con un esempio pratico: se un agente assistente veterinario non pone le giuste domande di follow-up, Workshop registra l’intera sequenza di eventi. Successivamente, Claude Code legge questa traccia, redige una valutazione mirata, rileva l’errore logico negli script o nel prompt e rilancia l’agente finché tutti gli assert non vengono passati.
Compatibilità e integrazione
Workshop è compatibile con una vasta gamma di linguaggi di programmazione come TypeScript, Python, Rust e Go. Inoltre, è integrato con strumenti SDK e framework popolari come Vercel AI SDK, OpenAI, Anthropic, LangChain, LlamaIndex, e CrewAI.
- Vercel AI SDK
- OpenAI
- Anthropic
- LangChain
- LlamaIndex
- CrewAI
L'integrazione con agenti di codifica come Claude Code, Cursor, Devin e OpenCode ne rafforza ulteriormente il valore per gli sviluppatori.
Licenza e impatto sulla comunità open source
Workshop viene rilasciato sotto licenza MIT, garantendo l'uso gratuito per tutti i tipi di utenti e permettendo una collaborazione aperta da parte della comunità. Questo tipo di licenza promuove anche la data sovereignty (sovraniità sui dati), un aspetto cruciale per chi opera in contesti aziendali.
Hylak ha sottolineato in una sua dichiarazione su X che lo scopo del tool era di fornire un approccio "logico" al debugging di agenti, rinnovando completamente il modo in cui la sua squadra e gli utenti iniziali sviluppano e ottimizzano i sistemi autonomi grazie a questo strumento.
Festività della lancio
Per festeggiare l'uscita ufficiale del tool, Raindrop ha distribuito un’edizione limitata di merch fisico agli utenti che hanno scaricato e installato il Workshop e hanno eseguito un comando specifico "drip" (goccia).