sakana ai lancia sakana fugu, un modello di orchestrazione per compiti su una serie di modelli llm avanzati
Oggi Sakana AI lancia Sakana Fugu
Oggi, Sakana AI ha lanciato Sakana Fugu. Si tratta di un sistema di orchestrazione multi-agente che si comporta come un unico modello. Si invia una richiesta a un unico endpoint. Fugu decide autonomamente come gestirla internamente. Risolve direttamente un compito quando è sufficiente. Altrimenti, coordina un team di modelli esperti necessario.
La complessità di un sistema multi-agente non giunge mai al codice del tuo sistema. Il sistema non richiede codifica fissa né flussi di lavoro. Fugu impara come coordinare agenti. Decidi quando delegare e come gli agenti debbono comunicare. Unisce poi i loro lavori in una singola risposta.
Che cos'è Sakana Fugu
Fugu è esso stesso un modello linguistico. E' addestrato per chiamare altri modelli linguistici in una piscina di agenti. Questa piscina include istanze di sé stesso, richiamandosi ricorsivamente. Fugu gestisce la selezione del modello, la delega, la verifica e la sintesi internamente.
Non ci sono ruoli né workflow rigidi. Fugu impara a coordinare. Decide quando delegare e come gli agenti debbono comunicare. Combinando il lavoro, genera una singola risposta. Dall'esterno, si chiama come un singolo modello. Internamente, un sistema coordinato di esperti esegue il lavoro.
Sakana AI presenta questa tecnologia come antidoto al rischio di dipendenza da un unico fornitore. Se un fornitore limita l'accesso, Fugu devia il problema. La motivazione della squadra di ricerca si basa sui recenti controlli d'importazione ai modelli Fable e Mythos di Anthropic.
Due modelli, un'unica API
Fugu è disponibile in due varianti attraverso un'unica API compatibile con OpenAI:
- Fugu bilancia una forte prestazione con bassa latenza.
- Fugu Ultra si adatta al massimo di qualità rispondendo a problemi complessi.
Fugu è il modello predefinito per attività quotidiane, code review e chatbot. Sopporta strumenti come Codex e permette agli utenti di escluderne alcuni agenti specifici per questioni di dati, privacy e conformità.
Fugu Ultra coordina una serie più profonda di agenti esperti. Questo pool è fisso, pertanto l'opt-out non è possibile. Il modello attuale è fugu-ultra-20260615.
I Raggiungimenti di Fugu
Fugu si basa su due studi presentati all'ICLR 2026, Trinity e Conductor, che esploravano l'orchestrazione appresa:
- Trinity utilizza un coordinatore leggero adatto a molteplici turni. Assegna ruoli adattativi di Thinker, Worker, Verifier per delegare il lavoro.
- Conductor è addestrato con il machine learning. Scopre strategie di coordinamento in linguaggio naturale, insieme a prompt focalizzati per un pool eterogeneo di modelli linguistici.
Insieme, dimostrano che i sistemi possono imparare a coordinare agenti per compito. Ciò sostituisce i workflow disegnati a mano.
I Benchmark
Sakana AI confronta Fugu con i modelli fondamentali che orchestra. I benchmark si basano su dati comunicati da ciascun fornitori.
Il SWE Bench Pro utilizza il mini-swe-agent come supporto strutturale:
- SWE Bench Pro: 73.7
- TerminalBench 2.1: 82.1
- LiveCodeBench: 93.2
- LiveCodeBench Pro: 90.8
- Exam: 50.0
- CharXiv Reasoning: 86.6 e 85.1
- GPQA-D: 95.5
- SciCode: 58.7
- τ³ Banking: 20.6
- Long Context Reasoning: 73.3
- MRCRv2: 93.6 e 94.8
Fugu risulta migliore in dieci delle undici righe. Fugu Ultra ha il primo posto in quattro benchmark di coding, in CharXiv Reasoning, e in Exam. Si aggiudica solo l’attuale benchmark MRCRv2. I modelli non sono inclusi nella piscina di Fugu, poiché non disponibili al pubblico.
Usi del modello
Sakana AI ha testato Fugu in un beta con circa 500 utenti iniziali. Gli esempi pubblicati riguardano tipicamente attività complesse e a passi multipli.
- AutoResearch: Un agente ha migliorato autonomamente la ricetta di addestramento di un piccolo modello GPT. Condotta 123 esperimenti in circa 14 ore su un'unica GPU H100. Fugu Ultra ha raggiunto la media di addestramento di 0.9774, con un singolo tentativo di 0.9748.
- Altri esempi inclusi: Cubi risolti, Lettura classica giapponese, Scacchi ciechi, Trading online.
Minimo esempio API
Utilizza un'API compatibile OpenAI, quindi non richiede spostamento dell'SDK. Configura un client esistente puntato su uno endpoint fornito da Sakana:
from openai import OpenAI
client = OpenAI(
base_url="https://<your-fugu-endpoint>/v1",
apikey="YOURSAKANAAPIKEY",
)
resp = client.chat.completions.create(
model="fugu-ultra-20260615",
messages=[
{"role": "user",
"content": "Reproduce the method in this paper and report the gap.",
],
)
Reazioni della Comunità
Un'indagine manuale su X, Hacker News ha rivisto una dozzina di commenti. Le reazioni sono state miste: tre sostenitive, sei scettiche e tre critiche. Il dubbio principale riguarda il fatto che Sakana AI non sembri offrire una novità sostanziale.
Altro
Guarda la pagina del prodotto e i dettagli tecnici. Segui Sakana su Twitter e unisciti al nostro subreddit dedicato ai ML. C'è anche la possibilità di seguire il canale Telegram.
Se des