Il Modello Più Piccolo di Liquid AI, LFM2.5-230M, Supera Modelli 4X Più Grandi nell'estrazione dei Dati su Dispositivi Locali
Il modello LFM2.5-230M: Velocità e precisione per dispositivi locali e robot
Liquid AI ha annunciato il lancio del suo modello linguistico più piccolo finora, LFM2.5-230M, che ha un totale di 230 milioni di parametri. Questo modello è progettato per l’elaborazione su dispositivi locali e sfrutta l'architettura LFM2, che permette di ottenere velocità di inferenza elevata riducendo il consumo di memoria. Inoltre, è in grado di superare modelli molto più grandi, come Qwen3.5-0.8B e Gemma 3 1B, in compiti specifici come l’estratto di dati.
Funzionalità e prestazioni: Dall'elaborazione su smartphone alla robotica
Il modello LFM2.5-230M è progettato per eseguire workflow autonomi su smartphone, laptop e dispositivi IoT con limiti di memoria. La capacità di eseguire operazioni avanzate su Raspberry Pi 5 a una velocità di 42 token al secondo e su smartphone come Samsung Galaxy S25 Ultra con 213 token al secondo lo rendono uno strumento versatile. Inoltre, gestisce facilmente un contesto di 32K, rendendolo ideale per l’elaborazione di documenti lunghi o dati robotici in tempo reale.
- Su un Galaxy S25 Ultra riesce a decodificare 213 token al secondo
- Sul Raspberry Pi 5 la velocità scende a 42 token al secondo
- Sono supportati contesti di 32K token
- Prestazioni eccellenti rispetto a modelli più grandi come Gemma 3 1B IT e Granite 4.0-H-350M
Architettura di Liquid AI: LFM2
L'architettura LFM2 permette a Liquid AI di realizzare modelli leggeri e performanti senza compromessi in termini di memoria. Rispetto alle trasformazioni classiche, LFM2 utilizza una combinazione di convoluzioni a corto raggio e attenzione con gruppo di query. Questo sistema consente di gestire grandi contesti e dati in sequenza in modo efficiente. Il risultato è un modello che mantiene un impatto di memoria inferiore a 400 MB, nonostante le sue funzionalità avanzate.
Aplicazioni e vantaggi industriali
Le aziende tradizionalmente dipendono da sistemi ETL rigidi per elaborare i dati. Queste soluzioni sono però fragili e costose da mantenere. Liquid AI ha sviluppato LFM2.5-230M appositamente per la "AI ETL", dove l'intelligenza artificiale interpreta automaticamente le mappature e adatta gli schemi in continuo. Il modello può lavorare direttamente sui dispositivi locali per estrarre dati non strutturati — PDF, mail, form web — e trasformarli in JSON senza dover utilizzare API costose in cloud.
- Strumento ideale per l'automazione dell'elaborazione dati
- Riduzione dei costi e delle latenze di elaborazione rispetto a modelli come Claude Opus 4.6
- Supporto completo su dispositivi locali come PC, robotica e smartphone
Risultati benchmark e confronti con modelli di 3 miliardi di parametri
Nel 2026 si sta osservando una rivalità crescente tra modelli di bassa potenza e quelli con 3 miliardi di parametri. Tuttavia, LFM2.5-230M si distinguere per un fattore di 10 inferiore rispetto a modelli come il Gemini 4 di Google e VibeThinker-3B. Nonostante la sua ridotta complessità, LFM2.5-230M risulta superiore su BFCLv3 (43.26 vs. 39.58 di IBM’s Granite 4.0-350M), dimostrando di essere il modello più adatto per eseguire operazioni di strutturazione efficiente su hardware limitanti.
Che differenze esistono con modelle avanzati?
Contrariamente al VibeThinker-3B che eccelle in calcoli matematici, LFM2.5-230M è specializzato nei compiti di chiamata a strumenti. Ad esempio, quando riceve un comando come: "Fermati per 2 secondi, cammina in avanti a 1 metro al secondo per 3 metri, fai un ginocchio sollevato per 5 secondi e indietreggia a 0,5 m/sec per 3 metri", il modello lo traduce in un piano strutturato chiamando strumenti autonomamente pre-addestrati come il framework NVIDIA SONIC.
Utilizzo in robotica: Il modello LFM2.5-230M applicato al Unitree G1
La capacità del modello di gestire comandi complessi su un robot come il Unitree G1 dimostra il suo potenziale in ambito avanzato. Funzionando interamente a bordo tramite il modulo di elaborazione NVIDIA Jetson Orin, LFM2.5-230M interpreta comandi non strutturati e traduce in azioni robotiche precise. Questo rappresenta un uso innovativo del modello per attività automatizzate e multi-step.
- Esegue comandi multi-step automaticamente
- Supporta l’elaborazione a bordo di comandi complessi
- Dimostrata operatività su framework robotici come NVIDIA SONIC
Licenza LFM Open: Disponibilità per utenti e aziende
Il modello LFM2.5-230M è stato rilasciato con una licenza doppia: aperta per utenti individuali e piccole imprese con introiti annuali inferiori ai 10 milioni, e a pagamento per aziende più grandi. I modelli di base sono disponibili immediatamente su Hugging Face, e i formati compatibili includono GGUF (llama.cpp), MLX, vLLM, SGLang e ONNX, permettendone l'uso in diversi contesti industriali.
- Licenza gratuita per privati e piccole aziende
- I modelli sono disponibili su Hugging Face
- Supportato da molteplici framework di inferenza
- Accessibile tramite licenza open per uso individuale e non commerciale
I benefici principali per le aziende utilizzatrici
Le aziende che utilizzano LFM2.5-230M riescono a ridurre costi di elaborazione, aumentare la velocità e automatizzare l’elaborazione dati. Il modello è l’ideale per scenari in cui non è richiesta un’alta capacità di analisi matematica o creatività, ma si richiede un sistema affidabile per gestire dati e richiamare strumenti in modo strutturato. La sua capacità di operare autonomamente su dispositivi locali apre nuove