Home Fondamenti Storia dell'AI Reti Neurali Backpropagation Architetture Token Modelli AI Case Studies Tecniche RAG RAG Avanzato GraphRAG MCP Orchestrazione LangChain LangGraph Prompt Engineering Usare l'AI ChipsBot News

Il Modello Più Piccolo di Liquid AI, LFM2.5-230M, Supera Modelli 4X Più Grandi nell'estrazione dei Dati su Dispositivi Locali

VentureBeat AI 27 giugno 2026

Il modello LFM2.5-230M: Velocità e precisione per dispositivi locali e robot

Liquid AI ha annunciato il lancio del suo modello linguistico più piccolo finora, LFM2.5-230M, che ha un totale di 230 milioni di parametri. Questo modello è progettato per l’elaborazione su dispositivi locali e sfrutta l'architettura LFM2, che permette di ottenere velocità di inferenza elevata riducendo il consumo di memoria. Inoltre, è in grado di superare modelli molto più grandi, come Qwen3.5-0.8B e Gemma 3 1B, in compiti specifici come l’estratto di dati.

Funzionalità e prestazioni: Dall'elaborazione su smartphone alla robotica

Il modello LFM2.5-230M è progettato per eseguire workflow autonomi su smartphone, laptop e dispositivi IoT con limiti di memoria. La capacità di eseguire operazioni avanzate su Raspberry Pi 5 a una velocità di 42 token al secondo e su smartphone come Samsung Galaxy S25 Ultra con 213 token al secondo lo rendono uno strumento versatile. Inoltre, gestisce facilmente un contesto di 32K, rendendolo ideale per l’elaborazione di documenti lunghi o dati robotici in tempo reale.

    • Su un Galaxy S25 Ultra riesce a decodificare 213 token al secondo
    • Sul Raspberry Pi 5 la velocità scende a 42 token al secondo
    • Sono supportati contesti di 32K token
    • Prestazioni eccellenti rispetto a modelli più grandi come Gemma 3 1B IT e Granite 4.0-H-350M

Architettura di Liquid AI: LFM2

L'architettura LFM2 permette a Liquid AI di realizzare modelli leggeri e performanti senza compromessi in termini di memoria. Rispetto alle trasformazioni classiche, LFM2 utilizza una combinazione di convoluzioni a corto raggio e attenzione con gruppo di query. Questo sistema consente di gestire grandi contesti e dati in sequenza in modo efficiente. Il risultato è un modello che mantiene un impatto di memoria inferiore a 400 MB, nonostante le sue funzionalità avanzate.

Aplicazioni e vantaggi industriali

Le aziende tradizionalmente dipendono da sistemi ETL rigidi per elaborare i dati. Queste soluzioni sono però fragili e costose da mantenere. Liquid AI ha sviluppato LFM2.5-230M appositamente per la "AI ETL", dove l'intelligenza artificiale interpreta automaticamente le mappature e adatta gli schemi in continuo. Il modello può lavorare direttamente sui dispositivi locali per estrarre dati non strutturati — PDF, mail, form web — e trasformarli in JSON senza dover utilizzare API costose in cloud.

    • Strumento ideale per l'automazione dell'elaborazione dati
    • Riduzione dei costi e delle latenze di elaborazione rispetto a modelli come Claude Opus 4.6
    • Supporto completo su dispositivi locali come PC, robotica e smartphone

Risultati benchmark e confronti con modelli di 3 miliardi di parametri

Nel 2026 si sta osservando una rivalità crescente tra modelli di bassa potenza e quelli con 3 miliardi di parametri. Tuttavia, LFM2.5-230M si distinguere per un fattore di 10 inferiore rispetto a modelli come il Gemini 4 di Google e VibeThinker-3B. Nonostante la sua ridotta complessità, LFM2.5-230M risulta superiore su BFCLv3 (43.26 vs. 39.58 di IBM’s Granite 4.0-350M), dimostrando di essere il modello più adatto per eseguire operazioni di strutturazione efficiente su hardware limitanti.

Che differenze esistono con modelle avanzati?

Contrariamente al VibeThinker-3B che eccelle in calcoli matematici, LFM2.5-230M è specializzato nei compiti di chiamata a strumenti. Ad esempio, quando riceve un comando come: "Fermati per 2 secondi, cammina in avanti a 1 metro al secondo per 3 metri, fai un ginocchio sollevato per 5 secondi e indietreggia a 0,5 m/sec per 3 metri", il modello lo traduce in un piano strutturato chiamando strumenti autonomamente pre-addestrati come il framework NVIDIA SONIC.

Utilizzo in robotica: Il modello LFM2.5-230M applicato al Unitree G1

La capacità del modello di gestire comandi complessi su un robot come il Unitree G1 dimostra il suo potenziale in ambito avanzato. Funzionando interamente a bordo tramite il modulo di elaborazione NVIDIA Jetson Orin, LFM2.5-230M interpreta comandi non strutturati e traduce in azioni robotiche precise. Questo rappresenta un uso innovativo del modello per attività automatizzate e multi-step.

    • Esegue comandi multi-step automaticamente
    • Supporta l’elaborazione a bordo di comandi complessi
    • Dimostrata operatività su framework robotici come NVIDIA SONIC

Licenza LFM Open: Disponibilità per utenti e aziende

Il modello LFM2.5-230M è stato rilasciato con una licenza doppia: aperta per utenti individuali e piccole imprese con introiti annuali inferiori ai 10 milioni, e a pagamento per aziende più grandi. I modelli di base sono disponibili immediatamente su Hugging Face, e i formati compatibili includono GGUF (llama.cpp), MLX, vLLM, SGLang e ONNX, permettendone l'uso in diversi contesti industriali.

    • Licenza gratuita per privati e piccole aziende
    • I modelli sono disponibili su Hugging Face
    • Supportato da molteplici framework di inferenza
    • Accessibile tramite licenza open per uso individuale e non commerciale

I benefici principali per le aziende utilizzatrici

Le aziende che utilizzano LFM2.5-230M riescono a ridurre costi di elaborazione, aumentare la velocità e automatizzare l’elaborazione dati. Il modello è l’ideale per scenari in cui non è richiesta un’alta capacità di analisi matematica o creatività, ma si richiede un sistema affidabile per gestire dati e richiamare strumenti in modo strutturato. La sua capacità di operare autonomamente su dispositivi locali apre nuove

Leggi l'articolo originale →
← Torna alle news