Kimi K2.7 Code: Il nuovo modello open-source cerca di competere con OpenAI e Anthropic con prezzi aggressivi

The Decoder (DE) 13 giugno 2026

Moonshot AI ha annunciato il rilascio di Kimi K2.7 Code, un modello open-source sviluppato specificatamente per gestire compiti di programmazione e workflow di lavoro con agenti. Costruito sul predecessore Kimi K2.6, il modello è disponibile gratuitamente su Hugging Face.

Kimi K2.7 Code si posiziona su un percorso intermedio: si distingue nell'efficienza rispetto agli scenari reali con agenti, ma mostra un certo ritardo nei benchmark puramente di codifica rispetto a modelli di grandi aziende come OpenAI e Anthropics. Moonshot AI consiglia comunque il modello K2.6 per compiti generali al di fuori della programmazione.

Il programma è utilizzato da Cursors, un venditore di strumenti di codifica, in forma modificata e ottimizzata.

Progressi rispetto al precedente, ma distacco dal settore leader

Secondo le valutazioni effettuate da Moonshot AI, K2.7 Code mostra notevoli miglioramenti nei benchmark. Su Kimi Code Bench v2, il punteggio è salito da 50.9 a 62.0. Sull’Program Bench, da 48.3 a 53.6, e su MLS Bench Lite da 26.7 a 35.1. I progressi si notano anche negli agenti: su MCP Atlas il punteggio è 76.0 rispetto agli 69.4 precedenti, e su MCPMark Verified arriva a 81.1 (prima 72.8).

Pur con miglioramenti significativi, K2.7 Code registra risultati inferiori a quelli di GPT-5.5 e Claude Opus 4.8 in molti test di programmazione. GPT-5.5 raggiunge punteggio 69.1 su Program Bench rispetto al 53.6 di K2.7 Code, e sull’indice Kimi Code Bench v2 i valori sono rispettivamente 69.0 e 62.0.

Il benchmark Program Bench rappresenta una sfida seria per gli agenti. È necessario ricostruire il comportamento di un programma partendo soltanto da un file eseguibile e una documentazione, senza accesso a codice sorgente, decompilatore o Internet.

Agenti forti ma con margine rispetto al best-in-class

Nonostante le sue prestazioni inferiori nei test di programmazione, K2.7 Code mostra eccellenza nei benchmark degli agenti. Il modello K2.7 Code raggiunge 81.1 punti su MCPMark Verified, superando Claude Opus 4.8 (76.4), pur rimanendo decisamente al di sotto di GPT-5.5 (che totalizza 92.9). Vale sempre la pena sottolineare che esiste una differenza tra i risultati delle prove e l’efficacia pratica.

Architettura multimodale a miliardi di parametri attivi

L’architettura di K2.7 Code, come dettagliato nella Modellkarte, utilizza una struttura Mixture-of-Experts (MoE) con un totale di un miliardo di miliardi di parametri, con 32 miliardi attivati per ogni token. Il modello dispone di 384 esperti, di cui in media vengono selezionati otto per ogni token.

La lunghezza del contesto raggiunge i 256.000 token e la capacità di K2.7 Code non si limita alla traduzione di testi ma include anche la gestione di immagini e video. Per gestire immagini, il modello utilizza un suo vision encoder chiamato MoonViT, con 400 milioni di parametri. L’architettura è la stessa di K2.5 e K2.6, quindi le configurazioni di distribuzione esistenti sono compatibili e riutilizzabili.

Maggiore efficienza e meno Overthinking

Moonshot ha concentrato i nuovi miglioramenti sulla capacità del modello di pensare in modo più efficiente. K2.7 Code utilizza circa il 30% in meno di token di thinking rispetto al predecessore, K2.6. Il modello attiva automaticamente la modalità di Thinking e il cosiddetto preserve_thinking, che mantiene i dati di ragionamento durante conversazioni successive. Questo si dimostra utile negli scenari di codifica basati sugli agenti.

La società ha annunciato anche la funzione 6x High-Speed Mode, attualmente in fase di lancio. K2.7 è gestibile tramite l’API Kimi, l’CLI Kimi Code e motori come vLLM e SGLang. I pesi del modello sono disponibili per download su Hugging Face e c’è una versione INT4 che rende il modello compatibile con hardware meno performanti o di costo inferiore.

Prezzi significativamente competitivi

I costi API per utilizzare K2.7 Code sono fissati a 0,95 dollari statunitensi per un milione di token di ingresso e 4,00 dollari per un milione di token di uscita. Negli input cachettati, il prezzo scende a 0,19 dollari statunitensi. K2.7 Code e il predecessore K2.6 condividono gli stessi prezzi API (0.95/4.00 dollari USA, cache 0.16 dollari).

Confrontati ai competitor, i costi di K2.7 Code sono estremamente vantaggiosi. GPT-5.5 richiede 5,00 dollari statunitensi per un milione di token in input e 30,00 dollari per un milione di token in uscita. La versione Opus 4.8 di Claude costa 5,00 dollari per input e 25,00 dollari per output, mentre il modello Fable 5 di Anthropics ha un costo estremamente superiore: 10,00 dollari per input e 50,00 dollari per un milione di token usciti.

La tabella sottostante mostra una panoramica chiara dei costi:

Kimi K2.7-Code: 0,95 dollari (Input/MTok) 4,00 dollari (Output/MTok)
Kimi K2.6: 0,95 dollari (Input/MTok) 4,00 dollari (Output/MTok)
Claude Opus 4.8: 5,00 dollari (Input/MTok) 25,00 dollari (Output/MTok)
GPT-5.5: 5,00 dollari (Input/MTok) 30,00 dollari (Output/MTok)
Anthropics Claude Fable 5: 10,00 dollari (Input/MTok) 50,00 dollari (Output/MTok)

A causa del prezzo basso, K2.7 Code può essere utilizzato frequentemente con lo stesso budget di un modello leader. Questo fa sì che la domanda non sia se il modello ha la prestazione migliore, ma se riesce a soddisfare le proprie esigenze. La decisione finale dovrà basarsi su test specifici.

Licenza MIT con clausola per grandi clienti

K2.7 Code è rilasciato sotto una

Leggi l'articolo originale →

← Torna alle news