Lo stato dell'open source su Hugging Face: Primavera 2026
Lo stato dell'open source su Hugging Face: Primavera 2026
Questo rapporto approfondisce come il panorama dell'IA open source si sia trasformato nell'ultimo anno, analizzando i cambiamenti in termini di concorrenza, geografia, tendenze tecniche e l'emergere di nuove comunità. La nostra analisi si concentra principalmente sull'attività della comunità di Hugging Face, utilizzando diverse metriche per offrire una visione olistica dell'ecosistema.
Il presente studio si basa su un'analisi precedente condotta a metà del 2025, che esaminava cosa stesse costruendo la comunità di Hugging Face. Per ulteriori prospettive sull'ecosistema open source, sia all'interno che all'esterno di Hugging Face, raccomandiamo di consultare i contributi della Data Provenance Initiative, Interconnects, OpenRouter, a16z, MIT e la Linux Foundation. Dato che l'ecosistema di Hugging Face è distribuito, le analisi presentate sono una combinazione del lavoro di Hugging Face e dei membri della comunità, ognuno dei quali è debitamente accreditato.
Crescita esplosiva dell'ecosistema dell'IA open source
L'attività nell'ecosistema dell'IA open source è cresciuta rapidamente, con il numero di utenti, modelli e repository di dataset che sono quasi raddoppiati. Nel 2025, Hugging Face ha raggiunto i 13 milioni di utenti, oltre 2 milioni di modelli pubblici e più di 500.000 dataset pubblici. Questa crescita non è solo un segno di maggiore interesse per l'open source; riflette un cambiamento verso una partecipazione più attiva, con gli utenti che creano sempre più artefatti derivati come modelli ottimizzati (fine-tuned), adattatori, benchmark e applicazioni, anziché limitarsi a consumare sistemi pre-addestrati.
(Dati da Hugging Face | I due milioni di modelli e oltre di Hugging Face: Grafico e storia di AI World)
Concentrazione e nicchie specializzate
Nonostante la crescita massiccia, l'ecosistema rimane altamente concentrato. Circa la metà dei modelli su Hugging Face ha meno di 200 download totali, e i 200 modelli più scaricati, ovvero lo 0,01% del totale, rappresentano il 49,6% di tutti i download.
Tuttavia, comunità specializzate si formano attorno a domini, lingue o aree problematiche specifiche, e spesso mostrano un impegno e un riutilizzo costanti anche quando i loro conteggi complessivi di download sono modesti. L'IA open source è meglio compresa come una collezione di sotto-ecosistemi sovrapposti piuttosto che come un unico mercato uniforme.
Aziende e Big Tech abbracciano l'open source
Sempre più aziende, sia grandi che piccole, stanno costruendo sull'open source. Oltre il 30% delle aziende Fortune 500 mantiene ora account verificati su Hugging Face. Le startup utilizzano frequentemente modelli aperti come componenti predefiniti: Thinking Machines ha costruito le opzioni del suo modello Tinker interamente su pesi aperti, mentre IDE popolari come VSCode e Cursors supportano sia modelli aperti che chiusi. Aziende americane consolidate come Airbnb hanno aumentato il loro impegno con l'ecosistema aperto, e Hugging Face ha registrato un aumento delle aziende "legacy" che hanno aggiornato le loro sottoscrizioni organizzative nel corso del 2025.
Le aziende Big Tech stanno frequentemente creando nuovi repository sull'Hugging Face Hub; visualizzato fianco a fianco, il forte aumento della crescita dei repository mostra un investimento nel tempo. NVIDIA è emersa come il più forte contributore.
(Dati da Hugging Face | Le Big Tech sono totalmente immerse nell'IA open source: Grafico e storia di AI World)
Il valore economico dell'open source nell'IA
Studi sul software aperto in senso più ampio suggeriscono che il valore a valle creato dagli artefatti aperti supera di gran lunga il costo della loro produzione. Dinamiche simili stanno emergendo nell'IA, dove i modelli aperti vengono riutilizzati, adattati e specializzati in migliaia di applicazioni a valle. Le organizzazioni che si affidano esclusivamente a sistemi chiusi spesso incorrono in costi più elevati e affrontano una ridotta flessibilità nella distribuzione e personalizzazione.
Cambiamento nel panorama geografico
I download totali negli ultimi quattro anni mostrano regioni chiaramente leader nella popolarità dei modelli. Gli Stati Uniti e la Cina sono stati storicamente i principali contributori, con Regno Unito, Germania e Francia secondari in popolarità. I modelli sviluppati da singoli utenti o organizzazioni distribuite senza una chiara base geografica rappresentano circa la metà di tutti i download della piattaforma.
(Dati da Hugging Face | Grafico e ricerca di Longpre et al. “Economies of Open Intelligence: Tracing Power & Participation in the Model Ecosystem”)
La Cina supera gli Stati Uniti nei download
La composizione geografica dell'ecosistema open source è cambiata radicalmente. I dati di Hugging Face mostrano che la Cina ha superato gli Stati Uniti nei download mensili e complessivi. Nell'ultimo anno, i modelli cinesi hanno rapidamente rappresentato la pluralità, ovvero il 41% dei download.
L'ascesa degli sviluppatori indipendenti
La quota dell'industria nello sviluppo complessivo è diminuita da circa il 70% prima del 2022 a circa il 37% nel 2025. Nel frattempo, gli sviluppatori indipendenti o non affiliati sono aumentati dal 17% al 39% di tutti i download nello stesso periodo, arrivando a volte a rappresentare più della metà dell'utilizzo totale. Individui e piccoli collettivi si sono concentrati sulla quantizzazione, adattamento e ridistribuzione di modelli di base. Questi intermediari ora guidano una porzione significativa di ciò che gli utenti tipici possono eseguire e di come le innovazioni si diffondono nell'ecosistema.
(Dati da Hugging Face | Grafico e ricerca di Longpre et al. “Economies of Open Intelligence: Tracing Power & Participation in the Model Ecosystem”)
Diversità dei contributi regionali
Diverse regioni contribuiscono in modi diversi. Gli Stati Uniti e l'Europa occidentale hanno storicamente dominato attraverso grandi laboratori industriali (Google, Meta, OpenAI, Stability AI), mentre la Cina ha assunto una leadership crescente sia nelle release che nell'adozione. Francia, Germania e Regno Unito continuano a contribuire tramite organizzazioni di ricerca, iniziative nazionali di IA e famiglie di modelli specializzati. Gli ecosistemi che supportano una varietà di contributori e forme organizzative tendono a produrre artefatti più ampiamente adottati.
I modelli popolari delle startup sono stati più diffusi. I paesi competitivi sono stati la Francia e la Corea del Sud. In particolare, la quarta entità più popolare per lo sviluppo di nuovi modelli di tendenza sono stati i singoli utenti, non le organizzazioni. Creare modelli competitivi a livello utente è più accessibile che mai.
Il ruolo dominante della Cina nei modelli di tendenza
Tra i modelli di nuova creazione nel 2025, la maggior parte dei modelli di tendenza sono stati sviluppati in Cina o derivati da un modello sviluppato in Cina. I modelli più popolari sono stati sviluppati da grandi organizzazioni, prevalentemente dagli Stati Uniti e dalla Cina. Per saperne di più sull'ecosistema cinese dell'IA, si consiglia la nostra serie in tre parti che riflette sui cambiamenti in un anno dal "DeepSeek Moment": una sulle modifiche strategiche, una sulle modifiche architetturali e una sulle organizzazioni e il futuro.
Nel 2025, l'ecosistema IA cinese si è orientato pesantemente verso l'open source, a seguito del rilascio virale del modello R1 di DeepSeek a gennaio. Il numero di organizzazioni cinesi competitive che rilasciano modelli e il numero di repository su Hugging Face sono saliti alle stelle. Baidu è passata da zero rilasci sull'Hub nel 2024 a oltre 100 nel 2025. ByteDance e Tencent hanno ciascuna aumentato i rilasci di otto o nove volte. Organizzazioni che in precedenza avevano favorito approcci chiusi, tra cui Baidu e MiniMax, si sono spostate decisamente verso i rilasci aperti.
Un numero simile di organizzazioni popolari statunitensi ha contribuito costantemente con un volume maggiore di repository nel tempo. Meta e la sua ex organizzazione di ricerca Facebook rappresentano una proporzione significativa di rilasci aperti, così come Google in misura minore.
Affiancate, la forte traiettoria ascendente della crescita dei repository tra le popolari organizzazioni cinesi emerge come una differenza strategica chiave.
Sovranità AI e iniziative nazionali
L'IA open source è sempre più legata a questioni di sovranità. I modelli a pesi aperti consentono a governi e istituzioni pubbliche di ottimizzare i sistemi su dati locali nell'ambito di quadri giuridici nazionali. I modelli che possono essere implementati su hardware domestico riducono la dipendenza da infrastrutture cloud controllate da entità straniere. La trasparenza sull'architettura del modello, i processi di addestramento e la valutazione supporta la revisione normativa e la responsabilità pubblica. Maggiori informazioni sull'approccio open source alla sovranità sono disponibili qui.
A livello nazionale, i governi stanno agendo. L'iniziativa nazionale per l'IA sovrana della Corea del Sud, lanciata a metà del 2025, ha nominato campioni nazionali come LG AI Research, SK Telecom, Naver Cloud, NC AI e Upstage per produrre modelli domestici competitivi. Tre modelli dalla Corea del Sud sono stati contemporaneamente di tendenza sull'Hugging Face Hub nel febbraio 2026. A marzo 2026, la Corea del Sud e la startup statunitense Reflection AI hanno annunciato una partnership per un data center, portando anche modelli all'avanguardia a pesi aperti in Corea del Sud.
L'iniziativa Swiss AI della Svizzera e vari progetti finanziati dall'UE riflettono priorità simili. Il principio del Regno Unito di "denaro pubblico, codice pubblico" sottolinea ulteriormente l'importanza crescente delle soluzioni open source per l'autonomia digitale e la sicurezza nazionale.