Home Fondamenti Storia dell'AI Reti Neurali Backpropagation Architetture Token Modelli AI Case Studies Tecniche RAG RAG Avanzato GraphRAG MCP Orchestrazione LangChain LangGraph Prompt Engineering Usare l'AI ChipsBot News

Build 2026: Microsoft supera Google nella generazione di immagini ma cerca di recuperare in termini di ragionamento

The Decoder (EN) 3 giugno 2026

Nella conferenza Build 2026, Microsoft ha svelato sette nuovi modelli di intelligenza artificiale realizzati internamente, inclusi il primo modello di ragionamento e un metodo innovativo di personalizzazione chiamato “Frontier Tuning”. Il modello principale, chiamato MAI-Thinking-1, è il primo in grado di supportare istruzioni complesse, lunghe sequenze di testo e generazione di codice. Il modello è stato addestrato sulla base di dati puliti, evitando di utilizzare modelli esterni, un aspetto che indica un atteggiamento critico nei confronti delle pratiche di altri laboratori.

MAI-Thinking-1 e i suoi confronti

Microsoft descrive MAI-Thinking-1 come un modello con 1 trilione di parametri e 35 miliardi di parametri attivi, con una finestra di contesto di 128.000 token. Il modello mostra risultati paragonabili con Deepseek V3.2 e in una valutazione interna, è stato preferito al modello Anthropic Sonnet 4.6. La performance di ragionamento, però, si colloca intorno al livello di Deepseek V3.2, nonostante le alte aspettative.

Una famiglia di modelli diversificati

Oltre a MAI-Thinking-1, Microsoft ha presentato una famiglia di modelli dedicati a diversi compiti:

    • MAI-Code-1-Flash: un modello per la scrittura di codice con 5 miliardi di parametri, paragonabile ad Anthropic Haiku ma a costi inferiori.
    • MAI-Image-2.5: un modello di generazione di immagini che ottiene il secondo posto nel benchmark Arena-Score, dietro a GPT-Image-2, ma davanti ai modelli Nano-Banana di Google.
    • MAI-Transcribe-1.5: un modello per la trascrizione, veloce e che supporta 43 lingue.
    • MAI-Voice-2: un sistema per la sintesi vocale in 15 lingue, in grado di clonare la voce da campioni brevi.

I modelli condividono una base comune di dati, infrastruttura ed endpoint per valutazione. Sono disponibili tramite Azure Foundry, e per la prima volta, gli sviluppatori possono personalizzare i pesi.

Frontier Tuning: Personalizzazione economica per le aziende

Microsoft ha introdotto “Frontier Tuning”, una tecnica avanzata per adattare i modelli di AI alle specifiche esigenze aziendali utilizzando l’apprendimento con rinforzo. L’azienda afferma che i dati di lavoro lasciati dagli agenti all’interno di un’organizzazione sono i dati più rilevanti per l’addestramento. In una prova interna, un modello MAI personalizzato per Excel ha ottenuto prestazioni paragonabili a quelle del GPT-5.4, ma con un costo fino a dieci volte inferiore.

Nella consulenza aziendale, un modello personalizzato ha mostrato i tassi di successo più alti tra tutti i sistemi testati da McKinsey, con costi ridotti al dieci per cento di quelli standard.

Scout: L’agente sempre attivo

Microsoft ha presentato “Scout”, il primo agente sempre attivo, integrato in strumenti come Teams, Outlook, OneDrive e SharePoint. Scout è progettato per gestire automaticamente compiti come la coordinazione di riunioni internazionali, la creazione di documenti di supporto, la programmazione di consegne e la segnalazione di decisioni bloccate.

Grazie al componente "Work IQ", l’agente costruisce una memoria del comportamento e delle priorità dell’utente. Gli agenti operano con identità autonome all’interno di Entra, con accessi limitati, esecuzione sandbox attraverso i Microsoft Execution Containers e richieste di approvazione umana per azioni sensibili.

Per il lancio iniziale, Scout è disponibile come versione sperimentale attraverso il programma Frontier e richiede una configurazione Intune e una licenza GitHub Copilot.

Hardware, sistema operativo e modelli sanitari

La strategia di Microsoft include anche nuovi sviluppi hardware e software. Il project Solara presenta un sistema operativo Android progettato per l’esecuzione di agenti su diversi dispositivi, co-sviluppato con Qualcomm e MediaTek. Microsoft ha mostrato un hub desktop e un badge digitale come possibili formati.

Per lo sviluppo locale, Microsoft ha introdotto il Surface RTX Spark Dev Box, dotato del chip basato sull’architettura Arm di Nvidia, RTX Spark, e 128 GB di memoria unificata. Dettagli completi sui prezzi non sono ancora stati comunicati.

Microsoft ha annunciato una collaborazione con il Mayo Clinic per creare un modello sanitario di fondazione. Tale sistema sarà dapprima adottato internamente e successivamente reso disponibile su Azure Foundry. Mayo Clinic rimarrà il proprietario del modello.

Obiettivi di Microsoft: Superintelligenza Umanista

Microsoft descrive la sua visione come "Superintelligenza Umanista", ovvero sistemi AI che restano strumenti controllati dagli uomini. Suleyman ha dichiarato che l’azienda punta a espandere in fretta potenza di calcolo e capacità nei prossimi mesi, sostenendosi anche con i propri chip Maia 200.

Gli annunci tecnologici della Build 2026 mostrano chiaramente che Microsoft sta cercando di consolidare la sua leadership nell’AI, superando in alcuni settori la sua concorrenza come Google, ma affrontando ancora sfide in compiti di ragionamento. L’approccio innovativo di adattare i modelli ad esigenze specifiche con Frontier Tuning offre una strada promettente anche per il mercato aziendale.

Leggi l'articolo originale →
← Torna alle news