NVIDIA e Google Cloud collaborano per avanzare nell’Agente e Fisico AI

NVIDIA Blog 14 maggio 2026

NVIDIA e Google Cloud hanno collaborato per più di un decennio, sviluppando insieme una piattaforma full-stack di AI che copre tutti i livelli tecnologici, da librerie e framework di alte prestazioni ad ambienti cloud su larga scala adatti alle imprese.

Queste tecnologie consentono a sviluppatori, startup e aziende di portare fuori dai laboratori l’AI agente fisico, dagli agenti che gestiscono workflow complessi ai robot e ai digital twins sul pavimento dello stabilimento.

Nel contesto della kermesse Google Cloud Next a Las Vegas, la partnership raggiunge un nuovo importante punto: avanzamenti finalizzati all’espansione dell’AI Hypercomputer di Google Cloud, il quale supporterà i prossimi confini dell’AI agente e fisica mediante tecnologie di nuova generazione.

Gli istanze di tipo A5X alimentati da NVIDIA Vera Rubin NVL72;

una preview di Google Gemini su Google Distributed Cloud funzionante su NVIDIA Blackwell e NVIDIA Blackwell Ultra GPUs;

VM confidenziali con NVIDIA Blackwell GPUs;

AI agente su Gemini Enterprise Agent Platform usando NVIDIA Nemotron modelli open e il NVIDIA NeMo framework.

Infrastruttura di Nuova Generazione: da NVIDIA Blackwell a Vera Rubin

Al Google Cloud Next, Google ha annunciaro A5X alimentati da NVIDIA Vera Rubin NVL72, sistemi a scala rack in cui estrema cooperazione tra chip, sistemi e software porta a costi di inferenza per token ridotti fino al 10x e throughput per megawatt raddoppiato per token rispetto alla generazione precedente.

I nuovi A5X utilizzeranno NVIDIA ConnectX-9 SuperNICs abbinati alla prossima generazione di Google Virgo networking, scalandosi fino a 80.000 NVIDIA Rubin GPU all’interno di un singolo cluster sito, e fino a 960.000 GPU NVIDIA Rubin in un cluster multisito, rendendo possibili di gestire i carichi di lavoro AI di grandi dimensioni su infrastrutture ottimizzate NVIDIA.

“A Google Cloud crediamo che la prossima decade di AI verrà modellata dalla capacità dei clienti di gestire le loro attività più esigenti su una pila di infrastruttura integrata e ottimizzata per l’AI,” ha dichiarato Mark Lohmeyer, vicepresidente e general manager dell’AI e infrastruttura di calcolo di Google Cloud. “Combinando l’infrastruttura e i servizi AI gestiti di Google Cloud con le piattaforme, i sistemi e il software di punta di NVIDIA, stiamo offrendo ai clienti la flessibilità necessaria a formare, adattare e servire da modelli aperti a compiti AI agenti e fisici, ottimizzandoli in termini di performance, costi e sostenibilità.”

Il portafoglio completo di NVIDIA Blackwell di Google Cloud spazia dagli A4 VM con sistemi NVIDIA HGX B200, ai A4X VM rack-scale con GB200 NVL72 e GB300 NVL72, fino a fractional G4 VM con NVIDIA RTX PRO 6000 Blackwell Server Edition GPUs.

I clienti possono dimensionare correttamente la loro capacità di accelerazione, sfruttando rack NVL72 connessi in più, singoli rack scalabili in fino a 72 Blackwell GPU con NVLink di quinta generazione e NVLink 5 Switch, fino a una frazione dell’8 di una GPU.

Con questa piattaforma estensiva, i team possono ottimizzare ogni tipo di lavoro, dagli algoritmi di ragionamento misto di esperti, all’inferenza multimodale e al processing di dati, fino a complessi simulazioni per il futuro dell’AI fisica e la robotica.

Esempio di utilizzo

I laboratori di frontiera AI come Thinking Machines Lab e OpenAI sono tra quelli che stanno utilizzando questa infrastruttura per accelerare i loro carichi di lavoro, come ad esempio l’addestramento su A4X Max VM e l’elaborazione di inferenze su GB300 e GB200 NVL72.

Ad esempio:

OpenAI utilizza i sistemi GB300 e GB200 NVL72 su Google Cloud per carichi di lavoro complessi per ChatGPT.

AI Sicura Dovunque Deve Eseguire: Sovrana e Riservata

I modelli Gemini di Google eseguiti su GPU NVIDIA Blackwell e Blackwell Ultra sono ora in anteprima su Google Distributed Cloud, permettendo ai clienti di trasferire i modelli Gemini di frontiera ovunque i loro dati più sensibili siano.

Grazie alla Confidential Computing di NVIDIA e alla piattaforma NVIDIA Blackwell, i modelli Gemini possono funzionare in ambiente protetto, dove i prompt e i dati di sottile personalizzazione restano cifrati e non modificabili da parte di enti non autorizzati, inclusi gli operatori dell’infrastruttura.

L’anteprima di Confidential G4 VM con NVIDIA RTX PRO 6000 Blackwell GPUs introduce queste protezioni anche negli ambienti multi-tenant del cloud pubblico, aiutando le aziende soggette a regolamentazione ad accedere alla potenza dell’AI senza compromettere la sicurezza e le prestazioni.

Questa iniziativa rappresenta la prima opzione di computing riservato in cloud con GPU NVIDIA Blackwell, offrendo a Google Cloud un fondamento sicuro e ad alte prestazioni per l’AI.

Modelli Aperti e API per l’AI Agente

La piattaforma NVIDIA su Google Cloud è ottimizzata per eseguire ogni tipo di modello, incluso Google Gemini, Gemma, NVIDIA Nemotron e modelli aperti di pesi, fornendo agli sviluppatori strumenti per costruire sistemi AI agenti che ragionano, pianificano ed agiscono.

NVIDIA Nemotron 3 Super è ora disponibile su Gemini Enterprise Agent Platform, offrendo agli sviluppatori un percorso diretto per scoprire, personalizzare e distribuire modelli di ragionamento multimodale e di inferenza per workflow agenti.

Dimostrazione pratica

Google Cloud e NVIDIA hanno reso più facile l’addestramento e la personalizzazione su larga scala di modelli aperti. Le Managed Training Clusters su Gemini Enterprise Agent Platform hanno introdotto una nuova API di apprendimento rinforzato (RL) costruita con NVIDIA NeMo RL per accelerare l’RL su larga scala, automatizzando le dimensioni del cluster, la gestione delle riprese e l’esecuzione del lavoro, permettendoti di concentrarti sul comportamento e la qualità del modello, invece che sulla gestione della infrastruttura.

Crowd

Leggi l'articolo originale →
← Torna alle news