NVIDIA HORIZON: Un Agente Libero per Disegnare Hardware e Raggiungere il 100% Completo nei Benchmark RTL

MarkTechPost 4 luglio 2026

Introduzione a HORIZON

La ricerca di NVIDIA ha annunciato HORIZON, un framework di agenti automatici per il design hardware. Questo sistema tratta il design hardware come l’evoluzione del codice su livello di repository. Il team di ricerca applica l’istantiazione su livello di registro-trasferimento (RTL). Un modello Markdown strutturato diventa un pacchetto del progetto. Un ciclo autonomo evolve un ambiente git isolato e genera una versione solo quando i test passano.

Il team di ricerca riporta il 100% di completamento in ogni serie di benchmark RTL valutata. Tuttavia, dichiara chiaramente che il design hardware autonomo non è ancora risolto.

Cosa è HORIZON?

Generare codice in una sola volta presenta limiti chiari in compiti di progettazione eseguibile. La descrizione plausibile di Verilog non basta per un vero hardware. La correttezza dipende dal comportamento al ciclo, dalle convenzioni di reset, dalle ampiezze di bit e dai feedback dei simulatori.

HORIZON gestisce ogni problema di design in un repository controllabile, non in un singolo prompt. L’unica entrata richiesta è un modello Markdown strutturato. Questo modello include quattro componenti: un obiettivo, direzioni relative alla conoscenza del dominio, una specifica di valutatore e un predicato di accettazione.

Un agente di installazione compila il modello in un pacchetto progettuale. Lo scrivono come p = (πagent, Ep, Ap, Γp, Ωp). Questi termini includono la politica dell’agente, l’esecutore valutatore e il predicato di accettazione. Coprono inoltre la politica del controllo delle versioni e le competenze del dominio.

Per il RTL, l’esecutore Ep può includere compilazione, simulazione, estrazione della copertura e controlli di affermazione o testbench. In altri domini, lo stesso posto può comprendere test unitari, teoremi, analizzatori o strumenti di sintesi. I problemi sono definiti su alberi di lavoro git, non su un tipo di repository fisso.

https://arxiv.org/pdf/2606.28279

Come Funziona il Ciclo a Livello di Repository

Dopo l'installazione, il ciclo continua senza ulteriore input umano. Ogni ciclo pianifica un obiettivo, modifica l’albero di lavoro, esegue gli strumenti e avvia il valutatore. Il predico di accettazione decide se un nuovo checkpoint va committato o se va registrato un fallito.

Git è l’elemento sottostante, non un mero strumento di registrazione. Le differenze mostrano le modifiche proposte. I checkpoint definiscono gli stati accettati. Le note collegano le prove del valutatore. Il log ricostruisce tutta la traccia.

Il ciclo utilizza comandi git nativi per mantenere traccia a basso costo. Le modifiche in stallo vengono ispezionate con git diff –caching. Ogni passo accettato diventa un git commit, le cui note tengono il risultato e le retribuzioni. Commits positivi diventano esempi di riparazione. Tentativi rifiutati vengono registrati come esempi negativi. La cronologia del repository è una cache di esperienza, non un database separato.

Il team presta i termini dei processi semi-Markov per uno scopo specifico: per indicare i dati registrati, non per formare o aggiornare una politica di apprendimento rinforzato. La parte base dell’agente rimane fisso nel corso di un’attività.

Riutilizzare sessioni diminuisce il costo. La sessione GPT del modello rimane attiva per gli iterazioni. Il modello, il pacchetto del progetto e le fonti stabili vengono serviti dal prompt cache del provider. I nuovi token emessi sono dominati dal delta corrente e dall'ultimo output valutatore.

La Posizione di HORIZON tra Sistemi Autoregolamentati

HORIZON amplia una serie di sistemi autonomi scalabili a livello di repository. Altri sistemi modificavano il software che gli ingegneri utilizzano. HORIZON, invece, si concentra sull’evoluzione degli artefatti di hardware creati dagli ingegneri.

AlphaEvolve (2025): Algoritmi di nuclei, Scoperta algoritmica e scientifica, Valutatori automatici.
SATLUTION (2025): Risolutori completi di SAT, Soluzione SAT, Correttezza distribuita e tempo di esecuzione.
ABCEvo (2026): Sintesi logica ABC, Software EDA, Correttezza e qualità.
HORIZON (lavoro attuale): Fonti di RTL, testbench e artefatti di verifica, Design di hardware, Compilazione, simulazione, copertura, controlli di affermazione.

Tutti condividono un principio: una modifica candidata entra solo quando esiste la prova eseguibile che la supporta.

Risultati dei Benchmark

Il modello base utilizzato è GPT-5.3, fissato per tutti gli esperimenti. Ogni risultato viene prodotto in modalità a un agente automatico. Le campagne vengono girate su un host AMD EPYC 9334 con 32 core e 512 GB di RAM.

L’analisi si estende attraverso ChipBench, RTLLM-2.0 e Verilog-Eval. Include nove categorie di generazione di codice e di verifica, CID 002 a 016. Il database CVDP contiene 783 problemi di autori umani suddivisi in 13 categorie di compiti (Pinckney et al., 2025).

Un’iterazione equivale a un passo esterno automatizzato. L’agente modifica l'albero di lavoro, esegue il valutatore e commette un passo o registra un rifiuto. HORIZON raggiunge un tasso al 100% in ogni set. L’unico errore residuo è un difetto nel modello di ChipBench, non da un fallimento dell’agente.

Con un’iterazione, il tasso complessivo al primo tentativo è 47.8%. L’iterazione 0 non è un misura Pass@1. È lo stato del repository dopo la prima iterazione dell’agente. L’agente può differire la risoluzione dei problemi a iterazioni successive per design.

Leggi l'articolo originale →

← Torna alle news

Serie / Categoria	Foco	Iter. 0	Conv. iter.	Pass. Totale
ChipBench	RTL Generazione mista	20.0	5	100.0
RTLLM-2.0	Da spec in NL a RTL	78.0	2	100.0
Verilog-Eval-v2	Verilog stile HDLBits	86.2	2	100.0
CVDP CID 002	Completamento del codice RTL