Arm AGI CPU: primo chip proprietario per data center, 136 core Neoverse V3 su dual-die a 3 nm
Martedì 24 marzo Arm ha tolto il velo all'AGI CPU, il primo processore progettato e venduto direttamente dalla società — non come IP da licenziare, ma come silicio production-ready. È un cambio di modello radicale per un'azienda che dal 1990 ha sempre operato a monte della filiera, vendendo architetture, non chip.
Il processore è costruito sulla microarchitettura Neoverse V3 e fabbricato da TSMC sul nodo N3. Il package integra due die collegati tramite interconnessione ad alta densità che il sistema operativo vede come un singolo socket. Le specifiche pubblicate da Arm indicano 136 core totali, frequenza boost a 3,7 GHz e 3,2 GHz all-core sostenuto, con un TDP dichiarato di 300 W. Sul fronte memoria: 12 canali DDR5 fino a 8800 MT/s, per una banda aggregata superiore a 800 GB/s e latenza target sotto i 100 ns. Ogni core include 2 MB di cache L2. Il chip integra anche Realm Management Extension (RME), che consente l'esecuzione di workload in regioni di memoria cifrate e isolate — rilevante per ambienti multi-tenant.
Configurazioni di rack
La configurazione di riferimento è un blade 1OU dual-node: due AGI CPU per blade, ciascuna con memoria e I/O dedicati, per 272 core per blade. Un rack air-cooled standard da 36 kW ospita 30 blade — 8.160 core totali. Per densità superiore, Arm ha sviluppato con Supermicro una variante liquid-cooled da 200 kW: 336 chip per rack, oltre 45.000 core. I sistemi completi sono disponibili da ASRockRack, Lenovo e Supermicro.
Arm dichiara oltre 2x le prestazioni per rack rispetto ai sistemi x86 correnti su workload agentici. Il meccanismo è strutturale: i core Neoverse V3 mantengono throughput stabile sotto carico sostenuto, mentre le CPU x86 multi-core tendono a degradare quando la contesa per banda di memoria aumenta. La metrica rilevante qui non è il picco single-thread ma il throughput aggregato su migliaia di thread paralleli — esattamente il profilo di carico dell'inferenza distribuita. Vale però sottolineare che questi numeri sono stime interne Arm, non benchmark indipendenti su configurazioni comparabili.
Posizionamento tecnico
Il target dichiarato sono i carichi AI agentici: sistemi che coordinano acceleratori, gestiscono scheduling di workload, spostano dati tra nodi e orchestrano pipeline su larga scala. In questo contesto la CPU non è più un coprocessore di servizio rispetto alla GPU — è il componente che detta la latenza end-to-end del sistema. Meta la userà in affiancamento ai propri acceleratori MTIA; OpenAI la integrerà nel layer di orchestrazione. La frequenza operativa sostenuta a 3,2 GHz all-core e la banda DDR5 a 12 canali sono dimensionate esattamente per questo: minimizzare i tempi di attesa tra inferenze, non massimizzare FLOPS di picco.
Roadmap e compatibilità
L'AGI CPU è il primo prodotto della nuova linea silicon di Arm per data center. Follow-on product sono confermati a intervalli di 12-18 mesi. Il percorso procede in parallelo con il roadmap Neoverse CSS esistente, con garanzia di compatibilità software tra le due linee — un dettaglio non secondario per chi gestisce parchi server eterogenei. Arm contribuirà inoltre il design del reference server 1OU all'Open Compute Project in formato DC-MHS, con firmware, specifiche di sistema e strumenti diagnostici.
I chip di test sono già funzionanti; la produzione in volume è prevista nella seconda metà del 2026.



