L’alimentazione nell’era dell’Intelligenza Artificiale (AI)

Analog Devices

Requisiti della rete di distribuzione dell'alimentazione delle schede di accelerazione AI, l'impatto dei transienti e una soluzione di alimentazione multifase

Le unità di elaborazione grafica (Graphics Processing Unit, GPU), le unità di elaborazione tensoriale (Tensor Processing Unit, TPU) e altri tipi di circuiti integrati specifici per le applicazioni (Application Specific Integrated Circuit, ASIC) offrono prestazioni di calcolo elevate consentendo l'elaborazione in parallelo necessaria per accelerare i carichi di lavoro di training e inferenza dell'intelligenza artificiale (AI).

L'AI richiede molta potenza di calcolo, soprattutto durante le fasi di apprendimento ed inferenza. Ciò continua a spingere i limiti delle reti di alimentazione a livelli mai visti prima. Questi carichi di lavoro ad alta densità sono diventati più sofisticati, con richieste più elevate al transiente, che spingono ogni parte della rete di distribuzione di potenza a funzionare al massimo delle proprie capacità. Oggi i rigorosi requisiti di alimentazione delle schede di accelerazione AI hanno un impatto sulle prestazioni del sistema. In questo articolo, esamineremo i requisiti della rete di distribuzione dell'alimentazione della scheda di accelerazione AI, analizzeremo l'impatto dei transienti e presenteremo una soluzione di alimentazione multifase di Analog Devices che risponde a queste esigenze.

L'AI sta rivoluzionando le architetture informatiche per replicare le reti neurali che emulano il cervello umano. Sembra che l'AI sia già ovunque, ma in realtà la tecnologia che la guida è ancora in fase di sviluppo. I circuiti integrati acceleratori di processori specializzati per i calcoli di AI includono GPU, FPGA (Field-Programmable Gate Array), TPU e altri tipi di ASIC. In questo articolo ci si riferirà collettivamente a tutti questi dispositivi come xPU.

I data center continueranno ad acquistare una grande quantità di schede di accelerazione AI, dato che la diffusione di questa tecnologia è in aumento. Secondo Gartner, il fatturato dei chip AI ha superato i 34 miliardi di dollari nel 2021 e si prevede che crescerà fino a 86 miliardi di dollari entro il 2026. [1] Rispetto a una normale CPU, le xPU offrono un enorme salto di prestazioni dell’AI, grazie all'utilizzo massivo di implementazioni di calcolo in parallelo. A causa dell'elevato numero di core di piccole dimensioni, le xPU sono adatte ai carichi di lavoro dell'AI, facilitando sia il training delle reti neurali che l'inferenza dell'AI. Tuttavia, richiedono in generale un consumo energetico relativamente elevato per i calcoli e gli spostamenti dei dati dell'AI. In poche parole, le xPU sono circuiti integrati che richiedono molta energia. I loro rigorosi requisiti di alimentazione stanno ponendo nuove sfide alle schede acceleratrici di AI che ora influiscono sulle prestazioni del sistema. In questo articolo esamineremo i requisiti della rete di alimentazione della scheda di accelerazione AI e presenteremo una soluzione di alimentazione multifase di ADI che indirizza questi vincoli stringenti.

L’AI ha imposto la sfida dell’erogazione di potenza

L'AI è molte cose, ma l'efficienza energetica non è una di queste. Quando l'AI è in azione, in particolare nel processare carichi di lavoro di intelligenza artificiale come deep learning e inferenza, richiede una potenza computazionale estrema. A livello di sistema, gli acceleratori AI svolgono un ruolo fondamentale nel fornire risultati quasi istantanei, che li rendono preziosi. Tutte le xPU hanno più core di fascia alta, realizzati con miliardi di transistor, e assorbono molte centinaia di Ampere. Le tensioni del core (VCORE) su queste xPU sono state ridotte a livelli inferiori a 1,0 V. La Figura 1 mostra un diagramma a blocchi generico di una scheda di accelerazione AI. L'articolo si concentra sul controllore multifase e sui circuiti integrati per stadi di potenza proposti per questo sistema.

Figura 1 – Schema a blocchi di una generica scheda di accelerazione AI
Figura 1 – Schema a blocchi di una generica scheda di accelerazione AI

Le densità di corrente di picco riscontrate nelle schede di accelerazione AI sono diventate estremamente pesanti da gestire per qualsiasi scheda madre. La natura altamente dinamica dei carichi di lavoro e i transienti di corrente estremamente elevati si traducono in di/dt molto elevati e in picchi di tensione che durano diversi microsecondi, sono altamente dannosi e potenzialmente dannosi per l'xPU. Con un carico di lavoro medio dell'AI così prolungato, i condensatori di disaccoppiamento non sono in grado di fornire l'energia necessaria a soddisfare la richiesta istantanea per l’intero periodo. La prossima sezione dell'articolo presenta una proposta di soluzione multifase ADI per il point of load (PoL) che elimina i tipici transienti dell'acceleratore AI che creano stress nella rete di distribuzione di potenza. Ma prima, discutiamo delle sfide di progetto dell'alimentazione introdotte dall'AI.

L'AI introduce nuove sfide nel progetto dell'alimentazione

Le richieste di potenza dell'AI stanno attualmente superando di gran lunga le capacità tradizionali delle reti di power delivery. I requisiti dei regolatori di tensione (Voltage Regulator, VR) delle xPU sono molto diversi da quelli dei regolatori PoL standard. In certe applicazioni dell'industria si vedono erogare più di 1000 A a <1 V all'xPU. È importante che l'alimentazione sia molto stabile e produca pochissimo rumore, eliminando al contempo tutte le possibilità di transienti di tensione, che possono causare falsi trigger all'interno della xPU. Il progetto di un acceleratore di AI VR PoL ad alte prestazioni, con una richiesta di corrente impressionante, deve soddisfare determinati requisiti chiave.

Gestione dei picchi di tensione e dei transienti in schede di AI

Uno dei requisiti fondamentali della scheda di accelerazione AI è che il VR sia strutturato in modo tale da offrire una gestione eccellente dei transienti di tensione. Fornire kilowatt di potenza a qualsiasi sistema è sempre una sfida di prim'ordine. La tensione di uscita, comprese le tolleranze, il ripple, i picchi e le cadute da transiente di carico, deve essere superiore alla tensione minima dell'xPU per evitare il blocco del sistema, e inferiore a quella massima per evitare danni all'xPU. I picchi di alimentazione ai transienti di queste schede possono richiedere oltre il doppio della massima potenza termica prevista.

L'importante è che la larghezza di banda del loop PoL sia sufficientemente ampia da poter gestire i tipi di transienti più rapidi. Maggiore è l'ampiezza di banda, più veloce è la risposta del loop e minore è la deviazione della tensione. Uno dei metodi più semplici per ottenere linee di alimentazione adatte ai transienti veloci è quello di scegliere regolatori che abbiano reazioni rapide durante gli stessi transienti. La famiglia di circuiti integrati ADI AI VCORE è caratterizzata da un rumore di uscita a frequenza eccezionalmente bassa, da una risposta rapida ai transienti e da un'efficienza elevata. Se a questo si aggiunge il loro supporto alla linea di carico, i chipset di potenza ADI AI fanno un ottimo lavoro per aiutare i progettisti di alimentazione a gestire i transienti e i picchi indotti dal carico di lavoro AI.

Perdite I2R nei lunghi percorsi di alimentazione e gestione termica AI

Man mano che la corrente del processore xPU di intelligenza artificiale continua a aumentare, la densità della soluzione di distribuzione di potenza PoL diventa un elemento critico. Sta diventando estremamente difficile fornire energia in modo affidabile a ogni parte dell'xPU senza doversi preoccupare del calore disperso che può influire sull'affidabilità del chip e portare ad un surriscaldamento. In altre parole, la gestione termica è una delle sfide più significative nella progettazione di questo alimentatore ad alta potenza. I metodi tradizionali di distribuzione di potenza posizionano il regolatore di tensione sul lato dell'xPU, in modo tale che l'alimentazione venga erogata lateralmente al processore. Anche la più piccola resistenza in queste piste può portare a cadute di tensione (I2R) inaccettabili. Una caduta di tensione attraverso la resistenza del piano di alimentazione del PCB aumenta proporzionalmente alla corrente dell'xPU. Si tratta di alcuni centimetri di pista di alimentazione del PCB tra i pin VR e BGA, dove si verifica una quantità significativa di perdite. Queste perdite nei power plane in rame del PCB sono diventate i fattori più importanti nel calcolo dell'efficienza e delle prestazioni del progetto del regolatore. L'uso di un circuito integrato monolitico nello stadio di potenza, con i blocchi relativi alla corrente e alla temperatura integrati, può ridurre notevolmente il numero di piste ad alta corrente necessarie sul PCB per implementare una soluzione tradizionale (discreta) di power delivery a 3 chip.

La Value Proposition di ADI: MAX16602 + MAX20790 + induttore accoppiato AI

L’ accuratezza dei regolatori di tensione AI è diventata ancora più stringente. Efficienza e dimensioni sono priorità assolute. Anche le prestazioni e la perdita di potenza sono oggetto di grande attenzione. Come illustrato nella sezione precedente, la soluzione dei problemi di progettazione del regolatore di tensione per le schede di accelerazione AI è diventata un compito arduo. I progettisti sanno bene che la generazione di grandi incrementi della corrente richiesta non può essere soddisfatta senza affrontare gli effetti di transienti indesiderati. Per affrontare tali effetti è inoltre necessario un qualche tipo di posizionamento dinamico ad alta precisione della tensione o uno schema della linea di carico. ADI ha investito molto nel mercato dell'AI e dispone di un portafoglio completo di soluzioni per sistemi sia a 48 V che a 12 V. Questa sezione dell'articolo propone i chipset AI di potenza multifase di ADI, il controllore multifase MAX16602 e lo stadio di potenza MAX20790, insieme alla nostra tecnologia brevettata con induttore accoppiato (CL) per affrontare queste sfide di progettazione PoL per l’AI. La Figura 2 mostra il collegamento dei diagrammi a blocchi di alto livello di MAX16602, MAX20790 e CL per un progetto MAX16602CL8_EV a 8 fasi. Questo design piuttosto pulito raggiunge una capacità di erogazione di corrente elevata di ~88 APK per fase. La compensazione interna e l'algoritmo di controllo avanzato, insieme ai circuiti di current sense integrati nello stadio di potenza e all'induttore accoppiato, ne fanno una soluzione compatta con l'efficienza migliore della categoria.

Figura 2 –Un progetto VR a 8 fasi con i chipset di potenza ad alta integrazione di ADI facilita un progetto ad alta densità con meno connessioni esterne
Figura 2 –Un progetto VR a 8 fasi con i chipset di potenza ad alta integrazione di ADI facilita un progetto ad alta densità con meno connessioni esterne

Circuito Integrato monolitico con stadio di potenza smart ad alto livello di integrazione

Il MAX20790 è un circuito integrato con stadio di potenza smart ricco di funzioni, progettato per lavorare con il MAX16602 (e alcuni altri controllori del portafoglio ADI) per implementare un regolatore di tensione multifase ad alta densità. Si tratta di un'integrazione monolitica che elimina quasi del tutto la resistenza e l'induttanza parassite tra i FET e il driver presenti nei progetti discreti, consentendo velocità di commutazione elevate con perdite di potenza significativamente inferiori rispetto alle implementazioni tradizionali. Se viene rilevato un errore del nodo di commutazione (VX), lo stadio di potenza si spegne immediatamente e comunica l'ID dell'errore al controllore. Questo circuito integrato con stadio di potenza smart include anche un sensore di corrente su chip. Questo blocco circuitale per il current sensing è di gran lunga superiore ai metodi che utilizzano la resistenza DC di un induttore. Il rilevamento della resistenza DC è notoriamente impreciso e richiede la compensazione della temperatura affinché la misurazione della corrente sia affidabile.

Controller IC AI

Il MAX16602 è un controller multifase per i regolatori di tensione VCORE di xPU. Il circuito integrato fornisce una soluzione ad alta densità, flessibile e scalabile per l'alimentazione delle xPU di AI. Il dispositivo supporta la modulazione a larghezza di impulso (Pulse Width Modulation, PWM) per controllare in parallelo fino a 16 fasi. L'architettura del circuito integrato semplifica la progettazione, riduce il numero di componenti, consente la gestione avanzata dell'alimentazione e la telemetria e aumenta il risparmio energetico sull'intero intervallo di carico, per garantire il quale è stata implementata la funzionalità di phase-shedding autonomo. Il chipset completo è un convertitore buck multifase ad alta efficienza con ampie funzioni di monitoraggio dello stato e dei parametri. I parametri per la protezione e lo spegnimento sono impostati e monitorati attraverso l'interfaccia seriale PMBus, inclusi i guasti rilevati nello stadio di potenza del circuito integrato.

Di seguito sono riportate un paio di altre caratteristiche chiave supportate dal controller ADI che sono importanti per qualsiasi implementazione di alimentazione per l’intelligenza artificiale.

Schema di Modulazione Avanzato AI

Il MAX16602 include uno schema di modulazione avanzato (Advanced Modulation Scheme, AMS) per migliorare la risposta ai transienti. Lo schema di modulazione permette di attivare e disattivare le fasi con un ritardo minimo. A seconda della richiesta di carico, più fasi possono attivarsi simultaneamente quando il carico aumenta o spegnersi immediatamente quando il carico diminuisce. Con l'AMS abilitato, la larghezza di banda a loop chiuso del sistema può essere estesa senza penalizzare il margine di fase. Ciò consente al PoL di rispondere meglio al tipo di domanda di corrente istantanea e dinamica che si verifica con i regolatori di tensione AI.

Controllo della linea di carico

La linea di carico consente a VCORE di spostarsi tra il minimo e il massimo in base alla corrente in uscita. In sostanza, imposta il VCORE alto per i carichi leggeri e basso per i carichi pesanti. Il motivo principale è che consente al loop di controllo di gestire una corrente di carico più elevata (condizione necessaria per un buon funzionamento). Il controllore ADI fornisce un controllo accurato della linea di carico in uscita sull'intera gamma di correnti operative. La regolazione della tensione di uscita viene eseguita utilizzando i segnali di current sense senza perdite provenienti dal circuito integrato dello stadio di potenza, che vengono restituiti al controller. In quest'ultimo, i valori della linea di carico vengono impostati programmando digitalmente il guadagno DC dell'amplificatore di errore del loop di controllo della tensione. Esiste un'ampia gamma di profili della linea di carico DC presentati nella tabella EC del controllore e nella Tabella 6 del data sheet, da 0,105 mΩ a 0,979 mΩ. La Figura 3 mostra il grafico del transiente di un progetto PoL a 16 fasi per un load step da 40 A a 360 A con slew rate di 800 A/µs. Il risultato mostra un overshoot minimo.

Figura 3 – Grafico del transiente di un VR a 16 fasi per un load step da 40 A a 360 A con slew rate di 800 A/µs
Figura 3 – Grafico del transiente di un VR a 16 fasi per un load step da 40 A a 360 A con slew rate di 800 A/µs

Complessivamente, i prodotti di conversione di potenza multifase e PoL di ADI offrono un'elevata efficienza e un'alta densità di potenza. La Figura 4 mostra il grafico dell'efficienza con le perdite di polarizzazione e dell'induttore della nostra scheda di valutazione MAX16602 + MAX20790 + CLH1110-4 a 16 fasi. ADI offre regolatori di tensione e altre soluzioni di conversione di potenza per varie applicazioni di acceleratori di intelligenza artificiale. I nostri controller multifase e le soluzioni integrate di stadi di potenza consentono ai clienti di ADI di affrontare i più stringenti requisiti di alimentazione dinamica delle xPU e le sfide di progettazione che le attuali applicazioni di AI presentano.

Figura 5 – Grafico dell'efficienza di una scheda di valutazione VR AI a 16 fasi
Figura 4 – Grafico dell'efficienza di una scheda di valutazione VR AI a 16 fasi

L'aggiunta del posizionamento attivo della tensione al design agevola il rispetto dei requisiti di risposta al transiente del carico e sfrutta meglio la finestra di tolleranza complessiva dell'xPU. Il controllo della linea di carico aiuta a ridurre la deviazione della tensione di uscita picco-picco per un determinato carico, consentendo di ridurre la mole di condensatori sulla linea di uscita. La fluttuazione complessiva della tensione viene così ridotta, riducendo il rischio di arresto o danneggiamento dell'xPU. Si noti che nel MAX16602 il blocco del circuito della linea di carico può essere disabilitato.

Vantaggi dell'induttore accoppiato

ADI ha investito nella propria tecnologia brevettata CL per oltre un decennio. Questa tecnologia consente una densità più elevata, una larghezza di banda maggiore, soluzioni più veloci per i transienti e, rispetto ad un'implementazione a componenti discreti, un'efficienza superiore del 50% e magneti più piccoli di un fattore 1,82x. Il CL si comporta effettivamente come una grossa induttanza in regime stazionario e come una piccola induttanza al transiente, consentendo di risparmiare COUT oltre a ridurre le dimensioni dell'induttore.[2] La Figura 5 mostra una serie di induttori accoppiati comunemente utilizzati nei progetti dei regolatori di tensione multifase di ADI.

Figura 4 – Serie di induttori accoppiati comunemente utilizzati nei progetti dei regolatori di tensione multifase di ADI
Figura 4 – Serie di induttori accoppiati comunemente utilizzati nei progetti dei regolatori di tensione multifase di ADI

A seconda delle specifiche e delle priorità di progettazione, il vantaggio della cancellazione del ripple di corrente degli induttori accoppiati può essere scambiato con dimensioni più ridotte o con un'efficienza più elevata. Il grande vantaggio del sistema e il fattore di differenziazione di ADI è che i progettisti di PoL per l’intelligenza artificiale possono utilizzare il CL per ottenere con relativa facilità una soluzione con un ingombro complessivo del regolatore di tensione ridotto. Diversi fornitori ben noti e conosciuti di componenti magnetici hanno ottenuto una licenza CL gratuita da ADI e rappresentano diverse fonti di approvvigionamento da cui ottenere i componenti necessari.

Package con raffreddamento Top-Side ideale per l'AI

Il raffreddamento della parte superiore offre una via alternativa di dissipazione del calore per i package a montaggio superficiale. Sia il MAX16602 che il MAX20790 hanno flip chip quad flat no-lead (FCQFN) package con pad termici esposti sul lato superiore. L'FCQFN è un package avanzato che offre le migliori prestazioni termiche della categoria, molto apprezzate dai progettisti. Questo package senza pin non solo riduce le induttanze parassite, ma permette anche la dissipazione diretta del calore dalla giunzione del dispositivo all'ambiente circostante. Il MAX20790 ha una resistenza termica junction-to-case top(θJC-TOP) di 0,25°C/W. Sfruttando la configurazione di raffreddamento top-side con i progetti di potenza dell’AI, è possibile migliorare le prestazioni termiche del sistema e la flessibilità di progettazione.

 

Vertical Power

Con l'avvento delle xPU che elaborano funzioni complesse di intelligenza artificiale, il settore ha assistito ad un drastico aumento del consumo di potenza. Sono diventati comuni i regolatori di tensione con capacità di erogare in modo continuo fino a 650 A e di superare i 1000 A di picco. La sfida nell'alimentazione dei processori di intelligenza artificiale consiste nel mantenimento dell'efficienza. Le architetture di alimentazione convenzionali non sono in grado di tenere il passo con queste xPU AI, molto esigenti in termini di energia. I produttori ed i progettisti di di chip per regolatori di tensione stanno studiando approcci diversi per il power delivery. Una nuova tendenza per l'alimentazione delle xPU AI di cui si parla nel settore è la cosiddetta Vertical Power, nota anche come backside power delivery.

I regolatori di tensione devono essere posizionati il più vicino possibile ai pin alimentazione delle xPU per erogare correnti elevate. Non è possibile raggiungere questo obiettivo con i tradizionali metodi di alimentazione laterale. La Vertical Power sposta e ricolloca il regolatore di potenza direttamente sotto il processore stesso, eliminando tutte le perdite che si avrebbero sul PCB. La struttura consiste nel posizionare il convertitore di alimentazione, gli stadi di potenza, i condensatori e i componenti magnetici sul lato posteriore del PCB, fornendo l'alimentazione all'xPU in verticale attraverso le vie. In altre parole, l'erogazione di corrente avviene verticalmente da sotto l'array BGA dell'xPU. Si tratta di un percorso verticale di lunghezza ridotta, che diminuisce significativamente l'impedenza ed elimina le perdite. La Figura 6 mostra l'architettura del modulo di alimentazione verticale montato sotto l'xPU sul lato opposto del PCB. Questo è solo a scopo illustrativo. ADI dispone di un'ampia gamma di soluzioni AI xPU Vcore per risolvere questi problemi. Le nostre soluzioni di alimentazione consentono di ottenere la migliore efficienza della categoria nel più piccolo form factor. La combinazione proposta del controllore multifase MAX16602 e dello stadio di potenza monolitico smart MAX20790 offre la più alta efficienza di conversione di potenza, la più rapida risposta ai transienti e la segnalazione telemetrica più accurata del settore. Per informazioni più dettagliate su questi chipset di potenza o per acquistare il kit di valutazione MAX16602CL8, visitate www.analog.com/en/design-center/evaluation-hardware-and-software/evaluation-boards-kits/max16602cl8evkit.html

Figura 6 – Architettura di un modulo di alimentazione verticale (solo a scopo illustrativo)
Figura 6 – Architettura di un modulo di alimentazione verticale (solo a scopo illustrativo)

La parte più impegnativa nella realizzazione di una soluzione di alimentazione verticale consiste nel riuscire a risolvere i problemi legati a peso e montaggio del modulo. Sotto l'xPU, sul lato opposto della scheda madre, si trovano anche i condensatori di disaccoppiamento ad alta frequenza, necessari per l'accumulo di energia e per soddisfare le richieste di energia istantanee. Il metodo di power delivery verticale, abbinato alla tecnologia CL di ADI, consente di ottenere densità di corrente e di potenza maggiori e prestazioni più rapide nella risposta al transiente. L'alimentazione verticale offre ai produttori di PoL come ADI nuove opportunità per innovare e continuare, a modo proprio, a sostenere l'avanzamento della legge di Moore.

 

Conclusione

Con il Machine Learning e il Deep Learning, le schede acceleratrici hanno portato l'AI dalla teoria al mainstream, consentendo la potenza di elaborazione parallela necessaria per accelerare i carichi di lavoro di training e inferenza. La progettazione di un regolatore di tensione PoL per una scheda acceleratore di AI ad alte prestazioni è un compito complesso, soprattutto per i requisiti di potenza sempre più elevati in termini di livelli di corrente e precisione di tensione richiesti dalle attuali xPU avanzate.

Come spiegato in questo articolo, i requisiti del regolatore di tensione per xPU sono molto diversi da quelli dei regolatori PoL standard. Le linee di alimentazione delle xPU hanno variazioni di carico estremamente rapide, richiedono un posizionamento dinamico della tensione o una linea di carico e devono essere di dimensioni ridotte.

Riferimenti

[1] “Forecast: AI Semiconductors, Worldwide, 2021-2027.” Gartner, Aprile 2023.

[2] “Utilizing the Benefits of Coupled Inductors.” Analog Devices, Inc.

 

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome