In occasione della GTC (GPU Technology Conference) dello scorso anno NVidia annunciò di essere al lavoro sullo sviluppo di un chip per il mercato dei data center apprestandosi a lanciare la sfida a Intel e AMD.
Con la GTC 2022 la società guidata da Jen-Hsun Huang ha rotto gli indugi e ha presentato il superchip NVidia Grace del quale abbiamo parlato brevemente nell’articolo dedicato alla presentazione della nuova architettura Hopper.
Cos’è un superchip e a che cosa serve
Sappiamo bene quanto NVidia aveva investito sull’acquisizione di ARM, poi sfumata per via delle indagini aperte dalle varie autorità Antitrust, anche sulla base delle eccezioni sollevate dai concorrenti.
Sì perché anche NVidia Grace è basato su architettura ARM e disporre in-house dei progettisti che fanno capo all’azienda britannica sarebbe stato essenziale per la società di Santa Clara.
Si tratta di un superchip perché Grace si presenta come un unico modulo che combina una CPU ARMv9 con una GPU di ultima generazione. CPU e GPU sono collegati usando un’interconnessione estremamente performante (NVLink-C2C).
Il superchip consta di ben 144 core ARM (72 core sono utilizzati su ciascun chip) che funzionano su un singolo socket, memoria LPDDR5x con ECC, ben 396 MB di cache, fino a 1TB/s di larghezza di banda e potenza di picco pari a 500W.
I SoC (System-on-a-Chip) di ARM sono nati per il mercato degli smartphone e in generale dei dispositivi mobili puntando tutto sull’efficienza energetica. Una scommessa riuscitissima se si pensa che praticamente la totalità del mercato mobile utilizza questi chip. Si pensi alle vette raggiunte con i SoC Cortex-X1, Cortex-X2, Cortex-A710.
I chip Neoverse sui quali stanno da anni lavorando gli ingegneri di ARM hanno invece permesso di spostare le ambizioni dell’azienda britannica verso il mercato dei server e dei data center. Finora conosciamo design come Neoverse N1, V1 e N2.
I primi due sono basati sull’architettura ARMv8 con N1 progettato per sostenere lo scaling delle infrastrutture utilizzate per erogare servizi cloud. Non è necessariamente la piattaforma più adatta per ottenere performance massime in single thread quanto piuttosto per massimizzare le prestazioni su carichi di lavoro pesanti che sollecitano un elevato numero di core. Di contro, V1 è pensato per offrire performance di primo livello in single thread grazie anche alla presenza di un motore SVE (Scalable Vector Extensions) di maggiori dimensioni. V1 diventa quindi un’ottima scelta per gestire machine learning, per le applicazioni di intelligenza artificiale e in generale per i workload tipici di un data center.
Il superchip NVidia Grace utilizza l’architettura ARMv9 e ad oggi l’unico design ARM che utilizza tale architettura è Neoverse N2.
Non è però scontato che NVidia abbia effettivamente usato N2 per il suo superchip: Grace è infatti destinato proprio al settore HPC (High Performance Computing), al cloud e quindi ai data center. Non è escluso quindi che l’azienda abbia “personalizzato” un design derivato da V1 proprio per trarre beneficio dalle estensioni SVE che N2 non offre. Che NVidia abbia potuto mettere le mani in anticipo sul design V2 che ARM presenterà nel corso del 2022? A questo punto è probabile. Anche perché la disponibilità del superchip Grace è fissata entro la prima metà del 2023.
NVidia utilizzerà il superchip Grace in varie configurazioni in futuro, anche con più CPU e GPU, consentendo di combinare la potenza computazionale complessiva.
L’obiettivo è quello di intercettare le esigenze di un mercato in rapida crescita come quello legato alle applicazioni per l’intelligenza artificiale, al cloud, alle esigenze di data analytics e di hyperscale computing. Pensate anche ai settori della robotica e automotive (veicoli a guida autonoma).
Insomma, NVidia non è più (e non lo è da anni) “soltanto” un’azienda produttrice di schede video e in generale di GPU.