Si parla dell’architettura Intel Ponte Vecchio da oltre tre anni ma ben pochi hanno avuto occasione di mettere davvero le mani sulle GPU ad alte prestazioni, progettate in primis per i data center. Nota da decenni per i suoi processori, la società di Santa Clara sta cercando di riacquistare quote di mercato anche nel mondo delle schede video dedicate, grazie alla sua architettura Xe.
Intel ha compiuto tuttavia audaci passi avanti anche nel settore delle schede video ultraprofessionali e sebbene si parli già del successore, Ponte Vecchio (PVC) rappresenta la punta di diamante della società guidata da Pat Gelsinger. PVC segna un primo ambizioso traguardo che permette a Intel di distinguersi soprattutto sul piano della larghezza di banda della memoria e del throughput su calcoli FP64, aspetti fondamentali per le elaborazioni ad alte prestazioni.
FP64 è un termine che si riferisce alla rappresentazione e alla manipolazione di numeri a virgola mobile (Floating Point) a precisione doppia. Nell’ambito del calcolo scientifico e delle operazioni complesse che richiedono una maggiore precisione numerica, l’uso di FP64 è fondamentale (utilizzo di 64 bit per rappresentare un numero a virgola mobile; maggiore precisione a fronte di più risorse computazionali).
L’architettura Intel Ponte Vecchio in breve
Ponte Vecchio rappresenta un po’ l’apice nella complessità dei chip. Al momento esistono varie versioni: Intel Data Center GPU Max 1550, Max 1350 e Max 1100. Entrambe sono contraddistinte da un design fisico innovativo: caratterizzate da una struttura che ricomprende un ampio numero di chiplet, quelle che Intel chiama tile ospitano elementi chiave denominati Xe Cores.
Nel caso della versione Max 1100, gli Xe Cores sono disposti su una tile di base che misura 640 mm² e che non solo integra una gigantesca cache L2 da 144 MB ma funge anche da interfaccia per HBM2e, PCIe e altre GPU peer. Il termine GPU peer si riferisce alla capacità di due o più unità di elaborazione grafica (GPU) di comunicare direttamente tra di loro senza passare attraverso la CPU o il sistema principale. L’uso di cinque diversi nodi di processo e tecniche avanzate di stacking 3D rendono PVC un prodotto affascinante dal punto di vista tecnologico.
La variante Max 1100 integra 56 Xe Cores e raggiunge frequenze operative fino a 1,55 GHz. Con 108 MB di L2 cache abilitata sulla tile base, sfrutta 48 GB di memoria HBM2e con una larghezza di banda teorica di 1,2 TB/s. La scheda si presenta come PCIe con un TDP di 300W, posizionandosi in competizione con AMD MI210 e Nvidia H100 PCIe.
Ogni Xe Core consiste di 8 motori vettoriali da 512 bit capaci di assicurare un throughput nominale di 11,1 miliardi di operazioni al secondo.
Max 1550 si spinge ancora più avanti: la GPU è infatti composta da un numero di transistor superiore ai 100 miliardi (escludendo la memoria), su una superficie complessiva di 2.330 mm². Il TDP sale in questo caso a 600W e gli Xe Cores sono ben 128, abbinati sempre alla memoria HBM2e.
Gerarchia della cache e latenza della memoria
Ogni Xe Core della GPU Max 1100 integra una generosa cache L1 da 512 KB mentre la cache di livello superiore è un “colosso” da ben 144 MB. L’unico punto debole sembra essere la latenza che, con i suoi 280 ns, appare notevolmente più elevata rispetto alle soluzioni della concorrenza. Si tratta di un aspetto che molti esperti stanno indicando e che potrebbe avere un impatto diretto sulle performance di GPU equipaggiate con cache voluminose. D’altra parte, le stesse GPU consumer tendono a offrire un accesso più rapido alla memoria locale.
Architettura a chiplet: croce e delizia per Intel
Per un’azienda storicamente ancorata a un approccio monolitico per la realizzazione dei suoi processori, la scelta di utilizzare un’innovativa configurazione a chiplet rappresenta un vero e proprio punto di svolta, confermato anche lato CPU con Meteor Lake, architettura che si preannuncia rivoluzionaria.
La scelta dei chiplet ha presentato e continuerà a presentare per Intel sfide significative. La duplicazione della logica causa un certo overhead e nel valutare le comunicazioni dati tra chiplet, bisogna mettere sulla bilancia anche le implicazioni in termini di raffreddamento e dissipazione del calore.
Ponte Vecchio è quindi per Intel una preziosa esperienza di apprendimento per lo sviluppo delle future GPU di fascia alta. Non è quindi un prodotto che rappresenta un punto di arrivo ma semmai traccia l’inizio di una nuova avventura.
Entrambe le schede sono progettate per sostenere al meglio applicazioni di intelligenza artificiale, machine learning e high-performance computing (HPC).
Il futuro delle GPU Intel per data center
GPU di punta come le già citate NVidia H100 e AMD MI210 sono tra i chip più complessi in circolazione e spingono al massimo le performance. Sono il frutto di decenni di esperienza raccolta nella progettazione, nello sviluppo e nella realizzazione di GPU di grandi dimensioni. Intel, ovviamente, non può godere ancora della medesima esperienza, sebbene con Ponte Vecchio abbia voluto tornare a “suonare la carica”.
L’utilizzo massivo di PVC su alcuni supercomputer darà modo a Intel di raccogliere preziosi dati sulle prestazioni reali, ottimi spunti per l’ottimizzazione delle architetture future.