Supercomputer Frontier basato su AMD EPYC resta il più potente, in quarta posizione l'italiano Leonardo

Due volte l’anno la classifica TOP500 viene puntualmente aggiornata, fotografando la lista dei supercomputer più potenti al mondo. Un supercomputer è un tipo di computer ad alte prestazioni progettato per eseguire calcoli complessi e risolvere problemi che richiedono una grande quantità di dati e potenza di calcolo. Rispetto ai computer personali o ai server tradizionali, i supercomputer sono in grado di elaborare volumi di dati enormi in tempi molto brevi.

I supercomputer sono concepiti utilizzando una combinazione di processori ad alte prestazioni, memoria veloce e connettività di rete estremamente efficace. Sono spesso utilizzati per compiti come la modellazione climatica, la ricerca scientifica, l’analisi dei dati complessi, la simulazione di fenomeni fisici e chimici, la previsione del tempo, l’analisi dei dati crittografati e in molteplici ulteriori campi applicativi.

La classifica TOP500 è una lista dei 500 supercomputer più potenti al mondo: è pubblicata e aggiornata da TOP500 Project, un’organizzazione internazionale che raccoglie e valuta le prestazioni dei supercomputer moderni. La classifica si basa sul benchmark Linpack, che misura le abilità di calcolo di un supercomputer risolvendo un sistema di equazioni lineari.

Anche con la TOP500 di giugno 2023, la palma d’oro di supercomputer più performante al mondo viene assegnata al sistema Frontier, in forze presso l’Oak Ridge National Laboratory, nel Tennessee (USA). Si tratta di un laboratorio nazionale di scienze interdisciplinari e tecnologia gestito dal Dipartimento dell’Energia degli Stati Uniti. Il funzionamento di Frontier è sostenuto da una batteria di processori AMD EPYC 64C a 2 GHz per un totale di ben 8.699.904 core (in un altro articolo abbiamo visto cosa sono i core di un processore) che consentono di assicurare una potenza pari a quasi 1.200 PetaFLOP/s. In termini di efficienza energetica, questo supercomputer ha fatto registrare 52,59 Gflops/watt mentre per il trasferimento dati utilizza un’interfaccia Multigigabit Ethernet.

Gli AMD EPYC sono noti per offrire prestazioni elevate e un’ampia larghezza di banda per l’elaborazione parallela e i carichi di lavoro multithread. Ad essi sono affiancati acceleratori AMD Instinct MI250X progettati per massimizzare le performance nelle applicazioni di machine learning e data analytics.

Cosa sono i PetaFLOP/s e i Gflops/watt

PetaFLOP/s (oppure PFlop/s) è un’abbreviazione per petaflop al secondo ed è una misura della velocità di calcolo di un supercomputer o di un sistema di elaborazione ad alte prestazioni. Un petaflop corrisponde a 10^15 di operazioni in virgola mobile al secondo.

Misurare la velocità di calcolo in PFlop/s è particolarmente rilevante per i supercomputer di fascia alta, in quanto esprimono la loro capacità di gestire problemi computazionalmente intensi in tempi relativamente brevi. Un aumento nella velocità di calcolo da gigaflop/s (miliardi di operazioni al secondo) a teraflop/s (bilioni di operazioni al secondo) e successivamente a petaflop/s ha reso possibili progressi significativi nella modellazione e simulazione di fenomeni complessi, come la meteorologia, l’astronomia, la ricerca sui materiali e la biologia computazionale.

I Gflops/watt, abbreviazione di gigaflop per watt, rappresentano invece una misura dell’efficienza energetica di un sistema informatico o di un processore. Questa misura esprime il numero di operazioni in virgola mobile che un sistema o un processore può eseguire al secondo per ogni watt di potenza consumata. I Gflops/watt sono un indicatore importante per valutare l’efficienza energetica di un sistema di calcolo, specialmente per i supercomputer, dove l’energia consumata può essere significativa: misurare l’efficienza energetica è cruciale per ottimizzare le prestazioni dei sistemi di calcolo e ridurre i costi energetici.

Un valore più alto di Gflops/watt indica una maggiore efficienza, poiché il sistema è in grado di eseguire più operazioni di calcolo utilizzando meno energia. Questo è particolarmente importante per applicazioni che richiedono calcoli intensivi su larga scala.

Supercomputer europei in terza e quarta posizione, con l’italiano Leonardo

Come segnalato dai responsabili della lista TOP500, al secondo posto nella classifica stilata a giugno 2023 c’è il supercomputer Fugaku che ha fatto segnare il punteggio di 442 PFlop/s; il sistema giapponese utilizza 1.069.056 core in meno rispetto a Frontier. Ad eccellere, in questo caso, è la tecnologia ARM: Fugaku poggia il suo funzionamento sui microprocessori A64FX 48C, sviluppati da Fujitsu su architettura ARM a 64 bit.

Il terzo e il quarto posto nella lista sono occupati rispettivamente dai supercomputer LUMI e Leonardo: il primo è fisicamente installato in Finlandia, il secondo in Italia presso il tecnopolo di Bologna.

LUMI utilizza l’infrastruttura HPE Cray EX235a, che fa parte della linea di sistemi di elaborazione ad alte prestazioni di HPE. Questo sistema è progettato per fornire prestazioni di calcolo estremamente elevate e scalabilità per gestire carichi di lavoro complessi. In termini di processori, sono stati scelti – ancora una volta – AMD EPYC di terza generazione ottimizzati allo scopo. Anche in questo caso vengono adottati acceleratori Instinct MI250X di AMD, come in Frontier.

Il primo sistema in elenco che utilizza la tecnologia Intel è proprio il supercomputer Leonardo: come abbiamo evidenziato nell’articolo, si tratta di una macchina in continua evoluzione che nella versione verificata da TOP500 si serve di quasi 1,9 milioni di core Xeon Platinum 8358 32C a 2,6 GHz.

Leonardo abbina inoltre gli acceleratori NVIDIA A100 SXM4 64 GB: basato sull’architettura NVIDIA Ampere, rappresenta una delle soluzioni più avanzate per l’accelerazione dei carichi di lavoro HPC e IA. SXM4 si riferisce al fattore di forma del modulo, che è progettato per l’installazione in server HPC e supercomputer. NVIDIA A100 offre un’eccezionale potenza di calcolo grazie ai suoi 6912 core CUDA, 432 core Tensor e 40 GB di memoria HBM2 per modulo.

A livello di interconnessione, Leonardo sfrutta la tecnologia di rete InfiniBand Quad-rail NVIDIA HDR100, per il trasferimento di dati ad alte prestazioni tra i componenti del sistema: combina l’interconnessione InfiniBand, il networking ad alta velocità, bassa latenza e l’architettura di comunicazione quad-rail di NVIDIA HDR100.

La tecnologia quad-rail di NVIDIA HDR100 si riferisce alla configurazione di quattro canali di comunicazione indipendenti utilizzati per trasferire i dati fino a 100 Gbps: questa configurazione consente di raggiungere velocità di trasferimento dati molto elevate e di migliorare l’affidabilità del sistema riducendo il rischio di congestione della rete.

La foto nell’immagine di apertura è di Carlos Jones/ORNL, U.S. Dept. of Energy.