Supercomputer Leonardo: cos'è, come funziona e a cosa serve

La classifica dei supercomputer più potenti al mondo, la nota TOP500 , aggiornata a giugno e novembre di ogni anno, pone al sesto posto assoluto un sistema italiano. Si tratta del supercomputer Leonardo, inaugurato il 24 novembre 2022 e fisicamente installato presso il tecnopolo di Bologna.

Concepito e gestito dal CINECA, consorzio interuniversitario italiano senza scopo di lucro al quale aderiscono 69 università italiane, 2 Ministeri e 27 Istituzioni pubbliche Nazionali, Leonardo proietta il nostro Paese verso il calcolo per la ricerca e l’innovazione tecnologica di classe exascale (vedere più avanti). È concepito con un’architettura di sistema polivalente in grado di servire tutte le comunità scientifiche e soddisfare le esigenze dei clienti industriali in tema di ricerca e sviluppo.

Una soluzione come Leonardo, inoltre, è in grado di massimizzare le potenzialità delle applicazioni basate sull’intelligenza artificiale. Possono sfruttare GPU parallelizzate e avvantaggiarsi di prestazioni ai massimi livelli, con core Tensor dedicati e un’architettura di sistema progettata per supportare carichi di lavoro legati all’I/O.

Cos’è un supercomputer

Un supercomputer è un tipo di computer molto potente e veloce che viene utilizzato per risolvere problemi di grande complessità e per eseguire operazioni di calcolo intensive. I supercomputer sono capaci di eseguire miliardi di operazioni al secondo e sono costituiti da migliaia di processori che lavorano massimizzando il parallelismo.

Si tratta di sistemi oggi attivamente sfruttati in un ampio spettro di applicazioni, tra cui la modellazione climatica, la simulazione di fenomeni fisici, la progettazione di nuovi prodotti e materiali, la ricerca medica e farmaceutica, la crittografia, l’intelligenza artificiale e il deep learning.

Come funziona il supercomputer Leonardo e quali sono le sue caratteristiche

Abbiamo visto che i migliori supercomputer utilizzano sia architetture x86 che ARM: Leonardo poggia il suo funzionamento su una “batteria” di processori Xeon Platinum 8358 con 32 core fisici a 2,6 GHz, GPU NVIDIA A100 SXM4 64 GB e si serve di un’interconnessione Infiniband Quad-rail NVIDIA HDR100.

Architettura del supercomputer Leonardo: fonte CINECA.

Moduli di calcolo usati nel supercomputer Leonardo

I principali moduli di calcolo di Leonardo sono due:

Booster: massimizza la capacità computazionale ed è progettato per soddisfare i requisiti computazionalmente più impegnativi. Utilizza al momento 3456 nodi di elaborazione, ciascuno dotato di quattro GPU basate su NVIDIA Ampere e una CPU Intel Ice Lake a 32 core.
Il sistema è interconnesso tramite una rete dati InfiniBand da 200 Gb/s (due schede NVidia HDR100 da 100 Gbps ciascuna).
Data Centric: è un secondo modulo in corso di lancio che utilizza 1536 nodi dotati di due CPU Intel Sapphire Rapids, ciascuna con un 56 core (TDP pari a 350W) e 512 (16 x 32) GB di memoria RAM DDR5 a 4800 MHz. L’obiettivo è quello di estendere le possibilità di utilizzo di Leonardo a un più ampio ventaglio di applicazioni. In questo caso viene usata una scheda NVidia HDR100 da 100 Gbps per l’interconnessione.

Nel complesso, il sistema si basa sulla tecnologia Atos BULL SEQUANA XH2000 con una configurazione differente, come abbiamo visto, nel caso dei due moduli.

Ogni nodo è di fatto un server blade ovvero un tipo di server modulare che consente di inserire molteplici unità di elaborazione all’interno di un singolo rack. I server blade sono progettati per massimizzare l’utilizzo dello spazio fisico e delle risorse di elaborazione all’interno dei data center. Nel video realizzato da CINECA è possibile verificare tutti gli aspetti chiave di Leonardo.

Il dato pubblicato nella classifica TOP500 dei migliori supercomputer pari a 174,7 PetaFLOP di potenza computazionale si riferisce al modulo Booster: CINECA e Atos porteranno le prestazioni ad almeno 240 PetaFLOP. La classifica TOP500 potrebbe quindi essere aggiornata già a giugno 2023 con il nuovo dato prestazionale.

Supercomputer Leonardo già saturo: CINECA guarda alla sua nuova evoluzione

A metà gennaio 2024, CINECA ha annunciato che Leonardo ha già raggiunto il livello di saturazione. In altre parole, il supercomputer è già utilizzato al massimo della sua capacità: ci sono tanti progetti in coda che aspettano di poter accedere alle risorse del sistema.

“Da un anno e mezzo a questa parte sta crescendo in maniera esponenziale la domanda di supercalcolo per allenare l’intelligenza artificiale“, osserva il presidente di CINECA Francesco Ubertini. La domanda, insomma, è molto più ampia dell’offerta. “Se avessero allenato GPT-4 su Leonardo, dedicando il supercomputer solo a questo, ci sarebbero voluti 120 giorni“, continua ancora Ubertini. “Ci hanno messo un po’ di più“, riferendosi al lavoro svolto da OpenAI.

Una start up francese, Mistral, ha sviluppato un modello generativo simile a quello di OpenAI, addestrato proprio usando il supercomputer Leonardo. Ne abbiamo parlato in occasione della presentazione del modello open source Mistral-7b. “Non sono gli unici“, sottolinea Ubertini. Seppur progettato nel 2017, infatti, Leonardo è nato con un’architettura adatta all’intelligenza artificiale. Oggi è la sesta macchina al mondo per potenza di calcolo, la seconda dedicata alle applicazioni di intelligenza artificiale (la prima in Europa).

Ci sono molte applicazioni in tanti campi che tradizionalmente utilizzano il supercalcolo, come ad esempio previsioni meteo, studio delle galassie, delle particelle elementari, studio di nuovi materiali, sviluppo di nuovi farmaci, accelerazione dei trial clinici, creazione dei gemelli digitali di prodotti, servizi o ambienti. “In questi ambiti, la parte che sta più crescendo è la domanda nel campo delle scienze della vita“, rivela il presidente di CINECA citando la genomica per la personalizzazione delle cure e lo sviluppo di nuovi farmaci. L’utilizzo di Leonardo si traduce in un risparmio di circa due anni nella prima fase di ricerca di medicinali innovativi. “E siamo solo all’inizio“.

L’evoluzione di Leonardo: a breve sarà affiancato da Lisa

La Commissione Europea e il Governo italiano hanno deciso “un ulteriore finanziamento per un aggiornamento che permetterà a Leonardo di arrivare alla fine del suo ciclo di vita nel 2027 sempre nella top ten dei supercalcolatori al mondo“, rivela Alessandra Poggiani, direttrice generale del CINECA.

Il nome del successore di Leonardo non è scelto a caso: Lisa fa penare subito alla Gioconda, alias Monna Lisa, l’iconica ed enigmatica opera ad olio su tela realizzata dallo scienziato, inventore e artista italiano ai primi del 1500.

Mentre Leonardo lavora a pieno ritmo, si guarda sempre più al computing post-exascale, con una potenza di oltre un miliardo di miliardi di calcoli al secondo (oggi Leonardo ne macina “solo” 250 milioni di miliardi). L’evoluzione dovrebbe concretizzarsi tra il 2026 e il 2028.

Il primo aggiornamento di Leonardo, Lisa, dovrebbe arrivare già a giugno 2024. A fine 2024 arriverà il computer quantistico del consorzio CINECA mentre nel 2028 Leonardo andrà in pensione, sostituito da un nuovo supercomputer.

Abbiamo visto i problemi che un computer quantistico può risolvere e perché i più grandi player a livello internazionale stanno guardando in questa direzione. L’ottima notizia è che il tecnopolo di Bologna diventerà anche un centro di calcolo quantistico, sempre finanziato dall’Europa, uno dei 6 siti per ospitare quantum computer. Il sistema affiancherà Leonardo nel suo lavoro di calcolo e servirà anche per fare ricerca e test.

Cos’è l’exascale computing

Abbiamo visto che a suo tempo, con i suoi processori EPYC per sistemi server e con gli acceleratori Instinct, AMD aveva aperto l’exascale computing. Ma cos’è l’exascale computing?

Con questo termine si fa riferimento ai sistemi informatici in grado di elaborare almeno 10¹⁸ operazioni in virgola mobile al secondo, il livello successivo di potenza di elaborazione dopo il petascale computing. L’exascale computing richiede l’utilizzo di tecnologie all’avanguardia ma consente di compiere un deciso balzo in avanti nei calcoli intensivi che sono chiamati a gestire i supercomputer moderni.

L’exascale computing offre la promessa di risultati scientifici e tecnologici significativi, consentendo di arrivare alla soluzione di problemi che altrimenti sarebbero impossibili da risolvere in un tempo ragionevole.

Il supercomputer Leonardo, definito di classe pre-exascale, si inserisce nell’iniziativa EuroHPC, uno sforzo europeo promosso a partire dal 2018 che mira a sviluppare una capacità di elaborazione ad alte prestazioni (HPC) disponibile nel territorio dell’Unione Europea, svincolandosi così da fornitori terzi. EuroHPC si propone di sviluppare e acquisire tecnologie HPC all’avanguardia e di creare una rete di centri specializzati nel sostenere calcoli HPC distribuiti in tutta Europa.

L’iniziativa EuroHPC è finanziata dall’Unione Europea e dai suoi Stati membri per costruire una serie di supercomputer a livello europeo, inclusi i primi sistemi europei di elaborazione exascale. L’obiettivo principale di EuroHPC è quello di fornire a ricercatori, scienziati e imprese europee gli strumenti necessari per effettuare ricerche e sviluppi ad alta intensità computazionale.

Il sistema che al momento precede Leonardo nella classifica TOP500 è il norvegese LUMI che si trova in Finlandia, utilizza processori AMD EPYC ed è esso stesso parte integrante del progetto EuroHPC.

La foto del supercomputer Leonardo utilizzata nell’articolo è di CINECA.