L’architettura di von Neumann, chiamata così in onore del matematico e informatico John von Neumann, è un’architettura classica che è diventata la base per la progettazione della maggior parte dei computer moderni. L’architettura è infatti caratterizzata da diverse componenti chiave che operano insieme in modo coordinato: CPU, memoria, unità I/O, bus di sistema, unità di controllo, storage. Anche se per decenni è risultato possibile scalare l’architettura di von Neumann in modo piuttosto semplice, da tempo i colli di bottiglia di questo approccio sono sotto gli occhi di tutti.
La CPU spesso deve attendere il recupero dei dati dalla memoria, che è più lenta rispetto alla CPU stessa; ci sono problemi di efficienza energetica; la scalabilità è ormai arrivata a un limite difficilmente superabile. Per superare alcuni di questi problemi, sono state sviluppate nuove architetture che sfruttano l’elaborazione parallela e l’informatica quantistica.
Mentre il mercato ha cominciato a offrire da alcuni anni interfacce più veloci per lo scambio delle informazioni tra CPU e memoria (si pensi a Infinity Fabric, NVLink e CXL), parallelamente proseguono gli esperimenti nel campo dell’informatica neuromorfica: essa si ispira al funzionamento del cervello umano e cerca di sviluppare sistemi di calcolo basati su principi biologici.
IBM NorthPole supera il collo di bottiglia di von Neumann
Nel 2014, il team di ricerca e sviluppo di IBM guidato da Dharmendra Modha, mise a punto un chip (TrueNorth) il cui funzionamento prendeva spunto dai meccanismi cerebrali. Negli anni successivi, il gruppo di lavoro ha proseguito con gli studi giungendo oggi a svelare NorthPole, un chip specializzato nell’inferenza neurale.
L’inferenza neurale è un processo computazionale che simula il funzionamento del sistema nervoso, in particolare delle reti neurali biologiche, per estrarre informazioni o prendere decisioni basate su dati o stimoli inviati in input. L’espressione è utilizzata nell’ambito delle applicazioni di intelligenza artificiale e nell’apprendimento automatico: le reti neurali artificiali sono utilizzate per eseguire operazioni di inferenza, cioè per trarre conclusioni ed effettuare previsioni basate su dati.
Come spiegano i tecnici di IBM, la più grande differenza tra NorthPole e i prodotti convenzionali è che ciascuno dei suoi 256 core è dotato di una propria memoria: in questo modo ciascun core può svolgere attività di inferenza più velocemente di qualsiasi chip esistente. Dal punto di vista architettonico, NorthPole offusca il confine tra calcolo e memoria. Tuttavia, il più grande vantaggio di NorthPole è anche il suo limite: l’integrazione della memoria a livello di core non permette di sfruttare il chip per le operazioni più “generaliste”.
Le prestazioni del nuovo chip IBM per l’intelligenza artificiale
Il processore per l’intelligenza artificiale nato nei laboratori di Big Blue ha mostrato una maggiore efficienza energetica, una migliore efficienza spaziale e una latenza inferiore rispetto a qualsiasi altro chip attualmente sul mercato nei test svolti sul riconoscimento di immagini ResNet-50 e sui modelli di rilevamento di oggetti YOLOv4.
Utilizzando il modello ResNet-50 come benchmark, NorthPole risulta notevolmente più efficiente delle comuni GPU a 12 nm e CPU a 14 nm (lo stesso NorthPole è costruito utilizzando un processo a 12 nm). In entrambi i casi, NorthPole è 25 volte più efficiente dal punto di vista energetico, quando si tratta del numero di fotogrammi interpretati per joule di potenza richiesta.
NorthPole ha sovraperformato anche in termini di latenza, nonché di spazio richiesto per il calcolo, in termini di frame interpretati al secondo per miliardo di transistor richiesti. Secondo Modha, su ResNet-50, NorthPole supera tutte le principali architetture più diffuse, anche quelle che utilizzano processi tecnologici più avanzati, come una GPU realizzata su un nodo produttivo a 4 nm.
Dal punto di vista prettamente tecnico, NorthPole contiene 22 miliardi di transistor in 800 millimetri quadrati; può eseguire 2.048 operazioni per core per ciclo con precisione a 8 bit.
Durante i test, il team di NorthPole si è concentrato principalmente sugli usi legati alla visione artificiale, in parte perché i finanziamenti per il progetto provengono dal Dipartimento della Difesa USA. Alcune delle principali applicazioni prese in considerazione includono il rilevamento di persone ed oggetti, la segmentazione delle immagini e la classificazione dei video. Il chip è comunque utilizzabile anche in altri ambiti, come per l’elaborazione del linguaggio naturale oppure per il riconoscimento vocale.
Le immagini pubblicate nell’articolo sono tratte dalla nota pubblicata da IBM Research.