Raccontavamo ieri della grande soddisfazione espressa da Linus Torvalds per il passaggio a una workstation Ampere ARM64, sistema adesso ampiamente utilizzato per gestire le attività di compilazione del kernel Linux. I responsabili di Ampere Computing hanno annunciato che la famiglia di chip AmpereOne si arricchirà presto di nuovi modelli basati su 256 core fisici. Un deciso balzo in avanti che si concretizzerà nel 2025 e che permetterà di offrire il 40% di prestazioni in più rispetto a qualunque CPU presente sul mercato. Almeno stando a quanto affermato da Jeff Wittich, chief product officer Ampere.
Collaborazione tra Ampere e Qualcomm per l’AI Computing
La collaborazione strategica avviata tra Ampere e Qualcomm consentirà di arrivare allo sviluppo congiunto di una soluzione hardware per ottimizzare le attività di inferenza legate all’intelligenza artificiale. L’obiettivo è gettare le basi per una piattaforma di AI Computing in grado di integrare le capacità cloud native con i carichi di lavoro propri dell’IA.
La soluzione partorita da Ampere e Qualcomm vuole essere versatile, flessibile e scalabile, abbinando i processori Ampere con gli acceleratori Qualcomm Cloud AI100 Ultra. Questi ultimi sono concepiti per supportare la gestione dei modelli generativi più grandi del settore.
Le applicazioni di intelligenza artificiale sono energivore: è necessario puntare su processori a basso consumo
Renee James, CEO di Ampere, ha sottolineato come le crescenti esigenze energetiche dell’intelligenza artificiale stiano mettendo in risalto l’approccio vincente adottato dalla sua società. “Una volta, basso consumo significava prestazioni mediocri. Ampere ha dimostrato che non è vero. Abbiamo pionieristicamente superato i confini dell’efficienza di calcolo, offrendo prestazioni superiori rispetto ai processori tradizionali in un contesto di calcolo efficiente“, ha spiegato James chiarendo che oggi si raccolgono i frutti di un lavoro iniziato 6 anni fa.
Lo schema applicato finora nei centri di elaborazione dati di tipo tradizionale non è più sostenibile. L’infrastruttura scelta per i futuri data center dovrà quindi da un lato fare perno sull’adeguamento delle strutture esistenti, dall’altro costruirne di nuove, capaci di adattarsi all’energia disponibile sulla rete.
Wittich ha reso noto che il modello Llama 3 di Meta sta funzionando su processori Ampere nel cloud di Oracle, dimostrando prestazioni paragonabili a una GPU NVIDIA A10, con un consumo energetico inferiore di due terzi.
Ampere presenta la sua roadmap ambiziosa
La nuova piattaforma AmpereOne a 256 core sarà basata sul processo costruttivo TSMC N3 (3 nm). I miglioramenti saranno tangibili anche rispetto al processore AmpereOne a 192 core, attuale top di gamma presentato nel 2023, che già ha dimostrato notevoli miglioramenti in termini di prestazioni ed efficienza.
Sempre sul versante della sostenibilità, Ampere ha inoltre annunciato la formazione di un gruppo di lavoro UCIe nell’ambito dell’AI Platform Alliance. L’obiettivo consiste nell’incorporare tecnologie a interfaccia aperta nei futuri processori, ampliando ulteriormente la flessibilità delle proprie CPU.