Le soluzioni di intelligenza artificiale (IA) non trovano spazio solamente in ambito server. Con l’iniziativa Arm Compute Subsystems (CSS) per Client, la società britannica è determinata a rivoluzionare il mondo degli smartphone e dei tablet. La nuova piattaforma integra diverse componenti hardware avanzate, tra cui core Cortex-X925 e Cortex-A725 basati sull’architettura Armv9.2 per la CPU. L’obiettivo è quello di assicurare prestazioni ed efficienza energetica senza precedenti.
Con le applicazioni di IA che sbarcano sempre più spesso sui sistemi consumer, l’ecosistema CSS migliorerà significativamente le capacità di calcolo e la gestione energetica dei dispositivi dei quali ci serviamo ogni giorno.
Una soluzione come CSS per Client garantisce prestazioni migliorate del 59% lato CPU e del 36% sul versante GPU, quando si tratta di gestire operazioni di inferenza legate all’IA. Il punto di riferimento è la precedente piattaforma TCS23. Utilizzando due core Cortex-X925, le attività di inferenza IA effettuate sulla CPU sono 2,7 volte più performanti se confrontate con una configurazione a singolo Cortex-X4.
Un esempio pratico delle abilità di CSS per Client sono le prestazioni migliorate nell’elaborazione delle immagini della fotocamera. Arm spiega che l’aggiunta di effetti bokeh realistici sulle foto, basata sull’IA, assicura l’applicazione delle modifiche richieste in maniera più veloce e fluida, senza compromettere la durata della batteria.
Cortex-X925: prestazioni migliorate e supporta per l’IA integrato
Il core Cortex-X925, conosciuto con il nome in codice di Blackhawk, rappresenta certamente il fiore all’occhiello della nuova piattaforma CSS per Client. Le performance appaiono particolarmente convincenti: un aumento del 36% nelle prestazioni single-thread e un incremento del 46% nelle elaborazioni collegate con l’IA rispetto alla generazione precedente, Cortex-X4.
L’architettura Armv9.2 introduce miglioramenti significativi che massimizzano il valore IPC (numero di istruzioni elaborate per ciclo di clock). L’obiettivo è raggiunto grazie al raddoppio delle dimensioni della instruction window e della banda utilizzabile dalla cache L1.
L’intervento a livello di instruction window permette alla CPU di “osservare” un numero maggiore di istruzioni in anticipo rispetto a quelle che sta effettivamente eseguendo. In pratica, consente al processore di “guardare avanti” in una sequenza di istruzioni lunga, per identificare e risolvere eventuali dipendenze tra le istruzioni stesse. Questa modifica riduce i blocchi nell’esecuzione dei programmi e del sistema operativo, ovvero i momenti in cui la CPU deve fermarsi perché le istruzioni non possono essere eseguite a causa di dipendenze non risolte o di altre limitazioni.
La cache L1 è una memoria molto veloce situata direttamente all’interno del core della CPU, utilizzata per memorizzare le istruzioni più frequentemente utilizzate. Arm ha raddoppiato la banda della cache delle istruzioni L1, il che significa che la CPU può leggere e scrivere le istruzioni nella cache a una velocità doppia rispetto a prima. In questo modo è possibile ridurre il tempo necessario per recuperare le istruzioni dalla memoria principale, minimizzando la latenza e migliorando le prestazioni complessive.
La Translation Lookaside Buffer (TLB) per le istruzioni L1 è una cache che memorizza le traduzioni degli indirizzi virtuali in indirizzi fisici. Raddoppiando anche la dimensione della TLB per le istruzioni L1, Arm ha aumentato il numero di traduzioni che possono essere memorizzate contemporaneamente, riducendo il numero di volte in cui la CPU deve accedere alla memoria principale.
Core Cortex-A725 e GPU Immortalis-G925
Rispetto al Cortex-A720, il nuovo Cortex-A725 è il 35% più efficiente e consuma il 25% in meno di energia. Un aumento della cache L2 a 1 MB contribuisce a ridurre la latenza e migliorare le prestazioni in applicazioni che richiedono un rapido accesso ai dati.
Immortalis-G925, evoluzione della quinta generazione di GPU Arm, offre prestazioni grafiche migliorate del 37% rispetto alla generazione precedente Immortalis-G720. Con 14 core e una cache L2 di 4 MB, questa GPU è progettata per gestire applicazioni grafiche complesse, garantendo un’esperienza grafica significativamente migliorata sui dispositivi mobili.
L’unità DSU-120 (DynamIQ Shared Unit) è responsabile della gestione energetica sulla piattaforma CSS per Client: introduce nuove modalità d’uso, efficienza e basso consumo energetico. Questi miglioramenti riducono il consumo di energia del 50% per carichi di lavoro tipici, prolungando significativamente la durata della batteria dei dispositivi consumer.