Con particolare riguardo ai SoC più avanzati destinati ai dispositivi mobili si parla sempre più di unità specializzate nella gestione degli algoritmi di intelligenza artificiale: le unità di elaborazione neurale (NPU, Neural Processing Unit).
Gli stessi nuovi Mac basati su chip Apple M1 integrano una NPU all’interno del nuovo SoC di derivazione ARM insieme con diverse altre unità altrettanto specializzate: Apple Silicon: perché il nuovo chip M1 è così veloce?.
Questi tipi di unità sono diventati fondamentali per smartphone e tablet evoluti perché consentono di eseguire compiti molto complessi in breve tempo e con pochissime risorse. Peculiarità che hanno fatto il vuoto rispetto a ciò che è possibile fare con le CPU dei normali computer.
Sui PC non si è mai parlato prima d’ora di unità dedicate alle elaborazioni connesse con l’intelligenza artificiale. Tutto però potrebbe cambiare grazie all’implementazione delle estensioni Intel AMX (Advanced Matrix Extension).
Se si dispone di un computer tradizionale al momento l’unico modo per avere un’unità specializzata per l’intelligenza artificiale è acquistare un hardware separato: si può acquistare una GPU della famiglia NVidia RTX oppure servirsi di un FPGA montato su uno slot PCI Express.
Intel sta lavorando sull’integrazione a livello di CPU di un’unità chiamata GNA che può gestire alcuni algoritmi utilizzati nel campo dell’intelligenza artificiale facendo sì che a breve un numero crescente di applicazioni possa trarre vantaggio da questo tipo di configurazione.
Le estensioni Intel AMX vanno ad ampliare il set di istruzioni precedentemente disponibile nell’ambito dell’architettura x86 (vedere x86, le origini dell’architettura: perché è feudo di Intel e AMD) introducendo nuove abilità e ottimizzando in particolare la gestione dei tensori, strutture matematiche alla base delle elaborazioni nel campo dell’intelligenza artificiale.
Intel AMX aggiunge in particolare due elementi nuovi: una serie di registri bidimensionali (tiles) e un set di acceleratori in grado di operare su tali registri. Questi acceleratori condividono l’accesso alla memoria in modo coerente con il resto degli elementi della CPU e possono lavorare in modo sincrono con altre unità di esecuzione x86 e in parallelo con esse.
Anche se Intel utilizzerà per la prima volta le estensioni AMX nei processori Xeon Sapphire Rapids non c’è dubbio che le vedremo successivamente introdotte anche nel resto delle CPU dell’azienda di Santa Clara.