Con la progressiva migrazione dalla piattaforma Intel x86 ai suoi SoC di derivazione ARM, Apple sta via via presentando Mac sempre più performanti.
Abbiamo parlato del SoC Apple M1 Ultra: altro non è che un doppio SoC M1 Max interconnessi mediante un collegamento UltraFusion ad alta velocità.
Ma cos’è e come funziona UltraFusion? A spiegarlo ci hanno pensato i tecnici di TSMC, azienda taiwanese che realizza i SoC per conto di Apple.
Gli ingegneri di TSMC chiariscono che UltraFusion è un’interconnessione diretta tra chip chiamata InFO (Integrated Fan-Out) in gergo tecnico. Nell’elettronica digitale il fan-out rappresenta il numero di porte logiche che possono essere collegate all’uscita di una porta logica.
Nel caso del SoC M1 Ultra TSMC ha utilizzato la tecnica InFO_LI (InFO con interconnessione locale) e un Redistribution Layer (RDL). Si tratta di una scelta tecnica che appare molto meno costosa rispetto ad altre soluzioni (si era parlato ad esempio di CoWoS) con interconnessioni in silicio che ricordano da vicino EMIB (Embedded Die Interconnect Bridge) di Intel.
I due chip M1 Max utilizzati per creare l’M1 Ultra funzionano su un’architettura “non-uniform memory access” (NUMA) che si può ricordare dai primi AMD Threadripper ed era una fonte di latenza aggiuntiva. Come nel caso del Threadripper, il SoC M1 Ultra nasconde al sistema operativo il fatto di utilizzare NUMA quindi appare come un unico chip.
Poiché entrambi i chip possono accedere alla propria memoria o a quella dell’altro chip, il flusso di dati attraverso l’interconnessione UltraFusion aggiunge comunque latenza, non importa quanto sia veloce l’interconnessione. Apple fa riferimento a un’interfaccia capace di muovere ben 2,5 TB/s, un valore incredibile che soltanto la tecnica InFO_LI permette di raggiungere.
Nel complesso M1 Ultra è quasi 8 volte più veloce di M1 e può sfruttare un massimo di 20 core di cui 14 ad alte prestazioni e 6 a elevata efficienza energetica. Può inoltre indirizzare un massimo di 128 GB di memoria RAM ovvero 64 GB per chip con una larghezza di banda fino a 800 GB/s. La GPU utilizza 64 core con il Neural Engine, utilizzato per i compiti legati all’intelligenza artificiale, che poggia il suo funzionamento su 32 core.