Il leggendario progettista di CPU Jim Keller non ha certo bisogno di presentazioni. È il padre dell’architettura Zen, che ha permesso ad AMD di tornare al successo in tempi brevi dopo essersi pericolosamente avvicinata al baratro. Dopo aver svolto ruoli di primaria importanza in Apple, Tesla, AMD e Intel, Keller ha assunto la carica di CEO di Tenstorrent all’inizio del 2023 dopo essere stato CTO dell’azienda per due anni. Keller è coinvolto anche in progetti curiosi e ambiziosi: citiamo ad esempio Atomic Semi, la fabbrica di semiconduttori innovativi ideata con Sam Zeloof.
Tenstorrent è un’azienda specializzata nella progettazione e nello sviluppo di soluzioni di elaborazione accelerata per le applicazioni di intelligenza artificiale. L’azienda è stata fondata nel 2016 da Ljubisa Bajic, docente di informatica presso l’Università di Toronto, insieme con altri esperti nel campo dell’architettura dei processori. L’approccio di Tenstorrent consiste nello sviluppo di processori specializzati, progettati specificamente per le esigenze dell’IA. Si tratta di unità di elaborazione tensoriale (TPU) che mirano a massimizzare le prestazioni nei calcoli intensivi legati all’utilizzo delle reti neurali pur puntando sull’efficienza energetica.
Jim Keller ne è sicuro: RISC-V sarà protagonista della scena già entro i prossimi 5-10 anni
Pur seguendo in prima linea le evoluzioni dei microprocessori (di recente ha dichiarato che l’architettura AMD Zen 5 migliorerà il rendimento del 30%), Keller è diventato negli ultimi anni un convinto sostenitore RISC-V, ISA libero da royalty destinato a diventare sempre più popolare in futuro.
“La mia convinzione è che nei prossimi 5-10 anni RISC-V prenderà il controllo di tutti i data center“, ha detto Keller in una splendida intervista rilasciata ad EE Times, aggiungendo che i processori RISC-V saranno utilizzati soprattutto per il calcolo scientifico e l’HPC (High Performance Computing).
A questo proposito, Keller ha sottolineato quanto RISC-V permetterà di sostenere la diffusione di hardware e software aperti. La stessa Tenstorrent, ha aggiunto, intende rendere open source il suo stack di software AI, a breve. “Volevamo farlo l’anno scorso, ma non eravamo pronti: il nostro stack software era troppo disordinato e doveva essere riorganizzato in modo ragionato“, ha detto Keller.
LG utilizza la proprietà intellettuale di Tenstorrent per sviluppare nuovi chip. Cosa si intende per edge integrato
Con una mossa a sorpresa per un’azienda che realizza chip per data center, Tenstorrent ha recentemente concesso in licenza a LG Electronics sia la proprietà intelllettuale dell’acceleratore AI Tensix che quella relativa alla CPU Ascalon. Il colosso coreano dell’elettronica di consumo prevede di utilizzare le risorse sviluppate da Tenstorrent per sviluppare un “edge integrato”, ad esempio nelle smart TV e nei chip per il mercato automotive.
Con il termine edge integrato, LG fa riferimento a un modello di elaborazione dei dati in cui l’elaborazione avviene direttamente “sul campo” (edge) o in prossimità delle fonti di generazione dei dati, invece di trasmettere tutti i dati a un’infrastruttura centrale o a un cloud remoto per l’elaborazione. In passato, infatti, i dati venivano trasmessi a un centro di elaborazione dati remoto o comunque passati al cloud per l’elaborazione. Ciò può tuttavia introdurre diversi problemi: una certa latenza nella trasmissione dei dati e la dipendenza dalla connettività di rete. Inoltre, l’invio di grandi quantità di dati attraverso la rete può richiedere una larghezza di banda significativa sollevando anche preoccupazioni sulla privacy e sulla sicurezza dei dati.
Con l’approccio edge integrato, l’elaborazione dei dati avviene più vicino alla loro origine, tipicamente su dispositivi o sistemi integrati nell’infrastruttura locale. Questi dispositivi o sistemi possono essere sensori, dispositivi per l’Internet delle Cose (IoT), server perimetrali o appliance di rete, tra gli altri. L’idea è di spostare l’elaborazione più vicino ai punti di generazione dei dati per ridurre la latenza, migliorare la reattività del sistema ed evitare la dipendenza dalla connettività di rete.
LG e Tenstorrent prevedono inoltre di collaborare alle future generazioni di CPU RISC-V, acceleratori per l’IA, codec video e dispositivi basati sull’architettura a chiplet.
Per Jim Keller l’intelligenza artificiale evolverà tanto nei prossimi anni e sarà ampiamente utilizzata a livello di edge
Non deve destare meraviglia che una società come LG si sia interessata al core business di una realtà innovativa come Tenstorrent. Proprio LG, infatti, nel 2020 ha fondato una divisione specializzata nello sviluppo di soluzioni basate sull’intelligenza artificiale. “Ad essere onesti, siamo all’inizio della nostra attività… siamo ancora piccoli e stiamo risolvendo molti problemi tecnologici“, ha dichiarato Keller parlando di Tenstorrent. “Come tecnologo, sono davvero interessato al coinvolgimento di altre persone intelligenti; se qualcuno chiede di accedere al nostro hardware open source in modo da poterlo programmare secondo le sue esigenze, perché dovrei dire di no?”
D’altra parte Keller sostiene che le soluzioni edge basate sull’IA fino ad oggi disponibili sono state sempre troppo “specifiche” e difficili da programmare.
L’ingegnere che l’anno scorso criticò la decisione di AMD di abbandonare lo sviluppo di ARM K12, chip basato su piattaforma ARM, afferma che parlando di intelligenza artificiale essa è destinata ad evolvere molto. Quello che abbiamo visto negli ultimi 5 anni e nei periodi più recenti è nulla rispetto ancora a ciò che deve accadere. “La differenziazione tra inferenza e addestramento, linguaggio e immagine sarà sempre più sfocata“, sostiene Keller. Basta prendere Stable Diffusion: è in parte un image model, in parte un language model che riceve in risposta anche una pipeline di addestramento.
Differenze tra image model e language model
Un “image model” è un modello che viene addestrato per analizzare e comprendere le immagini. Può essere utilizzato per una varietà di compiti, come riconoscimento di oggetti, classificazione delle immagini, segmentazione delle immagini o generazione di nuove immagini. I modelli di immagini spesso utilizzano tecniche di deep learning, come le reti neurali convoluzionali (CNN), per estrarre caratteristiche significative dalle immagini e prendere decisioni basate su tali caratteristiche.
D’altra parte, un “language model” è un modello addestrato per comprendere e generare linguaggio naturale, ad esempio dei testi. I language model possono essere utilizzati per una vasta gamma di compiti nel campo del trattamento del linguaggio naturale, come traduzione automatica, generazione di testo, comprensione del linguaggio naturale, risposte alle domande e molto altro ancora.
Credit immagine in apertura: iStock.com/Andy