Intel non si ferma più: dopo avere confermato l’impegno in Germania con la fabbrica di chip di Magdeburgo, la divisione Intel Labs e Blockade Labs annunciano Latent Diffusion Model for 3D (LDM3D). Si tratta di un nuovo modello di IA generativa che crea contenuti visivi 3D a 360 gradi a partire da un prompt testuale. Questa soluzione ha il potenziale per rivoluzionare la creazione di contenuti, le applicazioni del metaverso e le esperienze digitali, trasformando un’ampia gamma di settori, dall’intrattenimento e dai giochi all’architettura e al design.
Intel svela LDM3D: come funziona e a cosa serve?
LDM3D è un modello addestrato su un set composto da 10.000 campioni del database LAION-400M, che contiene oltre 400 milioni di coppie immagine-didascalia. Utilizzando poi Dense Prediction Transformer (DPT), il modello fornisce una profondità relativa estremamente accurata per ogni pixel in un’immagine, attribuendo determinati parametri a minime porzioni di una composizione artistica e, infine, proponendo una ricostruzione tridimensionale a 360 gradi di un ambiente.
Per Intel, LDM3D rappresenta una delle soluzioni verso la democratizzazione dell’IA, in quanto consentirà un accesso più ampio a tutti i vantaggi dell’intelligenza artificiale su più settori. La prima applicazione concreta di questo modello è DepthFusion, un’applicazione che sfrutta foto RGB 2D standard e mappe di profondità per creare esperienze di visualizzazione a 360 gradi coinvolgenti e interattive. Sfruttando TouchDesigner, un linguaggio di programmazione visiva basato su nodi per contenuti multimediali interattivi in tempo reale, le richieste testuali vengono trasformate in esperienze digitali complete.
In questo modo si apre la strada a ulteriori progressi nell’IA generativa multi-vista e nella visione artificiale. Come afferma Vasudev Lal, ricercatore AI/ML di Intel Labs, l’IA generativa di LDM3D permette di risparmiare molto tempo per sviluppare intere scene tridimensionali con una profondità notevole. Al momento si basa su supercomputer Intel AI alimentati da processori Intel Xeon e acceleratori AI Intel Habana Gaudi, ma è chiaro che troverà un futuro in più ambienti e con più aziende, trattandosi di una soluzione open source.