Durante la GTC 21, evento organizzato da NVidia che si concluderà oggi, i responsabili della società hanno presentato GANverse3D, una soluzione che permette di convertire le immagini 2D in oggetti 3D che possono essere animati in tempo reale e in modo semplice e veloce anche senza disporre di alcuna competenza in materia di modellazione e rendering tridimensionale.
Il processo è completamente automatizzato e in pochi secondi si ottiene il risultato come dimostra il video pubblicato dai tecnici di NVidia.
Con il progetto GANverse3D la società conferma il suo impegno nel supportare le più complesse applicazioni di intelligenza artificiale.
Si tratta infatti di un motore che sfrutta il deep learning per creare modelli 3D animati partendo da un’immagine in due dimensioni: vedere Machine learning, deep learning e reti neurali: come avvicinarsi a questo mondo e Intelligenza artificiale: come provarla usando solo il browser.
La “magia” avviene utilizzando un metodo di deep learning costruito a partire da una rete generativa avversaria (GAN è appunto acronimo di Generative Adversarial Network).
Le GAN vengono addestrate in maniera competitiva così che possano via via apprendere come generare nuovi dati aventi la stessa distribuzione di quelli usate nella fase di addestramento.
Nel caso delle autovetture dell’esempio la GAN ha sintetizzato le immagini che mostrano lo stesso oggetto 2D da diversi punti di vista: frontale, laterale, parte posteriore e superiore.
Le immagini passate alla GAN vengono sono combinate in un framework che, attraverso un processo di inferenza, provvede alla creazione di un modello 3D a partire proprio dalle informazioni ottenute dalle immagini 2D tratte da diverse prospettive.
Una volta completato questo processo di addestramento, il motore GANverse3D di NVidia è stato in grado di creare modelli 3D partendo da una singola immagine 2D: non ha più avuto bisogno di immagini 2D raffiguranti lo stesso oggetto.
I tecnici di NVidia, in particolare gli esperti dell’AI Research Lab di Toronto (Canada), hanno spiegato che lo stesso approccio può essere utilizzato per qualunque genere di oggetto. GANverse3D è infatti compatibile con la piattaforma NVidia Omniverse e le schede grafiche GeForce RTX serie 20 e RTX serie 30.
Per dimostrare il potenziale della soluzione appena presentata, il team di NVidia ha convertito un’immagine 2D di Kitt, l’auto parlante e senziente di Supercar, in un elaborato modello 3D.
Sono stati poi utilizzati Omniverse e PhysX per migliorare la qualità delle texture e per ottenere una fisica realistica per ciò che riguarda i movimenti della vettura.
GANverse3D è senza dubbio uno dei migliori esempi di ciò che l’intelligenza artificiale consente di fare semplificando notevolmente il lavoro di tecnici, ingegneri, creativi, sviluppatori e professionisti in vari campi.