Meta è una della aziende che stanno scommettendo di più sui modelli generativi e sull’intelligenza artificiale in generale.
Yann LeCun, informatico francese naturalizzato statunitense esperto di machine learning, visione artificiale, robotica e di neuroscienze computazionali, a capo della divisione IA di Meta, aveva dichiarato a fine febbraio 2023 che ChatGPT non è poi una piattaforma così innovativa lasciando intendere che l’azienda guidata da Mark Zuckerberg avrebbe presto presentato “rivoluzionarie” novità.
La prima innovazione, arrivata a distanza di qualche giorno, è stata il rilascio di LLaMa (Large Language Model Meta AI): non si tratta di un servizio, come ChatGPT, bensì di un modello che Meta ha messo a disposizione degli interessati attraverso una licenza non commerciale. In un altro nostro articolo abbiamo visto come usare LLaMa per creare un ChatGPT in locale.
Adesso Meta ha svelato pubblicamente il nuovo progetto Segment Anything (SAM), uno strumento basato sull’intelligenza artificiale che può innanzi tutto identificare i vari elementi presenti in un’immagine per poi cosentire di scontornare oggetti e persone dalle foto con un semplice clic oppure partendo da una descrizione testuale. È in pratica possibile chiedere a SAM di evidenziare, ad esempio, tutti i gatti che trova in un’immagine: l’intelligenza artificiale riconosce il profilo di ciascun gatto e ne marca con precisione il contorno.
Il funzionamento di SAM può essere valutato servendosi della demo accessibile tramite browser Web. Poiché gli sviluppatori di Meta hanno pubblicato su GitHub il codice sorgente del progetto, gli interessati possono installare ed eseguire SAM in locale previa clonazione del repository con il comando git e caricamento del codice Python.
Meta racconta che il modello alla base del funzionamento di SAM è stato addestrato con un set da 11 milioni di immagini, anch’esso condiviso. Nella pagina di test, la società di Zuckerberg mostra una selezione composta da circa 50.000 immagini utilizzabili per verificare come funziona SAM (è ovviamente possibile caricare le proprie immagini selezionandole dal dispositivo in uso).
L’uso più ovvio di uno strumento come SAM consiste nello scontornare ed estrarre oggetti dalle immagini rimuovendo lo sfondo dalle foto. L’intelligenza artificiale di Meta è però in grado di segmentare automaticamente tutto ciò che appare in un’immagine, generare più maschere valide per prompt (richieste dell’utente) ambigui, accettare richieste di input da altri sistemi. Quest’ultimo è un aspetto davvero interessante perché in futuro SAM può rilevare in quale direzione sta guardando l’utente che indossa un dispositivo per la realtà aumentata o virtuale e selezionare automaticamente un oggetto fornendo informazioni pertinenti su di esso.
Nonostante i munifici investimenti di Meta sul suo metaverso, l’accoglienza del pubblico rimane ancora piuttosto fredda. L’impatto che le scelte di Zuckerberg e dei “suoi” hanno avuto sull’azienda, sui suoi conti e sulla sua immagine è stato più che rilevante. Sebbene sia ancora un progetto sperimentale, SAM potrebbe dare nuova spinta alle ambizioni di Meta in ambito metaverso abilitando funzionalità inedite ed esclusive.