A fine aprile 2023, Google aveva annunciato la nuova DeepMind. L’azienda precedentemente controllata dalla “casa madre” Alphabet, è entrata a far parte di Google con il preciso obiettivo di spingere l’acceleratore sulle soluzioni per l’intelligenza artificiale, a tutti i livelli. Così, i tecnici di DeepMind hanno presentato un robot intelligente in grado di imparare in modo autonomo.
Sì, perché i robot stanno rapidamente entrando a far parte della nostra vita quotidiana, ma spesso sono programmati solo per eseguire bene compiti specifici. Sfruttando i recenti progressi nel settore dell’IA, è invece possibile realizzare robot che potrebbero offrire un valido aiuto in molti altri modi.
RoboCat è un dispositivo robotico che impara a eseguire una varietà di compiti sui diversi bracci dei quali è dotato. Genera automaticamente nuovi dati di addestramento per migliorare la sua tecnica, continuare ad “apprendere” e migliorarsi progressivamente. Secondo i portavoce di DeepMind, RoboCat impara molto più velocemente rispetto ad altri modelli all’avanguardia. Può ad esempio eseguire una nuova attività con un minimo di 100 dimostrazioni perché può attingere da un set di dati ampio e diversificato.
Le abilità dimostrate con il progetto Robocat, contribuiranno ad accelerare la ricerca sulla robotica. Il periodo di formazione sotto la supervisione umana risulta radicalmente ridotto tanto che DeepMind sembra aver compiuto un passo importante verso la creazione di un “robot generico”.
Il robot intelligente Robocat utilizza un modello multimodale: cosa significa
Seguendo il trend verso il quale si stanno orientando le principali aziende promotrici di nuovi modelli generativi per l’intelligenza artificiale, RoboCat si basa su un modello multimodale sviluppato dagli ingegneri di DeepMind. Si chiama Gato (“gatto” in spagnolo) ed è in grado di elaborare linguaggio, immagini e azioni sia in ambienti simulati che fisici. DeepMind ha unito l’architettura di Gato con un ampio set di dati di addestramento basati su sequenze di immagini e azioni di vari bracci robotici che risolvono centinaia di compiti diversi.
L’attività formativa alla quale è stato sottoposto RoboCat
Dopo questo primo round di formazione, RoboCat è stato messo alla prova con un ciclo di formazione di “auto-miglioramento” presentandogli una serie di compiti mai visti prima. L’apprendimento di ogni nuovo compito ha seguito cinque fasi:
- Raccolta di 100-1000 dimostrazioni di un nuovo compito, utilizzando un braccio robotico controllato da un essere umano.
- Messa a punto dell’abilità di RoboCat sul nuovo compito, creando un “agente” specializzato.
- L’agente si esercita su questa nuova attività per una media di 10.000 volte, generando più dati di addestramento.
- I dati dimostrativi e i dati autogenerati sono aggiunti al set di dati di addestramento esistente.
- Una nuova versione di RoboCat è addestrata a partire dal nuovo set di dati.
Con la formazione diversificata alla quale è stato sottoposto RoboCat (qui un video che ne mostra il funzionamento), il robot ha imparato a utilizzare diversi bracci robotici in poche ore. Sebbene fosse stato addestrato su braccia con pinze a due punte, RoboCat si è mostrato capace di adattarsi all’uso di un braccio più complesso con una pinza a tre dita e il doppio degli input.
A margine degli innumerevoli test condotti da DeepMind, RoboCat ha dimostrato di potersi adattare per la risoluzione di compiti che combinano precisione e “comprensione”.
La capacità di RoboCat di apprendere autonomamente le abilità e di auto-migliorarsi rapidamente, contribuirà a spianare la strada verso una nuova generazione di dispositivi robotici più utili e “versatili”.