Siamo abituati a concepire l’Intelligenza Artificiale come un semplice chatbot. Ma se questa tecnologia fosse in grado di gestire direttamente un computer?
Nella giornata di ieri Anthropic ha annunciato l’ultima generazione del suo modello IA Claude e, durante la presentazione, ha svelato come esso sarà in grado di muovere un mouse, simulare la pressione dei tasti sulla tastiera e far funzionare un PC. Claude 3.5 Sonnet è stata proposta in modalità beta, con accesso tramite API per gli sviluppatori, sorprendendo appassionati e addetti ai lavori.
L’IA in questione può essere programmata per interagire con un computer in diversi modi. Claude 3.5 Sonnet è in grado di analizzare ciò che appare a schermo e, di conseguenza, muovere il cursore e cliccare sulle icone presenti sul monitor. Inoltre l’IA è in grado di simulare una tastiera, con conseguente pressione dei tasti.
Il tutto è ancora in fase sperimentale e, come sottolineato da Anthropic, si presentano ancora molti errori ma, viste le premesse, le prospettive sono a dir poco interessanti.
Anthropic renderà l’IA in grado di usare un PC senza intervento umano?
Perché Anthropic considera così interessante questo progetto? Secondo la compagnia, gran parte del lavoro svolto quotidianamente nel mondo avviene tramite computer. Permettendo all’IA di interagire con il software del computer permetterà a tale tecnologia di andare a svolgere un’enorme mole di lavoro in modo automatico.
Viste le enormi potenzialità di Claude 3.5 Sonnet per quanto riguarda il suo interfacciarsi con i computer, diverse aziende si sono già fatte avanti per l’integrazione nei loro processi. A tal proposito si parla di nomi importanti come Canva, Asana e tante altre compagnie di rilievo.
Nonostante ciò, il lavoro previsto per Anthropic non è di certo poco. Programmare l’IA per interfacciarsi con i PC significa addestrare Claude 3.5 Sonnet affinché riesca a decifrare cosa appare a schermo, intraprendendo determinate azioni in risposta agli input visivi. Ciò porta, almeno ad oggi, a numerosi e fisiologici errori di interpretazione.