In un altro nostro articolo abbiamo parlato di automazione del browser Web per migliorare la produttività e snellire le attività ripetitive, demandandole alla macchina. OpenAI ha appena annunciato la disponibilità di Operator per gli utenti di ChatGT Pro in Europa. Si tratta di un annuncio importante perché gli utenti italiani hanno per la prima volta la possibilità di usare un agente AI capace di navigare sul Web ed eseguire compiti al posto loro.
Come funziona ChatGPT Operator e a cosa serve
Gli sviluppatori di OpenAI hanno concepito Operator come uno strumento del tutto automatizzato in grado di svolgere operazioni sulle pagine Web al posto dell’utente. Il sistema si basa su Computer-Using Agent (CUA), modello che combina le capacità visive di GPT-4o con un ragionamento avanzato tramite apprendimento strutturato.
CUA è addestrato per interagire con le interfacce utente grafiche (GUI) che comprendono pulsanti, menu e campi di testo. Tutti gli elementi, insomma, con cui gli utenti interagiscono quotidianamente.
Il vantaggio di Operator è che l’agente AI è completamente svincolato dalla piattaforma sottostante (i.e. sistema operativo) e non necessita di API (Application Programming Interface), come nel caso di altre soluzioni. Non è necessario, inoltre, disporre di conoscenze in materia di programmazione perché l’attività è svolta da Operator in maniera del tutto autonoma.
La principali abilità di OpenAI Operator
Operator è progettato per essere intuitivo: basta descrivere il compito da eseguire e l’agente AI si occuperà del resto. Gli utenti possono comunque intervenire in qualsiasi momento per assumere il controllo manuale del browser.
Le principali funzionalità di Operator includono:
- Interazione con le pagine Web senza la necessità di API dedicate.
- Capacità di auto-correzione in caso di ostacoli o errori.
- Personalizzazione dei flussi di lavoro, con la possibilità di salvare istruzioni personalizzate per specifici siti Web.
- Gestione di compiti multipli in simultanea, con l’esecuzione di più operazioni in parallelo.
Operator chiede conferma prima di eseguire azioni critiche e richiede l’intervento dell’utente per inserire dati sensibili come credenziali o informazioni di pagamento. Gli utenti possono cancellare i dati di navigazione con un solo clic e disattivare l’uso dei propri dati per il miglioramento dei modelli AI. Inoltre, Operator è progettato per ignorare iniezioni di prompt dannosi e utilizza un sistema di monitoraggio per identificare comportamenti sospetti.
Cosa cambia con Operator integrato in ChatGPT
Un agente AI del calibro di Operator segna l’inizio di un futuro in cui l’AI non solo fornisce informazioni, ma esegue autonomamente flussi di lavoro per le aziende e le persone, sotto la loro supervisione. Le abilità di computer vision integrate nel prodotto, fanno sì che con Operator sia addirittura possibile superare i CAPTCHA, utilizzando lo stesso approccio di un essere umano.
L’integrazione diretta con ChatGPT democratizza l’accesso a Operator mettendo gli utenti finali nelle condizioni di automatizzare qualunque operazione sul Web a partire da un comando di alto livello fornito usando esclusivamente il linguaggio naturale.
Come provare ChatGPT Operator
Tutte le informazioni per accedere subito a ChatGPT Operator e mettere alla prova il nuovo agente AI sono disponibili sul sito ufficiale.
Al momento, l’uso di Operator è riservato agli utenti sottoscrittori del piano a pagamento più costoso (ChatGPT Pro). OpenAI ha comunque precisato che l’obiettivo è estenderne, nei prossimi mesi, la disponibilità agli utenti dei piani Plus, Team ed Enterprise. Non è escluso che, alla fine, Operator possa debuttare anche in ChatGPT Free, magari con qualche restrizione sul volume di query gestibili.