Fate ragionare l'intelligenza artificiale con o1 su ChatGPT

OpenAI ha reso disponibile su ChatGPT il nuovo o1, modello generativo avanzato progettato per ragionare meglio su problemi logico-matematici. Come funziona e come metterlo subito alla prova.

L’intelligenza artificiale (AI) e in particolare i modelli generativi, ad esempio quelli alla base del funzionamento di chatbot come ChatGPT, sono progettati per produrre risposte coerenti e contestualmente appropriate a partire da enormi volumi di dati, acquisiti ed elaborati nella fase di addestramento iniziale. I sottostanti Large Language Models (LLM), tuttavia, come abbiamo spesso avuto modo di spiegare, utilizzano un approccio matematico-statistico, scegliendo sempre i termini (o meglio i token) che con maggiore probabilità dovrebbero seguire quelli già presenti in una frase. La base di partenza è il prompt, ossia la richiesta fornita dall’utente. E se vi dicessimo che è possibile far ragionare l’intelligenza artificiale alla base di ChatGPT?

OpenAI rende disponibile per gli utenti di ChatGPT il modello o1 in grado di ragionare

Sono in tanti a sostenere che non passerà tanto tempo prima che l’intelligenza artificiale supererà quella umana. Da parte nostra, invece, invitiamo a muoversi con i proverbiali piedi di piombo.

Una cosa sono infatti le logiche di ragionamento del cervello umano, un’altra quelle implementabili in un’intelligenza artificiale. I modelli generativi e i sottostanti LLM non pensano nel senso umano del termine; piuttosto, manipolano rappresentazioni numeriche per generare risposte il più possibile sensate.

Appena un paio di mesi fa, intorno alla metà di settembre 2024, OpenAI ha presentato un’anteprima del suo nuovo modello o1, capace di “ragionare” e comportarsi in maniera nettamente migliore, rispetto al passato, ad esempio nell’elaborazione di problemi di tipo logico-matematico. In un altro articolo abbiamo provato a svelare il segreto di OpenAI o1 per introdurre abilità di ragionamento nell’intelligenza artificiale.

OpenAI ha battuto tutti sul tempo nel realizzare un prodotto commerciale completamente funzionante, ma le abilità di reasoning dei modelli generativi sono qualcosa di cui si parla già dal 2022 (ancora volta in un documento firmato Google Research).

Come usare il modello OpenAI o1 con ChatGPT

Senza bisogno di attivare l’API (Application Programming Interface) a pagamento di OpenAI, da oggi diventa possibile provare il modello o1 capace di ragionare, direttamente dall’interfaccia di ChatGPT.

La novità è accessibile da tutti gli utenti paganti di ChatGPT in possesso di un piano Plus o Team. Dalla prossima settimana, la possibilità di usare o1 sarà estesa anche ai possessori di piani ChatGPT Enterprise ed Edu.

Ragionamento avanzato ChatGPT o1

Cliccando sul menu a tendina in alto, nell’interfaccia di ChatGPT, si può da oggi selezionare il ragionamento avanzato dei modelli o1 e o1-mini.

OpenAI o1 utilizza un’implementazione avanzata del processo noto come “chain-of-thought“: a differenza dell’approccio più tradizionale, il modello scompone i problemi in passaggi più semplici e gestibili. Sebbene, come detto, le differenze tra il ragionamento umano e quello di un’AI siano sostanziali, la suddivisione del problema in più parti da gestire con la dovuta attenzione fa avvicinare il comportamento del modello generativo a quello che ciascuno di noi segue abitualmente per cimentarsi con le sfide più complesse.

L’AI generativa può quindi continuare a operare su modelli probabilistici e, pur non seguendo un processo logico rigoroso, sa comunque produrre risposte corrette senza una vera comprensione del contenuto.

Porre quesiti logico-matematici a OpenAI o1

Adesso che una larga fetta di utenti di ChatGPT può mettere le mani su OpenAI o1, suggeriamo di valutare le abilità di “ragionamento” del modello proponendo domande che richiedano deduzione logica, comprensione causale o analisi strutturata.

Oggi possiamo dire che con o1, ChatGPT argina gli errori che avevamo scovato in passato e risponde correttamente ai quesiti che avevamo proposto a suo tempo.

Il consiglio, però, è quello di non usare formule preconfezionate. I modelli generativi, come quelli di OpenAI, sono soggetti a una continua attività di addestramento. Sono quindi capaci di migliorare continuamente le informazioni prodotte. Per testare davvero le abilità di reasoning sarebbe quindi preferibile usare quesiti (prompt) che l’IA non ha mai visto prima.

Utilizzate l’ebook “Test Your Logic”

Abbiamo scovato per voi un’utile risorsa pubblicata su Google Books che offre spunti interessanti sulla risoluzione dei problemi di logica. Si tratta di Test Your Logic, un vecchio testo del 1972: tutto il suo contenuto è disponibile gratuitamente.

Google Lens con OpenAI o1

Potete scorrere i vari quiz con il browser quindi, ad esempio in Chrome, cliccare con il tasto destro, scegliere Cerca con Google Lens quindi cliccare su Seleziona testo, Copia. In questo modo otterrete il quesito da sottoporre direttamente a ChatGPT o1. Potete anche tradurlo in italiano con DeepL.

Test quesiti logico-matematici OpenAI o1

Il testo di George J. Summers è una buona “palestra” per verificare le abilità di reasoning di ChatGPT. O meglio, del sottostante modello o1.

Abbiamo posto il seguente quesito a ChatGPT o1:

Test ChatGPT o1 ragionamento

Ci sono voluti più di due minuti e mezzo di elaborazioni, scomponendo il problema in più passaggi. Eppure, alla fine, o1 ha trovato il bandolo della matassa fornendo la risposta giusta:

Risposta giusta ChatGPT o1

Fornendo lo stesso prompt in una nuova chat, o1 ha risolto l’enigma in appena 23 secondi, prova evidente di come l’addestramento del modello sia continuativo.

Differenze tra OpenAI o1 e o1-mini

Caratteristica OpenAI o1 OpenAI o1-mini
Dimensione Maggiore, progettato per compiti complessi Più piccolo, ottimizzato per velocità
Velocità di elaborazione Elaborazione standard Elabora i token tre volte più velocemente
Tempo di “riflessone” “Pensa” meno a lungo rispetto a o1-mini “Pensa” più a lungo, migliorando la qualità delle risposte
Prestazioni programmazione Buone, ma non sempre superiori a GPT-4o Potenzialmente migliori in compiti di codifica
Applicazioni ottimizzate Generalmente per ragionamento complesso Ottimizzato per ragionamento STEM e codifica
Risultati nei benchmark Eccelle in test complessi, ma con variabilità Prestazioni comparabili in molti compiti, ma inferiori in conoscenze fattuali non-STEM

Il termine STEM è un acronimo che sta per Science, Technology, Engineering, and Mathematics (Scienze, Tecnologia, Ingegneria e Matematica). Si riferisce a un campo educativo e professionale che comprende le discipline scientifiche e tecniche. L’accento su STEM è spesso posto sull’importanza di queste aree per lo sviluppo economico e l’innovazione tecnologica. Le competenze STEM sono considerate fondamentali per affrontare le sfide moderne e prepararsi per l’attività lavorativa nel settore tecnologico e scientifico.

Ti consigliamo anche

Link copiato negli appunti