Dopo la presentazione di novembre 2023, OpenAI ha consegnato a fine maggio 2024 – anche agli utenti non paganti – la possibilità di usare GPT personalizzati all’interno di ChatGPT. Accessibili cliccando su Esplora GPT nella schermata principale dell’applicazione ChatGPT, questi strumenti arricchiscono le potenzialità del chatbot combinando le abilità del sottostante modello generativo con le informazioni provenienti da strumenti di terze parti o successivamente elaborate da quest’ultime.
GPT, cosa sono e a cosa servono
Quando si parla di GPT (Generative Pre-trained Transformers), si fa solitamente riferimento a una serie di modelli generativi sviluppati da OpenAI. Sono progettati per comprendere e generare testo in linguaggio naturale e la loro struttura è basata su una variante dei Transformer, un’architettura di rete neurale introdotta da un team di ingegneri Google nel 2017 (documento dal titolo “Attention Is All You Need“). I Transformer gestiscono in modo efficace sequenze molto lunghe di testo.
I modelli GPT sono pre-addestrati su grandi quantità di testo per prevedere la parola successiva in una sequenza, un compito chiamato “addestramento autoregressivo“. Questo li rende capaci di “comprendere” una vasta gamma di informazioni linguistiche e, soprattutto, come effetto direttamente conseguente, stabilire le relazioni tra parole e concetti.
Il modello pre-addestrato è poi ulteriormente migliorato (fine tuning) su set di dati specifici per compiti particolari. In questo modo il modello diventa più abile nello svolgimento di mansioni specifiche come la traduzione, la risposta a domande o la generazione di testi coerenti e pertinenti.
Queste attività fanno emergere anche gli aspetti semantici ovvero il significato intrinseco di parole, frasi e concetti.
Vettori e dimensioni dei modelli generativi
Quando un modello GPT riceve un input testuale, trasforma il testo in vettori numerici (embedding) che rappresentano il significato delle parole nel contesto in cui sono utilizzate. Ne parliamo nell’articolo incentrato sui segreti dell’attenzione nei modelli per l’intelligenza artificiale generativa. I vettori sono fatti transitare attraverso i vari strati del modello ed elaborati per determinare quali parole sono rilevanti al fine della “comprensione” del contesto generale. Come ultimo passo, il modello genera un output testuale che risponde al prompt o input iniziale fornito dall’utente.
Ne è passato di tempo da quando, prima ancora di ChatGPT, OpenAI ha svelato il modello GPT-2 (2019) che nella versione più “evoluta” usava 1,5 miliardi di parametri. GPT-3 aveva 175 miliardi di parametri, mentre GPT-4 (sebbene il numero esatto non sia mai stato rivelato) potrebbe usare circa 1760 miliardi di parametri.
Il numero di parametri nei modelli generativi come GPT fa riferimento alla quantità di pesi (o coefficienti) che devono essere adattati durante il processo di addestramento del modello. Rappresentano i pesi delle connessioni tra i neuroni nelle varie parti della rete neurale.
A cosa servono i GPT accessibili attraverso l’interfaccia di ChatGPT
Chiarito qual è il significato generale di GPT, è immediato rilevare come – anche nell’interfaccia della versione gratuita di ChatGPT – sia comparsa la voce Esplora GPT nella colonna di sinistra. Di che cosa si tratta?
ChatGPT utilizza i modelli GPT come base tecnologica per generare risposte in linguaggio naturale. A questo proposito abbiamo spiegato perché ChatGPT non è un motore di ricerca e come potrebbe eventualmente diventarlo (ne riparliamo anche più avanti).
I GPT che da qualche tempo sono comparsi nell’interfaccia di ChatGPT non offrono, a stretto rigore, la possibilità di collegare il chatbot con GPT di terze parti. Almeno non direttamente.
Sono invece strumenti aggiuntivi che estendono le abilità di ChatGPT e che possono essere sviluppati sia dai tecnici di OpenAI sia da altri soggetti, come avviene spesso. La società guidata da Sam Altman in questo documento spiega che si tratta di “versioni personalizzate di ChatGPT che gli utenti possono scegliere per attività o argomenti specifici combinando istruzioni, conoscenze e capacità“. Gli utenti delle versioni a pagamento di ChatGPT possono creare i loro GPT senza mettere mano al codice di programmazione; i soggetti non paganti che si servono della versione free, possono accedere ai GPT personalizzati resi pubblici da altri individui.
Date un’occhiata a questo catalogo su ChatGPT: si possono facilmente “sfogliare” e scoprire versioni personalizzate di ChatGPT che riuniscono istruzioni, conoscenze aggiuntive e qualsiasi combinazione di competenze sotto un unico cappello.
I GPT di ChatGPT non sono modelli generativi aggiuntivi ma soltanto “ricette”
L’interfaccia di ChatGPT permette di scegliere il modello generativo preferito, dal noto e apprezzato GPT-3.5 fino ad arrivare ai più evoluti GPT-4 e GPT-4o (quest’ultimo multimodale). Gli stessi possessori di un account gratuito possono provare GPT-4o per un numero limitato di prompt per poi essere automaticamente “dirottati” su GPT-3.5. Un piccolo menu a tendina posto immediatamente sotto la risposta fornita di volta in volta da ChatGPT, permette di specificare se usare GPT-3.5 oppure GPT-4o.
Introducendo un po’ di confusione, i GPT accessibili attraverso Esplora GPT non sono modelli generativi completi bensì, come accennato in precedenza, delle “ricette” per combinare informazioni e produrre contenuti maggiormente in linea con le aspettative degli utenti.
Tanti utenti sono soliti copiare informazioni da varie fonti, incollarle nella casella Scrivi un messaggio a ChatGPT e chiedere di effettuare specifiche elaborazioni. Le fonti possono essere anche file in vari formati (compreso il PDF), caricabili dal sistema locale o da sorgenti come Google Drive e Microsoft OneDrive.
Dicevamo in precedenza che ChatGPT non è un motore di ricerca. Provate però a cliccare su Esplora GPT e a selezionare WebSearch. Si tratta di un’aggiunta sviluppata dal team di ChatGPT che combina la ricerca sul Web con il sottostante modello generativo. Come fanno altri modelli (si pensi a Perplexity e Phind), WebSearch usa le informazioni reperite nelle SERP (risultati delle ricerche sul Web) per passarle a GPT e produrre contenuti che vedono la presenza delle fonti, citate in modo chiaro.
Provate a chiedere informazioni a WebSearch su fatti in corso o accadimenti recenti: diversamente rispetto a ChatGPT, la cui conoscenza si ferma a gennaio 2022 (nel caso di GPT-3.5), il chatbot unirà quanto trovato sul Web con un’elaborazione effettuata dal sottostante modello GPT.
Funzionalità dei GPT personalizzati
I GPT esposti nell’interfaccia di ChatGPT non sono insomma modelli generativi. Sono semplicemente strumenti che combinano le abilità dei modelli di OpenAI con informazioni provenienti o prodotte da terze parti.
Quando si clicca su un GPT in elenco, suggeriamo di porre innanzi tutto massima attenzione sul nome dello sviluppatore, verificando il suo sito Web e le piattaforme sulle quali è presente. Allo stesso modo, è utile controllare le valutazioni e il numero di conversazioni complessivamente gestite.
Al di sotto del paragrafo Funzionalità, ChatGPT indica quali operazioni pone in essere il GPT selezionato. L’indicazione “Azioni, recupera o esegue azioni al di fuori di ChatGPT“, significa che i dati immessi dall’utente possono essere utilizzati non soltanto nel chatbot di OpenAI ma vengono adoperati anche all’esterno, ad esempio inviandoli sui server dello sviluppatore terzo.
Al GPT Canva, si può chiedere di generare dei contenuti utilizzando la nota piattaforma. Lo strumento per ChatGPT può essere aggiunto all’elenco dei trucchi e segreti Canva da conoscere subito.
Come si vede nell’immagine, ChatGPT chiede l’autorizzazione per trasferire dei dati verso un server esterno. In questo senso, l’utente è messo nelle condizioni di controllare in tempo reale quali dati fluiscono verso piattaforme diverse, con la possibilità di accettare o negare l’invio delle informazioni.
C’è da dire che in alcuni casi il componente aggiuntivo per ChatGPT fornito da terze parti mostra un link a un contenuto a partire dalle istruzioni dell’utente. Tale link, tuttavia, è spesso visualizzabile soltanto previo login sul sito della terza parte.
GPT multimodali
Alcune “ricette” abilitano la possibilità di sbloccare funzionalità multimodali in ChatGPT: consentono cioè di inviare al chatbot immagini, suoni, video e ottenere un’elaborazione diretta di questi contenuti. Oppure produrli in risposta a uno specifico quesito dell’utente.
Per fare un nome, Hot Mods, sviluppato sempre dagli autori di ChatGPT permette di modificare immagini per ottenere risultati artistici in pochi secondi. Gli utenti della versione free di ChatGPT sono comunque limitati dal numero di messaggi gestibili giornalmente con il sottostante modello GPT-4o. Non tutte le “aggiunte” disponibili nella sezione Esplora GPT sono infatti compatibili con il più vecchio GPT-3.5.
I GPT via via aggiunti nella colonna di sinistra di ChatGPT possono essere richiamati al bisogno, anche dall’interno delle conversazioni usando il simbolo @ seguito dal nome del componente addizionale. Ancora, cliccando su tre puntini a destra del nome di un GPT, si può eventualmente rimuoverlo dall’elenco (Nascondi dalla barra laterale).