Ci sono casi e casi, ma l’utilizzo senza consenso di materiale protetto da copyright resta uno dei principali problemi dei numerosi strumenti basati sull’intelligenza artificiale generativa. Dopo le proteste (condite da un profondo senso di preoccupazione) di un noto attore britannico, arriva un’altra notizia a porre nuovamente i riflettori sull’argomento. La Authors Guild e 17 scrittori, tra cui anche George R. R. Martin e John Grisham, hanno fatto causa a OpenAI.
L’accusa mossa alla società dietro ChatGPT e DALL-E è molto semplice: per l’addestramento dei suoi modelli sarebbero stati utilizzati senza alcun consenso anche dei romanzi, compresi quelli di Martin e Grisham. È cosa nota che i Large Language Model vengono addestrati con informazioni pubbliche che tutti possono reperire online. OpenAI, in particolare, sfrutta i set Common Crawl, Book1, Book2 e Book3 per l’addestramento dei modelli GPT-3, GPT-3.5 e GPT-4. E qui c’è l’intoppo.
Infatti, secondo i ricercatori, in questi dataset sarebbero contenuti anche i milioni di libri pirata contenuti in repository come Z-Library e Library Genesis. Per questo motivo, l’Authors Guild e 17 scrittori hanno fatto causa a OpenAI, che – involontariamente – avrebbe violato la legge sul diritto d’autore. L’accusa chiede un’ingiunzione per bloccare l’uso dei contenuti, un risarcimento dei danni e la certificazione di class action.
Nel frattempo è arrivata anche la risposta di OpenAI, raccolta dalla redazione di The Verge. Dalla società guidata da Sam Altman filtra un certo ottimismo: «i colloqui sono positivi e lavoriamo insieme per comprendere e discutere delle loro preoccupazioni sull’intelligenza artificiale».