La comica e autrice Sarah Silverman, insieme ad altri autori come Christopher Golden e Richard Kadrey, hanno citato in giudizio OpenAI e Meta.
Le diverse cause sostengono che ChatGPT e LLaMA siano stati addestrati attraverso dati di proprietà dei suddetti professionisti, attraverso contenuti illegali presenti su Bibliotik, Library Genesis, Z-Library e simili.
Nella causa rispetto a OpenAI, i tre hanno mostrato prove di come ChatGPT riassume i loro libri, violando di fatto i diritti d’autore. Bedwetter di Silverman è il primo libro mostrato riassunto da ChatGPT in fase di processo, seguito da un libro di Golden e a uno di Kadrey.
La difesa, dal canto suo, afferma che il chatbot non si è mai preso la briga di “riprodurre nessuna delle informazioni sulla gestione del copyright che i querelanti hanno incluso nelle loro opere pubblicate“.
Violazione copyright: i tre autori contro OpenAI e Meta
Per quanto riguarda la causa separata contro Meta, la denuncia espone in passaggi il motivo per cui i querelanti ritengono che il pacchetto di dati abbia origini illecite. In questo senso, attraverso un documento, le fonti utilizzate sembrano rifarsi a Bibliotik e ad altre “biblioteche ombra“, considerate illegali.
In entrambe le affermazioni, gli autori affermano di non aver acconsentito all’uso dei loro libri protetti da copyright come materiale di formazione per i modelli di AI delle società. Le azioni legali contengono ciascuna sei diversi tipi di violazioni del copyright, negligenza, appropriazione indebita e concorrenza sleale.
Gli avvocati Joseph Saveri e Matthew Butterick, che rappresentano i tre autori, scrivono sul loro sito web di aver sentito da “scrittori, autori ed editori che sono preoccupati per la straordinaria capacità [ ndr. di ChatGPT] di generare testo simile a quello trovato in copyright materiali testuali, tra cui migliaia di libri“.
In questo contesto infatti, le cause contro l’Intelligenza Artificiale non sono una novità: lo stesso Saveri ha già avviato un contenzioso contro società di intelligenza artificiale per conto di vari programmatori e artisti.
La piattaforma Getty Images, dal canto suo, si è già mossa sostenendo che Stability AI ha creato lo strumento di generazione di immagini (Stable Diffusion) ha addestrato il suo modello, a suo dire, su milioni di immagini protette da copyright. Di certo, nei prossimi mesi questi non saranno gli unici casi di questo genere.