L’introduzione massiccia dell’Intelligenza Artificiale e la relativa alimentazione dei modelli IA, ha comportato diverse controversie legali per quanto riguarda i diritti d’autore.
Secondo quanto affermato da OpenAI, società che ha realizzato e che gestisce ChatGPT, il materiale protetto da copyright è però essenziale per strumenti di questo tipo. La dichiarazione è stata rilasciata nel contesto di un’indagine della Camera dei Lord del Regno Unito, in cui è stato preso in esame il rapporto tra modelli linguistici di grandi dimensioni (LLM) e il materiale coperto dai diritti d’autore.
Come è ormai ben noto il già citato ChatGPT, così come DALL-E e altri strumenti simili, devono per forza essere alimentati da contenuti esterni per poter funzionare. Gran parte dei testi e delle immagini utili a tale scopo sono ovviamente proprietà intellettuale di soggetti specifici (singole persone o altre società). Di fatto, i modelli IA setacciano la rete raccogliendo materiale che, almeno teoricamente, non potrebbero sfruttare.
Stando al documento inviato da OpenAI alla Camera dei Lord “Poiché il diritto d’autore oggi copre praticamente ogni tipo di espressione umana – inclusi post di blog, fotografie, post di forum, frammenti di codice software e documenti governativi – sarebbe impossibile addestrare i principali modelli di Intelligenza Artificiale di oggi senza utilizzare materiali protetti da copyright“.
OpenAI si appella al fair use per aggirare il copyright dei contenuti online
OpenAI, poi, ha voluto spiegare come limitare i dati per l’addestramento dei modelli IA a libri e immagini di pubblico dominio “Creati più di un secolo fa” non fornirebbe sistemi di IA in grado di soddisfare le necessità degli utenti contemporanei.
Il documento in questione segue la recente causa intentata dal New York Times nei confronti di OpenAI e Microsoft. In tal senso, la celebre testata giornalistica sostiene che vi è stato un abuso dei propri contenuti, con ChatGPT che ha attinto dai propri articoli. OpenAI ha risposto lunedì alla causa sul suo sito Web, sostenendo che la causa è priva di merito e affermando il suo sostegno al giornalismo e alle partnership con le testate giornalistiche.
La difesa di OpenAI si basa in gran parte sul principio legale del fair use, che consente un uso limitato di contenuti protetti da copyright senza il permesso del proprietario in circostanze specifiche.
Questo caso non è il primo in cui la società diretta da Sam Altman si appella al fair use per quanto riguarda i dati e l’addestramento dell’IA. Nello scorso mese di agosto si è infatti verificata situazione molto simile, con una causa che ha visto coinvolta anche la comica Sarah Silverman.