L’attività detta Web Scraping non è percepita positivamente da chi detiene il diritto di autore su certe opere, che si tratti di libri, musica, o altri contenuti protetti da copyright. Ora che l’intelligenza artificiale generativa deve crescere per risultare performante, poi, il timore è cresciuto a dismisura sia tra aziende che creator e governi. Mentre in Italia c’è il Garante della Privacy a spiegare quando il web scraping è legale, in Australia il governo sta considerando nuove leggi sull’IA che andrebbero a colpire direttamente anche Google.
Il colosso della tecnologia, infatti, al momento sta utilizzando tale pratica al limite della legalità per addestrare Google Bard e altri prodotti di IA generativa, sostenendo il “fair use” come giustificazione. Ma è davvero accettabile?
Il problema del Web scraping secondo Google
La Grande G ha le idee chiare in merito a questa materia. Secondo la società di Mountain View, in futuro serviranno “sistemi di copyright che consentano un uso appropriato ed equo dei contenuti protetti da copyright per consentire la formazione di modelli di intelligenza artificiale in Australia su una vasta e diversificata gamma di dati, supportando allo stesso tempo opt-out praticabili per le entità che preferiscono che i loro dati non vengano addestrati all’uso dei sistemi di intelligenza artificiale”.
Questa è la base del web scraping secondo Google, da portare anche negli Stati Uniti, nel Regno Unito e in Europa, permettendole di “masticare” contenuti protetti da copyright sostenendosi sulle dottrine già esistenti relative al fair use, evitando le denunce di violazione del diritto di autore.
Ma è davvero accettabile? Secondo alcuni esperti, raschiare dati dal web è tecnicamente una riproduzione ai sensi della legge sul copyright, e i tribunali affermano che lo scraping è consentito a patto che ci siano file che confermano l’autorizzazione. Nel caso specifico di Google, i tribunali potrebbero stabilire che la copia di libri, documenti e opere artistiche parola per parola potrebbe costituire una violazione. Di conseguenza, possiamo aspettarci battaglie legali tra Google e altre aziende in futuro.