Stando a un rapporto di 404 Media considerato attendibile, Nvidia avrebbe ammesso di aver attinto a piene mani da Netflix e YouTube per addestrare i propri progetti nel contesto dell’Intelligenza Artificiale.
Quanto appena affermato sembra emergere da alcune chat interne di Slack della compagnia ma anche da alcune e-mail e documenti della stessa. Alcuni ex dipendenti del noto produttore hardware sostengono che i dati, ottenuti attraverso la tecnica dello scraping, potrebbero essere utili per realizzare dei prodotti IA come Omniverse 3D (un generatore di mondi) e un sistema di guida autonoma per automobili.
In una e-mail del vicepresidente Nvidia, ovvero Ming-Yu Liu, appare una frase alquanto esaustiva riguardo l’operato della compagnia “Un’esperienza visiva di una vita umana di dati di addestramento al giorno“. Tale progetto, denominato internamente all’azienda Cosmos, sembra prevedere la realizzazione di un modello IA di base come Gemini 1.5, GPT-4 o Llama 3.1.
Per realizzare gli obiettivi di Cosmos sarebbe stato utilizzato un downloader video open source, aggirando i sistemi di YouTube per evitare scraping e azioni simili.
Nvidia e il vizio dello scraping per addestrare l’IA
Secondo le e-mail mostrate da 404 Media, per le operazioni di scraping sono state utilizzate fino a 30 macchine virtuali su Amazon Web Services, andando a scaricare 80 anni di video ogni singolo giorno.
Ma come risponde Nvidia a queste pesanti accuse? Nella risposta ufficiale della compagnia, la stessa afferma come la società sia impegnata a rispettare i diritti di tutti i content creator e come i modelli IA e i progetti di Nvidia siano conformi alle leggi sul copyright. Va comunque ricordato come la compagnia (anche se non è la sola) ha già avuto una filosofia di questo tipo, ovvero di attuale politiche a dir poco “aggressive” per trovare, senza pagare alcun tipo di diritto, dati con cui alimentare l’IA.
Giusto un mese fa, il produttore hardware è apparso in un altro rapporto riguardante lo scarping illegale di video coperti da copyright, anche se in quel caso in compagnia di altre aziende come Anthropic e Salesforce.