Nvidia sembra aver addestrato di nuovo IA con dati di Netflix e Youtube

NVidia

Stando a un rapporto di 404 Media considerato attendibile, Nvidia avrebbe ammesso di aver attinto a piene mani da Netflix e YouTube per addestrare i propri progetti nel contesto dell’Intelligenza Artificiale.

Quanto appena affermato sembra emergere da alcune chat interne di Slack della compagnia ma anche da alcune e-mail e documenti della stessa. Alcuni ex dipendenti del noto produttore hardware sostengono che i dati, ottenuti attraverso la tecnica dello scraping, potrebbero essere utili per realizzare dei prodotti IA come Omniverse 3D (un generatore di mondi) e un sistema di guida autonoma per automobili.

In una e-mail del vicepresidente Nvidia, ovvero Ming-Yu Liu, appare una frase alquanto esaustiva riguardo l’operato della compagnia “Un’esperienza visiva di una vita umana di dati di addestramento al giorno“. Tale progetto, denominato internamente all’azienda Cosmos, sembra prevedere la realizzazione di un modello IA di base come Gemini 1.5, GPT-4 o Llama 3.1.

Per realizzare gli obiettivi di Cosmos sarebbe stato utilizzato un downloader video open source, aggirando i sistemi di YouTube per evitare scraping e azioni simili.

Nvidia e il vizio dello scraping per addestrare l’IA

Secondo le e-mail mostrate da 404 Media, per le operazioni di scraping sono state utilizzate fino a 30 macchine virtuali su Amazon Web Services, andando a scaricare 80 anni di video ogni singolo giorno.

Ma come risponde Nvidia a queste pesanti accuse? Nella risposta ufficiale della compagnia, la stessa afferma come la società sia impegnata a rispettare i diritti di tutti i content creator e come i modelli IA e i progetti di Nvidia siano conformi alle leggi sul copyright. Va comunque ricordato come la compagnia (anche se non è la sola) ha già avuto una filosofia di questo tipo, ovvero di attuale politiche a dir poco “aggressive” per trovare, senza pagare alcun tipo di diritto, dati con cui alimentare l’IA.

Giusto un mese fa, il produttore hardware è apparso in un altro rapporto riguardante lo scarping illegale di video coperti da copyright, anche se in quel caso in compagnia di altre aziende come Anthropic e Salesforce.

Fonte: digitaltrends.com

Nvidia sembra aver addestrato di nuovo IA con dati di Netflix e Youtube

Nvidia e il vizio dello scraping per addestrare l’IA

Ti consigliamo anche

Test matematici USAMO 2025: tutti i modelli AI deludono le aspettative

Intel rilancia anche con i nuovi SoC Panther Lake e Nova Lake per i veicoli

Adobe, svolta Photoshop: nuovo agente AI e aggiornamenti Firefly

Gli occhiali smart di Ray-Ban Meta iniziano a diventare davvero utili