Secondo una recente indagine di 404 Media, il modello di Intelligenza Artificiale Runaway potrebbe essere stato addestrato attraverso la pratica dello scraping, venendo alimentato attraverso canali di YouTube dedicati alla fotografia.
La piattaforma che si occupa di informazione a tema tecnologia, ha ottenuto alcuni documenti interni del team che sta lavorando al modello IA. All’interno di essi, vi sarebbero indizi inconfutabili riguardo l’utilizzo di filmati YouTube e di contenuti provenienti da piattaforme relative alla pirateria di film e serie TV. Il tutto, sarebbe utilizzato per addestrare l’ultimo modello di IA per la generazione di filmati, ovvero Gen-3 Alpha.
Nella documentazione incriminata sembrano apparire elenchi con canali consigliati, parole chiave, hashtag relativi a YouTuber che offrono contenuti relativi alla fotografia. 404 Media ha inoltre scoperto come gli sviluppatori, generando video in Gen-3 Alpha, utilizzavano proprio i nomi degli YouTuber per ottenere risultati simili per stile ai content creator di riferimento.
Il caso Runway: YouTube è una occasione troppo ghiotta per chi deve addestrare IA
Nonostante quanto detto finora, tutto quello che è nelle mani di 404 Media è solo un foglio di calcolo che si pensa creato internamente a Runway. Di fatto, non esistono prove concrete di comportamenti simili da parte della compagnia. Riguardo la documentazione emersa, in seguito alla richiesta di un commento da parte di Runway, non vi è ancora stata una risposta ufficiale.
Quanto avvenuto, se confermato, sarebbe una chiara violazione delle politiche di YouTube. La piattaforma, infatti, vieta azioni di scraping per raccogliere e catalogare materiale (tra l’altro coperto da diritti d’autore) dal suo sito.
Il presunto caso Runway, tra l’altro, potrebbe non essere il primo di questo genere. Negli scorsi giorni, infatti, diversi colossi tecnologici sono stati coinvolti in un caso simile, con YouTube che sarebbe stato anche in questo caso “saccheggiato”.