Cloudflare: stop allo scraping selvaggio dei dati per addestrare IA

Cloudflare si muove per tutelare i content creator: basterà un solo clic per bloccare i bot.
Cloudflare: stop allo scraping selvaggio dei dati per addestrare IA

Nella giornata di ieri Cloudflare ha annunciato alcuni nuovi strumenti che potrebbero mettere un freno allo scraping di dati per addestrare l’Intelligenza Artificiale, il tutto attraverso un un semplice clic.

Secondo quanto affermato dalla piattaforma, dovrebbe permettere ai creatori di contenuti di individuare quali sono i testi o i video analizzati maggiormente dai bot, bloccandone l’accesso. Ciò significa che, le aziende che lavorano nel contesto dei modelli IA, dovranno mettere mano al portafoglio per ottenere tali informazioni.

Secondo Cloudflare, gli strumenti che offre ai creator permetteranno di “Comprendere rapidamente e facilmente come i provider di modelli AI stanno utilizzando i contenuti e quindi assumere il controllo riguardo se e come i modelli possano accedervi“.

In precedenza, i webmaster  potevano agire sui propri siti selezionando i bot utili, come i crawler di Google e degli altri motori di ricerca, o quelli potenzialmente dannosi. Con il boom dell’IA, a questi si sono aggiunti quelli relativi ai Large Language Model (LLM) che di fatto vanno a “saccheggiare” i siti con dati per alimentare i modelli IA.

Cloudflare promette di bloccare i bot per lo scraping con un singolo clic

Lo scraping indesiderato è ormai un qualcosa di concreto, come testimoniato dal celebre caso che ha visto il New York Times fare causa a OpenAI, seguito poi da altre iniziative legali simili.

Se alcuni grandi gruppi editoriali hanno stretto accordi con compagnie che si occupano di IA, per piattaforme indipendenti o di piccole dimensioni, il problema resta al momento senza una soluzione chiara. Gli strumenti di Cloudflare mirano proprio a fornire supporto a queste realtà che, in questo modo, potranno tutelare i propri contenuti.

Se è vero che oggi è possibile bloccare manualmente ogni singolo bot IA, avere il controllo su tutti è praticamente impossibile. Cloudflare intende fornire nella propria dashboard una scheda dedicata a questa tematica, con un semplice bottone in grado di bloccare qualunque strumento di scraping riguardante l’IA.

Una possibilità di guadagno anche per le piattaforme più piccole

Cloudflare vuole però andare oltre, offrendo la possibilità di guadagnare per sbloccare i bot. I creatori di contenuti potranno accedere anche a una nuova funzionalità per “Impostare in modo affidabile un prezzo equo per i loro contenuti“, proponendo poi gli stessi alle compagnie che lavorano per addestrare l’IA.

La funzione è ancora in fase di sviluppo e, probabilmente, Cloudflare addebiterà un costo per accedere alla stessa. In alternativa, intervenendo come mediatore, potrebbe ottenere una percentuale sui pagamenti.

Matthew Prince, CEO della piattaforma, durante un’intervista al sito Arstecnica.com ha affermato come “L’IA cambierà in modo radicale i contenuti digitali e dobbiamo decidere tutti insieme come quale sarà il suo futuro“. Lo stesso ha poi aggiunto come Cloudflare sarà in grado di “Fornire gli strumenti adatti e stabilire gli standard per offrire a editori, siti Web e content creator il ​​controllo e un’equa compensazione per il loro contributo a Internet“.

Ti consigliamo anche

Link copiato negli appunti