Modelli AI addestrati con video YouTube senza consenso

Rapporto rivela che modelli AI sono stati addestrati con video YouTube senza consenso dei creatori, potenzialmente violando i termini di YouTube.

Big Data e AI

| Martedì, 16 luglio 2024 a robot training on a laptop while surrounded by streaming YouTube videos

Modelli AI di Apple, Salesforce e Anthropic sono stati addestrati con decine di migliaia di video YouTube senza il consenso dei creatori, secondo un nuovo rapporto. Questi modelli sono stati parzialmente addestrati utilizzando “the Pile”, una raccolta di dati messa insieme da EleutherAI. La raccolta include libri, articoli di Wikipedia e molto altro, tra cui sottotitoli di YouTube raccolti tramite l’API dei sottotitoli di YouTube, estratti da 173536 video su più di 48000 canali. Questa pratica potrebbe violare i termini di YouTube.

Tra i canali coinvolti ci sono grandi influencer come MrBeast, PewDiePie e Marques Brownlee, il quale ha evidenziato la complessità della situazione su X. Man mano che i contenuti generati dall’AI proliferano, sarà sempre più difficile creare dataset che non includano contenuti già prodotti dall’AI.

Modelli AI addestrati con video YouTube senza consenso

Potrebbe interessarti anche...