Modelli AI addestrati con video YouTube senza consenso
Modelli AI di Apple, Salesforce e Anthropic sono stati addestrati con decine di migliaia di video YouTube senza il consenso dei creatori, secondo un nuovo rapporto. Questi modelli sono stati parzialmente addestrati utilizzando “the Pile”, una raccolta di dati messa insieme da EleutherAI. La raccolta include libri, articoli di Wikipedia e molto altro, tra cui sottotitoli di YouTube raccolti tramite l’API dei sottotitoli di YouTube, estratti da 173536 video su più di 48000 canali. Questa pratica potrebbe violare i termini di YouTube.
Tra i canali coinvolti ci sono grandi influencer come MrBeast, PewDiePie e Marques Brownlee, il quale ha evidenziato la complessità della situazione su X. Man mano che i contenuti generati dall’AI proliferano, sarà sempre più difficile creare dataset che non includano contenuti già prodotti dall’AI.