
Image by Szabo Viktor, from Unsplash
Criadores do YouTube Alimentam Inadvertidamente os Modelos de IA do Google
O Google confirmou que usa um subconjunto de vídeos do YouTube para treinar seus modelos de inteligência artificial, que incluem o Gemini e o avançado gerador de vídeos Veo 3.
Está com pressa? Aqui estão os fatos rápidos:
- Criadores não foram informados de que seus vídeos treinam ferramentas de IA.
- Os termos do YouTube permitem que o Google licencie o conteúdo carregado globalmente e sem royalties.
- Especialistas alertam que a IA poderia competir com os criadores sem consentimento ou compensação.
A notícia, inicialmente relatada pela CNBC, gerou críticas de criadores de conteúdo e especialistas em propriedade intelectual, que se preocupam com o uso de seu conteúdo para desenvolver ferramentas que poderiam eventualmente substituí-los.
“Sempre usamos o conteúdo do YouTube para melhorar nossos produtos, e isso não mudou com o advento da IA”, disse um porta-voz do YouTube à CNBC.
“Também reconhecemos a necessidade de proteções, por isso investimos em robustas proteções que permitem aos criadores proteger sua imagem e semelhança na era da IA”, acrescentou o porta-voz.
A CNBC informa que o YouTube hospeda mais de 20 bilhões de vídeos. No entanto, o Google não revelou o número específico de vídeos que utiliza para treinamento de IA. O artigo destaca que mesmo uma seleção de 1% do vasto catálogo do YouTube ainda resultaria em bilhões de minutos de conteúdo, o que excede os dados de treinamento da maioria das plataformas de IA concorrentes.
A CNBC conversou com vários criadores e profissionais de propriedade intelectual que não sabiam que seu conteúdo poderia ser usado para treinar IA. “É plausível que eles estejam pegando dados de muitos criadores que investiram muito tempo, energia e seus próprios pensamentos para criar esses vídeos”, disse Luke Arrigoni, CEO da empresa de identidade digital Loti. “Isso não é necessariamente justo com eles”, acrescentou.
O Google apresentou o Veo 3 em maio por meio de conteúdo cinematográfico gerado por IA. Embora a empresa tenha o direito legal, de acordo com os termos de serviço do YouTube, de usar conteúdo carregado, especialistas como Dan Neely da Vermillio alertam que ferramentas geradas por IA poderiam competir diretamente com os criadores que fornecem dados de treinamento.
“Vimos um número crescente de criadores descobrindo versões falsas de si mesmos”, disse Neely à CNBC.
Alimentando ainda mais o debate, uma investigação revelou que várias grandes empresas de IA, como Apple, Nvidia, Anthropic e Salesforce, usaram transcrições de mais de 173.000 vídeos do YouTube para treinar modelos de IA, apesar das políticas da plataforma.
Esses vídeos vieram de mais de 48.000 canais, incluindo criadores de topo como MrBeast, PewDiePie e Marques Brownlee, bem como instituições acadêmicas e de notícias como o MIT, Khan Academy, NPR e a BBC.
A ausência de uma opção clara de opt-out, ou de um aviso quando uma IA está coletando conteúdo, levou os criadores a exigir maior transparência e proteção para os processos de treinamento de IA.