Meta usou contas falsas de menores para testar chatbots rivais com prompts sobre suicídio e drogas, diz Wired

Atenção: a matéria a seguir inclui uma discussão sobre suicídio. Se você ou alguém que você conhece precisar de ajuda, procure apoio especializado. O Centro de Valorização da Vida (CVV) funciona 24 horas por dia pelo telefone 188. Também é possível conversar por chat ou e-mail.

Continua após a publicidade

A Meta instruiu centenas de contratados a criar contas falsas de usuários menores de idade e usá-las para enviar prompts sobre suicídio, transtornos alimentares, drogas e outros temas de alto risco a chatbots de empresas rivais, segundo documentos internos e cinco pessoas familiarizadas com o projeto, conforme matéria exclusiva da Wired.

O projeto, chamado internamente de Cannes e gerenciado pela contratada Covalen, estava ativo até pelo menos 21 de abril de 2026. Uma única rodada de testes realizada em agosto de 2025 gerou mais de 45 mil prompts enviados aos sistemas rivais. As empresas testadas não foram informadas sobre o projeto.

Como o projeto funcionou

Os contratados foram instruídos a criar contas com dados fictícios de menores de idade, enviar prompts escritos e imagens aos chatbots e registrar as respostas em planilhas. Os prompts foram projetados para empurrar os sistemas para respostas que seus mecanismos de segurança deveriam recusar, segundo as instruções do projeto revisadas pela Wired.

Um documento interno da Covalen descreveu o projeto como “benchmarking abrangente de segurança de IA” que entregava “conjuntos de dados críticos para comparação de modelos.”

Contratados relataram preocupações

Ex-contratados ouvidos pela Wired descreveram aspectos do projeto como alarmantes. Segundo um deles, funcionários temiam a possibilidade de estar gerando ou preservando material de abuso sexual infantil caso um chatbot respondesse a determinados prompts envolvendo menores.

“Vi muitas coisas que gostaria de não ter visto fazendo esse trabalho”, disse um dos ex-contratados à Wired. “Todos que eu conhecia nesse projeto ficaram completamente chocados com alguns dos textos que nos pediam para testar.”

A zona cinza legal e ética

Dois advogados especializados em direito digital consultados pela Wired concluíram que o material apresentado não cruzou a linha para material de abuso sexual infantil ou obscenidade ilegal.

Mas Rumman Chowdhury, fundadora da organização sem fins lucrativos Humane Intelligence, questionou a natureza do projeto. “Estruturar um projeto de meses, em larga escala, aparentemente projetado para sistematicamente quebrar essas regras, por meio de contas falsas se passando por crianças, está fora do que normalmente é descrito como avaliação padrão da indústria”, disse à Wired.

Para Chowdhury, a combinação de avaliação de segurança e benchmarking competitivo é “exatamente o tipo de zona cinza de governança onde a segurança se torna uma cobertura conveniente para práticas anticompetitivas.”

O projeto também aparentemente violou os termos de serviço das três empresas testadas. A OpenAI proíbe testes de segurança não solicitados e o uso de outputs para desenvolver modelos concorrentes. O Google proíbe tentativas de contornar filtros de segurança fora de seus programas oficiais. A Character.AI proíbe conteúdo prejudicial e exploratório.

Continua após a publicidade

O que as empresas dizem

A Character.AI afirmou que não autorizou os testes e que a conduta descrita pela Wired viola seus termos e políticas. A OpenAI disse estar “analisando o assunto.” O Google afirmou não ter autorizado os testes e não conhecer seu propósito.

Em nota, a Meta defendeu o trabalho como teste de segurança rotineiro. “Testar e comparar respostas de chatbots para garantir experiências seguras e adequadas à idade é uma prática padrão da indústria”, disse porta-voz da empresa à Wired. A Meta afirmou não usar benchmarking de concorrentes para treinar seus próprios modelos de IA.

A Covalen não respondeu ao pedido de comentário da Wired.

‘Favor tentar na próxima Copa’

Boi Caprichoso vence o Festival de Parintins por menos de um ponto

STJ: estado de SP deve ter protocolo para atuar em manifestações

Lula entrega a Motta projeto para beneficiar MEIs

Lucas Paquetá passará por exames e preocupa para o restante da Copa do Mundo

Meta usou contas falsas de menores para testar chatbots rivais com prompts sobre suicídio e drogas, diz Wired

Resultado da Lotofácil de hoje: veja números e ganhadores do concurso 3722 (segunda, 29/06)

Por que os streamings estão apostando em planos com anúncios — e quanto isso muda no preço

Samsung e Huawei em promoção: smartwatches para todos os estilos e bolsos

Halo, LEGO e Dragon Ball: uma seleção de jogos Xbox que estão em oferta agora

Check Out the Celebrities From the International Film Festival Awards 2023

Harley Davidson: Bundle of Joy Crafted for Top Speed

Review: 7 Future Fashion Trends Shaping the Future of Fashion

Asimo Robot Unveils a New Tool For Simple Robot Programming

Our Picks

‘Favor tentar na próxima Copa’

Boi Caprichoso vence o Festival de Parintins por menos de um ponto

Acidente entre caminhão e moto deixa feridos na RJ-165, em Paraty | G1

Most Popular

Check Out the Celebrities From the International Film Festival Awards 2023

Harley Davidson: Bundle of Joy Crafted for Top Speed

Review: 7 Future Fashion Trends Shaping the Future of Fashion

Meta usou contas falsas de menores para testar chatbots rivais com prompts sobre suicídio e drogas, diz Wired

Como o projeto funcionou

Contratados relataram preocupações

A zona cinza legal e ética

O que as empresas dizem

Relacionado

Related Posts