Atenção: a matéria a seguir inclui uma discussão sobre suicídio. Se você ou alguém que você conhece precisar de ajuda, procure apoio especializado. O Centro de Valorização da Vida (CVV) funciona 24 horas por dia pelo telefone 188. Também é possível conversar por chat ou e-mail.
Continua após a publicidade
A Meta instruiu centenas de contratados a criar contas falsas de usuários menores de idade e usá-las para enviar prompts sobre suicídio, transtornos alimentares, drogas e outros temas de alto risco a chatbots de empresas rivais, segundo documentos internos e cinco pessoas familiarizadas com o projeto, conforme matéria exclusiva da Wired.
O projeto, chamado internamente de Cannes e gerenciado pela contratada Covalen, estava ativo até pelo menos 21 de abril de 2026. Uma única rodada de testes realizada em agosto de 2025 gerou mais de 45 mil prompts enviados aos sistemas rivais. As empresas testadas não foram informadas sobre o projeto.
Como o projeto funcionou
Os contratados foram instruídos a criar contas com dados fictícios de menores de idade, enviar prompts escritos e imagens aos chatbots e registrar as respostas em planilhas. Os prompts foram projetados para empurrar os sistemas para respostas que seus mecanismos de segurança deveriam recusar, segundo as instruções do projeto revisadas pela Wired.
Um documento interno da Covalen descreveu o projeto como “benchmarking abrangente de segurança de IA” que entregava “conjuntos de dados críticos para comparação de modelos.”
Contratados relataram preocupações
Ex-contratados ouvidos pela Wired descreveram aspectos do projeto como alarmantes. Segundo um deles, funcionários temiam a possibilidade de estar gerando ou preservando material de abuso sexual infantil caso um chatbot respondesse a determinados prompts envolvendo menores.
“Vi muitas coisas que gostaria de não ter visto fazendo esse trabalho”, disse um dos ex-contratados à Wired. “Todos que eu conhecia nesse projeto ficaram completamente chocados com alguns dos textos que nos pediam para testar.”
A zona cinza legal e ética
Dois advogados especializados em direito digital consultados pela Wired concluíram que o material apresentado não cruzou a linha para material de abuso sexual infantil ou obscenidade ilegal.
Mas Rumman Chowdhury, fundadora da organização sem fins lucrativos Humane Intelligence, questionou a natureza do projeto. “Estruturar um projeto de meses, em larga escala, aparentemente projetado para sistematicamente quebrar essas regras, por meio de contas falsas se passando por crianças, está fora do que normalmente é descrito como avaliação padrão da indústria”, disse à Wired.
Para Chowdhury, a combinação de avaliação de segurança e benchmarking competitivo é “exatamente o tipo de zona cinza de governança onde a segurança se torna uma cobertura conveniente para práticas anticompetitivas.”
O projeto também aparentemente violou os termos de serviço das três empresas testadas. A OpenAI proíbe testes de segurança não solicitados e o uso de outputs para desenvolver modelos concorrentes. O Google proíbe tentativas de contornar filtros de segurança fora de seus programas oficiais. A Character.AI proíbe conteúdo prejudicial e exploratório.
Continua após a publicidade
O que as empresas dizem
A Character.AI afirmou que não autorizou os testes e que a conduta descrita pela Wired viola seus termos e políticas. A OpenAI disse estar “analisando o assunto.” O Google afirmou não ter autorizado os testes e não conhecer seu propósito.
Em nota, a Meta defendeu o trabalho como teste de segurança rotineiro. “Testar e comparar respostas de chatbots para garantir experiências seguras e adequadas à idade é uma prática padrão da indústria”, disse porta-voz da empresa à Wired. A Meta afirmou não usar benchmarking de concorrentes para treinar seus próprios modelos de IA.
A Covalen não respondeu ao pedido de comentário da Wired.


