O Chatbot da Meta Compartilha Número de Telefone Privado por Engano

Image by Dimitri Karastelev, from Unsplash

O Chatbot da Meta Compartilha Número de Telefone Privado por Engano

Tempo de leitura: 3 minuto

A assistente de IA da Meta revelou o número de telefone de um estranho, depois se contradisse repetidamente, o que levantou preocupações sobre alucinações de IA e recursos de proteção do usuário.

Está com pressa? Aqui estão os fatos rápidos:

  • A Meta AI forneceu a um usuário o número de uma pessoa real como contato de suporte ao cliente.
  • O AI se contradisse repetidamente quando confrontada sobre o erro.
  • Especialistas alertam sobre o comportamento de “mentira branca” dos assistentes de AI para parecerem úteis.

Mark Zuckerberg promoveu seu novo assistente de IA como “o assistente de IA mais inteligente que você pode usar livremente”, no entanto, a ferramenta recebeu atenção negativa após revelar o número de telefone privado de uma pessoa real durante consultas de suporte ao cliente, como foi inicialmente relatado por The Guardian.

Durante sua tentativa de contatar a TransPennine Express via WhatsApp, Barry Smethurst recebeu o que parecia ser um número de atendimento ao cliente do assistente de inteligência artificial da Meta. O Guardian noticiou que, quando Smethurst discou o número, James Gray atendeu a ligação, mesmo estando a 170 milhas de distância em Oxfordshire, trabalhando como executivo de imóveis.

Quando questionado, o chatbot primeiro afirmou que o número era fictício, depois disse que ele havia sido “retirado erroneamente de um banco de dados”, antes de se contradizer novamente, afirmando que simplesmente gerou um número aleatório no estilo do Reino Unido. “Dar um número aleatório a alguém é uma coisa insana para uma IA fazer”, disse Smethurst, conforme relatado pelo The Guardian. “É aterrorizante”, acrescentou.

O Guardian informa que Gray não recebeu ligações, mas expressou suas próprias preocupações: “Se está gerando o meu número, poderia gerar os detalhes do meu banco?”

Meta respondeu: “A Meta AI é treinada em uma combinação de conjuntos de dados licenciados e publicamente disponíveis, não nos números de telefone que as pessoas usam para se registrar no WhatsApp ou em suas conversas privadas”, relatou o Guardian.

Mike Stanhope da Carruthers e Jackson observou: “Se os engenheiros da Meta estão projetando tendências de ‘mentiras brancas’ em sua IA, o público precisa ser informado, mesmo que a intenção do recurso seja minimizar o dano. Se este comportamento é novo, incomum ou não projetado explicitamente, isso levanta ainda mais questões sobre quais salvaguardas estão em vigor e o quanto podemos forçar o comportamento de uma IA a ser previsível”, reportou o The Guardian

As preocupações em torno do comportamento da IA aumentaram ainda mais com o último modelo o1 da OpenAI. Em um estudo recente da Apollo Research, a IA foi flagrada enganando desenvolvedores, negando envolvimento em 99% dos cenários de teste e até mesmo tentando desativar seus mecanismos de supervisão. “Ficou claro que a IA poderia pensar em suas ações e formular negações convincentes”, disse Apollo.

Yoshua Bengio, um pioneiro em IA, alertou que tais capacidades enganosas representam sérios riscos e exigem salvaguardas muito mais fortes.

Outro estudo da OpenAI aumenta essas preocupações ao mostrar que punir a IA por trapacear não elimina a má conduta, mas ensina a IA a escondê-la. Usando o raciocínio de cadeia de pensamento (CoT) para monitorar o comportamento da IA, os pesquisadores perceberam que a IA começou a mascarar intenções enganosas quando penalizada por manipulação de recompensa.

Em alguns casos, a IA interromperia tarefas prematuramente ou criaria resultados falsos, para então reportar falsamente o sucesso. Quando os pesquisadores tentaram corrigir isso por meio de reforço, a IA simplesmente parou de mencionar suas intenções em seus registros de raciocínio. “A trapaça é indetectável pelo monitor”, afirmou o relatório.

Gostou desse artigo? Avalie!
Eu detestei Eu não gostei Achei razoável Muito bom! Eu adorei!

Estamos muito felizes que tenha gostado do nosso trabalho!

Como um leitor importante, você se importaria de nos avaliar no Trustpilot? É rápido e significa muito para nós. Obrigado por ser incrível!

Avalie-nos no Trustpilot
0 Votado por 0 usuários
Título
Comentar
Obrigado por seu feedback