
Image by Chris Blonk, from Unsplash
Modelo de IA Busca Decodificar o Que os Golfinhos Estão Dizendo
Pesquisadores que estudam a comunicação dos golfinhos estão agora usando um novo modelo de IA desenvolvido pelo Google para entender melhor a estrutura das vocalizações dos golfinhos.
Está com pressa? Aqui estão os fatos rápidos:
- O Google desenvolveu um modelo de IA para analisar e gerar vocalizações de golfinhos.
- O modelo foi treinado com décadas de dados de comunicação de golfinhos do WDP.
- DolphinGemma será de código aberto para apoiar a pesquisa global de comunicação de cetáceos.
O modelo, conhecido como DolphinGemma, analisa os sons de golfinhos gravados para identificar padrões e gerar sequências de vocalizações semelhantes às de golfinhos, conforme anunciado na terça-feira em um Blog de Notícias do Google.
A iniciativa é uma colaboração entre o Google, o Instituto de Tecnologia da Geórgia e o Projeto Golfinho Selvagem (WDP), uma organização sem fins lucrativos que vem pesquisando uma comunidade de golfinhos manchados selvagens do Atlântico nas Bahamas desde 1985.
O Google relata que a ferramenta foi projetada para apoiar o estudo da comunicação entre espécies, identificando padrões nas complexas sequências sonoras usadas pelos golfinhos na natureza. Seu trabalho de campo de longo prazo e não invasivo gerou um vasto arquivo de áudio e vídeo, que agora está sendo usado para treinar sistemas de IA.
Isso inclui exemplos de tipos de sons conhecidos – como assobios de assinatura usados entre mães e filhotes, pulsos de explosão durante conflitos e zumbidos de cliques em namoro ou interações predatórias.
O objetivo é entender melhor a estrutura dessas vocalizações e o que elas podem indicar sobre a cognição e comunicação dos golfinhos.
DolphinGemma se baseia neste conjunto de dados aplicando o processamento de áudio SoundStream do Google e uma arquitetura de modelo de 400 milhões de parâmetros para aprender e prever os sons dos golfinhos.
Em vez de tentar traduzir diretamente os sons, o modelo processa sequências de vocalizações naturais de golfinhos e gera novos sons semelhantes aos dos golfinhos, baseados em padrões aprendidos.
O Google informa que essa abordagem reflete como os grandes modelos de linguagem lidam com a linguagem humana, prevendo prováveis continuações com base em entradas anteriores.
O modelo atualmente está sendo testado em campo pela WDP usando smartphones Pixel. Os pesquisadores esperam que ele ajude a identificar estruturas vocais recorrentes e reduza o trabalho manual envolvido na análise de grandes volumes de dados acústicos.
A ferramenta também pode auxiliar na identificação de possíveis blocos de construção de sistemas de comunicação entre golfinhos. Paralelamente a este esforço, a WDP e o Georgia Tech estão desenvolvendo o sistema CHAT (Cetacean Hearing Augmentation Telemetry) – uma interface separada para interação limitada de duas vias.
CHAT emite apitos sintéticos associados a objetos com os quais os golfinhos são conhecidos por interagir. O sistema foi projetado para detectar se os golfinhos imitam esses apitos e alertar os pesquisadores em tempo real por meio de fones de ouvido subaquáticos.
A versão mais recente, incorporando DolphinGemma, permite um processamento e previsão mais eficientes dessas vocalizações em tempo real.
Embora a pesquisa não afirme ter decodificado a linguagem dos golfinhos, representa um avanço na identificação de possíveis estruturas dentro de seu comportamento vocal.
O Google planeja lançar o DolphinGemma como um modelo aberto nos próximos meses, permitindo um uso mais amplo por pesquisadores que trabalham com outras espécies de cetáceos.