Durante décadas, compreender sons como cliques, assobios e pulsos explosivos de golfinhos tem sido um desafio científico. Mas e se pudéssemos não apenas ouvir, mas também compreender seus padrões complexos de comunicação e gerar respostas realistas?
No Dia Nacional do Golfinho, o Google fez parceria com pesquisadores da Georgia Tech e do Wild Dolphin Project (WDP) para anunciar o DolphinGemma—um modelo de IA fundamental treinado para aprender a estrutura acústica dos golfinhos e gerar novas sequências de sons semelhantes aos deles. Isso marca um avanço significativo na jornada da comunicação interespecífica, além de expandir o potencial de conexão entre humanos e o mundo oceânico.
Décadas de Pesquisa Social com Golfinhos
Compreender uma espécie requer contexto profundo—algo que o WDP tem fornecido. Desde 1985, eles conduzem o projeto de pesquisa subaquática de golfinhos mais longo do mundo, focando nos golfinhos-pintados-do-Atlântico nas Bahamas. Eles utilizam métodos não invasivos, gravando vídeo e áudio combinados com a identidade e o comportamento de cada golfinho individual.
Alguns sons distintivos:
- Assobios de assinatura para mães chamarem seus filhotes
- Pulsos explosivos durante conflitos
- Cliques vibrantes durante o acasalamento ou ao perseguir tubarões
Apresentando o DolphinGemma
O Google desenvolveu o DolphinGemma aplicando a tecnologia de áudio SoundStream e um modelo com 400 milhões de parâmetros que pode rodar diretamente em celulares Pixel. Esse modelo reconhece, analisa sequências naturais de sons e prevê o próximo som—de forma semelhante ao processamento de linguagem por IA.
O DolphinGemma já foi utilizado em campo, ajudando a detectar padrões repetitivos, agrupamentos de sons e possíveis significados. Pesquisadores também usaram sons sintetizados ligados aos objetos favoritos dos golfinhos para construir um “vocabulário compartilhado” para comunicação interativa.
Usando Celulares Pixel para Comunicação Subaquática
O WDP também está desenvolvendo o sistema CHAT (Cetacean Hearing Augmentation Technology), em colaboração com a Georgia Tech. Esse sistema utiliza sons sintetizados representando objetos como algas ou toalhas, ajudando os golfinhos a aprenderem a imitar sons para fazer “pedidos”.
Como funciona:
- Ouve com precisão em meio ao ruído do oceano
- Identifica corretamente o som imitado
- Notifica os pesquisadores via fones de condução óssea
- Fornece o objeto correto em resposta ao golfinho
O Pixel 6 já foi utilizado, e o Pixel 9 (previsto para o verão de 2025) será ainda mais aprimorado, integrando alto-falante/microfone e rodando o modelo de IA simultaneamente, melhorando a velocidade e fluidez das respostas durante as interações.
Compartilhando o DolphinGemma com a Comunidade Científica
O Google vai disponibilizar o DolphinGemma como open source neste verão. Embora tenha sido treinado com dados de golfinhos-pintados-do-Atlântico, o modelo pode ser customizado para uso com outras espécies, como golfinhos-nariz-de-garrafa ou golfinhos-rotadores.
A combinação de pesquisa de campo, engenharia e tecnologia de IA está abrindo novas portas para que os humanos obtenham uma compreensão mais profunda das criaturas marinhas inteligentes.
Source: https://blog.google/technology/ai/dolphingemma/