DolphinGemma: Como a IA do Google Ajuda a Decifrar a Comunicação dos Golfinhos

Google lança o DolphinGemma – um modelo de IA que analisa e prevê sons de golfinhos, abrindo caminho para a comunicação entre humanos e golfinhos. O modelo será lançado como open source no verão de 2025.

Durante décadas, compreender sons como cliques, assobios e pulsos explosivos de golfinhos tem sido um desafio científico. Mas e se pudéssemos não apenas ouvir, mas também compreender seus padrões complexos de comunicação e gerar respostas realistas?

No Dia Nacional do Golfinho, o Google fez parceria com pesquisadores da Georgia Tech e do Wild Dolphin Project (WDP) para anunciar o DolphinGemma—um modelo de IA fundamental treinado para aprender a estrutura acústica dos golfinhos e gerar novas sequências de sons semelhantes aos deles. Isso marca um avanço significativo na jornada da comunicação interespecífica, além de expandir o potencial de conexão entre humanos e o mundo oceânico.

Décadas de Pesquisa Social com Golfinhos

Compreender uma espécie requer contexto profundo—algo que o WDP tem fornecido. Desde 1985, eles conduzem o projeto de pesquisa subaquática de golfinhos mais longo do mundo, focando nos golfinhos-pintados-do-Atlântico nas Bahamas. Eles utilizam métodos não invasivos, gravando vídeo e áudio combinados com a identidade e o comportamento de cada golfinho individual.

Alguns sons distintivos:

  • Assobios de assinatura para mães chamarem seus filhotes
  • Pulsos explosivos durante conflitos
  • Cliques vibrantes durante o acasalamento ou ao perseguir tubarões

Apresentando o DolphinGemma

O Google desenvolveu o DolphinGemma aplicando a tecnologia de áudio SoundStream e um modelo com 400 milhões de parâmetros que pode rodar diretamente em celulares Pixel. Esse modelo reconhece, analisa sequências naturais de sons e prevê o próximo som—de forma semelhante ao processamento de linguagem por IA.

O DolphinGemma já foi utilizado em campo, ajudando a detectar padrões repetitivos, agrupamentos de sons e possíveis significados. Pesquisadores também usaram sons sintetizados ligados aos objetos favoritos dos golfinhos para construir um “vocabulário compartilhado” para comunicação interativa.

Usando Celulares Pixel para Comunicação Subaquática

O WDP também está desenvolvendo o sistema CHAT (Cetacean Hearing Augmentation Technology), em colaboração com a Georgia Tech. Esse sistema utiliza sons sintetizados representando objetos como algas ou toalhas, ajudando os golfinhos a aprenderem a imitar sons para fazer “pedidos”.

Como funciona:

  1. Ouve com precisão em meio ao ruído do oceano
  2. Identifica corretamente o som imitado
  3. Notifica os pesquisadores via fones de condução óssea
  4. Fornece o objeto correto em resposta ao golfinho

O Pixel 6 já foi utilizado, e o Pixel 9 (previsto para o verão de 2025) será ainda mais aprimorado, integrando alto-falante/microfone e rodando o modelo de IA simultaneamente, melhorando a velocidade e fluidez das respostas durante as interações.

Compartilhando o DolphinGemma com a Comunidade Científica

O Google vai disponibilizar o DolphinGemma como open source neste verão. Embora tenha sido treinado com dados de golfinhos-pintados-do-Atlântico, o modelo pode ser customizado para uso com outras espécies, como golfinhos-nariz-de-garrafa ou golfinhos-rotadores.

A combinação de pesquisa de campo, engenharia e tecnologia de IA está abrindo novas portas para que os humanos obtenham uma compreensão mais profunda das criaturas marinhas inteligentes.

Source: https://blog.google/technology/ai/dolphingemma/