Durante décadas, comprender sonidos como chasquidos, silbidos y pulsos explosivos de los delfines ha sido un desafío científico. Pero, ¿y si no solo pudiéramos escuchar, sino también comprender sus complejos patrones de comunicación y generar respuestas realistas?
En el Día Nacional del Delfín, Google se asoció con investigadores de Georgia Tech y el Wild Dolphin Project (WDP) para anunciar DolphinGemma, un modelo de IA fundamental entrenado para aprender la estructura acústica de los delfines y generar nuevas secuencias de sonidos similares a los de los delfines. Esto marca un avance significativo en el camino hacia la comunicación interespecies, al tiempo que amplía el potencial de conexión entre los humanos y el mundo oceánico.
Décadas de investigación social sobre delfines
Comprender una especie requiere un contexto profundo, algo que el WDP ha proporcionado. Desde 1985, han llevado a cabo el proyecto de investigación submarina sobre delfines más largo del mundo, centrado en los delfines manchados del Atlántico en las Bahamas. Utilizan métodos no invasivos, grabando video y audio combinados con la identidad y el comportamiento de cada delfín individual.
Algunos sonidos distintivos:
- Silbidos característicos para que las madres llamen a sus crías
- Pulsos explosivos durante conflictos
- Chasquidos zumbantes durante el cortejo o al perseguir tiburones
Presentando DolphinGemma
Google desarrolló DolphinGemma aplicando la tecnología de audio SoundStream y un modelo de 400 millones de parámetros que puede ejecutarse directamente en teléfonos Pixel. Este modelo reconoce, analiza secuencias de sonidos naturales y predice el siguiente sonido, de manera similar a como la IA procesa el lenguaje.
DolphinGemma se ha utilizado en el campo, ayudando a detectar patrones repetitivos, agrupaciones de sonidos y posibles significados. Los investigadores también han utilizado sonidos sintetizados adjuntos a los objetos favoritos de los delfines para construir un “vocabulario compartido” para la comunicación interactiva.
Uso de teléfonos Pixel para la comunicación submarina
El WDP también está desarrollando el sistema CHAT (Cetacean Hearing Augmentation Technology), en colaboración con Georgia Tech. Este sistema utiliza sonidos sintetizados que representan objetos como algas marinas o toallas, ayudando a los delfines a aprender a imitar sonidos para hacer “peticiones”.
Cómo funciona:
- Escuchar con precisión en medio del ruido oceánico
- Identificar correctamente el sonido imitado
- Notificar a los investigadores mediante auriculares de conducción ósea
- Proporcionar el objeto correcto en respuesta al delfín
Se ha utilizado el Pixel 6, y el Pixel 9 (previsto para el verano de 2025) se mejorará aún más, integrando tanto altavoz/micrófono como ejecutando el modelo de IA simultáneamente, mejorando la velocidad y fluidez de respuesta durante las interacciones.
Compartiendo DolphinGemma con la comunidad investigadora
Google hará de código abierto DolphinGemma este verano. Aunque fue entrenado con datos de delfines manchados del Atlántico, el modelo aún puede personalizarse para su uso con otras especies como los delfines nariz de botella o los delfines giradores.
La combinación de investigación de campo, ingeniería y tecnología de IA está abriendo nuevas puertas para que los humanos obtengan una comprensión más profunda de las criaturas marinas inteligentes.
Source: https://blog.google/technology/ai/dolphingemma/