DolphinGemma: Wie Googles KI hilft, die Kommunikation von Delfinen zu entschlüsseln

Google bringt DolphinGemma auf den Markt – ein KI-Modell, das Delfinlaute analysiert und vorhersagt und damit den Weg für die Kommunikation zwischen Menschen und Delfinen ebnet. Das Modell wird im Sommer 2025 als Open Source veröffentlicht.

Seit Jahrzehnten stellt das Verständnis von Lauten wie Klicks, Pfiffen und Impulsgeräuschen von Delfinen eine wissenschaftliche Herausforderung dar. Aber was wäre, wenn wir nicht nur zuhören, sondern auch ihre komplexen Kommunikationsmuster verstehen und lebensechte Antworten generieren könnten?

Zum National Dolphin Day hat Google gemeinsam mit Forschern des Georgia Tech und des Wild Dolphin Project (WDP) DolphinGemma vorgestellt – ein grundlegendes KI-Modell, das darauf trainiert wurde, die akustische Struktur von Delfinen zu erlernen und neue, delfinähnliche Klangsequenzen zu erzeugen. Dies markiert einen bedeutenden Fortschritt auf dem Weg zur Kommunikation zwischen den Arten und erweitert zugleich das Potenzial für eine Verbindung zwischen Mensch und Ozeanwelt.

Jahrzehnte der sozialen Delfinforschung

Um eine Spezies zu verstehen, ist tiefer Kontext erforderlich – etwas, das das WDP liefert. Seit 1985 führen sie das weltweit am längsten laufende Unterwasser-Delfinforschungsprojekt durch, das sich auf Atlantische Fleckendelfine auf den Bahamas konzentriert. Sie verwenden nicht-invasive Methoden und zeichnen Video- und Audiodaten zusammen mit der Identität und dem Verhalten jedes einzelnen Delfins auf.

Einige charakteristische Laute:

Signaturpfiffe, mit denen Mütter ihre Kälber rufen
Impulsgeräusche während Konflikten
Klicklaute beim Werben oder bei der Verfolgung von Haien

Einführung von DolphinGemma

Google entwickelte DolphinGemma durch den Einsatz der SoundStream-Audiotechnologie und eines Modells mit 400 Millionen Parametern, das direkt auf Pixel-Smartphones laufen kann. Dieses Modell erkennt und analysiert natürliche Klangsequenzen und sagt den nächsten Laut voraus – ähnlich wie KI Sprache verarbeitet.

DolphinGemma wurde bereits im Feld eingesetzt und hilft dabei, sich wiederholende Muster, Klangcluster und potenzielle Bedeutungen zu erkennen. Forscher haben zudem synthetisierte Laute an den Lieblingsobjekten der Delfine angebracht, um ein „gemeinsames Vokabular“ für interaktive Kommunikation aufzubauen.

Pixel-Smartphones für die Unterwasserkommunikation

Das WDP entwickelt außerdem das CHAT-System (Cetacean Hearing Augmentation Technology) in Zusammenarbeit mit Georgia Tech. Dieses System nutzt synthetisierte Laute, die Objekte wie Seegras oder Handtücher repräsentieren, und hilft Delfinen, Laute nachzuahmen, um „Anfragen“ zu stellen.

So funktioniert es:

Präzises Zuhören trotz Ozeangeräuschen
Korrekte Identifikation des nachgeahmten Lauts
Benachrichtigung der Forscher über Knochenschall-Kopfhörer
Übergabe des richtigen Objekts als Antwort an den Delfin

Das Pixel 6 wurde bereits verwendet, und das Pixel 9 (erwartet im Sommer 2025) wird weiter verbessert, indem es Lautsprecher/Mikrofon integriert und das KI-Modell gleichzeitig ausführt, um die Reaktionsgeschwindigkeit und -flüssigkeit bei Interaktionen zu erhöhen.

DolphinGemma für die Forschungsgemeinschaft freigeben

Google wird DolphinGemma diesen Sommer als Open Source bereitstellen. Obwohl das Modell mit Daten von Atlantischen Fleckendelfinen trainiert wurde, kann es dennoch für andere Arten wie Große Tümmler oder Spinnerdelfine angepasst werden.

Die Kombination aus Feldforschung, Ingenieurwesen und KI-Technologie eröffnet neue Möglichkeiten für den Menschen, ein tieferes Verständnis für intelligente Meereslebewesen zu erlangen.

Source: https://blog.google/technology/ai/dolphingemma/