DolphinGemma: Bagaimana AI Google Membantu Menguraikan Komunikasi Lumba-lumba

Google meluncurkan DolphinGemma – sebuah model AI yang menganalisis dan memprediksi suara lumba-lumba, membuka jalan bagi komunikasi antara manusia dan lumba-lumba. Model ini akan dirilis sebagai open source pada musim panas 2025.

Selama beberapa dekade, memahami suara seperti klik, siulan, dan denyut ledakan dari lumba-lumba telah menjadi tantangan ilmiah. Namun bagaimana jika kita tidak hanya bisa mendengarkan, tetapi juga memahami pola komunikasi kompleks mereka dan menghasilkan respons yang menyerupai kehidupan nyata?

Pada Hari Lumba-lumba Nasional, Google bekerja sama dengan peneliti dari Georgia Tech dan Wild Dolphin Project (WDP) untuk mengumumkan DolphinGemma—model AI dasar yang dilatih untuk mempelajari struktur akustik lumba-lumba dan menghasilkan rangkaian suara baru yang mirip lumba-lumba. Ini menandai lompatan signifikan dalam perjalanan komunikasi antarspesies, sekaligus memperluas potensi koneksi antara manusia dan dunia lautan.

Penelitian Sosial Lumba-lumba Selama Puluhan Tahun

Memahami suatu spesies memerlukan konteks yang mendalam—sesuatu yang telah disediakan oleh WDP. Sejak 1985, mereka telah melakukan proyek penelitian lumba-lumba bawah air terlama di dunia, dengan fokus pada lumba-lumba tutul Atlantik di Bahama. Mereka menggunakan metode non-invasif, merekam video dan audio yang dikombinasikan dengan identitas serta perilaku setiap individu lumba-lumba.

Beberapa suara khas:

  • Siulan khas untuk induk memanggil anaknya
  • Denyut ledakan saat terjadi konflik
  • Klik berdengung saat merayu atau mengejar hiu

Memperkenalkan DolphinGemma

Google mengembangkan DolphinGemma dengan menerapkan teknologi audio SoundStream dan model 400 juta parameter yang dapat dijalankan langsung di ponsel Pixel. Model ini mengenali, menganalisis rangkaian suara alami, dan memprediksi suara berikutnya—mirip dengan cara AI memproses bahasa.

DolphinGemma telah digunakan di lapangan, membantu mendeteksi pola berulang, klaster suara, dan potensi makna. Para peneliti juga telah menggunakan suara sintetis yang dilekatkan pada objek favorit lumba-lumba untuk membangun “kosakata bersama” guna komunikasi interaktif.

Menggunakan Ponsel Pixel untuk Komunikasi Bawah Air

WDP juga sedang mengembangkan sistem CHAT (Cetacean Hearing Augmentation Technology), bekerja sama dengan Georgia Tech. Sistem ini menggunakan suara sintetis yang mewakili objek seperti rumput laut atau handuk, membantu lumba-lumba belajar meniru suara untuk membuat “permintaan.”

Cara kerjanya:

  1. Mendengarkan secara akurat di tengah kebisingan laut
  2. Mengidentifikasi suara tiruan dengan benar
  3. Memberi tahu peneliti melalui headphone konduksi tulang
  4. Memberikan objek yang benar sebagai respons kepada lumba-lumba

Pixel 6 telah digunakan, dan Pixel 9 (diperkirakan musim panas 2025) akan lebih ditingkatkan, mengintegrasikan speaker/mikrofon dan menjalankan model AI secara bersamaan, meningkatkan kecepatan respons dan kelancaran selama interaksi.

Berbagi DolphinGemma dengan Komunitas Riset

Google akan membuka sumber DolphinGemma musim panas ini. Meskipun model ini dilatih dengan data lumba-lumba tutul Atlantik, model ini tetap dapat disesuaikan untuk digunakan pada spesies lain seperti lumba-lumba hidung botol atau lumba-lumba pemintal.

Kombinasi penelitian lapangan, rekayasa, dan teknologi AI membuka pintu baru bagi manusia untuk mendapatkan pemahaman yang lebih dalam tentang makhluk laut yang cerdas.

Source: https://blog.google/technology/ai/dolphingemma/

Thông tin liên hệ

Email

Info@ninecode.vn

Ninequiz. một sản phẩm của Ninecode JSC