Selama beberapa dekad, memahami bunyi seperti klik, wisel, dan denyutan letupan daripada ikan lumba-lumba telah menjadi cabaran saintifik. Tetapi bagaimana jika kita bukan sahaja dapat mendengar, malah memahami corak komunikasi kompleks mereka dan menghasilkan respons yang seakan-akan nyata?
Pada Hari Dolphin Kebangsaan, Google bekerjasama dengan penyelidik dari Georgia Tech dan Wild Dolphin Project (WDP) untuk mengumumkan DolphinGemma—model AI asas yang dilatih untuk mempelajari struktur akustik ikan lumba-lumba dan menjana urutan bunyi baharu yang menyerupai ikan lumba-lumba. Ini menandakan satu lonjakan besar dalam perjalanan komunikasi antara spesies, di samping memperluaskan potensi hubungan antara manusia dan dunia lautan.
Dekad Penyelidikan Sosial Dolphin
Memahami sesuatu spesies memerlukan konteks yang mendalam—sesuatu yang telah disediakan oleh WDP. Sejak 1985, mereka telah menjalankan projek penyelidikan ikan lumba-lumba bawah air yang paling lama di dunia, memfokuskan kepada ikan lumba-lumba berbintik Atlantik di Bahamas. Mereka menggunakan kaedah tidak invasif, merakam video dan audio yang digabungkan dengan identiti dan tingkah laku setiap ikan lumba-lumba individu.
Beberapa bunyi yang unik:
- Wisel tanda pengenalan untuk ibu memanggil anak mereka
- Denyutan letupan semasa konflik
- Klik berdesir semasa mengawan atau ketika mengejar jerung
Pengenalan DolphinGemma
Google membangunkan DolphinGemma dengan menggunakan teknologi audio SoundStream dan model 400 juta parameter yang boleh dijalankan terus pada telefon Pixel. Model ini mengenal pasti, menganalisis urutan bunyi semula jadi, dan meramalkan bunyi seterusnya—sama seperti cara AI memproses bahasa.
DolphinGemma telah digunakan di lapangan, membantu mengesan corak berulang, kelompok bunyi, dan potensi makna. Penyelidik juga telah menggunakan bunyi sintetik yang dipasang pada objek kegemaran ikan lumba-lumba untuk membina “perbendaharaan kata bersama” bagi komunikasi interaktif.
Menggunakan Telefon Pixel untuk Komunikasi Bawah Air
WDP juga sedang membangunkan sistem CHAT (Cetacean Hearing Augmentation Technology), dengan kerjasama Georgia Tech. Sistem ini menggunakan bunyi sintetik yang mewakili objek seperti rumpai laut atau tuala, membantu ikan lumba-lumba belajar meniru bunyi untuk membuat “permintaan.”
Cara ia berfungsi:
- Mendengar dengan tepat di tengah bunyi bising lautan
- Mengenal pasti bunyi tiruan dengan betul
- Memaklumkan penyelidik melalui fon kepala konduksi tulang
- Memberikan objek yang betul sebagai respons kepada ikan lumba-lumba
Pixel 6 telah digunakan, dan Pixel 9 (dijangka musim panas 2025) akan dipertingkatkan lagi, menggabungkan kedua-dua pembesar suara/mikrofon dan menjalankan model AI secara serentak, meningkatkan kelajuan respons dan kelancaran semasa interaksi.
Berkongsi DolphinGemma dengan Komuniti Penyelidikan
Google akan membuka sumber DolphinGemma pada musim panas ini. Walaupun ia dilatih menggunakan data ikan lumba-lumba berbintik Atlantik, model ini masih boleh disesuaikan untuk digunakan dengan spesies lain seperti ikan lumba-lumba hidung botol atau ikan lumba-lumba pemintal.
Gabungan penyelidikan lapangan, kejuruteraan, dan teknologi AI sedang membuka pintu baharu untuk manusia memahami makhluk marin yang bijak dengan lebih mendalam.
Source: https://blog.google/technology/ai/dolphingemma/