เป็นเวลาหลายทศวรรษที่การทำความเข้าใจเสียงต่างๆ เช่น การคลิก เสียงผิวปาก และเสียงพัลส์สั้นๆ จากโลมาเป็นความท้าทายทางวิทยาศาสตร์ แต่ถ้าเราสามารถไม่เพียงแค่ฟัง แต่ยังเข้าใจรูปแบบการสื่อสารที่ซับซ้อนของพวกมันและสร้างการตอบสนองที่สมจริงได้ล่ะ?
ในวันโลมาแห่งชาติ Google ได้ร่วมมือกับนักวิจัยจาก Georgia Tech และ Wild Dolphin Project (WDP) เพื่อประกาศเปิดตัว DolphinGemma—โมเดล AI พื้นฐานที่ได้รับการฝึกฝนให้เรียนรู้โครงสร้างเสียงของโลมาและสร้างลำดับเสียงใหม่ที่คล้ายโลมา นี่ถือเป็นก้าวสำคัญในเส้นทางของการสื่อสารระหว่างสายพันธุ์ และยังขยายศักยภาพในการเชื่อมโยงระหว่างมนุษย์กับโลกใต้ทะเลอีกด้วย
หลายทศวรรษแห่งการวิจัยสังคมโลมา
การเข้าใจสิ่งมีชีวิตชนิดหนึ่งต้องอาศัยบริบทที่ลึกซึ้ง—ซึ่ง WDP ได้มอบให้มาตลอด ตั้งแต่ปี 1985 พวกเขาได้ดำเนินโครงการวิจัยโลมาใต้น้ำที่ยาวนานที่สุดในโลก โดยมุ่งเน้นไปที่โลมาจุดแอตแลนติกในบาฮามาส พวกเขาใช้วิธีที่ไม่รุกล้ำ บันทึกวิดีโอและเสียงควบคู่กับการระบุและพฤติกรรมของโลมาแต่ละตัว
เสียงที่โดดเด่นบางประเภท:
- เสียงผิวปากเฉพาะตัวสำหรับแม่โลมาเรียกลูก
- เสียงพัลส์สั้นๆ ในระหว่างการขัดแย้ง
- เสียงคลิกแบบสั่นในช่วงเกี้ยวพาราสีหรือขณะไล่ล่าฉลาม
แนะนำ DolphinGemma
Google ได้พัฒนา DolphinGemma โดยใช้เทคโนโลยีเสียง SoundStream และโมเดลขนาด 400 ล้านพารามิเตอร์ที่สามารถทำงานได้โดยตรงบนโทรศัพท์ Pixel โมเดลนี้สามารถจดจำ วิเคราะห์ลำดับเสียงธรรมชาติ และทำนายเสียงถัดไป—คล้ายกับวิธีที่ AI ประมวลผลภาษา
DolphinGemma ถูกนำไปใช้ภาคสนามเพื่อช่วยตรวจจับรูปแบบที่ซ้ำกัน กลุ่มเสียง และความหมายที่เป็นไปได้ นักวิจัยยังได้ใช้เสียงสังเคราะห์ที่ผูกกับวัตถุโปรดของโลมาเพื่อสร้าง “คำศัพท์ร่วม” สำหรับการสื่อสารแบบโต้ตอบ
ใช้โทรศัพท์ Pixel สำหรับการสื่อสารใต้น้ำ
WDP กำลังพัฒนาระบบ CHAT (Cetacean Hearing Augmentation Technology) ร่วมกับ Georgia Tech ระบบนี้ใช้เสียงสังเคราะห์ที่แทนวัตถุต่างๆ เช่น สาหร่ายทะเลหรือผ้าขนหนู เพื่อช่วยให้โลมาเรียนรู้การเลียนเสียงเพื่อ “ขอ” สิ่งของ
วิธีการทำงาน:
- ฟังอย่างแม่นยำท่ามกลางเสียงรบกวนในทะเล
- ระบุเสียงที่เลียนแบบได้อย่างถูกต้อง
- แจ้งนักวิจัยผ่านหูฟังนำเสียงผ่านกระดูก
- มอบวัตถุที่ถูกต้องเป็นการตอบสนองให้กับโลมา
Pixel 6 ได้ถูกนำมาใช้แล้ว และ Pixel 9 (คาดว่าจะเปิดตัวฤดูร้อนปี 2025) จะได้รับการปรับปรุงเพิ่มเติม โดยผสานรวมทั้งลำโพง/ไมโครโฟนและรันโมเดล AI พร้อมกัน เพิ่มความเร็วและความราบรื่นในการตอบสนองระหว่างปฏิสัมพันธ์
แบ่งปัน DolphinGemma กับชุมชนนักวิจัย
Google จะเปิดโอเพ่นซอร์ส DolphinGemma ในฤดูร้อนนี้ แม้ว่าโมเดลจะได้รับการฝึกฝนด้วยข้อมูลของโลมาจุดแอตแลนติก แต่ก็ยังสามารถปรับแต่งเพื่อใช้กับสายพันธุ์อื่น เช่น โลมาปากขวดหรือโลมาหมุนได้
การผสมผสานระหว่างการวิจัยภาคสนาม วิศวกรรม และเทคโนโลยี AI กำลังเปิดประตูใหม่ให้มนุษย์ได้เข้าใจสิ่งมีชีวิตอัจฉริยะในทะเลลึกมากยิ่งขึ้น
Source: https://blog.google/technology/ai/dolphingemma/