DolphinGemma: วิธีที่ AI ของ Google ช่วยถอดรหัสการสื่อสารของโลมา

Google เปิดตัว DolphinGemma – โมเดล AI ที่วิเคราะห์และทำนายเสียงของโลมา ปูทางสู่การสื่อสารระหว่างมนุษย์กับโลมา โดยโมเดลนี้จะเปิดให้ใช้งานแบบโอเพ่นซอร์สในช่วงฤดูร้อนปี 2025

เป็นเวลาหลายทศวรรษที่การทำความเข้าใจเสียงต่างๆ เช่น การคลิก เสียงผิวปาก และเสียงพัลส์สั้นๆ จากโลมาเป็นความท้าทายทางวิทยาศาสตร์ แต่ถ้าเราสามารถไม่เพียงแค่ฟัง แต่ยังเข้าใจรูปแบบการสื่อสารที่ซับซ้อนของพวกมันและสร้างการตอบสนองที่สมจริงได้ล่ะ?

ในวันโลมาแห่งชาติ Google ได้ร่วมมือกับนักวิจัยจาก Georgia Tech และ Wild Dolphin Project (WDP) เพื่อประกาศเปิดตัว DolphinGemma—โมเดล AI พื้นฐานที่ได้รับการฝึกฝนให้เรียนรู้โครงสร้างเสียงของโลมาและสร้างลำดับเสียงใหม่ที่คล้ายโลมา นี่ถือเป็นก้าวสำคัญในเส้นทางของการสื่อสารระหว่างสายพันธุ์ และยังขยายศักยภาพในการเชื่อมโยงระหว่างมนุษย์กับโลกใต้ทะเลอีกด้วย

หลายทศวรรษแห่งการวิจัยสังคมโลมา

การเข้าใจสิ่งมีชีวิตชนิดหนึ่งต้องอาศัยบริบทที่ลึกซึ้ง—ซึ่ง WDP ได้มอบให้มาตลอด ตั้งแต่ปี 1985 พวกเขาได้ดำเนินโครงการวิจัยโลมาใต้น้ำที่ยาวนานที่สุดในโลก โดยมุ่งเน้นไปที่โลมาจุดแอตแลนติกในบาฮามาส พวกเขาใช้วิธีที่ไม่รุกล้ำ บันทึกวิดีโอและเสียงควบคู่กับการระบุและพฤติกรรมของโลมาแต่ละตัว

เสียงที่โดดเด่นบางประเภท:

  • เสียงผิวปากเฉพาะตัวสำหรับแม่โลมาเรียกลูก
  • เสียงพัลส์สั้นๆ ในระหว่างการขัดแย้ง
  • เสียงคลิกแบบสั่นในช่วงเกี้ยวพาราสีหรือขณะไล่ล่าฉลาม

แนะนำ DolphinGemma

Google ได้พัฒนา DolphinGemma โดยใช้เทคโนโลยีเสียง SoundStream และโมเดลขนาด 400 ล้านพารามิเตอร์ที่สามารถทำงานได้โดยตรงบนโทรศัพท์ Pixel โมเดลนี้สามารถจดจำ วิเคราะห์ลำดับเสียงธรรมชาติ และทำนายเสียงถัดไป—คล้ายกับวิธีที่ AI ประมวลผลภาษา

DolphinGemma ถูกนำไปใช้ภาคสนามเพื่อช่วยตรวจจับรูปแบบที่ซ้ำกัน กลุ่มเสียง และความหมายที่เป็นไปได้ นักวิจัยยังได้ใช้เสียงสังเคราะห์ที่ผูกกับวัตถุโปรดของโลมาเพื่อสร้าง “คำศัพท์ร่วม” สำหรับการสื่อสารแบบโต้ตอบ

ใช้โทรศัพท์ Pixel สำหรับการสื่อสารใต้น้ำ

WDP กำลังพัฒนาระบบ CHAT (Cetacean Hearing Augmentation Technology) ร่วมกับ Georgia Tech ระบบนี้ใช้เสียงสังเคราะห์ที่แทนวัตถุต่างๆ เช่น สาหร่ายทะเลหรือผ้าขนหนู เพื่อช่วยให้โลมาเรียนรู้การเลียนเสียงเพื่อ “ขอ” สิ่งของ

วิธีการทำงาน:

  1. ฟังอย่างแม่นยำท่ามกลางเสียงรบกวนในทะเล
  2. ระบุเสียงที่เลียนแบบได้อย่างถูกต้อง
  3. แจ้งนักวิจัยผ่านหูฟังนำเสียงผ่านกระดูก
  4. มอบวัตถุที่ถูกต้องเป็นการตอบสนองให้กับโลมา

Pixel 6 ได้ถูกนำมาใช้แล้ว และ Pixel 9 (คาดว่าจะเปิดตัวฤดูร้อนปี 2025) จะได้รับการปรับปรุงเพิ่มเติม โดยผสานรวมทั้งลำโพง/ไมโครโฟนและรันโมเดล AI พร้อมกัน เพิ่มความเร็วและความราบรื่นในการตอบสนองระหว่างปฏิสัมพันธ์

แบ่งปัน DolphinGemma กับชุมชนนักวิจัย

Google จะเปิดโอเพ่นซอร์ส DolphinGemma ในฤดูร้อนนี้ แม้ว่าโมเดลจะได้รับการฝึกฝนด้วยข้อมูลของโลมาจุดแอตแลนติก แต่ก็ยังสามารถปรับแต่งเพื่อใช้กับสายพันธุ์อื่น เช่น โลมาปากขวดหรือโลมาหมุนได้

การผสมผสานระหว่างการวิจัยภาคสนาม วิศวกรรม และเทคโนโลยี AI กำลังเปิดประตูใหม่ให้มนุษย์ได้เข้าใจสิ่งมีชีวิตอัจฉริยะในทะเลลึกมากยิ่งขึ้น

Source: https://blog.google/technology/ai/dolphingemma/

Thông tin liên hệ

Email

Info@ninecode.vn

Ninequiz. một sản phẩm của Ninecode JSC