DolphinGemma៖ របៀបដែល AI របស់ Google ជួយបកស្រាយការទំនាក់ទំនងរបស់ដុលហ្វិន

Google បានបើកដំណើរការម៉ូឌែល AI ថ្មីឈ្មោះ DolphinGemma ដែលអាចវិភាគ និង tiên្យាយសំឡេងដាល់ហ្វិន ដោយបើកផ្លូវសម្រាប់ការទំនាក់ទំនងរវាងមនុស្ស និងដាល់ហ្វិន។ ម៉ូឌែលនេះនឹងត្រូវចេញផ្សាយជាកូដបើកចំហនៅរដូវក្តៅឆ្នាំ 2025។

អស់រយៈពេលជាច្រើនទសវត្សរ៍ ការយល់ដឹងអំពីសំឡេងដូចជា សំឡេងចុច សំឡេងផ្លុំ និងសំឡេងផ្ទុះរបស់ដុលហ្វិន គឺជាបញ្ហាប្រឈមវិទ្យាសាស្ត្រ។ ប៉ុន្តែបើសិនជាយើងអាចមិនត្រឹមតែស្តាប់ប៉ុណ្ណោះទេ ប៉ុន្តែអាចយល់ដឹងពីលំនាំនៃការប្រាស្រ័យទាក់ទងស្មុគស្មាញរបស់ពួកវា និងបង្កើតចម្លើយដែលមានភាពស្រដៀងនឹងជីវិតវិញ?

ក្នុងថ្ងៃជាតិដុលហ្វិន Google បានសហការជាមួយអ្នកស្រាវជ្រាវពីសាកលវិទ្យាល័យ Georgia Tech និងគម្រោង Wild Dolphin Project (WDP) ដើម្បីប្រកាសអំពី DolphinGemma—គំរូ AI មូលដ្ឋានមួយដែលត្រូវបានបណ្តុះបណ្តាលឲ្យសិក្សាភាពរចនាសំឡេងរបស់ដុលហ្វិន និងបង្កើតលំដាប់សំឡេងថ្មីៗដែលស្រដៀងនឹងដុលហ្វិន។ នេះជាជំហានធំមួយក្នុងការប្រាស្រ័យទាក់ទងរវាងប្រភេទ ខណៈពេលដែលក៏ពង្រីកសក្តានុពលនៃការតភ្ជាប់រវាងមនុស្ស និងពិភពសមុទ្រផងដែរ។

ការស្រាវជ្រាវសង្គមដុលហ្វិនជាច្រើនទសវត្សរ៍

ការយល់ដឹងអំពីប្រភេទមួយត្រូវការបរិបទជ្រៅ—អ្វីដែល WDP បានផ្តល់។ ចាប់តាំងពីឆ្នាំ 1985 ពួកគេបានធ្វើគម្រោងស្រាវជ្រាវដុលហ្វិនក្រោមទឹកដែលមានរយៈពេលវែងជាងគេបំផុតនៅលើពិភពលោក ដោយផ្តោតលើដុលហ្វិនចំណុច Atlantic នៅ Bahamas។ ពួកគេប្រើវិធីសាស្ត្រដែលមិនរំខាន ដោយថតវីដេអូ និងសំឡេងរួមជាមួយអត្តសញ្ញាណ និងឥរិយាបថរបស់ដុលហ្វិននីមួយៗ។

សំឡេងពិសេសខ្លះៗ៖

  • សំឡេងផ្លុំផ្ទាល់ខ្លួនសម្រាប់ម្តាយហៅកូន
  • សំឡេងផ្ទុះពេលមានជម្លោះ
  • សំឡេងចុចលឿនពេលស្វែងរកគូ ឬពេលបន្តបន្ទាប់តាមប Sharks

ណែនាំអំពី DolphinGemma

Google បានអភិវឌ្ឍ DolphinGemma ដោយប្រើបច្ចេកវិទ្យាសំឡេង SoundStream និងគំរូ ៤០០ លានប៉ារ៉ាម៉ែត្រ ដែលអាចដំណើរការដោយផ្ទាល់លើទូរស័ព្ទ Pixel។ គំរូនេះអាចស្គាល់ វិភាគលំដាប់សំឡេងធម្មជាតិ និងទស្សន៍ទាយសំឡេងបន្ទាប់—ស្រដៀងនឹងរបៀបដែល AI ដំណើរការភាសា។

DolphinGemma ត្រូវបានប្រើប្រាស់នៅក្នុងវាលស្រាវជ្រាវ ដើម្បីជួយរកឃើញលំនាំដែលកើតឡើងញឹកញាប់ ក្រុមសំឡេង និងអត្ថន័យដែលអាចមាន។ អ្នកស្រាវជ្រាវក៏បានប្រើសំឡេងសំយោគភ្ជាប់ជាមួយវត្ថុដែលដុលហ្វិនចូលចិត្ត ដើម្បីស្ថាបនាពាក្យសព្ទ “រួម” សម្រាប់ការប្រាស្រ័យទាក់ទងអន្តរកម្មផងដែរ។

ប្រើទូរស័ព្ទ Pixel សម្រាប់ការប្រាស្រ័យទាក់ទងក្រោមទឹក

WDP ក៏កំពុងអភិវឌ្ឍប្រព័ន្ធ CHAT (Cetacean Hearing Augmentation Technology) ជាមួយសហការី Georgia Tech។ ប្រព័ន្ធនេះប្រើសំឡេងសំយោគដែលតំណាងឲ្យវត្ថុដូចជា ស្លឹកសមុទ្រ ឬកន្សែង ដើម្បីជួយឲ្យដុលហ្វិនរៀនស្ទាក់សំឡេង ដើម្បីធ្វើ “សំណើ”។

របៀបដំណើរការ៖

  1. ស្តាប់បានត្រឹមត្រូវក្នុងកម្រិតសំឡេងរំខាននៃសមុទ្រ
  2. កំណត់សំឡេងស្ទាក់បានត្រឹមត្រូវ
  3. ជូនដំណឹងដល់អ្នកស្រាវជ្រាវតាមកាសបញ្ជូនតាមឆ្អឹង
  4. ផ្តល់វត្ថុត្រឹមត្រូវឲ្យដុលហ្វិនឆ្លើយតប

Pixel 6 ត្រូវបានប្រើប្រាស់ ហើយ Pixel 9 (រំពឹងនៅរដូវក្តៅ ២០២៥) នឹងត្រូវបានបន្ថែមប្រសិទ្ធភាពបន្ថែម ដោយរួមបញ្ចូលទាំងកំពូលសម្លេង/មីក្រូហ្វូន និងដំណើរការគំរូ AI ជាមួយគ្នា ដើម្បីបង្កើនល្បឿននិងភាពរលូននៃអន្តរកម្ម។

ចែករំលែក DolphinGemma ជាមួយសហគមន៍ស្រាវជ្រាវ

Google នឹងបើកប្រភពកូដ DolphinGemma នៅរដូវក្តៅនេះ។ ទោះបីវាត្រូវបានបណ្តុះបណ្តាលលើទិន្នន័យដុលហ្វិនចំណុច Atlantic ក៏ដោយ គំរូនេះនៅតែអាចប្ដូរតាមតម្រូវការសម្រាប់ប្រើជាមួយប្រភេទដុលហ្វិនផ្សេងទៀតដូចជា ដុលហ្វិនច្រមុះដប ឬដុលហ្វិនច្រវ៉ាក់។

ការរួមបញ្ចូលគ្នារវាងការស្រាវជ្រាវក្នុងវាល វិស្វកម្ម និងបច្ចេកវិទ្យា AI កំពុងបើកទ្វារថ្មីៗឲ្យមនុស្សយល់ដឹងជ្រៅជាងមុនអំពីសត្វសមុទ្រដែលមានបញ្ញា។

Source: https://blog.google/technology/ai/dolphingemma/