អស់រយៈពេលជាច្រើនទសវត្សរ៍ ការយល់ដឹងអំពីសំឡេងដូចជា សំឡេងចុច សំឡេងផ្លុំ និងសំឡេងផ្ទុះរបស់ដុលហ្វិន គឺជាបញ្ហាប្រឈមវិទ្យាសាស្ត្រ។ ប៉ុន្តែបើសិនជាយើងអាចមិនត្រឹមតែស្តាប់ប៉ុណ្ណោះទេ ប៉ុន្តែអាចយល់ដឹងពីលំនាំនៃការប្រាស្រ័យទាក់ទងស្មុគស្មាញរបស់ពួកវា និងបង្កើតចម្លើយដែលមានភាពស្រដៀងនឹងជីវិតវិញ?
ក្នុងថ្ងៃជាតិដុលហ្វិន Google បានសហការជាមួយអ្នកស្រាវជ្រាវពីសាកលវិទ្យាល័យ Georgia Tech និងគម្រោង Wild Dolphin Project (WDP) ដើម្បីប្រកាសអំពី DolphinGemma—គំរូ AI មូលដ្ឋានមួយដែលត្រូវបានបណ្តុះបណ្តាលឲ្យសិក្សាភាពរចនាសំឡេងរបស់ដុលហ្វិន និងបង្កើតលំដាប់សំឡេងថ្មីៗដែលស្រដៀងនឹងដុលហ្វិន។ នេះជាជំហានធំមួយក្នុងការប្រាស្រ័យទាក់ទងរវាងប្រភេទ ខណៈពេលដែលក៏ពង្រីកសក្តានុពលនៃការតភ្ជាប់រវាងមនុស្ស និងពិភពសមុទ្រផងដែរ។
ការស្រាវជ្រាវសង្គមដុលហ្វិនជាច្រើនទសវត្សរ៍
ការយល់ដឹងអំពីប្រភេទមួយត្រូវការបរិបទជ្រៅ—អ្វីដែល WDP បានផ្តល់។ ចាប់តាំងពីឆ្នាំ 1985 ពួកគេបានធ្វើគម្រោងស្រាវជ្រាវដុលហ្វិនក្រោមទឹកដែលមានរយៈពេលវែងជាងគេបំផុតនៅលើពិភពលោក ដោយផ្តោតលើដុលហ្វិនចំណុច Atlantic នៅ Bahamas។ ពួកគេប្រើវិធីសាស្ត្រដែលមិនរំខាន ដោយថតវីដេអូ និងសំឡេងរួមជាមួយអត្តសញ្ញាណ និងឥរិយាបថរបស់ដុលហ្វិននីមួយៗ។
សំឡេងពិសេសខ្លះៗ៖
- សំឡេងផ្លុំផ្ទាល់ខ្លួនសម្រាប់ម្តាយហៅកូន
- សំឡេងផ្ទុះពេលមានជម្លោះ
- សំឡេងចុចលឿនពេលស្វែងរកគូ ឬពេលបន្តបន្ទាប់តាមប Sharks
ណែនាំអំពី DolphinGemma
Google បានអភិវឌ្ឍ DolphinGemma ដោយប្រើបច្ចេកវិទ្យាសំឡេង SoundStream និងគំរូ ៤០០ លានប៉ារ៉ាម៉ែត្រ ដែលអាចដំណើរការដោយផ្ទាល់លើទូរស័ព្ទ Pixel។ គំរូនេះអាចស្គាល់ វិភាគលំដាប់សំឡេងធម្មជាតិ និងទស្សន៍ទាយសំឡេងបន្ទាប់—ស្រដៀងនឹងរបៀបដែល AI ដំណើរការភាសា។
DolphinGemma ត្រូវបានប្រើប្រាស់នៅក្នុងវាលស្រាវជ្រាវ ដើម្បីជួយរកឃើញលំនាំដែលកើតឡើងញឹកញាប់ ក្រុមសំឡេង និងអត្ថន័យដែលអាចមាន។ អ្នកស្រាវជ្រាវក៏បានប្រើសំឡេងសំយោគភ្ជាប់ជាមួយវត្ថុដែលដុលហ្វិនចូលចិត្ត ដើម្បីស្ថាបនាពាក្យសព្ទ “រួម” សម្រាប់ការប្រាស្រ័យទាក់ទងអន្តរកម្មផងដែរ។
ប្រើទូរស័ព្ទ Pixel សម្រាប់ការប្រាស្រ័យទាក់ទងក្រោមទឹក
WDP ក៏កំពុងអភិវឌ្ឍប្រព័ន្ធ CHAT (Cetacean Hearing Augmentation Technology) ជាមួយសហការី Georgia Tech។ ប្រព័ន្ធនេះប្រើសំឡេងសំយោគដែលតំណាងឲ្យវត្ថុដូចជា ស្លឹកសមុទ្រ ឬកន្សែង ដើម្បីជួយឲ្យដុលហ្វិនរៀនស្ទាក់សំឡេង ដើម្បីធ្វើ “សំណើ”។
របៀបដំណើរការ៖
- ស្តាប់បានត្រឹមត្រូវក្នុងកម្រិតសំឡេងរំខាននៃសមុទ្រ
- កំណត់សំឡេងស្ទាក់បានត្រឹមត្រូវ
- ជូនដំណឹងដល់អ្នកស្រាវជ្រាវតាមកាសបញ្ជូនតាមឆ្អឹង
- ផ្តល់វត្ថុត្រឹមត្រូវឲ្យដុលហ្វិនឆ្លើយតប
Pixel 6 ត្រូវបានប្រើប្រាស់ ហើយ Pixel 9 (រំពឹងនៅរដូវក្តៅ ២០២៥) នឹងត្រូវបានបន្ថែមប្រសិទ្ធភាពបន្ថែម ដោយរួមបញ្ចូលទាំងកំពូលសម្លេង/មីក្រូហ្វូន និងដំណើរការគំរូ AI ជាមួយគ្នា ដើម្បីបង្កើនល្បឿននិងភាពរលូននៃអន្តរកម្ម។
ចែករំលែក DolphinGemma ជាមួយសហគមន៍ស្រាវជ្រាវ
Google នឹងបើកប្រភពកូដ DolphinGemma នៅរដូវក្តៅនេះ។ ទោះបីវាត្រូវបានបណ្តុះបណ្តាលលើទិន្នន័យដុលហ្វិនចំណុច Atlantic ក៏ដោយ គំរូនេះនៅតែអាចប្ដូរតាមតម្រូវការសម្រាប់ប្រើជាមួយប្រភេទដុលហ្វិនផ្សេងទៀតដូចជា ដុលហ្វិនច្រមុះដប ឬដុលហ្វិនច្រវ៉ាក់។
ការរួមបញ្ចូលគ្នារវាងការស្រាវជ្រាវក្នុងវាល វិស្វកម្ម និងបច្ចេកវិទ្យា AI កំពុងបើកទ្វារថ្មីៗឲ្យមនុស្សយល់ដឹងជ្រៅជាងមុនអំពីសត្វសមុទ្រដែលមានបញ្ញា។
Source: https://blog.google/technology/ai/dolphingemma/