DolphinGemma: कैसे Google की एआई डॉल्फिन संचार को डिकोड करने में मदद करती है

Google ने DolphinGemma लॉन्च किया – एक एआई मॉडल जो डॉल्फिन की आवाज़ों का विश्लेषण और पूर्वानुमान करता है, जिससे इंसानों और डॉल्फिनों के बीच संचार का रास्ता खुलता है। यह मॉडल गर्मी 2025 में ओपन सोर्स के रूप में जारी किया जाएगा।

दशकों से, डॉल्फ़िन की क्लिक, सीटी और बर्स्ट पल्स जैसी ध्वनियों को समझना एक वैज्ञानिक चुनौती रहा है। लेकिन क्या हो अगर हम न केवल सुन सकें, बल्कि उनकी जटिल संचार प्रणालियों को समझ भी सकें और जीवन्त प्रतिक्रियाएँ भी उत्पन्न कर सकें?

नेशनल डॉल्फ़िन डे पर, Google ने Georgia Tech और Wild Dolphin Project (WDP) के शोधकर्ताओं के साथ मिलकर DolphinGemma की घोषणा की—एक आधारभूत AI मॉडल जिसे डॉल्फ़िन की ध्वनियों की संरचना सीखने और डॉल्फ़िन जैसी नई ध्वनि अनुक्रम उत्पन्न करने के लिए प्रशिक्षित किया गया है। यह प्रजातियों के बीच संचार की यात्रा में एक महत्वपूर्ण छलांग है, साथ ही मानव और समुद्री दुनिया के बीच संबंध की संभावनाओं का विस्तार भी करता है।

डॉल्फ़िन सामाजिक अनुसंधान के दशकों

किसी प्रजाति को समझने के लिए गहरा संदर्भ आवश्यक है—जो WDP ने प्रदान किया है। 1985 से, वे दुनिया की सबसे लंबे समय तक चलने वाली पानी के नीचे डॉल्फ़िन अनुसंधान परियोजना चला रहे हैं, जो बहामास में अटलांटिक स्पॉटेड डॉल्फ़िन पर केंद्रित है। वे गैर-आक्रामक तरीकों का उपयोग करते हैं, प्रत्येक डॉल्फ़िन की पहचान और व्यवहार के साथ वीडियो और ऑडियो रिकॉर्ड करते हैं।

कुछ विशिष्ट ध्वनियाँ:

माँओं द्वारा अपने बच्चों को बुलाने के लिए सिग्नेचर सीटी
संघर्ष के दौरान बर्स्ट पल्स
प्रेमालाप या शार्क का पीछा करते समय बज़िंग क्लिक

DolphinGemma का परिचय

Google ने DolphinGemma को SoundStream ऑडियो तकनीक और 400 मिलियन-पैरामीटर मॉडल का उपयोग करके विकसित किया है, जो सीधे Pixel फोन पर चल सकता है। यह मॉडल प्राकृतिक ध्वनि अनुक्रमों को पहचानता, विश्लेषण करता है और अगली ध्वनि की भविष्यवाणी करता है—ठीक वैसे ही जैसे AI भाषा को प्रोसेस करता है।

DolphinGemma का उपयोग फील्ड में किया गया है, जिससे दोहराए जाने वाले पैटर्न, ध्वनि समूह और संभावित अर्थों का पता लगाने में मदद मिली है। शोधकर्ताओं ने डॉल्फ़िन की पसंदीदा वस्तुओं से जुड़े सिंथेटिक ध्वनियों का उपयोग करके “साझा शब्दावली” बनाने के लिए भी काम किया है, जिससे इंटरैक्टिव संचार संभव हो सके।

पानी के नीचे संचार के लिए Pixel फोन का उपयोग

WDP Georgia Tech के साथ मिलकर CHAT सिस्टम (Cetacean Hearing Augmentation Technology) भी विकसित कर रहा है। यह सिस्टम समुद्री शैवाल या तौलिया जैसी वस्तुओं का प्रतिनिधित्व करने वाली सिंथेटिक ध्वनियों का उपयोग करता है, जिससे डॉल्फ़िन ध्वनियों की नकल करना सीखती हैं ताकि “अनुरोध” कर सकें।

यह कैसे काम करता है:

समुद्र के शोर के बीच सटीक सुनना
नकल की गई ध्वनि की सही पहचान करना
शोधकर्ताओं को बोन कंडक्शन हेडफोन के माध्यम से सूचित करना
डॉल्फ़िन को प्रतिक्रिया स्वरूप सही वस्तु प्रदान करना

Pixel 6 का उपयोग किया गया है, और Pixel 9 (जिसकी उम्मीद गर्मी 2025 में है) को और बेहतर बनाया जाएगा, जिसमें स्पीकर/माइक दोनों एकीकृत होंगे और AI मॉडल एक साथ चलेगा, जिससे इंटरैक्शन के दौरान प्रतिक्रिया की गति और सहजता बढ़ेगी।

शोध समुदाय के साथ DolphinGemma साझा करना

Google इस गर्मी में DolphinGemma को ओपन सोर्स करेगा। हालांकि इसे अटलांटिक स्पॉटेड डॉल्फ़िन डेटा पर प्रशिक्षित किया गया है, फिर भी इस मॉडल को बॉटलनोज़ डॉल्फ़िन या स्पिनर डॉल्फ़िन जैसी अन्य प्रजातियों के लिए अनुकूलित किया जा सकता है।

फील्ड अनुसंधान, इंजीनियरिंग और AI तकनीक का संयोजन मनुष्यों के लिए बुद्धिमान समुद्री जीवों को गहराई से समझने के नए द्वार खोल रहा है।

Source: https://blog.google/technology/ai/dolphingemma/