DolphinGemma:グーグルのAIがイルカのコミュニケーション解読を支援

GoogleはDolphinGemmaを発表しました。これはイルカの音を解析し予測するAIモデルであり、人間とイルカのコミュニケーションへの道を切り開きます。このモデルは2025年夏にオープンソースとして公開される予定です。

何十年もの間、イルカのクリック音、ホイッスル音、バーストパルスなどの音を理解することは科学的な課題でした。しかし、もし私たちがそれらを「聞く」だけでなく、複雑なコミュニケーションパターンを理解し、リアルな応答を生成できたらどうでしょうか?

ナショナル・ドルフィン・デーに、Googleはジョージア工科大学およびワイルド・ドルフィン・プロジェクト(WDP)の研究者と提携し、イルカの音響構造を学習し、イルカのような新しい音のシーケンスを生成できる基盤AIモデル「DolphinGemma」を発表しました。これは異種間コミュニケーションの旅における大きな飛躍であり、人間と海の世界とのつながりの可能性を広げるものです。

数十年にわたるイルカの社会的研究

ある種を理解するには深い文脈が必要ですが、それをWDPが提供してきました。1985年以来、彼らはバハマの大西洋ハンドウイルカを対象に、世界最長の水中イルカ研究プロジェクトを実施しています。非侵襲的な方法を用い、各個体のイルカの識別と行動とともに、映像と音声を記録しています。

特徴的な音の例:

  • 母親が子イルカを呼ぶためのシグネチャーホイッスル
  • 争いの際のバーストパルス
  • 求愛やサメを追うときのバジングクリック

DolphinGemmaの紹介

Googleは、SoundStreamオーディオ技術と4億パラメータのモデルを活用し、Pixelスマートフォン上で直接動作するDolphinGemmaを開発しました。このモデルは自然な音のシーケンスを認識・分析し、次の音を予測します。これはAIが言語を処理する方法に似ています。

DolphinGemmaは現場で活用され、繰り返し現れるパターンや音のクラスター、潜在的な意味の検出に役立っています。研究者たちは、イルカのお気に入りの物体に合成音を付与し、「共有語彙」を構築してインタラクティブなコミュニケーションを行う試みも行っています。

Pixelスマートフォンによる水中コミュニケーション

WDPはジョージア工科大学と協力し、CHATシステム(Cetacean Hearing Augmentation Technology)も開発しています。このシステムは、海藻やタオルなどの物体を表す合成音を用い、イルカが音を模倣して「リクエスト」できるよう学習を助けます。

仕組み:

  1. 海中ノイズの中で正確に聞き取る
  2. 模倣された音を正しく識別する
  3. 骨伝導ヘッドホンで研究者に通知する
  4. イルカに正しい物体を提供する

Pixel 6が使用されており、Pixel 9(2025年夏発売予定)ではさらに改良され、スピーカー/マイクの統合とAIモデルの同時稼働により、インタラクション時の応答速度と滑らかさが向上します。

DolphinGemmaを研究コミュニティと共有

Googleは今夏、DolphinGemmaをオープンソース化します。大西洋ハンドウイルカのデータで訓練されていますが、バンドウイルカやハシナガイルカなど他の種にもカスタマイズして利用できます。

フィールドリサーチ、エンジニアリング、AI技術の組み合わせにより、人類が知的な海洋生物をより深く理解するための新たな扉が開かれています。

Source: https://blog.google/technology/ai/dolphingemma/