AIでイルカとの会話が可能に Google、イルカのための新AIモデル「DolphinGemma」公開

現地時間2025年4月14日、米Googleは「ナショナル・ドルフィン・デー」に合わせ、イルカのコミュニケーション解読を目的としたAIモデル「DolphinGemma」を発表した。
イルカとの対話はこれまで科学者が追い求めてきたテーマでもあり、夢の実現に向けた挑戦的なプランだと言える。
イルカの「言葉」を理解する、DolphinGemmaの技術と背景
Googleが公開した「DolphinGemma」は、同社の軽量大規模言語モデル「Gemma」をベースに、イルカの研究機関であるWild Dolphin Project(WDP)と連携して開発された。
WDPが1985年からバハマで蓄積してきた大西洋マダライルカの音声・映像データを学習素材として活用しており、母子の再会時や争い、求愛行動などの行動に伴う音声パターンの解析が行われている。
DolphinGemmaは、これらのパターンを学習し、開発された。
DolphinGemmaには約4億のパラメータが搭載されている。
Googleの音声技術「SoundStream tokenizer」を応用することで、イルカ特有の高周波音や連続的なクリック音を効率よく分解・表現することが可能になった。
人間の言語モデルが文脈から単語を予測するように、音の連鎖から構造と意味を見出すことができるのである。
モデルはGoogleのスマートフォン「Pixel」に最適化されており、モデルはマイクとスピーカーを利用して、モバイル端末上でも直接動作する。
海中でのリアルタイム観測や音声再生といったフィールドワークを意識した設計だ。
※SoundStream tokenizer:
Googleが開発した音声信号を処理する技術。音の特徴を保持したまま、効率よく符号化することができ、音声認識や生成に有効とされる。
CHATシステムとの連携と今後の展望
DolphinGemmaのポテンシャルは、WDPとジョージア工科大学が共同開発した「CHAT(※)」システムとの連携によって大きく向上している。
CHATは水中での双方向コミュニケーションを試みるシステムで、Pixel端末を通じてイルカの音を検出し、人間側が生成した合成音を即座に再生する機能を持つ。
この技術により、単なる観察対象だったイルカと「問いかけ」や「応答」といったやり取りが行える可能性が出てきたのだ。
Googleは今夏にもDolphinGemmaをオープンモデルとして公開する予定であり、大西洋マダライルカに加え、ハンドウイルカやシャチなど他種の研究への応用も見込まれている。
ただ、DolphinGemmaが仮に特定の「再会音」「威嚇音」などを分類できたとしても、それが本当にイルカ同士の「意図」を反映しているかは科学的検証を要するだろう。
今後は、複数の種・群れへの応用可能性、学習データの多様化、そして「意図共有」の有無を確かめる実験設計が鍵になると思われる。
もし一定の相互理解が成立しうるという証拠が積み重なれば、イルカとの共生に関する倫理観や、法制度にまで波及する議論へと発展していく可能性もあるだろう。
※CHAT:
Cetacean Hearing Augmentation Telemetryの略。水中での鯨類とのコミュニケーションを可能にするデバイスで、特定の音を送信し、その反応をリアルタイムで解析する仕組みを持つ。