クジラの「方言」など野生動物の鳴き声解読にAIが大活躍中
カナダのオタワにあるカールトン大学で鯨類生物学者のシェーン・ゲロ氏は、20年間にわたってクジラのコミュニケーション方法を解明しようと研究を続けており、クジラが家族の一員であることを示す特定の鳴き声を出すことや、人間がさまざまな言語を話すように、マッコウクジラにも生息地域によって鳴き声に「方言」が存在することを突き止めました。クジラのコミュニケーション内容を解き明かすため、研究者たちは人工知能(AI)を活用しています。
Will artificial intelligence let us talk to the animals?
https://www.nature.com/immersive/d41586-024-04050-5/index.html
イルカ・ゾウ・鳥などの動物の鳴き声には特定のパターンが存在しており、仲間とコミュニケーションをとるために鳴き声が使用されています。しかし、人間が動物の鳴き声の微妙な違いを識別・理解することは非常に難しいものです。このような微妙な差異を判別することに適しているのがAIで、近年の生物学者やコンピューターサイエンティストはAIを用いて動物たちの鳴き声を解読しようとしています。
過去1年間のAI支援研究によると、アフリカのサバンナゾウとコモンマーモセットは共に仲間に名前をつけていることが明らかになりました。研究者は機械学習ツールを使ってカラスの鳴き声をマッピングする作業を行っています。コンピューターモデルの能力が向上すると、動物のコミュニケーション方法が解明され、科学者が動物の自己認識を調査できるようになるかもしれません。これは絶滅危惧種を保護するための取り組みを強化するきっかけになる可能性があります。
しかし、人間の言語については膨大な用例があるためAIによる言語分析・翻訳が猛烈な速度で進んでいますが、動物の鳴き声はそうはいかないので、ただちに翻訳ツールが出てくるようなことにはならないようです。マッコウクジラの音響コミュニケーションを理解するための国際的なプロジェクトである「Project CETI」を設立した海洋微生物学者のデイビット・グルーバー氏は、「そのすべての技術を別の種に向け、何らかの方法で学習させて翻訳を始めさせることができると考えるのは大きな仮定だと思います」と語りました。
Project CETIはマッコウクジラに焦点を当てており、ゲロ氏の研究のスポンサーとなっています。しかし、Project CETI以前からゲロ氏はカリブ海で何千時間も過ごし、同僚と共に島の近くに生息する30頭以上のクジラの家族に関するデータを収集してきました。
クジラはほとんどの時間を水深2000メートルの深海でエサ探しに費やします。水深2000mの世界には太陽光が届かないため、獲物の捜索時にはクリック音を発してエコーロケーションを利用します。時には、「コーダ」と呼ばれるクリック音を30~40回連続で発して、他のクジラとコミュニケーションを図ることもあります。
ゲロ氏と他の研究者たちは、クジラはメスが率いる「クラン」と呼ばれる集団を形成し、それぞれが独特の食生活、社会行動、生息地の利用法を持っていることを明らかにしました。数千頭の個体から構成されるクランもあり、独自の方言でコミュニケーションをとるそうです。方言はコーダのテンポによって区別できるそうで、異なる2つのクランは5回連続でクリック音を発するという同じパターンを使用しますが、テンポと休止のタイミングは異なります。ゲロ氏はクジラの持つ方言を「クラン間の文化的境界」と表現しました。
クジラの発するコーダがどんなものなのかは、以下の動画を見ればわかります。
Listening in on sperm whale conversations - YouTube
コーダのリズムとテンポを理解するため、研究チームはクジラの音声録音のスペクトログラムを手作業で作成しました。これは音量や周波数などの特性を描写して、音を視覚化する手段で、人間の場合は音素と呼ばれる個々の音声単位を識別することに利用できます。
このプロセスは時間のかかる作業で、チームメンバーが1分の録音データから個々のクリック音を分離するまで従来は約10分ほどかかっていました。しかし、機械学習アルゴリズムを用いることでこの作業は大幅にスピードアップ。機械学習の利用について、「どの音がどの動物が発した音なのかを分離するのにも役立った」とゲロ氏は語りました。
AIを活用することで研究はさらなる飛躍を遂げています。研究者たちは基本的に手作業で個々の単語を分類していましたが、AIによってクジラの文章や会話全体に相当するコーダを見つけることが可能となったそうです。
さらに、クリック音の間隔の微妙な変化が発見されており、これを科学者たちは「ルバート」と名付けています。ルバートは楽曲の表現力を豊かにするわずかなテンポの変化を意味する音楽用語に由来します。他にも、時折クリック音が追加されることも発見され、メロディーの上に音符を追加する音楽的慣習にちなんで「オーナメンテーション」と名付けられました。
それぞれの特徴が何を意味するのかはまだ明らかになっていませんが、リズム・テンポ・ルバート・オーナメンテーションをさまざまな組み合わせで使用することで、クジラは膨大な数の異なるコーダを作り出すことが可能です。研究者は8719ものコーダのデータセットを収集し、マッコウクジラの音声アルファベットと呼ばれるものを発見しました。研究チームはクジラが複雑な情報を共有するための構成要素としてコーダを使っているのではないかと推測しています。
AIがクジラの発声のこうした特徴を明らかにするにつれ、研究チームはそれがどんな意味を持つのかを研究し続けています。例えば、ルバートは潜水前に増加するのか、それとも母親が子クジラとコミュニケーションをとる時に減少するのかなどを分析することで、ルバートなどの個々の特徴が持つ意味を分析しようとしているそうです。ゲロ氏は「ルバートの存在を知らなければ、『ルバートはいつ重要なのか』という問いを始めることはできません」と語りました。
特定の発声法で自分を識別する生物はマッコウクジラだけではありません。行動生態学者のミッキー・パルド氏は、機械学習を用いて野生のアフリカゾウが名前らしきものを持っていることを突き止めています。研究チームによると、ゾウは低いゴロゴロという音を発することで、ゾウ同士が視界から外れているか接近しているか、また母ゾウが子ゾウと触れ合っているかどうかなど伝えあうそうです。
パルド氏ら研究チームは、ゾウが特定の呼びかけには反応するものの、他の呼びかけは無視することに興味を持ち、反応があった鳴き声がユニークなものであるかどうかを確認するため、ゾウが反応した発声で機械学習モデルをトレーニングしました。
この機械学習モデルに、鳴き声がどの個体を呼んだものか予測するタスクを行わせたところ、27.5%の精度で予測することに成功しました。パルド氏は「成功率はそれほど高くないように思えるかもしれませんが、ゾウが呼び出し音に毎回名前を使うとは考えられないということを覚えておいてください」と言及。なお、あらゆるゾウの鳴き声で機械学習モデルをトレーニングした場合の「ゾウがどの個体を呼んでいるのか予測するタスク」の精度はわずか8%だったそうです。
イスラエルのエルサレム・ヘブライ大学の神経学者であるデイビッド・オマー氏も、マーモセットで同様の実験を行っています。研究チームはコンピューターにマーモセットの鳴き声を学習させることで、同じ科の仲間が、他のマーモセットを名前を呼ぶ際に、類似した音響的特徴を持つことを発見しました。
パルド氏は同じ技術を使って、場所を表す言葉など、ゾウの他の語彙も解読できるかどうか試したいと考えているそうです。ゾウは仲間を移動させようとするときに特定の鳴き声を出すため、鳴き声のいくつかが特定の場所への移動を意味している可能性があると研究チームは指摘しています。
・関連記事
Googleが協力する「AIを使った動物とのコミュニケーション」を実現させる試みが進行中 - GIGAZINE
スマホやPCで鳴き声をAIで解析して鳥の種類を判別できる「BirdNET」が登場 - GIGAZINE
人工知能を使用してクジラと会話するプロジェクトとは? - GIGAZINE
「ネズミの鳴き声の意味」を機械学習で解読するシステム「DeepSqueak」が開発中、マウス実験で活用される見込み - GIGAZINE
誰でも100種類の声に変換できるAIボイスチェンジャーを使ってみたらこんな感じ - GIGAZINE
・関連コンテンツ