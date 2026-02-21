2026年02月21日 15時00分 AI

Googleの鳴き声分類AI「Perch 2.0」がクジラの生態研究に役立っている



Google DeepMindが開発した生物音響基盤モデルであるPerch 2.0は、主に鳥類などの陸生生物の鳴き声を用いて事前学習されていますが、海洋哺乳類の分類においても極めて高い性能を発揮することが明らかになりました。研究結果は未査読論文リポジトリのarXivで公開されています。



How AI trained on birds is surfacing underwater mysteries

https://research.google/blog/how-ai-trained-on-birds-is-surfacing-underwater-mysteries/



[2512.03219] Perch 2.0 transfers 'whale' to underwater tasks

https://arxiv.org/abs/2512.03219



Perch 2.0は1万4500種以上の生物データを学習した基盤モデルですが、その訓練データに水中音響はほとんど含まれていません。しかし、少数のラベル付きデータを用いた転移学習を行うことで、海洋哺乳類の分類において既存のモデルを凌駕(りょうが)する極めて高い性能を発揮することが示されました。



Googleが環境音から「周囲にいる生物の種類や個体数」を推測できるAI「Perch」の強化版をリリース - GIGAZINE





実験では、陸生生物の音声で学習された基盤モデルであるPerch 2.0を、海洋哺乳類や水中音響の分類タスクに転移学習させる能力が検証されました。具体的には、モデルから生成された埋め込み(エンベディング)を用いて線形プローブ(リニアプローブ)を行い、既存の他の事前学習済み生物音響モデルと比較評価しています。比較対象には、Perch 1.0、SurfPerch、Google Multispecies Whale Model(GMWM)、BirdNet V2.3、AVES-bio、BirdAVESといったモデルが含まれています。



実験に使用されたデータセットは主に3つで構成されています。1つ目は「NOAA PIPAN」で、ミンククジラ、ザトウクジラ、イワシクジラ、シロナガスクジラ、ナガスクジラ、ニタリクジラといったヒゲクジラ類の鳴き声や、人為的なノイズを含む30秒間の録音データです。2つ目は「ReefSet」で、サンゴ礁の生物由来音や特定の魚類、イルカ、波の音などを含むデータセットです。3つ目は「DCLDE 2026」で、北東太平洋のシャチやザトウクジラ、非生物的な音などを区別するタスクが設定されています。





実験の結果、Perch 2.0はほとんどの海洋タスクにおいて一貫して高い性能を示し、多くのケースで他の比較モデルを上回ることが確認されました。特にシャチの亜種識別においては、Perch 2.0の埋め込みが他モデルよりもはっきりと区別できていることが実証されています。





なぜ鳥類で学習したモデルが水中でのタスクにこれほど適応できるのかについて、Googleは大規模モデルと膨大な訓練データがもたらす汎化能力の高さを挙げています。ニューラルスケーリング則の観点では、多数のクラスを持つ大規模データセットで学習されたモデルは、学習対象外の領域でも高いパフォーマンスを維持しやすいとされています。



また、鳥類の種分類の難度がモデルの精度を高める決定的な要因となっているとも説明されています。鳥類の鳴き声は種ごとの差異が小さい一方で、1万4500種を超える膨大なクラスを正確に判別する必要があるため、訓練の過程でモデルは音響の細かな特徴を捉える能力を強く学習します。こうして磨かれた特徴抽出能力が、水中でのクジラの鳴き声やシャチのエコタイプの識別にも転用できるというわけです。





実際に、NOAAのアーカイブデータを利用したクジラの分類用チュートリアルも公開されており、アジャイルモデリングを通じて海洋生態系の監視や保護活動が大幅に効率化されることが期待されています。Googleは、この技術が絶えず変化し続けるクジラの歌や新しい音の発見に迅速に対応するための不可欠なツールとなりつつあると述べました。

