10億枚以上のInstagramに投稿された写真を用いて学習した画像認識モデル「SEER」をFacebookが発表
Facebookが、Instagramに投稿された10億枚以上の画像を用いて学習した画像認識モデル「SEER」を、2021年3月2日に発表しました。また、SEERの開発に用いられた「自己教師あり学習」を可能にするライブラリ「VISSL」も同時に公開されています。
[2103.01988] Self-supervised Pretraining of Visual Features in the Wild
https://arxiv.org/abs/2103.01988
VISSL · A library for state-of-the-art self-supervised learning
https://vissl.ai/
SEER: The start of a more powerful, flexible, and accessible era for computer vision
https://ai.facebook.com/blog/seer-the-start-of-a-more-powerful-flexible-and-accessible-era-for-computer-vision
既存のAIを用いた画像認識モデルの多くは、「教師あり学習」と呼ばれる手法を採用しており、手動でラベル付けされたデータセットを用いた学習を必要とします。しかし、今回Facebookが発表したSEERは、手動でラベル付けされたデータセットを必要としない「自己教師あり学習」を採用しており、Instagramに投稿された10億枚以上の画像を用いることで、高い画像認識精度を獲得することに成功したとのこと。
「ImageNet」を用いた画像認識能力測定試験の「分類制度スコア」をSEERや「SwAV」、Googleが2020年に発表した「SimCLRv2」、「Vision Transformer(ViT)」といった既存の画像認識モデルと比較した結果はこんな感じ。グラフの横軸がパラメーター数、縦軸が画像の認識精度(数値高いほど認識精度が高い)を表しており、SEERの画像認識精度が既存の画像認識モデルを上回っていることが確認できます。
Facebookは、「SEERは自己教師あり学習が実際のタスクで有用なことを示しました。SEERは柔軟で、正確かつ適応性のあるコンピュータービジョンモデルを構築する道筋となります」と語っています。
また、Facebookは、SEERの開発に使用したライブラリ「VISSL」のソースコードを公開。「VISSLをAI研究コミュニティと共有することで、開かれた意見交換が実施され、自己教師あり学習に関する研究が加速することを願っています」と述べ、AIによる画像認識モデルの研究に対する展望を語っています。
なお、SEERの開発にInstagramに投稿された画像が10億枚以上使用されていることから、アメリカのニュースメディアCNBCは「Instagramのユーザーは自身の画像がAI研究に用いられていると知って驚くでしょう」と指摘。この不安に対して、FacebookのAI研究所でソフトウェアエンジニアを務めるPriya Goyal氏は、「私たちは研究の詳細を公開し、他の研究者が自己教師あり学習を用いたトレーニングを可能にするオープンソースライブラリを作成していますが、Instagramに投稿された画像は共有していません」と語り、Instagramユーザーのプライバシーは保護されていると主張しています。
・関連記事
画像認識モデルの「盲点」を克服するための奇妙な画像ばかり集めたデータセット「ObjectNet」をMITとIBMの研究チームが公開 - GIGAZINE
「動画に隠されたマウンテンデューの数を当てたら賞金100万ドル」というコンテストのために画像認識のスペシャリストが立ちあがる - GIGAZINE
ディープラーニングの手法「CNN」の画像識別処理がアニメーションで理解できる「CNN Explainer」 - GIGAZINE
コンピューターは「人間の目線」をどのように認識するのか? - GIGAZINE
巨大写真データセット「ImageNet」で攻撃的・差別的なカテゴリー分類タグ付けが判明し人物写真の半数以上を削除 - GIGAZINE
「差別をAIに植え付ける」としてMIT研究者らが大規模なデータセットをネットから完全削除 - GIGAZINE
・関連コンテンツ