ソフトウェア

IBMが100万人の顔データを収めた膨大なデータセットを「顔認識技術の公平性」を目指してリリース


IBM基礎研究所は2019年1月29日、「Diversity in Faces(DiF、顔の多様性)」と呼ばれるデータセットをリリースしました。このデータセットは顔認識技術の公平性と正確性の向上を目指して作られたもので、さまざまな性別や人種の人間の顔画像とその注釈がおよそ100万人分含まれているとのことです。

Diversity in Faces
(PDFファイル)https://www.research.ibm.com/artificial-intelligence/trusted-ai/diversity-in-faces/documents/Diversity-in-Faces-Publication.pdf


IBM Research Releases 'Diversity in Faces' Dataset to Advance Study of Fairness in Facial Recognition Systems - IBM Blog Research
https://www.ibm.com/blogs/research/2019/01/diversity-in-faces/


カメラとアルゴリズムを用いて顔を認識し個人を特定する「顔認識技術」の開発・実用はいよいよ広がりをみせていて、スマートフォンのロック解除にFace IDなどの顔認識システムが用いられたり、警察の捜査や警備に顔認識システムが導入されて実際に成果を上げたりといったケースが増えつつあります。しかし、顔認識システムの精度はまだ完璧からはほど遠いようで、イギリスの警察では顔認識システムが導入されたものの、誤判定率90%超という結果を残しています。

2000人以上のサッカーファンが監視カメラを使った顔認識システムによって犯罪の容疑者と誤判定されていたことが判明 - GIGAZINE


この誤認識率の高さには「顔認識システムの偏り」が影響しているという指摘があり、実際にアフリカ系アメリカ人は白人よりも5~10%精度が下がるという調査結果も存在しています。IBM基礎研究所の研究チームは「実際に顔認識システムのパフォーマンスを制限する重要な側面は『内在的な顔の多様性』であり、顔認識システムのパフォーマンスは個人や集団によって異なるべきではありません」と述べています。

そんなIBM基礎研究所がリリースしたDiFデータセットにはさまざまな人種や性別の人間の顔画像がおよそ100万人分含まれているとのこと。

さらに、それぞれの画像には頭の形や顔の対称性、鼻の長さ、額の高さなどといった顔の「客観的尺度」や、年齢や性別などの注釈データがラベル付けされているそうです。研究チームによると、注釈データでは47以上の部位のサイズや特徴がまとめられていて、これが顔認識システムの公平性と正確性を向上させ、アルゴリズム性能をより強力なものにするとのこと。


研究チームは「IBM基礎研究所はより公正な顔認識システムの研究を継続することを約束していますが、それだけで顔認識システムが進歩するとは考えていません。DiFのリリースによって、他の顔認識システム研究にも貢献し、この重要な科学的アジェンダを前進させます」と述べていて、このDiFが顔認識システム研究の新たな第一歩となるように期待しています。

DiFデータセットは世界中の顔認識システムを研究するコミュニティに提供され、アクセスするためには以下からIBM基礎研究所のアンケートに答えてメールで申請する必要があります。

Diversity in Faces Dataset - Trusted AI - IBM Research AI
https://www.research.ibm.com/artificial-intelligence/trusted-ai/diversity-in-faces/

この記事のタイトルとURLをコピーする

・関連記事
MicrosoftやGoogleの研究者が「顔認識技術」に規制を求めている - GIGAZINE

Amazonが顔認識ソフトを警察に販売していることが判明、国民の監視に乱用される可能性アリとして警鐘が鳴らされる - GIGAZINE

謎の企業がFacebookやYouTubeなどから収集した膨大な画像から顔認識データベースを構築していることが明らかに - GIGAZINE

顔認識機能を使って逃亡者を6万人参加のコンサート会場から中国警察が見つける - GIGAZINE

FBIが犯罪捜査に使う顔認識技術は「正確性に欠ける」のに規制がない - GIGAZINE

ディープラーニングを使い強力な画像分析を可能にしたサービス「Amazon Rekognition」が登場 - GIGAZINE

ヒトの眼球を生体認識に使う「虹彩スキャン」のデータ43万人分がFBIによって収集されていることが判明 - GIGAZINE

in ソフトウェア, Posted by log1i_yk

You can read the machine translated English article here.