ソフトウェア

最先端のAI画像認識モデルでも正しく認識できない画像まとめ


人工知能(AI)を用いた画像認識技術は自動運転車や防犯システムなどさまざまな分野で活躍していますが、最先端のパフォーマンスを実現するディープラーニングを用いた画像認識モデル「InceptionNet」であっても、画像を正しく認識できないケースが多々あります。スタンフォード大学で機械学習やAIについて研究するアブバカル・アビド氏は、「最先端の画像認識モデル(InceptionNet)でも正しく認識できなかった画像」をまとめており、まだまだAIが人間並みの認識能力を有することは難しいと実感できます。

What Inception Net Doesn't See – Abubakar Abid – Zou Group @Stanford
https://abidlabs.github.io/Inception-Blindspots/

◆1:逆さまの車
自動車が逆さまに写っている場合、画像認識モデルは画像を「アナログ時計(analog clock)」や……


「レッカー車(tow truck)」に誤認してしまいます。


◆2:スライスしたリンゴ
InceptionNetはカットした果物でも正しく認識することができますが、リンゴの場合は「キュウリ(cucumber)」や……


「バナナ(banana)」と誤認されています。


◆3:パキスタンの新郎衣装
パキスタンの新郎が切る衣装は、「毛皮のコート(fur coat)」や……


「ガスマスク(gasmask)」と誤認。


◆4:長い風船
InceptionNetは丸以外の風船は風船と認めないようで、バルーンアートに使われそうな長細い風船は「ハンマー(hammer)」と誤認されています。


さらに、バルーンアートの犬は「マラカス(maraca)」と誤認されました。


◆5:マスク
InceptionNetをトレーニングする用の画像データセットは新型コロナウイルスのパンデミック前に収集されたものであったため、マスクを正しく認識することもできなかった模様。立体的なマスクは「バケツ(bucket)」に……


未使用マスクは「手さげ袋(purse)」に誤認されました。耳にかけるひもを手さげ袋の持ち手部分と誤認したのでしょうか……?


◆6:イラストのライオン
また、InceptionNetはイラスト画像の認識も不得意のようです。特にイラストのライオンを正しく認識することが苦手なようで、以下のイラストは「猟犬(bloodhound)」や……


「封筒(envelope)」と判断されてしまった模様。


◆7:ルンバ
他にも、InceptionNetは掃除ロボットのルンバを「CDプレイヤー(CD player)」と認識してしまう模様。確かにルンバ誕生前にこの形状のものを見せられたなら、CDプレイヤーと誤解してしまうかも。


◆8:空飛ぶガチョウ
群れを成して空を飛ぶガチョウの姿は、「軍用機(warplane)」と誤認識。


アビド氏は「InceptionNetは非常に正確なものと考えられており、複数の企業が一般向けに使用できるものとしてInceptionNetを用いたAPIをリリースしています。しかし、InceptionNetにも問題点が存在するということを多くの人は理解していません」と指摘。

実際にアビド氏が行った実験だけでも、「異常な位置にあるオブジェクト(◆1)」「非西洋圏のアイテム(◆3)」「非標準の芸術的な画像(◆6)」などは、誤認識されやすいことが判明しました。画像認識モデルにはこのような問題点が複数存在することを徹底的に調査・文書化し、ユーザーが理解できるように周知する必要があるとアビド氏は主張しています。

この記事のタイトルとURLをコピーする

・関連記事
画像認識モデルの「盲点」を克服するための奇妙な画像ばかり集めたデータセット「ObjectNet」をMITとIBMの研究チームが公開 - GIGAZINE

「動画に隠されたマウンテンデューの数を当てたら賞金100万ドル」というコンテストのために画像認識のスペシャリストが立ちあがる - GIGAZINE

画像認識システムの落とし穴となる「ExifのOrientation属性」とは? - GIGAZINE

「監視カメラの画像認識をだます服」をハッカー兼ファッションデザイナーが発表 - GIGAZINE

ニューラルネットワークを用いた画像認識は簡単にだますことができることを示すムービー - GIGAZINE

in ソフトウェア, Posted by logu_ii

You can read the machine translated English article here.