ラーメン二郎の画像を機械学習により9割以上の精度で見分けるシステムがGoogleのCloud AutoML Visionを用いて開発される
Google Cloudが2018年1月に発表した「Cloud AutoML Vision」は、機械学習についての知識がほとんどない人でも簡単に画像認識を使った機械学習を利用できるサービスですが、さっそくこのCloud AutoML Visionを利用して、日本のエンジニアがラーメン二郎のラーメンを高い精度で識別することに成功しました。
Noodle on this: Machine learning that can identify ramen by shop
https://www.blog.google/topics/machine-learning/noodle-machine-learning-can-identify-ramen-shop/
AutoML Vision in action: from ramen to branded goods | Google Cloud Big Data and Machine Learning Blog | Google Cloud
https://cloud.google.com/blog/big-data/2018/03/automl-vision-in-action-from-ramen-to-branded-goods
Google Cloud AIチームが発表したCloud AutoML Visionは、専門的な知識がない人でもラベルとラベリングした画像と一緒に読み込ませることで、画像認識用のカスタム機械学習モデルが簡単に作れるサービスです。
一方、ラーメン二郎は東京・三田に本店を構え、首都圏を中心に40店舗以上の支店が存在する人気のラーメン店です。山盛りの野菜・分厚いチャーシュー・刻んだにんにく・たっぷりの背脂を載せたラーメンは「ジロリアン」とも呼ばれる熱狂的なファンを生み出しています。41店舗で作られるラーメンは、味や盛り付けに多少の違いはあっても、おおまかなスタイルは同じであるため、相当コアなファンでもない限り、まず見分けをつけることができません。
土井賢治さんは、2018年1月にGoogleがCloud AutoML Visionのアルファ版を公開したことを知りました。土井さんは「Apache MXNet」というディープラーニング用のフレームワークを利用して、ラーメン二郎のラーメン識別用ニューラルネットワークを構築し、87%という精度でラーメン画像を見分けることに成功していたとのこと。
土井さんは、店のラベルと約4万8000枚のラーメンの画像をCloud AutoML Visionに読み込ませ、「ラーメン画像から店舗を見分けられるか」をテストしてみた結果、94.5%の精度でラーメンを見分けることに成功しました。以下の画像はCloud AutoML Visionが出力した、ラーメン識別器の予測精度を表す混合行列です。各店舗のラーメン画像が50枚ずつ読み込まれていて、縦が正解の店名、横が予測された店名、縦と横の店名が一致した青い部分の数字は予測的中した件数です。
テーブルやどんぶりの色・形が同じ場合でも、Cloud AutoML Visionを用いた識別器は高い精度で店舗を見分けられていたとのこと。ここまで高精度で識別できていた理由については、土井さんは店舗ごとの盛り付け方や肉の切り方の違いを見極めているのではないかと考えています。
また、中古品売買アプリ「メルカリ」のエンジニアが約5万枚の画像を用いて、Cloud AutoML Visionによるブランド品の識別を試したところ、91.3%の精度をたたき出したとのこと。メルカリが独自に開発した機械学習モデルでは75%の精度であったということを考えると、Cloud AutoML Visionによる識別はかなり高い精度だとわかります。
Cloud AutoML Visionは、NASNetと呼ばれる新しいアーキテクチャを利用しており、機械学習によって機械学習の最適化を行うというモデルになっているとのこと。機械学習によって得られた結果に応じて機械学習のシステムそのものを更新していくというシステムによって、高精度の機械学習モデルを誰でも簡単に使えるようになったCloud AutoML Visionは、Googleの掲げる「AIの民主化」を象徴する技術だとのことです。
なお、土井さんが独自に開発した「ラーメン二郎全店分類器」は@jirou_deepとしてTwitter bot化されていて、実際にラーメン二郎の画像を添えてリプライすると、予測した店舗を教えてくれるとのことです。
・関連記事
Googleが「Cloud AutoML Vision」を発表、独自のデータセットを使ったカスタム機械学習モデルが簡単に構築できるように - GIGAZINE
ブラウザで機械学習が実行できるようになる「TensorFlow.js」が登場 - GIGAZINE
AlphaGoを開発したGoogleの人工知能研究部門が「機械学習によって書き順を考えながら文字を描くAI」を開発 - GIGAZINE
データ分析や機械学習にバリバリ使える上にブラウザで使用できて環境構築不要のPython実行環境「Google Colaboratory」 - GIGAZINE
機械学習を使って全く新しい音作りを可能にする新概念シンセサイザー「Google NSynth Super」 - GIGAZINE
ブラウザがあれば誰でも機械学習を体験できるGoogleのサイト「Teachable Machine」がオープン - GIGAZINE
・関連コンテンツ