「ディープラーニングとは何か?」を初心者でも分かりやすく実例を含めて解説するムービー「Introduction to Deep Learning: What Is Deep Learning?」


画像認識、言語翻訳、人工知能などの分野で活用されている「ディープラーニング」について簡単に解説するムービー「Introduction to Deep Learning: What Is Deep Learning?」をMATLABがYouTubeで公開しています。ムービーではディープラーニングのはじまりや具体的な実用例が挙げられており、まったくの初心者でもなんとなくディープラーニング技術についてイメージできるような内容になっています。

Introduction to Deep Learning: What Is Deep Learning? - YouTube


「近年、大きな注目を集めているディープラーニングとは何でしょうか?」と話す、MathWorksのシャマル・パテル氏。ディープラーニングが注目されるのには、それなりの理由があるとのこと。


パテル氏は、「ディープラーニングとは何か?」「実際にどのように利用されているのか」「どうやってディープラーニングについて学び始めればいいか」の3点をムービーで解説してくれるそうです。


ディープラーニングとは機械学習の一つで、特徴やタスクをデータから直接学習できるという特徴があります。データは主に画像、テキスト、音から構成されます。


ディープラーニングではよく「End to End(エンドツーエンド)」の学習が可能だと言われます。その意味を、画像認識を例に挙げて説明してみます。


ある画像を自動車、トラック、ボートなどのカテゴリに分類する場合を考えます。まずは、ラベル付き画像のイメージやトレーニング済みのデータを用意するところから始めます。


ラベルはタスクで求められる出力に一致するもので、物の特徴を教えるのに必要となります。ディープラーニングのアルゴリズムは、画像のイメージから特徴を読み取って、どのカテゴリに分類すれば良いかを学びます。このように、画像などのデータから直接学習できる特長からディープラーニングを「エンドツーエンドの学習」と呼んでいるわけです。


ディープラーニングの他の例はロボットです。


ロボットはアームを使って物の動きを直接学ぶことで、物をどのように取り扱えば良いのかを学ぶことができます。画像の分類やロボットアームのどちらの例も、ディープラーニングを使って画像認識を行っています。


ディープラーニングは、元々は郵便局での仕分け作業に活用されていました。1990年代に手紙に手書きされた郵便番号を読み取って、仕分ける作業に利用されたのがディープラーニングの始まりです。


しかし、ディープラーニング技術が一気に重要性を増したのはここ5年のこと。それには3つの要素が挙げられます。


1つ目は、ディープラーニングメソッドが画像分類において、人間よりもエラー率で下回るレベルに到達したこと。


2つめは、グラフィックボードの性能向上で演算能力が飛躍的に向上しディープネットワークの処理を現実的な時間で行えるようになったこと。3つめは、ディープラーニングに必要な大量のラベル付きデータにアクセスできるようになったことです。


ほとんどのディープラーニングメソッドでは「ディープニューラルネットワーク」構造を用います。これが、ディープラーニングとディープニューラルネットワークを同義語のように取り扱うゆえんです。


最も一般的なディープニューラルネットワークは「Convolutional Neural Network(畳み込みニューラルネットワーク)」として知られるネットワークで「CNN」と呼ばれます。CNNは特に画像データの取り扱いに適していることで知られます。


「ディープ」という用語は、たいていの場合、ニューラルネットワークにおける「hidden network(隠れ層)」の数が多いことを意味します。古典的なニューラルネットワークでは2~3つの隠れ層があるだけでしたが、近年のディープラーラーニングでは150層もの隠れ層を使うとのこと。


「ここまででディープラーニングのキーとなるコンセプトは理解したはず。ということで、ディープラーニング技術が実際にどのように使われているのかを説明します」


これは、MATLABで使っている画像認識技術。机の上の電話機をカメラで映すと、それが何であるのかを確率付きで表示します。


ノートPCを映すと、「laptop」「notebook」と認識。ディープラーニングによって、被写体の特徴を読み取りデータに照らし合わせることで「それが何なのか?」をコンピューターが判断しています。


これは走行する自動車の車載カメラの映像から、前方の物体が「一時停止」を示す標識であることを認識している例です。


ムービー冒頭で話した「ディープラーニングとは何か?」「実際にどのように利用されているのか」について説明しましたが、3つめの「どうやってディープラーニングについて学び始めればいいか」については、「mathworks.com/deep-learning」を参照して欲しいと、ムービーは締めくくられていました。

・関連記事
初心者向け「機械学習とディープラーニングの違い」をシンプルに解説 - GIGAZINE

Googleの開発者が作った3時間でディープラーニング(深層学習)をスライドとムービーで学べる集中レッスン - GIGAZINE

AIを現実のものとする「ディープラーニング」の歴史はどこから始まったのか? - GIGAZINE

ディープラーニングを用いて「写真の見た目の特徴」を別の写真に転送してしまう「Deep Photo Style Transfer」 - GIGAZINE

画像を塗りつぶした部分に一瞬で自然な画像を補完する技術を早稲田大学の研究者が開発 - GIGAZINE

ディープラーニングで白黒アニメをカラー化するとこうなる - GIGAZINE

糖尿病による目の病気をGoogleのディープラーニング技術は専門医よりも正確に見抜く - GIGAZINE

NVIDIAはディープラーニング技術を武器に「医療」という巨大市場に切り込んでいる - GIGAZINE

Googleがディープラーニングを使ってプロレベルの写真を自動生成できる「バーチャルフォトグラファー」を開発 - GIGAZINE

Appleが初めて明かすディープラーニングによる人工知能開発秘話 - GIGAZINE

AI(人工知能)に対するありがちな「誤解」とそれに対する回答まとめ - GIGAZINE

228

in ソフトウェア,  動画, Posted by logv_to