「動物の表情を別の動物に当てはめるAI」をNVIDIAが開発、デモ用のウェブサイトも公開中
人間は頭の中で、「飼っているネコのようにあくびをするライオン」や「柴犬のように笑うオオカミ」の顔を想像することができますが、コンピューターにとっては動物の表情を認識し、別の動物に当てはめて画像を生成する作業は困難だそうです。高性能なGPUを開発・販売することで知られるNVIDIAは、このタスクを実現する「GANimal」という新たなAIを開発しました。
[1905.01723] Few-Shot Unsupervised Image-to-Image Translation
https://arxiv.org/abs/1905.01723
AI Uses GANs to Turns Pets into GANimals | NVIDIA Blog
https://blogs.nvidia.com/blog/2019/10/27/ai-gans-pets-ganimals/
最先端のGPUを開発しているNVIDIAは、AIやディープラーニングの分野にも積極的に進出しています。過去には「落書きを風景写真にリアルタイムで変換するソフトウェア」や、「現実世界の映像から3DCGのバーチャル環境を構築するAI」などを開発しています。
落書きをリアルな風景写真にリアルタイムで変換できる驚異的なお絵かき技術「GauGAN」をNVIDIAが発表 - GIGAZINE
AIでリアル映像から3DCGのバーチャル世界を生成する方法をNVIDIAが公開、3D環境構築のコストが大幅カット可能に - GIGAZINE
新たにNVIDIAの研究チームは、「1つの動物の写真から表情を認識し、他のさまざまな動物の顔に当てはめる」というAIを開発しました。このAIには「生成ネットワーク」と「識別ネットワーク」という2つのニューラルネットワークを用いて出力の精度を向上させていく、敵対的生成ネットワーク(GAN)というアルゴリズムが採用されています。
GANでは、生成ネットワークが出力した画像などを、識別ネットワークが「本物かAIによって作られた偽物か否か」を判別します。生成ネットワークは識別ネットワークを欺くために学習を行い、識別ネットワークは生成ネットワークによって出力されたものをより正確に識別するために学習し、それぞれの精度を向上させていく仕組みとなっているとのこと。
このアルゴリズムを使用して作られたNVIDIAの新たなAIは、「GANimal」と名付けられています。GANimalを実行するのは簡単で、たとえば笑ったように見える犬の写真をインプットし、顔の周囲を四角の枠で囲むと……
似たような表情を浮かべる数多くの他の種類の犬などが生成されました。生成された画像を見ると、犬は舌を見せているものの、猫の中には口を閉じてしまっているものもあります。しかし、左下のトラについては、口を開けてインプットした画像と似た表情を浮かべています。
また、種類の異なる動物であってもナマケグマやアメリカグマ、リカオンなどはインプットの画像と近い表情をしていました。研究チームのMing-Yu Liu氏は、「ほとんどのGANベースの画像変換ネットワークは、単一のタスクを解決するように訓練されています」と述べ、複数の画像を単一のAIが生成する点は大きな進歩だと主張しています。
NVIDIAはGANimalのデモを実行可能なウェブサイトを公開しており、誰でも簡単にペットなどの写真を使って、さまざまな動物の画像を生成させることができます。
nvidia-research-mingyuliu.com/ganimal
http://nvidia-research-mingyuliu.com/ganimal/
トップページから「参照」をクリックし……
選択した画像をアップロードします。
「Upload」をクリックすると……
ページ下部に画像が表示されるので、ドラッグをして動物の顔を四角い枠で囲みます。
「Translate」をクリックすると……
インプットした画像の猫と似た表情をしたさまざまな動物の写真が生成されました。
今回のデモで生成された画像の中には、ところどころ顔が崩れている動物もいましたが、研究チームは今後もツールの精度向上を進めていくとのこと。すでに動物以外の対象もテストしており、花や食事の画像についても訓練を進めているそうです。
・関連記事
NVIDIAが深層学習でX線写真の分析をサポートする医療用AIキット「Clara」を開発 - GIGAZINE
落書きをリアルな風景写真にリアルタイムで変換できる驚異的なお絵かき技術「GauGAN」をNVIDIAが発表 - GIGAZINE
AIでリアル映像から3DCGのバーチャル世界を生成する方法をNVIDIAが公開、3D環境構築のコストが大幅カット可能に - GIGAZINE
リアル写真と判別不能なレベルの偽画像をAIが生成可能になるGANs向けアーキテクチャをNVIDIAが作成 - GIGAZINE
AIが人間の行動を観察するだけで同じ行動を模倣する技術をNVIDIAが公開 - GIGAZINE
「ディープラーニングを用いて通話時のノイズを抑える」という試みにNVIDIAが挑戦している - GIGAZINE
・関連コンテンツ