ソフトウェア

表情の変化や2つの顔の合成などをAIが違和感なく行うOpenAIの「Glow」


AIに関する非営利の研究機関として設立されたOpenAIは、違和感なく2つの顔写真を合成したり、顔写真に年齢やヒゲ、笑顔などの属性を追加したりすることができる技術「Glow」を発表しました。

Glow: Generative Flow with Invertible 1×1 Convolutions
(PDFファイル)https://d4mucfpksywv.cloudfront.net/research-covers/glow/paper/glow.pdf

Glow: Better Reversible Generative Models
https://blog.openai.com/glow/

OpenAIのディーデリック・キングマ氏とプラフルラ・ダリワル氏によって開発されたGlowは、可逆1×1畳み込み(invertible 1x1 convolutions)を使用した画像生成AIです。Glowは学習した画像から自動でラベル付けを行うのも特徴で、デモ用として用意された3万人分の顔写真を学習させた場合、自動で「笑顔」「年齢」「細目」「金髪」「ヒゲ」などのラベルが設定されます。設定されたラベルは後から自由に操作することができ、新しく入力した画像に変化を加えることが可能になります。

たとえば、左上のINPUTにセットされたジェフリー・ヒントン氏の顔写真の場合、赤枠のように「Smiling(笑顔)」「Age(年齢)」「Blonde Hair(金髪)」「Beard(ヒゲ)」の値を最大にして、「Narrow Eyes(細目)」を最小(目を大きく開ける状態)にセットすると、右上のOUTPUTの顔写真に変更することが可能。ヒゲが黒いことに少し違和感が残りますが、実際にいても不思議ではない男性の顔となっており、AIが独自に判断して作り出した顔には見えません。


また、Glowは2つの画像を合成して、合成度合いを変更することもできます。LEFT INPUTにニール・ドグラース・タイソン氏の顔写真、RIGHT INPUTにラシダ・ジョーンズ氏の顔写真をセットし、赤枠のMIXを中央の位置に設定して2つの画像を均等に合成すると、OUTPUTに実際にいても不思議ではない自然な男性の顔が生成されました。


また、MIXの値を左側に寄せると、LEFT INPUTのドグラース・タイソン氏の特徴が強くなるものの、生成される顔写真はこちらも自然な顔となり……


ジョーンズ氏(右)側に寄せても、違和感はありませんでした。


OpenAIはダリワル氏の写真と9名の有名人の画像を合成したムービーも公開しています。以下の画像をクリックするとムービーが再生されます。


9枚並んだダリワル氏の写真が、徐々に変化し……


ほとんど違和感なく、9人それぞれの有名人の顔写真に変わりました。髪型や顔の特徴があまりにも異なっていたりすると途中の画像がおかしくなるようですが、ムービーとして見ると大きな違和感を感じることはありませんでした。


キングマ氏とダリワル氏も途中の画像のデキが気に入らないのか、「Glowは不自然な変化を付けることがある」と述べており、より自然な変化を付けるために「自己回帰モデルVAEを使用して改善していきたい」としています。

OpenAIはGlowをGitHubで公開しており、誰でも自由に試すことが可能です。Glowを動作させるためには、TensorFlowHorovodが必要で、具体的な操作方法などについてはGlowのドキュメントで説明されています。

・関連記事
OpenAIの人工知能「OpenAI Five」がDota 2の5対5バトルで人間チームに勝利 - GIGAZINE

AIの進化が止まる気配はなく、6年間で約30万倍以上の学習が可能に - GIGAZINE

Googleの自己ゲーム学習AI「DQN」も苦戦した「Montezuma’s Revengeでハイスコアをたたき出すAIの開発」をたったひとつのデモンストレーションから学習することで達成 - GIGAZINE

イーロン・マスクの人工知能研究機関OpenAIがAI学習プラットフォーム「Universe」をリリース - GIGAZINE

レトロゲームの攻略をAIに学習させてスーパープレイを生み出すことが可能な「Gym Retro」 - GIGAZINE

in ソフトウェア, Posted by log1j_ty