2017年12月08日 12時41分ソフトウェア

世界最強の囲碁AI・AlphaGoがあらゆるボードゲームを学習できる「AlphaZero」に進化

by Jotam Trejo

Googleと同じAlphabetを母体に持つ人工知能(AI)開発企業・DeepMindが作り出した「AlphaGo」といえば、世界最強の囲碁棋士を打ち負かしたプログラムとして大きな話題となった囲碁AIです。そんなAlphaGoが幾度の進化を経て、囲碁以外のボードゲームをも学習して強くなれるAI「AlphaZero」へ生まれかわりました。

AlphaZero AI beats champion chess program after teaching itself in four hours | Technology | The Guardian
https://www.theguardian.com/technology/2017/dec/07/alphazero-google-deepmind-ai-beats-champion-program-teaching-itself-to-play-four-hours

AlphaZeroは、世界を驚かせた囲碁AI「AlphaGo」をもとに開発された「AlphaGo Zero」の進化版となるAIです。AlphaGo Zeroは、囲碁について教えなくても対戦形式のトレーニングの中で勝手に囲碁の腕前をメキメキ上げていくことができるという囲碁AIで、その実力については以下の記事を読むとその詳細がよくわかります。

世界最強の碁プログラム・AlphaGoの新バージョン「AlphaGo Zero」はもう自力で強くなれるレベルに到達 - GIGAZINE

そんなAlphaGo Zeroのアルゴリズムを活用し、囲碁以外のボードゲームにも応用しようということで誕生したのが「AlphaZero」です。このAlphaZeroが、わずか4時間の学習で世界最強のオープンソースチェスエンジンであるStockfishに勝利してしまいました。

AlphaZeroはAlphaGo Zeroと同じように、人間がゲームの進め方を教えなくても、AIが勝手に打ち方から勝利するための方法まですべて導き出してしまうというボードゲームAIです。そんなAlphaZeroは、チェスの学習をスタートしてわずか4時間で世界最強のチェスプログラムであるStockfishに勝利しました。対局は100局も行われたのですがその内訳はAlphaZeroの28勝・72引き分けで、1度も負けることはなかったそうです。

AlphaZeroは機械学習の一種である強化学習を用いてボードゲームを学ぶのですが、例えば囲碁でいうところの「定石」などの専門知識を教える必要はありません。

以下の埋込みから、AlphaZeroとStockfishの対局のひとつを追うことができます。

AlphaZeroは次の手を1秒間に8万通り想定するそうですが、Stockfishはなんと1秒間に7000万通り想定するとのこと。また、先手(白)の方が勝率が高くなるというデータも出ており、AlphaZeroの28回の勝利のうち先手だったのは25回で、残りの3回のみ後手で勝利することができたそうです。

AlphaGoの生みの親であるデミス・ハサビス氏は、「ランダムプレイから始まり、ゲームのルールを除く専門知識を持っていなくても、AlphaZeroは24時間以内にチェスや将棋といったゲームで超人的な能力を身につけることができます。また、各ボードゲームのワールドチャンピオンプログラムを破ることで、その精度も示しています」と語っています。

チェスの元世界チャンピオンであるギャリー・カスパロフ氏は、「AlphaGoの登場後、我々はこういった成果を期待してはいたものの、それにしてもめざましい成果だ。我々はチェスの学習には膨大な経験値が必要と考えていましたが、人間からの知識を一切必要としないとは……」と語っています。

なお、AlphaZeroはわずか2時間の学習で世界最強の将棋プログラムであるelmoにも勝利しています。

この記事のタイトルとURLをコピーする

・関連コンテンツ

2017年12月08日 12時41分00秒 in ソフトウェア, Posted by logu_ii

You can read the machine translated English article The world's strongest Go AI · AlphaGo e….