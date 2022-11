最先端囲碁AI「 KataGo 」は記事作成時点で世界最強の囲碁AIとして知られており、データやソースが公開されていることから、誰でも自由にこのAIを学習させることができます。このAIを特殊な手法で学習させたアメリカ・コーネル大学のTony Tong Wang氏らが、最強クラスに学習させたKataGo相手に高い確率で勝利することができると発表しました。 [2211.00241] Adversarial Policies Beat Professional-Level Go AIs https://doi.org/10.48550/arXiv.2211.00241 Adversarial Policies in Go - Game Viewer https://goattack.alignmentfund.org/ 用魔法打败魔法!一个叫板顶级人类棋手的围棋AI输给了它的同类_博弈_研究_KataGo https://it.sohu.com/a/602280072_129720 KataGoなどの囲碁AIを始め、オセロ、チェスといった近年の対戦型AIは基本的に「セルフプレイ」で強化学習を行っています。セルフプレイとはつまり「自分自身」が対戦相手となって学習すること。自分の手と相手の手、それぞれで最も効率のいい動かし方を考え出し、相手がどんな手で挑んでこようと、常に最良の選択を行い続けるようにするというのがセルフプレイの学習方法です。これは「お互いが常に最も合理的な選択を行うと、お互いに戦略を譲らない状態となる」という ナッシュ均衡 の考え方に基づいています。 今回、Wang氏らは異なる手法で学習させた2つのKataGoを用意し、お互いに囲碁で戦わせるという実験を行いました。実験において、これまでと同じセルフプレイで学習するKataGoは「被害者」、反対に新たな手法で学習するKataGoは「攻撃者」と名付けられます。

・関連記事

世界最強の囲碁AI・AlphaGoがあらゆるボードゲームを学習できる「AlphaZero」に進化 - GIGAZINE



囲碁AI「AlphaGo」に敗北した世界チャンピオンが「AIを負かすことはできない」と棋士を引退 - GIGAZINE



最強将棋AIが新境地へ、DeepMindのAI「AlphaTensor」が50年以上停滞していた行列乗算アルゴリズムの改良に成功 - GIGAZINE



囲碁棋士が全国大会で禁止されている「競技中のAI使用」により1年間の出場禁止処分に - GIGAZINE

2022年11月07日 07時00分00秒 in ソフトウェア, ゲーム, Posted by log1r_ut

You can read the machine translated English article here.