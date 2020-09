2020年09月18日 11時05分 ソフトウェア

AIが「グランツーリスモSPORT」で人間を超えたタイムをたたき出す



囲碁で人類最強の棋士を破ったAlphaGoや、リアルタイムストラテジー「スタークラフト2」でプロゲーマーに圧勝したAlphaStarに続き、PlayStation 4のゲームソフト「グランツーリスモSPORT」でも、深層学習モデルが人間を追い抜いたとの研究結果が発表されました。



[2008.07971] Super-Human Performance in Gran Turismo Sport Using Deep Reinforcement Learning

https://arxiv.org/abs/2008.07971



A deep learning model achieves super-human performance at Gran Turismo Sport

https://techxplore.com/news/2020-09-deep-super-human-gran-turismo-sport.html



Deep Learning Model Outperforms NPC, Player Records in Gran Turismo | Science Times

https://www.sciencetimes.com/articles/27310/20200915/deep-learning-model-outperforms-npc-player-records-gran-turismo.htm



2020年8月18日に、スイスのチューリッヒ工科大学(ETHZ)とSony AI Zürichの研究チームが、ソニー・インタラクティブエンタテインメントから発売されたドライビングシミュレーター「グランツーリスモSPORT」をプレイできるようトレーニングした深層学習モデルについての論文を発表しました。





査読前論文の公開サイトarXivに掲載された論文によると、ETHZらによって開発された深層学習モデルは、グランツーリスモSPORT内のCPUに勝っただけでなく、5万人を超える人間のプレーヤーのベスト記録を全て打ち破る最速タイムをたたき出したとのことです。



人間を超えた走りを見せたという深層学習モデルが一体どんなものなのかは、以下のムービーを見るとよく分かります。



Super-Human Performance in Gran Turismo Sport Using Deep Reinforcement Learning - YouTube





「グランツーリスモSPORT」で人間を上回る記録を出した深層学習モデルは、事前の情報がなくても単独でレースカーを運転可能な人工ニューラルネットワーク(ANN)ベースの制御システムを開発することを目的とした研究により生み出されました。





深層学習モデル開発のため、研究チームはシミュレーションを重ねて観察データをマップ化し、ステアリングの角度や、スロットルとブレーキ調節といったコマンドを学習させました。





また、深層学習モデルは「グランツーリスモSPORT」の国際大会で最も優れた成績を収めたという匿名のプレーヤー・TG氏のプレーも参考に、最小限のハンドリングでカーブを曲がって速度を維持する戦略などを学習しました。





こうしてトレーニングした深層学習モデルの記録を、「グランツーリスモSPORT」の開発会社であるポリフォニー・デジタルが提供した5万人分の記録と照合した結果、深層学習モデルのタイムはデータセットに含まれる全てのタイムを超えていたとのことです。





深層学習モデルの人間離れした走りを目にしたTG氏は、「深層学習モデルは非常に攻めた走りをしますが、これは正確なアクションができるからこその芸当だと思います。技術的には私も同じ軌道を走ることができますが、1000回中999回は壁に車体をこすってしまい、タイムを台無しにしてしまうことでしょう」と述べて、深層学習モデルの精緻なテクニックを称賛したとのことです。





ETHZのYunlong Song氏は、「私たちは目下、いろいろな車種であらゆるコースを走ることが可能な、より一般的なAIエージェントの開発を計画中です。また、高速で走行中に他車にぶつかることなく追い抜くという『自律走行車の追い越し問題』の解決にも取り組んでいきます」と話しました。