NVIDIA RTX 2080 Tiのディープラーニング性能をGTX 1080 Ti・Titan V・Tesla V100と比較
ディープラーニングにはCPUよりも並列演算の得意な「GPU」がよく用いられます。ディープラーニング処理のためにゲーム向けのグラフィックボードが利用されることもよくあるということで、ディープラーニング用サーバー機器を販売するLambdaが、最新のグラフィックボード「GeForce RTX 2080 Ti」&「RTX 2080」のディープラーニング性能を測るべく、GTX 1080 Ti・Titan V・Tesla V100など既存のGPU製品と比較テストを行い、コストパフォーマンスなどの結果を公開しています。
2080 Ti TensorFlow GPU benchmarks - 2080 Ti vs V100 vs 1080 Ti vs Titan V
https://lambdalabs.com/blog/best-gpu-tensorflow-2080-ti-vs-v100-vs-titan-v-vs-1080-ti-benchmark/
2018年9月にNVIDIAは、Turing GPUアーキテクチャを導入した新型GPUとして、従来の「GTX」シリーズに代わる「RTX」シリーズを発表し、「RTX 2080」と同時にフラッグシップモデル「RTX 2080 Ti」をリリースしました。
リアルタイムレイトレーシングに対応するなどゲーミング性能として大幅な進化を遂げたRTX 2080 Ti&RTX 2080について、ディープラーニング性能がどれくらい向上しているのかを調べるために、Lambdaは「RTX 2080 Ti」「RTX 2080」「GTX 1080 Ti」「Titan V(Volta)」「Tesla V100」を使って、Googleの機械学習ライブラリ「TensorFlow」の処理性能を比較しました。
テストはすべてGPUが1つの「シングルGPUシステム」が用いられており、グラフィックボード利用時の環境は、マザーボードがASUS Prime B360-Plus、CPUがIntel Core i7-8700K、CPUクーラーがNoctua L-Type Premium、32GBのDDR4メモリ、ケースがNZXT H500、電源がEVGA SuperNOVA 750 G2(750W)という条件で、Tesla V100のみIntel Xeon E5-1650 v4を搭載したマシン「Lambda Quad Basic」が使われています。
なお、テストに使ったベンチマークコードは、以下のGitHubページで公開されています。
GitHub - lambdal/lambda-tensorflow-benchmark
https://github.com/lambdal/lambda-tensorflow-benchmark
FP32のスループット(1秒間に処理されたトレーニングサンプル数)の結果は以下の通り。赤色の線がGTX 1080 Tiのベースラインです。
平均速度をGTX 1080 Tiと比較すると、RTX 2080はほぼ同等ですが、RTX 2080 TiはTitan Vに肉薄しています。
FP16での平均速度はこんな感じ。RTX 2080 TiはTitan Vを上回ります。
RTX 2080 Tiの北米価格は999ドル(約11万円)、RTX 2080が699ドル(約7万9000円)なのに対して、Tesla V100は9800ドル(約110万円)ということで、単なる処理速度で性能を比較するのはユーザー目線では有益ではありません。ということで、Lambdaは性能を価格で割ったコストパフォーマンスについてもグラフにしています。
1ドルあたりのFP32性能は、RTX 2080 Tiがトップで、RTX 2080とGTX 1080Tiがこれに続きます。
FP16性能でも順位は変わらず。
以上のような結果について、Lambdaは「Tesla V100はブガッティ・ヴェイロンのようなもの。圧倒的な性能と引き換えにプレミアムな車両価格だけでなくメンテナンス費用や保険料を払える人は少ないだろう」と述べています。これに対してRTX 2080 Tiをたとえるならポルシェ・911であり、高性能を(比較的)安い価格で手に入れられると表現しています。
・関連記事
NVIDIAの技術カンファレンス「GTC2018」が開幕、8万基超のCUDAコアで構成される小型スパコン「DGX-2」や自動運転車の仮想シミュレーション技術などを発表 - GIGAZINE
「ディープラーニング」や「ニューラルネットワーク」をできるだけ簡単かつわかりやすく解説するムービー - GIGAZINE
NVIDIAのハイエンドGPU「Titan V」は計算結果がその度に異なる気分屋すぎて技術者が悲鳴 - GIGAZINE
IBMとNVIDIAが世界最速のスーパーコンピューター「Summit」を構築、中国から世界一の座を奪還へ - GIGAZINE
Googleが機械学習専用の第3世代プロセッサ「TPU3.0」を発表、冷却が追いつかず液冷システムまで導入する事態に - GIGAZINE
NVIDIAがPascal世代の新GPU「TESLA P100」&ディープラーニング用スパコン「DGX-1」を発表 - GIGAZINE
AIを現実のものとする「ディープラーニング」の歴史はどこから始まったのか? - GIGAZINE
マリオカート64の全自動走行をGoogleの機械学習ライブラリ「TensorFlow」でやってみたムービー - GIGAZINE
・関連コンテンツ