Googleの機械学習用マシン「Cloud TPU Pod」のパブリックベータ版が提供開始
Googleが機械学習を高速化するために開発したマシン「TPU Pod」を、クラウドベースにしたスーパーコンピューターが「Cloud TPU Pod」です。Googleの開発者向けイベント「Google I/O 2019」で、Googleは「Cloud TPU v2 Pod」と「Cloud TPU v3 Pod」のベータ版を提供開始すると発表し、機械学習の研究者やエンジニアがより高速で機械学習の訓練を可能になるとアピールしています。
Google’s scalable supercomputers for machine learning, Cloud TPU Pods, are now publicly available in beta | Google Cloud Blog
https://cloud.google.com/blog/products/ai-machine-learning/googles-scalable-supercomputers-for-machine-learning-cloud-tpu-pods-are-now-publicly-available-in-beta
機械学習では大量のデータによってモデルを訓練するため、膨大な演算処理が必要となり、訓練には強力なマシンを使っても長い時間がかかります。この問題を解決するため、Googleは機械学習用に独自のカスタムシリコンチップ「TPU」を開発しており、Google Cloud Platform(GPC)ではTPUシステムをクラウド上でレンタルするサービス「Cloud TPU」を提供しています。
そんなTPUチップを1000以上もデータセンターネットワーク内で接続したものがTPU Podです。Cloud TPU v2 PodおよびCloud TPU v3 Podは、それぞれ第2世代TPUと第3世代TPUを用いたクラウドベースのコンピューターとなっています。
第3世代プロセッサ「TPU3.0」を用いたCloud TPU v3 Podは、高いパフォーマンスを実現するために液冷されているとのこと。Cloud TPU v3 Podでは、スタンフォード大学のデータセットであるImageNetを用いた「ResNet-50」の訓練がわずか2分で完了します。カスタムシリコンチップの中には単一の機能しか実行できないものもありますが、TPUは完全にプログラムすることが可能であるため、Cloud TPU Podは幅広い機械学習モデルの訓練に使用可能です。
Cloud TPU Podは「スライス」という小さなセクションでの利用も可能。Googleは、機械学習チームには最初のモデルを個々のCloud TPUで開発し、後に訓練の規模を拡大する際により大きなCloud TPU Podのスライスを使用する方法を推奨しています。
なお、GoogleにCloud TPU Podおよびスライスの使用を申請したい場合は、問い合わせフォームからGoogle Cloudの営業担当者にコンタクトを取る必要があるそうです。
・関連記事
Googleの機械学習マシン「Cloud TPU Pod」の新型はNVIDIA Tesla V100の200倍高速に - GIGAZINE
Googleが機械学習専用の第3世代プロセッサ「TPU3.0」を発表、冷却が追いつかず液冷システムまで導入する事態に - GIGAZINE
Googleの機械学習マシン「TPU」の第2世代登場、1ボード180TFLOPSで64台グリッドでは11.5PFLOPSに到達 - GIGAZINE
Googleが機械学習を爆速化する専用の「TPU」を数年前から極秘裏に作っていたことが明らかに - GIGAZINE
Googleのエッジデバイス向けTPU「Google Edge TPU」がついに発売か、気になる価格は? - GIGAZINE
・関連コンテンツ