Chips and Cheeseは「レイテンシが原因であることは間違いありませんが、それだけではありません。AMDの古いHD 7950のシングルCUは、VRAMのレイテンシが同じでも、VRAMから数倍の帯域幅を引き出すことができるからです。キャッシュの帯域幅もあまり良くないので、Arc A770 Xe Coreは他のGPUに比べてメモリレベルの並列処理能力が限られていることが示唆されます」と述べました。 ベンチマークテストを行った上で、Chips and Cheeseは「Intelは自社のグラフィックス・アーキテクチャをより高性能な分野に移行させるために多くの取り組みを行ってきました。AMDやNVIDIAのローエンドカード以上の性能を持つ、信頼できる単体GPUを作ることを目指した結果、現在のArcシリーズが誕生したのです」と指摘。 「A770はおそらくIntelが意図したものよりも少し低い値を叩き出す結果になりました。A770が本当に輝くためには、多くの作業をする必要があるのではないでしょうか。高解像度フレームの全ピクセルにわたって実行されるオペレーションを処理する場合、Intelはおそらくうまくいくでしょうが、ピクセルやその他の高占有率の作業がフレームをレンダリングする作業のごく一部であるときには、おそらくうまくいかないでしょう」と述べました。

IntelとNvidiaは、過去10年間に登場したほとんどのGPUのように、伝統的な2レベルのキャッシュ階層を採用しているとのこと。ここでIntelが独自に採った戦略は、競合他社よりも大きなキャッシュを採用することでした。L1キャッシュでは、Arc A770は多少のレイテンシと引き換えに少なくとも192KBのサイズを提供している反面、NVIDIA Ampere SMは、ローカルメモリとL1 Dキャッシュの両方に128KBのブロックを使っており、96KBをL1 Dとして割り当てているようだとChips and Cheeseは指摘。「L1 Dのレイテンシは低い方が良いに決まっていますが、高稼働のGPUであれば、そのようなレイテンシを隠すのに苦労することはないはずです。L1のヒット率が高ければ、L2以降で処理しなければならないリクエストが減るため、平均アクセスレイテンシも改善されるはずです」と述べました。 帯域幅はこんな感じ。Arc A770 Xe Core(青線)は他に比べて顕著に小さく、Chips and Cheeseは「メモリ階層全体で多くの帯域幅を引き出すことができず、特にVRAMの帯域幅が悪いです」と指摘します。

しかし、これは大失敗で、Intelは高性能なGPUはホスト接続に大きく依存できないことを学んだとChips and Cheeseは指摘。続く2度目の挑戦としてIntelは「Larrabee」を開発しましたが、処理を行うハードウェアの多くを欠いたものであり、IntelはLarrabeeを発売せず、GPU市場への参入には高い壁があると悟ったとChips and Cheeseは解説します。 こうした貴重な教訓を踏まえて、Intelは命令セットアーキテクチャの1つ「Xe-HPG」を使い、高性能GPUの開発に再挑戦しようとしているとのこと。 Arc A770は、512個のEU(コア)を搭載し、合計4096個のFP32レーンを備えています。これは、Intelの統合GPUの数倍の規模であり、ミッドレンジのGPU市場に挑むIntelの明確な意思を表しているそう。 次に、Chips and CheeseはArc A770でさまざまなマイクロベンチマークを走らせ、その結果を共有しました。 メモリレイテンシをテストした結果が以下。Intel Arc A770が青線、NVIDIA RTX 3060 Tiが緑線、NVIDIA RTX 3070が緑破線、AMD Radeon 6600 XTが赤線、AMD Radeon 6700 XTが赤破線で表されています。テストにおいて、キャッシュサイズ(横軸)が小さいとArc 770のレイテンシ(縦軸)は安定しているものの、キャッシュサイズが大きいとレイテンシが顕著に増大しているのが分かります。

Intelは2022年9月27日にRTX 3060 Ti相当の性能を持つGPU「 Arc A770 」を発表しました。基本的にCPUを作成するIntelのGPU市場への挑戦の歴史や、Arc A770のマイクロベンチマーク結果について、ガジェット系ブログのChips and Cheeseが解説しています。 Microbenchmarking Intel’s Arc A770 – Chips and Cheese https://chipsandcheese.com/2022/10/20/microbenchmarking-intels-arc-a770/ IntelのArc A770は専用GPU市場への挑戦としては3度目です。かつてIntelはグラフィック用チップの「Intel 740(i740)」を作成しており、この時は当時新しかったAGPインターフェイスを利用して、システムメモリにテクスチャを格納することを試みていました。理論的には、VRAMにテクスチャをコピーする必要がないため、少ないオンボードメモリでプログラミングを簡略化することが可能でした。

2022年10月27日

