ハードウェア

AMDの最高技術責任者が第4世代Ryzen CPUの採用する「Zen 3アーキテクチャ」について語る


AMDのCPU「Ryzen 5000」シリーズは、TSMCの7nmプロセスを採用したZen 3アーキテクチャのデスクトップCPUで、2020年11月5日に登場します。このZen 3アーキテクチャについて、テクノロジー系メディアのAnandTechが、AMDの最高技術責任者(CTO)であるマーク・ペーパーマスター氏にインタビューを行っています。

AMD Zen 3: An AnandTech Interview with CTO Mark Papermaster
https://www.anandtech.com/show/16176/amd-zen-3-an-anandtech-interview-with-cto-mark-papermaster


Q:
Ryzenを初めて発表した際に、代表取締役社長兼CEOのリサ・スー氏にインタビューしたとき、彼女はAMDのポジショニングが新しい高性能x86アーキテクチャを開発するために、AMDがどのように既成概念にとらわれない考え方をするのに役立ったかについて語ってくれました。

Ryzenで復活の狼煙を上げたAMDのリサ・スーCEOにインタビュー - GIGAZINE


AMDがマーケット・パフォーマンスにおけるリーダーシップを主張している今、AMDのエンジニアリングチームはどのようにして現状に根ざし、独創的な考え方を推進し続けているのでしょうか?

ペーパーマスターCTO:
私たちのチームは、業界で最も革新的なエンジニアリングチームの1つであることを非常に誇りに思っています。Zen 3 CPUの発表は、CPU市場のリーダーシップという地位を獲得するための激しい戦いであり、以降も非常に強力なロードマップがあります。Zen 3で採用したアプローチは、パフォーマンスを向上させる特効薬ではないことは見ていただければ理解していただけるでしょう。CPU全体のほぼすべてのユニットに触れることができ、チームはパフォーマンスの向上、効率の向上、メモリの遅延の削減、パフォーマンスの大幅な向上を実現するという優れた仕事を成し遂げました。


2019年半ばにリリースされたばかりのZen 2 CPUと比較して、Zen 3 CPUは1クロックあたりの命令実行数(IPC)が19%向上しました。これは驚異的な成果であり、私が「ハードコア・エンジニアリング」と呼ぶものに焦点を当てたもので、チームは今後も継続していきます。


Q:
この「19%の価値」を強調するために、Zen 2と比較してクロックあたりの性能が19%向上したことだけではなく、「8コア」と「32MBのL3キャッシュ」を含む新しいコアコンプレックス(CCX)がAMDの発表の中で強調されました。CCXはZenマイクロアーキテクチャにおいて、「4コア・8スレッド+8MB L3キャッシュ」を1つのCPUモジュールとして構成するAMD独自の単位です。2020年4月に発表された「Ryzen 3 3300X」では、CCXが「4コア・8スレッド+16MB L3キャッシュ」に、Zen 3アーキテクチャでは「8コア・16スレッド+32MB L3キャッシュ」に変更されています。


この新しいCCX設計は、本来のパフォーマンスの向上にどれくらい役立っていますか? また、新しく統合されたCCXに移行することで、CPU設計に他の大きなメリットがありますか?

ペーパーマスターCTO:
CCXの基本構成の変更は、ゲーミングにおいて膨大なメモリへの遅延の低減を実現するために非常に重要でした。ゲーミング用途は高性能デスクトップPC市場において非常に重要です。そして、その性能は、利用可能なL3キャッシュに非常に依存しています。これは、ローカルなL3キャッシュにヒットしたとしても、明らかにメインメモリの参照をたどれないからです。


このため、CCXを再編成し、16MBのL3キャッシュに直接アクセスできる4つのコアを倍増することで、32MBのL3キャッシュに直接アクセスできるコアを8つに増やすことができました。これは、遅延を低減する最大の手段です。明らかにキャッシュにヒットすると、効果的な遅延が得られます。これはパフォーマンスを直接改善します。

Q:
各コアのL3キャッシュアクセスを16MBから32MBに倍増することは、大きな飛躍です。全体の遅延が最大32MBまで改善されることで、メインメモリにアクセスする必要がなくなります。しかし、サイズを2倍にすることは、L3の遅延範囲に影響していますか? L3キャッシュを2倍にすると、それにアクセスするコアの数が増えた場合でも、明らかにトレードオフが生じます。

ペーパーマスターCTO:
開発チームは論理的にも物理的にも、エンジニアリングの面で素晴らしい仕事をしました。鍵となるのは「再編成をどのように設計するか」、そして「新しい構造をサポートするロジックを変更し、物理的な実装にも同様に焦点を当てるか」ということです。Zen 3コアの再編成には、遅延の削減というメリットを本当にもたらす素晴らしいエンジニアリングがありました。

通常、コア数を増やすと消費電力が増加します。また、テクノロジー・ノードは変更せず、7nmプロセスのままでした。開発チームは単に新しいCCXを管理するだけでなく、インプリメンテーションのあらゆる側面を管理するという驚異的な仕事をし、Zen 3をZen 2と同様の電力エンベロープで維持しました。そのため、同じAM4ソケットと同じパワーエンベロープを維持しながら、非常に大きなパフォーマンスの向上を実現しています。

Q:
プロセスノードといえば、Zen 3アーキテクチャで採用されているのはTSMCの7nmとのことでした。たとえばRyzen 3000XTでは、製造プロセスのマイナーアップデートが採用されたといわれています。Ryzen 5000が製造プロセスを経て得られる追加のメリットはありますか?

ペーパーマスターCTO:
実際には、コアは同じ7nmノードにあり、プロセスデザインキット(PDK)が同じであることを意味します。トランジスタを見てみると、製造工場からの設計ガイドラインが同じなのです。もちろん、どの半導体製造ノードでも、歩留まり向上などのために製造プロセスを調整することができます。四半期ごとに、プロセスのばらつきは時間の経過とともに減少していきます。7nmの「マイナー・バリエーション」と言われるのは、そういうことです。


Q:
Zen 2からZen 3に移行すると、1ワットあたりのパフォーマンスは24%向上となっています。これは明らかに、電力供給レベルで追加の強化が行われたことを意味しています。

ペーパーマスターCTO:
私たちは、電源管理にとてつもなく力を入れました。私たちには、CPU全体のマイクロコントローラーと電源管理のスキームがあります。そのため、Zen 3開発チームが24%の電力改善を達成するために行ったことを非常に誇りに思っています。これは、チップ上にある無数のセンサーに常に耳を傾けながら、周波数と電圧の両方をよりきめ細かく管理できるようにするために、Precision Boost全体をさらに進化させたものです。これにより、マイクロプロセッサ上で実行されているユーザーのワークロードに合わせた電力管理が可能になります。つまり、応答性が高く、なおかつ効率性も高いということです。

Q:
Zen 2で指摘された点の1つが、I/Oダイの待機消費電力が13ワットから20ワットで、比較的高いことでした。Zen 3アーキテクチャでは、Zen 2と同じI/Oダイを使用すると言われています。I/Oと消費電力に関するAMDの目標についてですが、 AMDは7nmでPCI Express 4.0に対応していますが、I/OダイはGlobalFoundriesの12/14nmプロセスをベースにしています。I/Oは、Ryzenにとって今後の改善の鍵となると思いますか?


ペーパーマスターCTO:
これは世代的なもので、将来を見据えるならば、私たちはすべての世代で改善を推進しています。そのため、AMDはPCI Express 5.0とエコシステム全体に移行することになるでしょう。設計中の次世代コアだけでなく、次世代のI/Oおよびメモリ・コントローラーの両方の改善については、次の段階で私たちからの報告があることを期待してください。

Q:
クライアントとエンタープライズの両方のx86アーキテクチャCPU市場は非常に競争が激しくなっていますが、両方の市場でArmのエコシステムからの圧力が高まっていることは否定できません。現在のところ、Arm独自のNeoverse V1設計は、x86に近いレベルのIPCと、前年比30%のパフォーマンス向上を、x86が動作する電力のほんの一部で実現することを約束しています。これまでのAMDの目標は、Zen 3のようにピークパフォーマンスを達成することでしたが、特にロードマップでより高いパフォーマンスを約束しているAMDは、どのようにしてArmとの競争に対抗するつもりなのでしょうか?


ペーパーマスターCTO:
私たちは性能の面ではアクセルを踏まないようにしています。命令セット・アーキテクチャ(ISA)の問題ではありません。どのISAでも、一度高性能を目標にしたら、その性能を達成するためにトランジスタを追加することになります。ISAと他のISAの間にはいくつかの違いがありますが、それは基本的なことではありません。私たちが設計にx86を選んだのは、膨大なソフトウェアのインストールベースと、そこにある膨大なツールチェーンがあったからです。これにより、業界で最も早く採用される道筋ができました。私たちは歴史的に競争環境の中で生きてきましたが、今後もそれが変わるとは思っていません。私たちの見解は「最大の防御は攻撃」ということです。

Q:
Zen 3で素の性能が大きく向上したことで、AMDがCPUベースのAIアクセラレーションにどのようにアプローチしているかについては、あまり話題になっていません。単純にこれだけのコアを持っていて、浮動小数点数の演算性能が強いということなのか、それともアクセラレーションや最適化された命令範囲があるのでしょうか。

ペーパーマスターCTO:
Zen 3で重視したのは素の性能です。Zen 2には多くの分野でリーダーシップを発揮するパフォーマンスがありましたが、Zen 3への移行においては、パフォーマンスで絶対的なリーダーシップを実現することを目標にしていました。


そこで、浮動小数点演算と積和演算の改善により、ベクトルワークロードや推論などのAIワークロードを支援することができるようになります。これにより、幅広いワークロードに対応できるようになります。また、最大ブースト周波数は、「上げ潮はすべての船を持ち上げる」ように周波数を増加しました。ただし、新しい数学フォーマットについては現時点では発表していません。

Q:
ということは、AMDはAIワークロードに関して、Zen 3用のアクセラレーションライブラリをすでに用意しているのでしょうか。

ペーパーマスターCTO:
はい、そうです。私たちはZen 3を中心に最適化する数学カーネル・ライブラリを用意しています。これは、年を追うごとに展開されていく予定です。

Q:
AMDは、ChromebookやAMDの初代Zenアーキテクチャの組み込み技術など、これまでそれほど高い市場シェアを誇っていなかった他の市場にも進出しています。AMDは今後もこれらの市場に特化していくのでしょうか。それとも、IoTやオートモーティブなど、AMDが特に取り組んでこなかった市場に未開拓の可能性があるのでしょうか。

ペーパーマスターCTO:
私たちは、現在の市場と比較して、密接する市場に注目し続けています。私たちは、これまでも組み込み型機器の市場に進出してシェアを伸ばしており、AMDではこれに重点を置いています。私たちがやっていないのは、メディアの注目度は高いかもしれませんが、AMDが持っているような高パフォーマンスとは信じられないほどマッチしていない市場を追い求めることです。私たちは、業界に価値あるハイパフォーマンスを提供したいと考えており、私たちが提供できるものを本当に価値あるものとして評価してくれる市場でのシェア獲得に力を入れていきます。

この記事のタイトルとURLをコピーする

・関連記事
AMDのZen3 CPU「Ryzen 5000」シリーズは2020年11月5日登場、「世界最高のゲーミングCPU」とアピール - GIGAZINE

「AMDのRadeon用ドライバー」はLinuxカーネル全体の1割を占めていることが判明 - GIGAZINE

AMDがGoogleと共同設計のChromebook向けプロセッサ「Ryzen 3000C」シリーズを発表 - GIGAZINE

AMDが2020年第2四半期決算を発表、モバイル向け&サーバー向けCPUは好調もGPUで苦戦 - GIGAZINE

AMDがZen 2アーキテクチャ採用のデスクトップ向けAPU「Ryzen 4000G」シリーズを発表、国内では3モデルが販売予定 - GIGAZINE

in ハードウェア, Posted by log1i_yk

You can read the machine translated English article here.