2021年04月23日

YouTubeが動画変換のために独自開発したチップ「Argos」とは?



YouTubeには日々大量の動画がアップロードされ、何億人もの人々がさまざまなデバイスで視聴を行っています。クリエイターがシームレスに動画をアップロードし、視聴者に適切な解像度で動画を提供するために必要なコーデック技術について、Googleのソフトウェアエンジニアであるジェフ・キャロウ氏が解説しています。



Reimagining video infrastructure to empower YouTube

https://blog.youtube/inside-youtube/new-era-video-infrastructure



YouTube is now building its own video-transcoding chips | Ars Technica

https://arstechnica.com/gadgets/2021/04/youtube-is-now-building-its-own-video-transcoding-chips/



動画は単一の形式で作成およびアップロードされますが、最終的にはテレビやスマートフォンなどのさまざまなデバイス、さまざまな解像度で視聴されるということを理解する必要があります。キャロウ氏が所属するインフラストラクチャーチームの仕事の1つは「トランスコーディング」と呼ばれるプロセスで動画を圧縮し、さまざまなデバイス向けに最小限のデータ量になるよう変換することです。



しかし、このような処理を通常のコンピューターのCPUで行うことは非効率であるため、キャロウ氏らはトランスコーディングを行う独自のチップ「Argos」と、Argos専用のソフトウェアを開発。さらにそれらすべてをまとめた「動画トランスコーディングユニット(VCU)」を形成したとのことです。VCUの画像は以下。





Argosの構成は以下の通りで、10個のエンコーダコア(緑)がそれぞれ3つの参照フレームを使用し、2160pの解像度を持った動画をリアルタイムでエンコーディングします。キャロウ氏は「Argosを使用することで、従来のシステムと比較して計算効率が20~33倍向上しました」と話します。昨今、高解像度動画の需要が高まり、H.264という従来の規格からVP9のようなデータ効率の高いコーデックが採用されつつありますが、VP9はエンコードに5倍のコンピューターリソースを使用するため、Argosのようなチップを開発する必要があったとキャロウ氏は語っています。





ジェフ氏は「ハードウェアの作成は長期的な取り組みであり、今後VP9よりも効率的なAV1の利用も視野に入れて開発を進めていきます」と語っています。