次世代コーデックの本命「AV1」の技術仕様をXiph.Orgが解説
ライセンスフリーを目指してAlliance for Open Media(AOM)が開発する次世代動画コーデック「AV1」が正式リリースされました。AOMに加わりAV1の開発に関わるXiph.Orgが、AV1に取り入れられている高圧縮技術について解説しています。数回にわたるシリーズの第1回は「Chroma from Luma prediction(CfL)」について解説されています。
next generation video: Introducing AV1
https://people.xiph.org/~xiphmont/demo/av1/demo1.shtml
フリーの次世代コーデック「Daala」を開発するXiph.Orgは、AOMに加わりAV1の開発に協力しています。当初、次世代コーデックAV1のベースとなるコーデックに名乗りを上げたのは、Googleの「VP9」、Ciscoの「Thor」そしてXiph.Orgの「Daala」でしたが、既存の特許に抵触するリスクの最も低かったVP9が選出されました。Xiph.Orgによると、当時、Daalaはラッピングアプローチとクロックドメイン技術の両方が成熟していなかったことからベースコーデックに選ばれなかったとのことで、VP9が選ばれた決定自体は妥当なものだったと考えているそうです。
ベースコーデックに選ばれなかったDaalaですが、同コーデックが取り入れている多くの技術はAV1にも取り入れられているとのこと。AV1の技術仕様が固まろうとしている中で、AV1で採用されている技術をXiph.Orgは公式ブログで複数回に分けて解説する予定で、第1回目は「CfL」という技術を中心に解説されています。
◆CfL
AV1では輝度予測に基づく彩度決定法「Chroma from Luma prediction:(CfL)」が取り入れられています。CfLは名前の通り輝度値(Luma)をベースにした画像の彩度から色を予測するテクニックです。最初に輝度値がコード・デコードされるとCfLは色の予測を行います。この予測が良好であれば、コード化される色情報の多くを減らすことでデータサイズを減らせます。
CfL自体は新技術というわけではなく、他のコーデックでも取り入れられています。LGのLM、Thor、Daala、HEVC(H.265)、AV1のそれぞれのCfLの違いを表にすると以下の通り。最終的なAV1のCfLはDaalaの実装に基づいており、デコーダ・エンコーダの複雑さが増すのを予防し、エンコードされたモデルの適合性と精度を高めているとXiph.Orgは述べています。
◆フレーム内予測の性能向上
Xiph.Orgによると圧縮技術とはつきつめれば「予測の技術」だとのこと。フレームとフレームの間のInter-frame(inter:中間フレーム)を予測する精度が新コーデックの開発では常に追求されています。しかし、中間フレームの予測精度が高まりサイズが小さくなるにつれ、圧縮しづらいキーフレーム(Iフレーム)とのサイズの差が大きくなっているとのこと。
以下の画像はムービー60フレームのビットレートを示したもの。左端のキーフレームは、中間フレームに比べて20~30倍のサイズになっています。
中間フレームのサイズが小さくなるにつれて、ムービーサイズ全体に占めるキーフレームの割合が高まってきており、キーフレームのサイズを減らす必要性が出てきています。そこで、intra-prediction(フレーム内予測)をキーフレームサイズを減らすために利用しています。そして、フレーム内予測技術の向上はCfLの精度向上にもつながるため、より一層重要性が増しているとXiph.Orgは述べています。
この他にも、CfLをテーマにAV1に取り入れられたいろいろな技術について書かれてあるので、コーデックに技術的関心がある人が読めば得られるものがあるはずです。
・関連記事
Appleも加わったオープンソース動画コーデック「AV1」は本当に業界スタンダードの座を奪えるのか? - GIGAZINE
GoogleやNetflixが主導するビデオコーデック「AV1」が正式リリース、4Kストリーミングの普及に期待 - GIGAZINE
ストリーミング動画の流れによって曲がり角を迎えるMPEGについて「MPEGの父」は何を思うのか? - GIGAZINE
無料でH.265以上のクオリティを実現できる次世代ビデオコーデック「Daala」の開発は順調 - GIGAZINE
より高品質なムービーを多くの人が見られるようになる「VP9」についてYouTubeが解説 - GIGAZINE
・関連コンテンツ