192kHz/24bitのハイレゾ無圧縮音源は本当に聴き分けられるものなのか?

By emmolos

従来よりも「音質が良い」とされるハイレゾ音源対応の機器が増え、その範囲は音楽プレイヤーにとどまらずにスマートフォンにまで広がってきています。活況を呈するようになってきているハイレゾの世界ですが、その一方で実際に音を聴いてはみたものの「違いがよくわからなかった」という声があるのも事実。果たしてハイレゾ化で本当に音が変わるのか、技術的な観点で論じたブログが公開されています。

24/192 Music Downloads are Very Silly Indeed
http://xiph.org/~xiphmont/demo/neil-young.html

ハイレゾ音源の広がりに対して「ひとこと物申す」とばかりに持論を唱えるクリス"モンティ"モンゴメリーさん。ライセンスフリーで誰でも使える音声圧縮フォーマット「Vorbis」を開発した人物でもあるモンゴメリーさんは専門的な知識をバックグラウンドに以下の観点で理論を展開し、いたずらにファイルサイズが大きくなってしまうハイレゾ音源に対して不要論を唱えています。
・高レートサンプリングによる弊害
・16ビットと24ビットの違い
・「ブラインドテスト」による聴き比べテストの結果


◆高レートサンプリングによる弊害その1:人間の耳の可聴域とハイレゾ音源の再生域
ハイレゾ音源が高音質と言われる理由として「CDよりも高い音を再生できる」というものがあります。一般的にハイレゾの基準は「サンプリング周波数96kHz以上」と捉えられ、日本オーディオ協会の定義では「40kHz以上の音を再生できること(PDFファイル)」、また、JEITA(電子情報技術産業協会)などが「CDスペックを超えるディジタルオーディオ(PDFファイル)」と定義しているハイレゾ音源は、理論上は人間の耳が聴くことのできる(可聴域)20kHzをはるかに超える高音を録音・再生できるわけなのですが、モンゴメリーさんは「人間の耳に聞こえない20kHz以上の音は必要ない」とバッサリ切り捨てる持論を展開しています。

モンゴメリーさんはこの持論について、「過去からの研究者がどのようにして『可聴域は20Hz~20kHz』という結論に達したかについて考えるべき」だと主張しています。以下の表は人間の耳が聞ける最も大きな音と小さな音を周波数別にプロットしたもので、特に高音域になると20kHz以上ではほとんど感知できないことが示されています。


◆高レートサンプリングによる弊害その2:192kHzは機器の音質に悪影響を与える
さらにモンゴメリーさんは、人の耳には聞こえない高音の再生を可能にするハイレゾ音源により、再生するオーディオ機器で音の「ひずみ」が発生するとして「そのメリットはない」と断言しています。

市販されている全てのオーディオ機器は音の濁りの原因となる「ひずみ」の影響から逃れることは不可能といえますが、従来のオーディオ機器は必要とされる周波数帯域の範囲でひずみをうまく回避してきました。しかし、さらに高い音を再生するハイレゾ音源を取り扱う場合になると従来どおりでは回避できない問題が露呈してくるといいます。

原則的にオーディオ機器は、超低音と超高音の成分に対する耐ひずみ性が低いとされ、ハイレゾ音源による超高音成分がオーディオ機器に入力されると途端に音に濁りが出てしまう場合があるとモンゴメリーさんは指摘。以下のグラフでは、水色で示される可聴域から外れた30000Hz(30kHz・赤)と33000Hz(33kHz・緑)で大きな入力があった場合に、相互変調ひずみによって余分なひずみ成分(倍音・青)が発生している様子が示されており、このひずみ成分が水色の可聴域の音にまでも濁りを生じさせてしまう弊害があるとしています。


モンゴメリーさんは「この問題を回避するためには4つの解決方法がある」として以下のポイントを挙げ、その中でも「4つめだけが実際の効果がある」としています。

1:専用の超高音スピーカー、アンプ、クロスオーバーをシステムに追加して、超高音成分を完全に分離して影響を受けないようにする。
2:超高音成分にも耐えるオーディオ機器を導入する。ただし、これにはコストがかかるのと、通常域の音質に影響を与える可能性がある。
3:機器の回路を入念にデザインして、超高音域を再生しないようする。
4:元となるファイルが超高音の成分を含まないようにし、問題が起こらないようにする

なお、相互変調ひずみの例としてモンゴメリーさんはサイト上で以下の5種類・6つの音源ファイルを提供。いずれも20kHz以上という高い音のファイルとなっているのですが、再生する機器によってはかすかに発生する変調ひずみのノイズが聞こえる時があります。

・30kHz tone+33kHz tone(96kHz/24ビット) [5秒・WAV] [30秒・FLAC]
・26kHz‐48kHz warbling tones(96kHz/24ビット) [10秒・WAV]
・26kHz‐96kHz warbling tones(192kHz/24ビット) [10秒・WAV]
・Song clip shifted up by 24kHz (96kHz/24ビット) [10秒・WAV](音楽ファイルを24kHz以上の超高音域に変換したもの・ほぼ無音)
・上記のオリジナルバージョン(44.1kHz/24ビット) [10秒・WAV](実音が出ます・音量注意)


◆高レートサンプリングによる弊害その3:サンプリングによるノイズとオーバーサンプリング
アナログ音源をデジタル化するというのは、音の波形を非常に細かい時間で分割して数値化(サンプリング・標本化)する処理のことです。以下の図では、元の波形(水色)をサンプリングすることで得られるデジタルデータ(赤色)を簡単に示したものなのですが、元の滑らかな波形に対し、時間軸で切り刻んだデジタルデータはどうしてもギザギザなものになってしまうことが避けられない様子がわかります。


さらに、高音の波形(細かい波形)になると、元の波形を正確に再現することが困難になります。高音になるほど波形とサンプルタイミングの問題も生じやすくなり、以下の図では元の波形と大きくかけ離れてしまったデジタルデータの様子をハッキリと見てとることができます。


ギザギザになった波形は元の音にはなかった不要な高音の成分(倍音)を生みだして、音に余分な濁り(折り返しノイズ)を与えてしまいます。このノイズを除去するためには、デジタル変換を行う前にイコライザーの一種であるローパスフィルタを通すのですが、このときに用いられる「アンチエイリアスフィルター」が音に悪影響を与えるとして避けられる傾向にあります。そんな問題を解決するために用いられている手法が「オーバーサンプリング」です。

オーバーサンプリングとは、簡単に言うとCD規格のようなサンプリング周波数44.1kHzよりも高速な96kHzや192kHzでサンプリングを行うことで滑らかな波形を実現し、折り返しノイズの発生を抑え、結果的にアンチエイリアスフィルターの悪影響を抑えるというもの。単にサンプリング周波数を上げるだけで良好な音質が得られるというシンプルかつ効率的な手法のため、現在ではほぼ全てのオーディオ機器でこの手法が取り入れられているといっても過言ではありません。


音質が確保できるために、特にレコーディングの現場などではフル活用されてきたオーバーサンプリングですが、モンゴメリーさんは「結果的にCDなどの音質に落とし込む際には従来どおりの44.1kHzに変換されてしまうために、あまり意味がない」と言いたげな様子。量子化ノイズはこれまでに触れている「PCM方式」のサンプリングを行う以上は原理的に避けることができないため、これはハイレゾ音源に限った問題ではないはず。その意味で、この部分についてはモンゴメリーさんの指摘にやや疑問を感じる人もいそうです。

◆16ビットと24ビットの違い
サンプリング周波数に加えてハイレゾの要となるのがビット数(ビット深度)です。ビット数が増える(深くなる)ことで得られるメリットは「ダイナミックレンジの拡大」であり、これはごく簡単に言うと小さい音と大きい音の差を幅広く表現できる、と言うことになります。ダイナミックレンジが拡大することで小さい音でもハッキリと聴き取れるようになり、音の解像度が上がって良い音になる、というのが高ビット化による音質向上とされているのですが、モンゴメリーさんはこの部分にも疑問を呈しています。

モンゴメリーさんは「たしかに、16ビットのリニアPCM音源では人間が理論的に聞き分けられるダイナミックレンジを全てカバーすることはできない」としながらも、高ビット技術は主に「レコーディングの現場」でのメリットのために導入されてきたと主張。

健康な青年が耐えられる最大の音量は140dBと言われているのに対し、16ビット音源が再生可能なダイナミックレンジは96dBとされ、スペック上は人間の能力をカバーできていません。これに対し、144dBというダイナミックレンジを持つ24ビット音源の優位性は明らかなのですが、ここでモンゴメリーさんが問題にしているのは「実際に必要なダイナミックレンジ」という観点です。

ソース元のサイトでは、1kHzのテストトーンを理論上の最大音量である0dBと16ビット音源よりも少し広い-105dBというレベルの極めて小さな音を含むファイルを試聴することが可能。1つめの0dBはハッキリと音が聞こえるのに対し、2つめの-105dBになるとデータ上では再生されているはずの音がほぼ聴き取れない状態であることがわかります。このことからモンゴメリーさんは、「一般的には16ビットのダイナミックレンジがあれば再生には十分」として、ここでもハイレゾ音源が不要であると主張しています。(画像クリックで元の音ファイルを再生)

1kHz tone at 0 dB (16 bit / 48kHz WAV)


1kHz tone at -105 dB (16 bit / 48kHz WAV)


ただし、そんなモンゴメリーさんでも「多ビット化が有効」と認めているのがレコーディングの現場。その理由として「不意に大きな音が入った時にも録音が歪まない余裕(マージン)をかせげること、逆に録音レベルが低すぎた場合にもノイズに音が埋もれてしまわずにすむ」という安全性を挙げています。音にこだわるエンジニアが耳にすると卒倒しかねない主張ですが、科学的な理論がベースになっているので一定の説得力はあると言えそうです。

◆「ブラインドテスト」による聴き比べテストの結果
実際に音が良くなったかどうかは、最終的にはやはり人間の判断を得るのが最も適切な方法と言えます。モンゴメリーさんは実際に行われた複数の聴き比べテストの結果を検証。ハイレゾ音源とCDクオリティの音源を聴き比べるテストを行ったところ、オーディオ愛好家からプロのエンジニアを含む554回のテストでの正解率は49.8%と半数をわずかに下回っていたことが分かっています。

BAS Experiment Explanation page - Oct 2007
http://www.bostonaudiosociety.org/explanation.htm


ちなみに、上記のBoston Audio Societyによると、聞き比べで多く使用されたのは以下の音源だとのこと。

Patricia Barber – Nightclub (Mobile Fidelity UDSACD 2004)
Chesky: Various -- An Introduction to SACD (SACD204)
Chesky: Various -- Super Audio Collection & Professional Test Disc (CHDVD 171)
Stephen Hartke: Tituli/Cathedral in the Thrashing Rain; Hilliard Ensemble/Crockett (ECM New Series 1861, cat. no. 476 1155, SACD)
Bach Concertos: Perahia et al; Sony SACD
Mozart Piano Concertos: Perahia, Sony SACD
Kimber Kable: Purity, an Inspirational Collection SACD T Minus 5 Vocal Band, no cat. #
Tony Overwater: Op SACD (Turtle Records TRSA 0008)
McCoy Tyner Illuminati SACD (Telarc 63599)
Pink Floyd, Dark Side of the Moon SACD (Capitol/EMI 82136)
Steely Dan, Gaucho, Geffen SACD
Alan Parsons, I, Robot DVD-A (Chesky CHDD 2003)
BSO, Saint-Saens, Organ Symphony SACD (RCA 82876-61387-2 RE1)
Carlos Heredia, Gypsy Flamenco SACD (Chesky SACD266)
Shakespeare in Song, Phoenix Bach Choir, Bruffy, SACD (Chandos CHSA 5031)
Livingston Taylor, Ink SACD (Chesky SACD253)
The Persuasions, The Persuasions Sing the Beatles, SACD (Chesky SACD244)
Steely Dan, Two Against Nature, DVD-A (24,96) Giant Records 9 24719-9
McCoy Tyner with Stanley Clark and Al Foster, Telarc SACD 3488

また、日本でも同様の検証が数多く実施されており、意外ともいえる結果が出ることもよくあるようです。

ハイレゾ音源は人間の耳で聴き分けられるか? 禁断のブラインドテストで検証! (1/6) - Phile-web
http://www.phileweb.com/review/article/201311/06/982.html

◆アドバイス:本当に良い音を楽しむためにはどうすれば良いのか
これらの検証を踏まえ、モンゴメリーさんは複数のアドバイスを提言しています。

・良いヘッドホンを使うこと
最も効果的な方法の一つが、音質が良いヘッドホンを使うことだとのこと。これにはオープン型、クローズ型、さらにはインナー型のイヤホンなど、どんなタイプでもいいので「ブランドとデザインにお金を払う」ようなタイプの製品を避け、金額に見合う品質のものを選ぶことが大切としています。

・ロスレス音源を選ぶこと
広く用いられているMP3やAACなどの非可逆圧縮ファイルは、ファイルをコンパクトにする際に程度の差はあれど音の成分が間引かれてしまっています。その点、FLAC音源や非圧縮のWAV音源であれば少なくとも音源ソースの段階では最良のものであることが確保できます。

・より良いマスター音源を手に入れる
いくら良いファイル形式を選んだところで、元となる音源のクオリティが低ければそのポテンシャルを活かすことができません。音が良いとされる作品を探し出し、さらに可能であれば「リマスター版」など可能な限り品質が高いものを求めるのが良い音を楽しむために必要としています。

◆まとめ
やや極論ともとれるモンゴメリーさんの「ハイレゾ不要論」でしたが、その中にはなるほどと納得させられる部分もありそう。今回の内容ではPCM方式のハイレゾ音源がトピックに挙げられていましたが、これとは全く仕組みが異なり、デジタルデータを扱いながらも「アナログ的」な仕組みとも言われるDSD方式(またはSACD:スーパーオーディオCD)の存在を忘れるべきではないといえます。モンゴメリーさんのアドバイスにもあるように、いい音に出会うためには上質に録音された音源をたくさん聴いて自分の耳と感性を磨き、周囲のさまざまな声に惑わされずに「本当に良い音」とは何かを見抜ける審美眼を養うことしかないと言えそうです。

・関連記事
多くのファンを魅了しながら突然姿を消した謎の天才オーディオエンジニア「NwAvGuy」 - GIGAZINE

4億円以上を集め名だたるミュージシャンが絶賛するハイレゾ音楽プレイヤー「PonoPlayer」は一体何がすごいのか? - GIGAZINE

MP3ファイルの音質を聞き分られるか自分の耳をテストできる「mp3ornot.com」 - GIGAZINE

SONYのプロ用ヘッドフォンのケーブルを交換して音質向上を図ってみたレポ - GIGAZINE

雑誌「デジファイ」付録のUSB DAC付きデジタルアンプをPCにつないで高品質な音を体験してみました - GIGAZINE

586

in ハードウェア,  サイエンス,  メモ, Posted by logx_tm