ハイレゾ音源の基礎知識:CDとの違いから体感まで
ハイレゾ音源の仕組みをCDの規格から順に解説。ビットレート、サンプリングレート、標本化定理、バランス接続、サービスごとの音質の違いまで。
ハイレゾ音源の音楽を聴く時は、いろいろな「数字」が理解できるとより「頭でも音楽が楽しめる」ようになります。
16bit、44.1kHz、1412kbps。こういう仕組みや基準を知っていると、音源を探す時にも「なにが違うのか」に注意を払って音楽を聴くことができます。
もちろん究極的には「いい音で聞ければなんでもいい」んですが、こういうのがわかることは、楽しい。
CDの音はどう記録されているか
まずはデジタル音楽の基本であるCDの数字を理解すると、ハイレゾとの比較で便利です。
まずCDは、16bit 44.1kHzのステレオPCMで記録されています。
44.1kHzは「サンプリング周波数」と呼ばれるもので、これは1秒間にどれだけの記録が残されているか、ということ。44.1kHzの場合、1秒あたりに44.1k = 44,100個の「音」が記録されている、ということになります。
16bitというのは、1回の記録でどれだけの情報を記録できるかという数字です。16bitは2の16乗で65536。つまり、音の波形を65536段階で描写できるということになります。
mp3の音質でよく見る「128kbps」「256kbps」という数字。あれが「ビットレート」で、1秒あたりに何bitのデータが使われているかを表しています。
では、CDのビットレートはいくつか。さっきのサンプリング周波数と、ビットレートを掛け算すると答えが出てきます。
44.1kHz(44100回) x 16bit(65536) = 705600。これがステレオで左右2チャンネルあるので、2倍にして約1412000bit per second。つまりCDの「音質」は1412kbps、という計算。mp3の128kbpsと比べると、データ量の差がよくわかります。
とは言え、mp3やAACは上手に必要ない情報を削って圧縮している(と言われている)ので、「CDは128kbpsの10倍音がいい」という単純な計算にはならないことに注意は必要です。
ビットレートとサンプリングレートを画像で例える
さっきの「サンプリングレート」と「ビット深度」、数字だけだとピンとこないかもしれません。これは、画像に例えると感覚的にわかりやすくなります。
サンプリングレートはイメージとしては「画像の解像度」。細かく区切るほど画像は鮮明になります。そしてビットレートは「画像の色数」色数が多いほど、微妙なグラデーションを表現できるようになります。
デジタルで記録される音も、これとほとんど同じ構造です。
サンプリングレートが高ければ時間変化の細かい違いが詳細になり、ビットレートが高ければ音量の微妙な違いを記録できるようになる。
これが「いい音」かどうかの基準です。
なぜ44.1kHzなのか
じゃあ、さっき出てきたCDのサンプリングレートはなぜ44.1kHzという数字なのか。
ある周波数の音を正しく捉えるには、その2倍のサンプリングレートが必要です。波の上と下、両方の点を結ばないとある周波数を表現できない。ここはちょっと難しいので、標本化定理(ナイキストレート)というもので調べるとよくわかります。
また、当時の人体の研究から、人間が聞き取れる音の上限は約20kHzだと考えられていました。なので、その2倍の40kHz以上あれば理論上は「聞こえる音が全部記録される」はず。CDの44.1kHzは、そこに少し余裕を持たせて音を記録するようにしました。
ハイレゾは「聞こえない音」も入っている
ハイレゾ音源は、さっきの44.1kHzよりも高いサンプリングレート(96kHzや192kHz)で記録されています。つまり、CDでは切り捨てていた20kHz以上の音もデータに入っています。
ここで面白いのは、さっき書いた「人間の可聴域は約20kHz」という前提が、実はそこまで単純ではなかったということです。
現代では、20kHzを超える超高周波が脳活動に快さをもたらすという「ハイパーソニック・エフェクト」という研究が報告されています。耳では聞こえないはずの音が、体感には影響するかもしれない。CDの規格を決めたときには、ここまでわかっていなかったのです。
と同時に、実は人間は、加齢とともに高周波が聞こえなくなってしまう、という悲しい現実も存在します。
蝸牛という耳の中にある不動毛というものが音の振動を伝えていますが、この不動毛というやつはすり減って、消耗していってしまうのです。
不動毛は、入り口に近いものが「高い音を担当」しており、入り口に近いほど早くすり減ってなくなっていってしまう。
しかも人間は、この不動毛を再生する能力はもっていません(鳥の不動毛は再生するらしい)
なので、人間として生存している限りは、必ずいつか高い音が聞こえなくなってしまう、というわけです。(医学的にこれを再生できれば、高音が聞こえるようになる可能性もあるのかもしれない)
ハイレゾを活かすなら再生環境も変わる
ここまでの話で、ハイレゾ音源にはCDより多くの情報が入っていることがわかりました。では、その情報をちゃんと届けるにはどうすればいいのか。ここで出てくるのが「バランス接続」です。
通常のイヤホンケーブル(アンバランス接続)では、左右の音信号がグラウンド(アース線)を共有しています。左の信号と右の信号が同じ線を通る部分がある。これが「クロストーク」と呼ばれる、左右の音が混ざる原因になります。
バランス接続は、左右それぞれにホット(信号)・コールド(逆位相の信号)・グラウンドを独立して持たせる方式です。左右が完全に分離されるので、クロストークが抑えられる。
端子の形でも見分けがつきます。一般的なイヤホンの3.5mmプラグはアンバランス。バランス接続は4.4mm(SONYが推進した規格)や2.5mm(Astell&Kernなどのポータブルプレーヤーで採用)が使われます。
せっかくハイレゾで情報量の多い音源を聴くなら、その情報をできるだけそのまま届けたい。バランス接続は、そのための手段のひとつです。
私が使っているイヤホンはFiiO FD3 Pro、TRN VX、KZ ZSN PRO X。どれもリケーブル対応で、ケーブルを交換するだけでバランス接続に切り替えられます。バランスケーブルはNiceHCK LitzPSの4.4mmを使っています。
具体的な製品の紹介と、今から揃えるならどれがいいかは ハイレゾを聴くために揃えた機材 にまとめています。
ストリーミングでハイレゾを聴く
ハイレゾ音源はもともとダウンロード購入が主流でしたが、今はストリーミングサービスでも聴けるようになっています。ただし、同じ「ハイレゾ対応」でもサービスごとに仕組みが違います。
まず、音声データの形式(コーデック)が異なります。Apple Musicは自社のALAC(Apple Lossless)を採用。Amazon Music HDはFLACで配信しています。どちらもロスレス(非可逆圧縮ではない)ですが、対応機器やアプリとの相性が変わってきます。
音の傾向にも差があるという報告があります。Amazon Music HDは情報量が多く音場が広いが、音が飽和する場面もある。Apple Musicは解像感が高くシャープだが、広がりに物足りなさを感じることもある(と言われています)。moraはダウンロード販売で、音源の品質自体が高いと評価されています。
もうひとつ注意したいのは、ストリーミングでハイレゾを聴くには、スマホやPCの内蔵DACでは性能が足りない場合があること。外付けのUSB DACを使うと、ハイレゾの情報量をきちんと音に変換できます。さっきのバランス接続に対応したDACもあります。
私はFiiO Q3というポータブルUSB DAC/アンプを使っています。4.4mmバランス出力もついているので、さっきのバランスケーブルをそのまま繋げます。詳しくは ハイレゾを聴くために揃えた機材 で。
音源の質、再生環境、接続方式。この3つが揃って初めて、ハイレゾの情報量が耳に届く。どこか1つだけ良くしても効果は限定的なので、バランスよく整えるのが現実的です。
Knowledge Stack
毎週配信のニュースレター
知識管理・Obsidian・自分で学ぶための方法を、Substack で継続的に深掘りしています。
Substack を購読する →