音声を圧縮(エンコード) するしくみ
CDのデータを圧縮してパソコンで管理する、デジタル音源をネット経由で購入する、スマホやポータブルDAPなどで音楽を手軽に持ち歩く…といったスタイルが、オーディオの楽しみ方として広がって久しいです。これから2回にわけて圧縮音源について解説しましょう。
圧縮とは音楽データの一部を間引いて、データ量を減らし扱いやすくすることです。しかし、データ量を減らせても、元の音楽が損なわれ聴くに堪えないような音になるようでは意味がありませんね。そこで利用されるのが人間の聴覚心理です。専門的にはフレッチャー・マンソンの聴感特性と呼び、音響学の教科書にしばしば登場しますね。
音の高さ(周波数)を横方向にとり、音の大きさを縦軸にとります。どの音も公平(フラット)に聞こえるならば、聞こえる範囲は四角になるはずですが、実際はこのように低い音と高い音の感度が鈍っているのです。特に小さいレベルの音では、この傾向が強まりますよ。
圧縮のターゲットその1。聞こえにくい低音・高音の小さい音をまずカットします。次にタ-ゲット2では「マスキング効果」という性質を利用します。駅のホームに電車が入ってきました。今まで話していた声が聞き取れなくなり、ゴーッという音が勝ってしまいますね。このように大きい音は小さい音をマスクする(消し去る)性質があるのです。だったら、色んな音が混在しているときは、小さい音をどんどんカットしてよい、という考えに基づいた方法です。
さらに音の高低でいうと、低音側がマスクされることが多いと統計的に知られています。そうした音の変化を時々刻々と判断して、デジタル処理でやってのけるのが圧縮の基本です。専門的にはエンコードと呼ぶのですが、その圧縮方式にもMP3、WMA、ATRAC3などいろいろなフォーマットがありますね。元はといえば、ソニーがMD(1992年の登場)のために考案したATRAC(アトラック)方式が圧縮の元祖といえるでしょう。12センチCDのデータを、まるごと6.4センチのMDにはコピーできないため、データを1/4~1/5に圧縮するATRAC方式を開発したのです。
ATRAC以外の圧縮方式も、基本的にはこれと同じ「聞こえない(聞こえにくい)音を間引く」という考えに則ったものです。いずれにせよ、間引いたデータは切り捨ててしまうので、一度圧縮したデータは元には戻せません。これを「非可逆圧縮」といいます。圧縮したデータを解凍すると元のデータとほぼ同じになる「可逆圧縮」もありますが、これは次回で解説します。
- ある周波数(例えば7kHz)から上をすべてカットしてみると、ハナがつまったような音になり問題外のクオリティです。これじゃあデータ量を減らしたことがバレバレ。そこで利用されるのが人間の聴覚心理。人の耳には面白い性質があって、左図の曲線のようになっているのです
おもな音声フォーマットの種類と特徴
MP3/WMA/AACなどの圧縮ファイルを使って1/10くらいのデータ容量にぎゅっと圧縮すると音質は多少落ちますが、このサイズであれば、フラッシュメモリーやHDDに保存してDAP(デジタルオーディオプレーヤー)で持ち歩けるようになります。もちろんCD以外のデジタル音源や、レコード、カセットテープなどのアナログの音源もすべて圧縮できますよ。代表的な圧縮フォーマットについてまとめていきましょう。
- 前回までで解説したCDは16ビット/44.1kHzのリニアPCM方式。計算上約640MB(74分)のデータ容量になります。データ量も多いし、12センチディスクは持ち歩きにもやや不便ですね。圧縮音源は、持ち歩いて外出先でも簡単に楽しめるのが魅力です
ポピュラーなのが「MP3(エム・ピー・スリー)」。正式には「MPEG1 Auduo Layer3」で、国際標準化機構(ISO)の定めたファイルフォーマットのひとつ。MPEGにはMPEG1/MPEG2/MPEG4などの規格があって、MPEG1は動画や音声をデジタル圧縮するための規格というわけです。さらに音声圧縮のためにレイヤー1、2、3の3つが用意されているのです。この順で圧縮率が高くなり、レイヤー3の場合はビットレート128kbpsのときに1/10程度となっていますよ。ビットレートは32 – 320kbpsから選択できます。
次に「WMA(Windows Media Audio)」ですが、これはマイクロソフトが開発した圧縮形式です。ウィンドウズメディアというマルチメディア技術を構成する技術のひとつで、MP3のあとに登場し、より効率の良い圧縮ができるのを謳い文句にしているのが特徴。MP3と比較して半分のビットレートで同等の音質を表現でき、64kbps時にはCD並みの音質のまま1/20程度に圧縮できるとしています。
「AAC(エー・エー・シー/Advanced Audio Cording)」はBSや地上デジタル放送の音声としておなじみですね。サンプリング周波数は最大96kHz。MP3よりも約1.5倍圧縮効率が高いのが特長です。
「ATRAC3(アトラック・スリー)」は上で述べた、ソニーがMDの圧縮技術として開発したATRACの改良バージョンです。このように、圧縮率のやや異なるフォーマットですが、サンプリング周波数やビットレートの設定により音のグレードを設定できるようになっています。
デジタル形式なら手軽に外で楽しめる
簡単に圧縮音源やデジタルオーディオプレーヤー(DAP)の楽しみ方をあげておきましょう。大別すると「CDなどのデータを圧縮する」「ネットからダウンロードする」のふたつです。パソコンがあれば、CDの音楽データの圧縮・保存は簡単ですね。MP3/WMA/AACなど、好みのフォーマットでデータを取り込みましょう。フォーマット同士の互換性はありませんが、専用のソフトを活用することでデータ形式を変換することもできます。保存したデータはパソコンでの再生はもちろん、USB経由でスマホやポータブルプレーヤーに転送して持ち運び、いつでもどこでも楽しむことができますね。
圧縮のメリットをまとめてみましょう。4つほどあげておきましたが、何といってもデータ容量がCDの1/10以下なのでインターネットを介して短時間でコピーや転送ができたり、持ち運べたりと手軽で便利です。手のひらサイズ、ポケットサイズで、手軽に音楽をエンジョイできるツールを上手に使いこなしましょう。
ハイレゾ対応の高音質配信サービスも
USBオーディオと並び、注目を集めているのが高音質配信です。これまではMP3に代表される圧縮音源で、平均128kbps程度のビットレートでしたね。どれだけ小さくなるかは1秒あたりのデータ量で決まり、圧縮なしで記録するWAVE(ウェーブ)形式に比べて、1/10程度でした。
高音質で録るなら、32kbpsや64kbpsじゃなく128kbps以上、192kbpsといった高いビットレートがおすすめ…というのがこれまでだとすれば、いまやCDをしのぐ大容量&高音質音楽配信の時代です。最大192kHz/24bitのハイレゾストリーミングサービスと、DSDやDXDを含む音源のダウンロード購入が可能な「Qobuz」をはじめ、高音質音楽サイトにも注目してみましょう。
高音質音楽サイトでの技術的な話題といえば、ロスレスコーデックでしょう。圧縮系の非可逆変換(圧縮後のデータが元データと同じに戻らない)とは違い、データロスが殆どないものです。ビットレートは最大8Mbpsといいますから、従来のざっと40倍以上。これは聴き応えがありますよ。ブロードバンド環境にあるのであれば、ぜひトライすべきでしょう。
というわけで、手軽な携帯音楽プレーヤーからPCを含めた高音質化のノウハウ(USB-DACの活用)、高音質サイトの話題など色々と解説してきました。次回からはテーマを改め、アナログ再生について基礎からやさしく解説します。