様々なメディア形式が世の中にある中、放送のようなプッシュサービスから、マルチプラットフォーム対応のインタラクティブエンターテイメント、そしてインターネットストリーミングに至るまで、ラウドネスは、信号伝送の規格の議論にとどまらず、ラウドネスウォー(音圧戦争)のように、消費者の美的感覚に直接、影響を与えます。今では、音楽がこれらのプラットフォームで同時に再生できることが当たり前となっています。一方、コンテンツを制作する側にとって実に頭の痛い要件です。一つの音が、どのプラットフォームで聞いても同じ品質となるには、どうすれば良いのでしょう?また、オーディオフォーマットが変われば、一部の周波数やダイナミックな動きが失われてしまう恐れがあります。「音質」は主観的であるとはいえ、基本の評価枠組みとして周波数特性などが存在します。異なる周波数の振幅反応は、どのような音でも、ラウドネスを決定する要素です。ここで一番問題になるのは、音を出すデジタルファイルをつくることではなく、音の異なる周波数、電力、またはラウドネスを、どのように制御するかです。
音量の大小とはなにか、という究極の問題です。客観的な基準点が必要です。
ラウドネス測定の法則は、すでに成熟しています。まず、参考値を確認するところから始めます。従来より、次のような非公式のラウドネス基準が用いられてきました:
- Music RMS = -16 dB (peak <= -3 dB)
- Voice/Speech RMS = -12 dB(peak <= -3 dB)
業界で大勢のプロたちが広く利用してきたものです。ところが、中国では専門家たちが基準を低くしました。レコーディングやポストプロダクションの業界では、特に若いエンジニアたちの間で、RMSの存在さえ知らない人が増えています。このため、先輩エンジニアたちが重視する既定基準に反する行動をとったとしても、若手は分からないままです。
ほかにもいくつかの参考値があります。
- 1990年代にプロデュースされたクラシック音楽に見られる平均RMSラウドネスは、-21dBでした。
- ハリウッド映画のサントラの最終ミックスは、RMSラウドネスが-20dBを超えることは稀で、-24dBを上回らないこともあります。(今は、主に -24 dB LKFS程度です。)
- 業界標準の携帯電話に組み込まれたスピーカーの出力で、音のサンプルのRMSが-8 dBを超えるとクリッピングが始まります。
一度、典型的なハリウッド映画のHDトレーラーを探して、RMSを確認してみてください、思ったより低いはずです!また、多くの波形は形が美しく、長方形ではなく上下に波があります。ダイナミックな周波数特性が、充分に満たされています。
上図の最初のトラックは、映画Shooter (2007) のトレーラーです。2本目のトラックは、Star Wars: Episode VII - The Force Awakens (2015) の初期トレーラーです。
上記の数値は当然、経験や美的感覚によって変わりますが、ポストプロダクション、放送、そして映画館の規格という後ろ盾があることに注目してください。実際、プロダクトが業界の規格に準拠すれば必要に応じて再生時に拡張できることが多く、最終的な品質は、再生機器にほとんど依存しています。こういった規格や処理は、特に映画館向けで厳しく規定されています(ただし中国を除く)。それなのに最近では、人気のaural aestheticsは標準規格に準拠していません。通常のヘッドフォンのインビーデンスは下がり、ヘッドフォンアンプが不要となった今も、サウンドアセットのラウドネスは上昇し続ける一方です。
以下は、映画Exodus: Gods and Kings (2014年)(720P, AAC) から抽出したサウンドです。
中央の44分間を抜粋して、ラウドネスを測定しました。
次に、SoundForge Pro for Mac 2を使いRMSを測定しました:
結果は以下のとおりです:
- LKFS= -23.5 dB
- RMS= -26.69 dB
- LRA= 16.4 dB LU
注: ここで使われる "dB" は、dBFS (Decibels relative to Full Scale) の短縮です。Full Scaleとは、完全な周波数帯域である20-20,000 Hzと、完全なダイナミックレンジ(現在使われるサンプリングレートによるとその範囲はCDで96 dB、DVDで144 dB)です。中国語の業界用語は“全幅”です。
そこで次に気になるのが、メーターの読み方です。まず、一般的なメーターの違いを確認します。最初に、誰もが知るクラシックメーターのVRメーターです。
最大値は0です。0以上の赤字部分は、許容ヘッドルームを表します。単位がdBでないことに注意してください。
VUメーターの素早く動くポインターが、オーディオ信号の現在の電圧変化を示します。針は機械的な動きに起因する遅延があるため、細かく敏速な変化に対応できない恐れがあります。最も広く使われるレベルメーターのPPM (Peak Program Meter) は、下図の左側にある縦のグラフのことです。
PPMは現在のピーク値だけを反映するので、別名トゥルーピークメーター (dBTP) と呼ばれ、PPMで計測される信号レベルの最大値は0 dBで、それ以上でも0 dBとして表示されますが、プロ仕様の高精度メーターは0 dB以上も表示するものもあります。VUメーターの最大値0は、"0 dB"ではなく、PPMメーターでいう-20 dBと同程度です。つまり、VUメーター値が0のとき、PPMでは同じ信号のヘッドルームが 20 dBほど残っています。なかには、現在の平均ピークも示すPPMメーターもあります。
VUメーターは物理的な限界があるため、信号レベルの相対的な変化を確認するためだけに、利用できます。針の動きが大きければ大きいほど、変化が激しいことを示します。PPMに表示されるのは、現在のピーク値です。どちらのメーターも、客観的なラウドネスを示していません。放送業界で主に使われているのが、LKFSラウドネスメーターです。
Waves WLM
TC LM2n
同じサンプルを、2つのメーターで測定した様子を比較すると:
測定結果が明らかに違います。
現状では、いくつかの国際ラウドネス規格が普及しています。最も普及する最新規格が、ITU-R BS.1770-3 (2012年完成) です。もともとBBSとEBUが作成し、中国のラジオやテレビ放送業界でも公式に採用されたこの規格は、長年にわたり発展してきました。適用するドメインによって使うバージョンが異なり、例えばBS.1770-2、EBU R128、TR-B32などがあります。インタラクティブエンターテイメントの分野では、Xbox OneとPS4の両者で、ラウドネステストがTRCに含まれています。TRCとは、プラットフォームに設定される妥協不可能なテクニカルスタンダードのことです。プラットフォームのTRCを満たさないゲーム製品は、そのプラットフォーム用にパブリッシュすることが許可されず、そのコンソールでリリースすることができません。同様にiPhone、iPad、Samsungスマートフォンでさえも、周波数特性やDAC (digital-analog conversion) のダイナミックレンジに関する基準が定義されています。このような規格は大量生産するための費用対効果のバランスのためだけでなく、ユーザーの聴覚的なエクスペリエンスも考慮しています。別の見方をすると、プロのプロデューサーやメディア関係者が携帯電話のスピーカーのために妥協をしないことを携帯電話メーカー各社も理解していて、それはプロたちが何十年も専門の事業にはげみ、ビジネスをよく分かっていることを認識しているからです。例えばテイラー・スィフトの歌に合うスピーカーを提供することが携帯電話メーカーの責任であり、テイラー・スィフトのプロデューサーが携帯に合わせる必要は、ないのです。主要メーカー各社はこのため、一連のラウドネス規格の確立に関与してきました。詳しくは、以下の資料を参考にしてください:
Waves WLMにプリセットされているラウドネス規格:
TC LC2nにプリセットされているラウドネス規格:
次の2つの機関が、この規格の専門機関であり、私達の日々の仕事の参照先です:
- ITU: The International Telecommunication Union
- EBU: European Broadcast Union
ITUやEBUのラウドネス規格や測定制度において、最も広く採用されているのがラウドネスメーターです。新しいメーターとして、VUメーターやPPMメーターと同じ目的で使えます。同時に、メーターのインターフェースに真新しい用語が導入されました。ラウドネスやダイナミックスを制御する上で、これらの用語は大事なので理解しておいてください。あなたが仕事する中で、大事な参考値となります。それでは、用語を説明します:
LKFS: Loudness, K-weighted, relative to Full Scale、中国語で「全幅K权重响度单位」。K-weightedはMcGill UniversityとCRC (the Communications Research Centre Canada)の共同研究の結果です。人間のラウドネスの感覚を表す曲線です。ラウドネスを表現するアルゴリズムの中でも最も精度が高いものとして、広く認められています。このアルゴリズムはデジタルシグナルの増幅に大きく影響し、なぜならラジオでもテレビ放送でもビデオゲームでも、音を増幅する際の信号のディストーションを最小限に抑えながら、人間の潜在的な聴覚の要件を満たす必要があるためです。ここで整理すると、LKFSはラウドネス測定の単位で、1 LKFS = 1 dBとなり、このブログ連載では、以下dBLKFSを適宜使います。
LUFS: Loudness Units Full Scale、これもラウドネス測定の単位で、基本的にLKFSと同じです。簡単に言うと、LUFSはEBUの規格です。1 LUFS = 1dB。
ゲーティング(Gating): 中国語で「 门限」。このパラメータは、すべてのメーターやラウドネスプロセシングツールで使われているわけではありません。例えば、クラシック音楽や映画の場合を考えます。長く静かなセクションが続くことがありますが、非常に音量の大きい瞬間もあります。そのような複雑な編成の全体的なラウドネスを、どう説明すればよいのか、あるいは測定するための客観的な基準は可能なのか?その答えが、ゲーティングです。相対的に低いレベルを無視することのできる測定方法です。例えば、-45 dB未満の信号を、普通は無視します。そして、音量の大きいセクションを使い、人間の受け取る感覚を表現します。ゲーティングは、もう一つの重要な分野であるラウドネスメトリックスでも、利用できるかもしれません。聴覚的な感覚に必要なのは、安定した基準値です(詳しくは、後述)。日常的に、ポップミュージックの方が、他のジャンルの音楽よりもよく耳に入ります。私たちは無意識のうちに、曖昧ながらも、ポップミュージックの様々なボリューム変化やラウドネス変化に関する基準値を有しているのです。一方、映画やビデオゲームが対象だと、どれほどのラウドネスにすべきか、不安になります。このようなメディア形式にある音の複雑な変化や、聴きなれない音に関して、ラウドネスの基準がないか、曖昧だからです。それでも、ポップミュージックがしばしば基準になります。ここで、ゲーティングがまさしくそれに役立ちます。もちろん、ゲートを使ってラウドネス測定を行うかどうかは、ルールを設定するあなたが決めることで、それには聞く耳の経験が必要です。ゲーティングは、あなたのラウドネス比較と判断能力のシステムを設定する力を養います。
同じボリュームの音を長い時間聞くことは、あまりありません。ITU-R BS.1770で採用されたラウドネス測定では、30分の継続的な音の再生中に、許容できる平均ラウドネスをおおよそ -24 dB LKFS (EBU規格では -23 dB LUFS) とし、ラウドネスの最大値を -12 dB LKFSとしてあり、それより上は、音が大きすぎると判断されます。
ビデオゲームの場合はこの測定方法が問題で、個々のサウンドアセットがそれほど長く続くことはめったにないからです。私たちは、もっと短い期間のラウドネスや、ゲームのランタイムの平均ラウドネスや、短期的な最大ラウドネス値(400-3,000 ミリ秒のタイムフレームの間)の方が、気になります。もちろん、ときには低ラウドネスの音楽やその期間を測定する必要があり、これも大事です。稼働中のゲームの低ラウドネス状態が長く続きすぎ、そのラウドネス値が低すぎると、ゲーム全体が静かすぎて、エキサイティングでない印象となり、ゲーマーのヘッドフォンで何も聞こえないように感じることもあるかもしれません。これでは不自然なエクスペリエンスになってしまいます。実際、これらの値はゲームのオーディオ出力全体を考慮するときだけでなく、ポストプロダクション中やBGMのバランスを取るときも大事で、特に低ラウドネス測定は、見逃しがちです。以上の数値は、こちらのスクリーンショットに出ています:
この数値の意味を理解するには、耳の訓練が要求されます。次は、私の個人的な工夫やベストプラクティスを説明します。
次回は「ラウドネスプロセシングのベストプラクティス、第1章: ラウドネス測定(PART 2)」です。
コメント