라우드니스를 처리하는 최상의 방법, 제 2강: 라우드니스와 다이내믹 처리 방법

사운드 디자인

우리가 여기서 말하는 '라우드니스'는 우리가 예시로 측정하는 도시 소음이나 sound pressure level (SPL) 미터와는 다릅니다. SPL 미터는 소리 압력을 측정해요. 사실 소리 압력은 실제 공기 압력보다 약간 더 높은 공기 압력 측량입니다. 우리가 여기서 얘기할 라우드니스와는 완전히 다른 측정을 사용해요. 라우드니스는 전력 관점에서 측정할 수는 있지만 인간의 라우드니스 인지를 나타내지는 못하죠. 실제로 라우드니스는 항상 주관적입니다. 즉, 음향 심리와 관련되어 있죠. 하지만 감정적, 심리적 요인 외에 사운드가 더 '크거나' '작은지' 결정하는 패턴이 있습니다. 이 패턴은 주로 다음과 같습니다.

  • ADSR
  • 지속 시간과 잔향
  • 주파수와 주파수 반응
  • 리듬과 움직임

ADSR = Attack, Decay, Sustain, Release (어택, 디케이, 서스테인, 릴리즈)

ADSR은 Envelope(엔벨로프)라고도 불립니다. 소리의 자연적인 발생부터 소멸까지의 수명 주기를 설명하죠. 항상 네 가지 단계로 표현되며 주로 ms (혹은 밀리세컨드) 단위로 표시됩니다다. Attack이 짧을수록 라우드니스가 더 커지죠. 예를 들어 타악기의 어택은 15ms 만큼 짧을 수 있어요. 현악기(어택이 보통 50ms를 초과함)와 믹스될 경우 타악기가 더 크게 들리며 심지어 동일한 볼륨 레벨에서도 더 크게 들릴 수 있죠. 또 다른 예는 어택이 10ms 미만인 총소리입니다. 타악기보다도 훨씬 더 크게 들릴 거예요. 그렇기 때문에 경우에 따라 에셋의 어택만 잘 조절해도 라우드니스 문제를 해결할 수 있습니다.


 

1.png

2.png


길이와 잔향

소리의 길이는 보통 Decay, Sustain, Release 시간에 의해 결정됩니다. Decay가 더 길수록 에셋에서 소리가 큰 부분의 길이가 더 길어지죠. 그래서 더 크게 들리게 됩니다. 마찬가지로 Sustain이 더 길수록 소리가 더 크게 들립니다. 하지만 이 길이는 고정적이지 않아요! 그 이유는 주로 인간의 본능인 '청각적 적응 능력' 때문입니다. 사무실 안으로 걸어갈 때 에어컨 소리가 아주 크게 들린다고 가정해봅시다. 하지만 몇 분이 지나고 다른 곳으로 관심이 쏠리면 에어컨 소리에 익숙해져서 거의 알아차리지 못하게 돼요 (심심해져서 다시 에어컨으로 관심이 되돌아가기 전까지는 말이죠). 이러한 청각적 적응 능력은 '선택적 청취'의 일부입니다. 간단하게 말하자면 인간은 청각적 관심을 자극하기 위해 지속적으로 새로움과 변화가 필요해요. 하지만 사운드 디자이너로서 때로는 여러분이 이 본능과 맞서야 할 수 있습니다. 

여기서 Release는 '지연'이 아니라 사운드가 계속해서 전파되면서 점점 소멸되는 것을 말해요. 종종 잔향과 연관이 있죠. 흥미롭게도 우리는 이 Release가 효과음의 라우드니스에 얼마나 큰 영향을 끼치는지 잊어버릴 때가 많습니다. Release 섹션이라는 곳이 어디인지 찾아내지 못할 때도 있어요. 폭발음을 예로 들어볼까요. 폭발음 자체는 10ms 안에 끝나기 때문에 소리의 대부분이 사실 Release입니다. 사실 우리가 "나는 이 소리가 아주 또렷하고 강력한 느낌이었음 좋겠다"라고 말할 때는 곧 Release가 이런 소리를 만들어 내는 핵심이랍니다. 예를 들어 특정 소리를 임팩트 있게 만들고 싶지만 그렇다고 다른 소리들을 덮어버릴 만큼 크지는 않았으면 싶을 때가 많죠.  이 경우 먼저 Release의 길이를 조정해서 소리가 '자연스럽게' 사라지지 않도록 해야 합니다. 특히 사운드트랙을 작업할 때 이런 부분이 필요해요. 어떤 특수 효과가 아닌 이상 빠르게 진행되는 전투 동안 옷깃 소리를 천천히 페이드 아웃 시키는 것은 보통 아마추어적인 방법입니다. 이러한 Release는 소리가 질질 끌리게 들리도록 해요. 레이어링 방법을 사용하는 폭발음과 큰 충격음이 연달아 일어난다고 생각해보세요. 각 에셋 레이어의 Release 레벨이 낮다고 해도 순식간에 서로 겹쳐져서 레이어 당 3dB 만큼 증가하여 소리가 지저분해집니다. 총소리도 마찬가지예요. 하지만 특정 타입의 사운드는 심미적으로 '충분히 긴 꼬리'가 필요하기도 합니다. 이 경우 Decay를 보다 빠르게 만들어서 Sustain 레벨이 더 빠르게 디케이되도록 할 수 있어요. 그러면 긴 Release가 여전히 다른 사운드에 의해 쉽게 마스킹될 수 있죠. 다양한 소리를 레이어링하려면 소리 간의 볼륨 차이가 일정해야 하기 때문에 Release를 알맞게 낮은 볼륨 레벨로 유지하면 소리가 서로 '내리겹치는' 것을 막을 수 있어요.

반면 잔향은 소리의 꼬리를 더 길게 만들어줄 수 있습니다. 초기 리플렉션은 원본 소리 위에 겹쳐 들릴 때 전체 사운드를 더 크게 만들 수 있습니다. 이건 딱히 나쁜 일은 아니에요! 두 경우 모두 올바르게 사용하여 라우드니스를 제어할 수 있습니다. 예를 들어 일반 일본 게임의 UI 사운드, 특히 PS3과 PS4의 시스템 사운드의 경우 아주 조용하지만 충분히 잘 들리죠. 그 이유는 무엇일까요? 여기에는 두 가지 요소가 작용합니다. 먼저 이 소리의 잔향이 보통 1-1.5s 사이로 길기 때문에 이 아주 짧은 소리(짧기 때문에 작게 들림)를 연장하여 인지적 라우드니스를 높여줍니다. 둘째로 알맞은 잔향 타입(BGM에 적용되는 잔향에 비해)은 해당 소리를 새롭거나 '부자연스러운' 음장(音場, sound field)에 배치할 수 있습니다. 이 부자연스러움이나 새로움은 여러분의 능동적 청취를 자극하여 더 크게 들리도록 하죠.

소리가 길게 지속될 경우, 예를 들어 음악 세그먼트가 60초보다 더 길 경우, ADSR로 소리를 설명하는 것이 부적절합니다. 그래서 Shape(모양)라는 새로운 용어를 사용하죠. Shape는 소리 파형 피크 시퀀스의 외형적인 모습입니다. 이 모습을 변경하면 사운드의 라우드니스 변화를 변경할 수 있어요. 이 방법은 '셰이핑(shaping)'이라고 부릅니다. 합성과 효과에서 흔히 사용되죠 (이 부분은 나중에 더 자세하게 다루겠습니다). 셰이핑은 소리의 리듬과 라우드니스를 제어하기 위해 제가 종종 사용하는 방법이기도 합니다. 특히 최종 마무리 작업에 자주 사용해요. 셰이핑은 단지 RMS를 변경하는 것이 아니라 피크의 변화를 변경해서 서스테인되는 소리를 특정 지점에서 줄이거나 크게 만드는 것입니다. 이 작업은 리스너의 주의를 끌어들여 원하는 라우드니스 변화를 성취하도록 해줍니다.

더 많은 라우드니스 참고 자료는 제가 어릴 때 안동(AnDong) 교수님과 함께 저작한  数字音频基础(수자음빈기초) 를 참고해주세요.

이 책에서는 여러분이 참조할 수 있는 라우드니스에 대한 다양한 법칙을 소개합니다.

주파수

동일 라우드니스 윤곽(equal-loudness contour)은 이미 다들 알고 있으니 이에 대한 중요성은 굳이 말하지 않을게요. 이 곡선은 Attack으로서의 Frequency가 라우드니스 인지에 영향을 끼친다는 기본 현상을 말해줍니다. 주파수를 통해 라우드니스를 제어하는 것은 저의 관찰과 경험에 빗대어 볼 때 아주 쉽게 간과되는 것임에 틀림없습니다. 예를 들어 모바일 게임에서 350Hz 아래의 주파수 부분은 휴대폰 스피커에서 빠르게 사라집니다. 그리고 대부분의 플레이어가 헤드폰을 사용하지 않죠. 이 경우 폭발음의 저주파수를 높이면 클리핑이 일어나며 다른 사운드가 마스킹되기 때문에 전반적인 소리가 먹먹하게 막힌 것처럼 들립니다. 폭발음이 클수록 더 먹먹한 소리로 들리는 현상은 사실 누구나 동일하게 느끼는 부분이죠. 고주파수가 있기는 할까요? 네, 있습니다. 하지만 저주파수가 고주파수를 마스킹할 뿐이에요. 그렇기 때문에 소리를 밝게 유지하려면 고주파수를 높이고 동시에 불필요한 저주파수를 낮춰야 해요. 이 부분은 음악에서 베이스를 믹싱할 때 주로 생깁니다. 베이스가 두껍고 안정적이게 들리도록 하려면 저주파수를 높여서는 안돼요. 고주파수(4kHz 이상)를 높이는 것이 더 효과적입니다. 하지만 이 경우 전반적인 볼륨도 함께 올라가요. 그렇다면 이걸 어떻게 바로잡을 수 있을까요? 물론 중/중저 주파수를 낮춰야겠죠! 중주파수(1-2kHz)는 보통 소리를 가깝고 크게 만들며 고/저주파수를 어느 정도 마스킹합니다. 특정 음악 장르의 경우 여기서 언급한 중저 주파수를 필요에 따라 저주파수로 교체할 수 있어요. 그래서 볼륨과 라우드니스를 처리하는 가장 효율적인 방법은 볼륨 레벨을 조정하는 것이 아니라 중 (1-2kHz) 혹은 저-중 (500Hz 정도) 주파수를 낮추는 것입니다. 이렇게 하면 베이스의 고음과 저음이 고/저 주파수를 높이지 않고도 단단하게 들릴 수 있어요. 그러고 나면 심지어 베이스의 52Hz 아랫 부분을 감쇠하여 다른 악기를 위한 자리를 만들어 줄 수도 있죠. 앗... 어느새 믹싱에 대한 얘기를 하고 있나요? 그런 것 같죠! 하지만 이 기술은 모든 사운드 디자이너가 공부하고 마스터해야 할 기술입니다. 믹싱은 페이더를 움직이는 것이 아니에요. 믹싱은 주로 EQ를 사용하여 모든 악기의 라우드니스, 깊이, 공간적 문제를 해결하는 것입니다. 그리고 작업에 따라 다른 EQ를 사용해봐야 해요. 사용해봐야 할 EQ 처리기 타입이 이 세상엔 너무나도 많답니다.

또 다른 예시인 1kHz와 500Hz의 이야기를 들려드릴게요. 대부분의 소리의 강도는 약 500-1000Hz에, 그리고 더욱 강력한 소리의 경우 약 250Hz에 초점을 둡니다. 소리가 크지만 너무 가깝게 들리지 않도록 하려면 1000Hz를 줄여야 해요. 먼저 간단한 실험을 해볼까요. 특정 사운드에서 해당 주파수를 완전히 줄여서 이 방법이 작동하는지 들어보세요. 그런 다음 주파수를 점점 다시 올려서 효과가 작동하는 것을 확인해보세요. 부분적인 감쇠는 무슨 일이 있어도 피해야 합니다. 이런 자잘한 모핑(morphing)은 주의를 산만하게 해서 나중에 원인을 전혀 알 수 없게 만들 수 있어요. 소리가 강력하면서도 (저주파수) 억세게 (1000Hz 정도의 중저파수) 들리지만 조용한 사운드를 마스킹하지 않도록 하려면 보통 250Hz와 500Hz 사이에서 500Hz를 직접 목표로 할 수 있습니다.

모든 사운드는 파워 스펙트럼 측면에서 주요 주파수 대역을 가진다는 것을 알아야 합니다. 이 대역을 수정하기 시작하면 소리의 전체 라우드니스가 변경됩니다. 다시 말해 이 주파수 대역은 아주 중요하기 때문에 필요에 따라 다른 모든 것을 제거할 수 있어요. 예를 들어 500Hz가 어쿠스틱 전자 기타의 가장 중요한 음색이지만 이 기타가 리듬 섹션으로만 사용된다면 어떨까요? 500Hz를 차단하더라도 음악적인 기능에는 영향을 끼치지 않겠죠. 그럼 그냥 차단해버리면 어떨까요? 사실 수많은 음악에서 리듬 어쿠스틱 전자 기타의 500Hz 아래 부분을 모두 차단하는 것은 아주 흔한 일입니다. 이 이야기를 통해 알 수 있는 중요한 메시지는 바로 모든 에셋이 믹스에서 부분적인 역할을 한다는 거예요. 에셋의 독특한 음색은 곧 해당 에셋이 존재하는 이유입니다 (그렇지 않으면 왜 이 에셋을 포함시키겠어요?). 이 특색을 유지하거나 변경하도록 선택할 수 있지만, 어떤 일이 있어도 전체 믹스에 가장 영향력 있는 부분을 유지하면서 필요에 따라 다른 모든 것을 덜 중요하거나 버려야 할 요소로 생각해야 합니다. 뭔가를 유지하려고 할 경우 먼저 생각해보세요. 정말 유지해야 할까요? 그런 다음 생각해보세요. 보다 덜 중요한 주파수 대역이 그 대비 요소로 제 역할을 잘 해내나요?

또 다른 흥미로운 이야기를 들려드리겠습니다. 대다수 성인의 스펙트럴 가청 범위는 사실 20kHz에 미치지 못합니다. 저의 경우 최근 18.5kHz 정도였어요. 하지만 18kHz의 사인음은 제 귀에 아주 날카로운 느낌을 주더군요. 또한 손톱으로 칠판을 긁는 소리는 아주 시끄러운 소리만큼이나 대부분의 사람들을 미치게 만듭니다. 심지어 SPL 미터로 측정했을 때 이 소리의 레벨이 그다지 높지 않은데도 말이죠. 아주 높은 과도 신호가 있을 수 있지만 RMS는 낮을 수 있습니다.

주파수 반응을 읽는 방법은 여러분의 믹싱 스킬과 경험에 따라 달라집니다. 믹싱할 때 우리는 먼저 작업물의 전반적인 표현을 가장 중요시하며 모든 조정 사항은 큰 그림의 일부로서 작용하죠. 게임, 영화, TV 프로그램, 음악 등, 매체에 상관없이 각 구성 요소의 역할은 해당 구성 요소가 어디에 놓여야 할 지와 얼마나 확연하게 들려야 하는가를 결정합니다.

리듬과 움직임

우리가 경험하는 대부분의 소리는 복잡하면서도 항상 움직이죠. 리듬과 움직임은 우리가 인지하는 라우드니스에 영향을 끼쳐요. 예를 들어 수많은 영화에서는 스펙트럴 폭발음 전에 20-80ms 정도의 짧은 공백이 있습니다 (보통 파노라마 샷). 심지어 음악과 대사도 갑자기 멈추죠. 그 뒤에 들리는 폭발음은 아주 큰 소리로 느껴집니다. 하지만 에셋을 추출해서 볼륨 레벨과RMS를 시험해보면 인지되는 소리의 크기보다 사실 훨씬 낮다는 것을 알 수 있어요.

이 효과의 원리는 아주 간단합니다. 바로 Dynamic(다이내믹)이죠. 음향에서 다이내믹은 볼륨 차이로 정의됩니다. 간단히 말해 '피크 레벨 간의 차이점'이라고 할 수 있죠. 하지만 라우드니스 측정이 발달하면서 우리는 이제 LRA를 라우드니스 차이 측량으로 사용하여 다이내믹을 표현합니다. 이 방법은 광범위하게 사용되며 특히 큰 폭발음, 반전되거나 점점 커지는 소리의 스팅어, 혹은 뒤따르는 충돌음의 강도를 제어하는 데 사용됩니다. 경우에 따라 소리가 아주 큰 환상을 만들어낼 때, 뒤따르는 소리의 피크를 높이지 않아도 됩니다. 그 비법은 바로 주변 세그먼트 간의 피크 차이점과 공백의 길이를 제어하는 것입니다. 수많은 할리우드 영화에서 이 공백은 약 1-2초입니다. 드라마틱한 일시 정지는 청각적으로 아주 굉장한 효과를 줄 수 있어요.

연이은 소리의 주요 주파수 대역 차이는 아주 분명한 효과를 줄 수 있습니다. 기본 구성 요소로 주요 주파수 대역의 차이가 큰 베이스 드럼과 스네어 드럼을 사용하는 드럼 박자를 생각해보세요. 동일한 피크나 RMS라도 두 드럼을 올바르게 시퀀싱하면 라우드니스가 꽤 높아질 수 있습니다. 흔한 예시로 드럼 앤 베이스(Drum N'Bass)와 힙합을 들 수 있죠. 여기 두 개의 예시가 있습니다. 두 번째 절반은 동일한 스팅어이지만 반전된 첫 번째 절반은 아주 다른 주요 주파수 대역을 사용합니다. 결과를 보면 차이점을 쉽게 알아차릴 수 있어요.

 

3.png

위의 이미지에서 선택된 어두운 부분은 100ms 정도의 공백입니다.

 

스팅어 자체로만 라우드니스의 차이를 느껴볼까요.

다음은 인트로 후 공백을 사용한 스팅어입니다.

이제 박자를 살펴봅시다. [첫 번째 줄이 원본음입니다]

 

4.png

 

A. 긴 잔향을 사용한 두 번째 줄에서는 음색이 서로 잘 섞여있는 것이 들릴 거예요.

B. 잔향이 없는 세 번째 줄에서는 음색이 서로 섞이지 않으며 심지어 게이팅을 통해 분리되어 있습니다.

대부분의 사람들은 잔향이 라우드니스에 영향을 끼친다는 것을 알고 있습니다. 하지만 우리는 잔향이 ADSR의 부분을 변경할 뿐만 아니라 특정 주파수 대역을 진폭시켜서 청각적 경험을 바꾼다는 것도 분명히 이해해야 해요. 이것은 복합적인 효과입니다. 사운드 디자이너의 경우 이러한 요소를 분석하고 활용할 수 있습니다. 특히 사운드가 일시적으로 분리될 경우 청각적 연속성을 깨뜨려서 리스너가 라우드니스를 정확하게 판단하지 못할 수 있어요.

본질적으로 이 요소는 음악적인 박자이지만 타악기는 '소음' 유형에 속하는 대부분의 효과음과 거의 다를 것이 없습니다. 그래서 타악기의 연주, 음색 형성, 믹싱 방법은 효과음 제작과 유사해요. 하지만 리듬, 움직임, 주파수 차이점으로부터 생성되는 인지적 다이내믹은 일반 '효과음'보다 훨씬 알아차리기 쉽습니다. 또 다른 경험을 예로 들어볼까요. 드러머가 불안정한 템포로, 심지어 불안정한 다이내믹으로 연주할 경우 소리가 이상하거나 잘못된 음이 너무 크게 들리는 것을 알 수 있어요. 이 현상은 라우드니스가 아주 주관적이고, 개개인의 경험에 따라 달라질 수 있으며, 또한 매우 선택적이라는 것을 말해줍니다.

제가 여기서 말하지 않은 다른 상황과 방법들이 정말 많이 있습니다. 사실 여러분이 선택하는 방법은 여러분이 소리를 이해하고, 상상하고, 시도해볼 용기에 의해 결정됩니다. 정확한 정답은 존재하지 않아요. 단지 더 좋은 방법이 존재할 뿐이죠. 음악이나 영화 사운드트랙 멀티트랙 믹싱으로 믹싱 연습을 해보실 것을 권장해드립니다. 장기적으로 볼 때 이 연습을 통해 정말 많은 기술과 경험을 얻으실 수 있을 거예요.

위의 모든 내용은 여러분의 재량에 따라 논의할 거리가 더 있을 수 있습니다. 제가 틀린 것이 있다면 알려주세요. 감사히 듣겠습니다!

지에 양 (Jie Yang, 디지몽크)

사운드 디자이너

Tencent NEXT Studios (텐센트 넥스트 스튜디오)

지에 양 (Jie Yang, 디지몽크)

사운드 디자이너

Tencent NEXT Studios (텐센트 넥스트 스튜디오)

디지몽크(Digimonk)는 1998년부터 경력을 쌓아온 베테랑 게임 개발자입니다. Ubisoft (유비소프트), 2K Games (2K 게임즈), Sheng You Sheng (셩요우셩), Virtuos (버츄오스), Tencent Aurora Studios (텐센트 오로라 스튜디오)에서 일하면서 100 개가 넘는 게임의 사운드 디자인을 작업해왔습니다. 디지몽크는 현재 Tencent NEXT Studios의 오디오 디자이너입니다. 2012에는 고품질 사운드 라이브러리인 Foley Stage(폴리 스테이지)를 개인 제작하여 전세계적으로 출시하기도 했습니다. 그 후 机器之心 (Heart of Machines), 微观世界(一) (Microscopic World Vol. 1), 北风 (Northern Wind)라는 세 개의 고품질 사운드 라이브러리를 유럽, 북미, 일본, 중국에서 출시했습니다. 가장 최근 출시한 라이브러리인 火气-中国武侠特效 (the art of Magic Kungfu)는 현재 구매 가능합니다.

댓글

댓글 달기

이메일 주소는 공개되지 않습니다.

이 시리즈의 다른 글

라우드니스를 처리하는 최상의 방법, 제 1강: 라우드니스 측정 (1부)

방송과 같은 푸시 서비스, 멀티 플랫폼 상호작용 엔터테인먼트, 인터넷 스트리밍과 같은 다양한 미디어 형식에서 라우드니스는 단지 신호 전달 표준이 아니라 소비자 선호에 직접적인...

12.11.2019 - 작성자: 지에 양 (Jie Yang, 디지몽크)

라우드니스를 처리하는 최상의 방법, 제 1강: 라우드니스 측정 (2부)

이전 블로그인 라우드니스를 처리하는 최상의 방법, 제 1강: 라우드니스 측정 (1부)에서는 지에 양 (디지몽크) 님이 다양한 플랫폼과 콘텐츠 타입에 대한 오디오 표준의 도전 과제와...

20.11.2019 - 작성자: 지에 양 (Jie Yang, 디지몽크)

라우드니스를 처리하는 최상의 방법, 제 3강: 게임을 위한 측정 가능한 라우드니스 처리

우리는 대부분의 경우 복잡한 사운드를 다룹니다. 게임에서는 각 사운드가 전반적인 출력 라우드니스에 기여합니다. 영화나 텔레비전 제작과 달리 작은 세그먼트의 다이내믹과 주파수 반응을...

27.5.2020 - 작성자: 지에 양 (Jie Yang, 디지몽크)

이 시리즈의 다른 글

라우드니스를 처리하는 최상의 방법, 제 1강: 라우드니스 측정 (1부)

방송과 같은 푸시 서비스, 멀티 플랫폼 상호작용 엔터테인먼트, 인터넷 스트리밍과 같은 다양한 미디어 형식에서 라우드니스는 단지 신호 전달 표준이 아니라 소비자 선호에 직접적인...

라우드니스를 처리하는 최상의 방법, 제 1강: 라우드니스 측정 (2부)

이전 블로그인 라우드니스를 처리하는 최상의 방법, 제 1강: 라우드니스 측정 (1부)에서는 지에 양 (디지몽크) 님이 다양한 플랫폼과 콘텐츠 타입에 대한 오디오 표준의 도전 과제와...

라우드니스를 처리하는 최상의 방법, 제 3강: 게임을 위한 측정 가능한 라우드니스 처리

우리는 대부분의 경우 복잡한 사운드를 다룹니다. 게임에서는 각 사운드가 전반적인 출력 라우드니스에 기여합니다. 영화나 텔레비전 제작과 달리 작은 세그먼트의 다이내믹과 주파수 반응을...