Музыкальный портал
info@topzvuk.com

Динамический диапазон и война за громкость

Динамический диапазон и война за громкость
0

Динамический диапазон и война за громкость

Дата публикации: 22 марта 2015, 14:43
Нравится
Нравится
Часть первая. Динамический диапазон и война за громкость
«Почему музыка стала звучать хуже». «Поклонники жалуются, что Death Magnetic в Guitar Hero звучит лучше, чем на CD». «Даже фанаты хеви-метала считают, что сегодняшняя музыка слишком громкая!» «Dynamic Range Day объявляет новое движение против громкости». «Смерть Hi-Fi»… В прессе и сети растёт движение против «войны за громкость», практики, когда люди пытаются получить максимально возможную громкость в своих треках, чтобы заставить слушателей ощущать их более «горячими» по сравнению с конкурирующими релизами. Согласно этим статьям, неблагоразумные методы мастеринга и, более конкретно, злоупотребление brickwall-ограничителями, ставят музыку под угрозу. В современном производстве не хватает детальности, и оно жертвует качеством ради уровня. Боб Дилан в 2006 году в своём интервью заявил, что «Вы слушаете эти современные альбомы, и они звучат просто по-зверски. У них один звук везде. Нет никакой чёткости и детальности, ни в вокале, ни в чём-то другом. Всё статично».

Но не является ли замечание Дилана отражением извечного конфликта между отцами и детьми? Это был бы не первый случай, когда старая гвардия презирает то, что делает новое поколение. Хотя, верно и то, что многие звукоинженеры присоединяются к обществу, предпочитающему «более динамичную» музыку. Но объективно ли они говорят о том, что такая музыка лучше, или они просто предпочитают какой-то определённый тип звучания? Моё исследование постарается дать ответы на эти вопросы. Мы узнаем, действительно ли стала громче современная музыка, и стало ли в ней меньше динамики. Мы также рассмотрим гипотезу, что громкость может быть стилистическим признаком специфических музыкальных жанров, а не «дурной манерой», мотивированной презренными коммерческими интересами. И, наконец, мы пристально поглядим на печально известный альбом Death Magnetic группы Metallica и выясним, почему многим людям кажется, что он звучит плохо.

Часть вторая. Действительно ли теперь музыка стала громче?
Да, это так, и здесь нет никаких сомнений. Давайте возьмём большое количество известных поп-песен, записанных в промежутке между 1969 и 2010 годами, нормализуем их так, чтобы пики стали под 0 dBFS, и измерим значение RMS. Теперь давайте рассортируем все значения согласно году релиза каждой песни. Первая диаграмма (вверху) показывает результаты эксперимента, и они реально возбуждают! Красная линия показывает усреднённые значения RMS для каждого года, а прямоугольники показывают распределение: чем темнее, тем больше песен имеет такой же уровень. Здесь, несомненно, наблюдается постоянный рост среднего уровня между 1982 и 2005 годами, и сегодняшние записи примерно на 5 dB громче, чем было в 70-х.

DR_01.jpg

По общему признанию, RMS даёт только информацию об «электрическом» или «физическом» уровне аудиофайла, но никак не говорит о той громкости, что мы реально воспринимаем. Для этого, согласно нормативным рекомендациям EBU 3341, мы оцениваем «интегрированную громкость». Как видно на второй диаграмме, это значение весьма сильно коррелируется с RMS, и два графика очень похожи друг на друга. Таким образом, второй набор результатов подтверждает первый.

Давайте воспользуемся другими критериями и повторим эксперимент. К примеру, для описания динамического поведения музыки часто используется такой критерий, как крест-фактор. Говоря простыми словами, он показывает разницу между пиковым и RMS-уровнями на протяжении песни. Он является хорошим маркером, позволяющим оценить количество компрессии, применённой к музыке: обычно, чем больше компрессии, тем ниже крест-фактор. Некоторые профессионалы считают аккуратное обращение с крест-фактором залогом успешного мастеринга. В общих словах, опять же, чем ниже крест-фактор, тем громче музыка.

Третья диаграмма показывает эволюцию крест-фактора. Основываясь на тех же самых 4500 песен, этот усреднённый график, начиная с 80-х годов, показывает падение на 3 dB. Это укрепляет нас во мнении, что увеличение громкости, явно начавшееся с 90-х, было порождено компрессией. Нетрудно заметить, что эволюцию крест-фактора можно разделить на три этапа. Первый, с 1969 по 1980-й, показывает увеличение крест-фактора, обусловленное, вероятно, совершенствованием студийного оборудования, улучшением отношения сигнал/шум и, как следствие, расширением его динамического диапазона. С 1980 по 1990-й крест-фактор остаётся довольно устойчивым. Затем, с 1990 по 2010-й – в эпоху войны за громкость – крест-фактор драматически уменьшается.

Наконец, ещё один полезный и информативный критерий – это пропорция сэмплов, после нормализации близко подобравшихся к потолку 0 dBFS. Большая плотность очень громких сэмплов предполагает, что в мастер-копии был клиппинг или использовался цифровой brickwall-ограничитель. Четвёртая диаграмма отслеживает плотность пиковых сэмплов в той же самой коллекции из 4500 треков. Первые две диаграммы показывают, что музыка становится громче; третья указывает, что это происходит, вероятно, в результате компрессии динамического диапазона; а эта иллюстрирует, что компрессия, скорее всего, сопровождалась цифровым brickwall-ограничением. 

Часть третья. Что такое динамический диапазон музыки?
Вы удивитесь, но на этот вопрос довольно трудно ответить. Интуитивно, мы чувствуем, что динамический диапазон это некий критерий, показывающий, насколько варьируется уровень в музыкальной композиции. Давайте попробуем материализовать эти догадки. Первая диаграмма сравнивает значения RMS в двух песнях: «Fuk» от Plastikman и «Smells Like Teen Spirit» от Nirvana. Очевидно, что уровень в Smells Like Teen Spirit более подвижен, чем в Fuk. И это не удивляет, поскольку Plastikman приверженец минимал-техно, тогда как для Nirvana характерны мягкие куплеты и громкие припевы.

Однако, результат меняется просто радикально, если для анализа использовать окно не 2 секунды, а 100 миллисекунд. При большем окне музыка Plastikman демонстрирует более стабильный RMS-уровень, но, как Вы видите на второй диаграмме, при меньшем времени интеграции в ней появляются более интенсивные вариации. Это обусловлено громкими и сухими барабанами. Поэтому, если мы хотим объективно измерить «подвижность уровня», то должны тщательно подумать над тем, какой масштаб использовать.

Также есть вопрос по поводу того, как фактически вычислить эту подвижность уровня. Иными словами, как получить цифровое значение, которое было бы мерой «динамического диапазона». Очевидно, мы могли бы измерить полную вертикальную амплитуду кривой RMS в заданном временном масштабе, суммируя амплитуду каждого вертикального движения. На первый взгляд, это даёт идеальную картину: снова посмотрите на первую диаграмму, на которой синяя кривая выглядит более подвижной, чем красная, и имеет большую общую вертикальную амплитуду.

Однако, на практике, этот метод ненадёжен. К примеру, изолированный пик посреди плоской RMS-кривой исказит измерение, давая ложное представление подвижности уровня. Существует более надёжный метод, используемый EBU для оценки диапазона громкости. Он заключается в вычислении распределения значений RMS. Такое распределение показано в третьей диаграмме. Затем мы измерили «разброс» распределения, используя трюк, подобный методу вероятностной выборки из арсенала описательной статистики, оставив только 5% высших значений и 10% низших. Результаты анализа в двухсекундном окне показывают более широкий разброс RMS у Smells Like Teen Spirit.

Давайте теперь изменим масштаб и измерим разброс RMS в окне 0,1 секунды. Итоги эксперимента показаны в четвёртой диаграмме и снова результаты прямо противоположны: разброс в Fuk намного больше, чем в Smells Like Teen Spirit. Теперь, проведём этот же эксперимент с другими размерами окна. Результаты представлены в последней диаграмме. Интересно, что вариации уровня в Smells Like Teen Spirit всегда больше, за исключением окон менее 0,18 секунды. Это как раз тот временной промежуток, где барабаны Fuk оказывают решающее влияние.

То, что изображено на пятой диаграмме, является хорошей кандидатурой на роль измерителя «динамического диапазона» музыки. Теперь предположим, что вместо того, чтобы пользоваться значениями RMS, мы будем иметь дело с некой единицей измерения воспринимаемой громкости, типа той, что упомянута в рекомендации ITU BS 1770. Это и есть тот самый «диапазон громкости». Основы того, как EBU определяет «диапазон громкости» находятся в документе EBU Tech 3342 и объясняются нами в главе «Измерение диапазона громкости по методике EBU».

Теперь остаётся только вопрос, нужно ли вообще использовать такой термин, как «динамический диапазон». Нет никакого официального определения для него, и это понятие можно спутать с динамическим диапазоном носителя записи, который показывает разницу между самым маленьким и самым большим уровнями, с которыми он может работать. Поэтому, в этой статье я не буду говорить о «динамическом диапазоне» музыки. Вместо этого, я буду использовать такие термины, как «RMS-вариабельность» или, в более широком смысле, «динамическая вариабельность». А термин «динамический диапазон» мы оставим для определения отношения сигнал/шум носителя записи. Я буду использовать термин «диапазон громкости» в строгом соответствии с документом EBU 3342 и термин «вариабельность громкости» во всех других случаях, вовлекающих понятие громкости вместо RMS.

DR_02.JPG

Часть четвертая. Так уменьшился ли диапазон громкости?
А вот здесь нас уже ждут сюрпризы. Мы можем без всяких сомнений доказать, что «война за громкость» никак не уменьшила диапазон громкости, описанный в EBU 3342! И при этом никак не уменьшилась вариабельность уровня или громкости. Кажется, что музыка последнего десятилетия имеет такую же динамическую вариабельность, как и музыка из 70-х или 80-х. Давайте докажем это утверждение.

Как мы уже говорили, такие параметры, как RMS-уровень, интегрированная громкость, крест-фактор и пропорция сэмплов выше -1dBFS, демонстрируют нам захватывающую эволюцию - начиная с 90-х и где-то до 2005 года. Это эффект войны за громкость. И, вроде бы, результаты измерений диапазона громкости по методике EBU тоже должны следовать за этой тенденцией? Но, как мы видим на первой диаграмме, это не так. Мы видим, что диапазон громкости уменьшается с 1969 по 1980-й годы, и затем стабилизируется до 1991-го. После 1991-го он неожиданно возрастает и в последующие годы совершенно не демонстрирует никакой предсказуемой тенденции к уменьшению.

Как мы уже говорили, плотность высокоуровневых сэмплов резко возросла с начала 90-х. Это показывает, что стало использоваться больше компрессии и цифрового ограничения, в результате чего увеличился общий уровень той музыкальной коллекции, которую мы тут анализируем. Но связано ли использование цифровых ограничителей с уменьшением диапазона громкости? Давайте ответим на этот вопрос, сравнив значения, измеренные по методике EBU 3342, с плотностью высокоуровневых сэмплов. Графики представлены на второй диаграмме, и они нам очень ясно показывают, что ответ – нет. Увеличение «тяжести» ограничения, происходившее в процессе наращивания войны за громкость, в общем, никаким образом не уменьшало наблюдаемый диапазон громкости.

Нельзя сказать, что brickwall-ограничители не уменьшают диапазон громкости. Как мы увидим позже, они это успешно делают. Наблюдение заключается в том, что при анализе этих треков мы приходим к выводу, что война за громкость не привела к любому заметному сокращению диапазона громкости.

Однако, «диапазон громкости» по методике EBU 3342 измеряется с размером окна около 3 секунд. Давайте посмотрим, что произойдёт, если для анализа выбрать другой размер окна (блока). Для этого оценим стробированную RMS-вариабельность, основанную на размерах окна от 0,05 до 12,8 секунд. И, чтобы ещё больше конкретизировать результаты, модифицируем эту оценку так, чтобы она отражала влияние соответствующих временных окон. Этим путём мы сможем увидеть, уменьшала ли война за громкость вариабельность уровня при использовании любого окна измерения. Результаты экспериментов на третьей диаграмме. Мало того, что они подтверждают предыдущие исследования, но и идут немного далее, показывая, что война за громкость не имеет явно идентифицируемого влияния на вариабельность уровня. Это весьма решительное заключение: вопреки тому, что часто пишут в Интернете, война за громкость не вызвала никакого уменьшения вариабельности уровня. Современные песни такие же, как в 70-х или 80-х.

Чтобы подтвердить эти результаты, я попросила доктора Damien Tardieu (специалиста по обработке сигналов из института IRCAM) выполнить аналогичные исследования с абсолютно другим набором музыкальных композиций. Для этого, 20000 песен были случайно выбраны из каталога EMI. Правда, эти альбомы отбирались на основании даты копирайта, что несколько уменьшило надёжность этого анализа, поскольку старые треки могут иметь недавний копирайт или ремастерённые версии. Однако, нам нужна общая оценка этого глобального явления, поэтому можно позволить небольшую погрешность. Четвёртая и пятая диаграммы показывают эволюцию диапазона громкости, измеренного в соответствии с EBU 3342, и плотность высокоуровневых сэмплов. Мы видим, что диапазон громкости не уменьшился после 1990 года, причём, несмотря на то, что ограничение стало использоваться всё тяжелее и тяжелее. Нет никаких сомнений: из-за войны за громкость не возникло никакого явного уменьшения её диапазона, и brickwall-ограничители практически не повлияли на этот параметр.

Часть пятая. Так в чём же противоречие?
Как мы уже говорили, количество компрессии/ограничения, используемого при мастеринге, резко выросло между 1990 и 2000 годами. Однако, хотя ограничение во многих случаях уменьшает диапазон громкости музыкальной композиции (глава «Диапазон громкости и ограничители»), мы не наблюдаем общее понижение этого параметра во всём музыкальном производстве. Так как же мы можем разрешить это очевидное противоречие?

Возможно, мастеринг-инженеры нашли разумные щадящие методики, применяя лишь столько ограничения, чтобы не привести к очевидной потере диапазона громкости. Как показано в главе «Диапазон громкости и ограничители», это теоретически возможно, поскольку RMS-вариабельность может иметь определённую «эластичность» по отношению к этой обработке. Но я не верю, что дело обстоит именно так. Существенное ограничение можно измерить или увидеть в характерных изменениях формы звуковой волны. Кроме того, его легко услышать: звуки приобретают специфическую атаку, становятся плотнее, жёстче и зачастую ярче. Прослушав очень большое количество треков из коллекции, использованной при написании этой статьи, вполне очевидно, что значительная часть недавних песен подверглась тяжёлой динамической обработке.

Остаётся только одно решение, о котором я могу думать: возможно, диапазон громкости музыки до мастеринга (или даже до микширования) также возрастал одновременно с тем, как возрастало количество компрессии и ограничения. Иными словами, исходный материал имел больше первичной вариабельности и больше эластичности к ограничению. Это подтверждается стилистическими изменениями, произошедшими в музыке во время войны за громкость. Начало 90-х (когда, в общем-то, и стартовала война за громкость), отмечено ростом популярности рэп-музыки и появлением большого количества исполнителей в этом жанре. Рэп типично имеет довольно разрежённую аранжировку с очень громкими большим и малым барабанами, которые значительно увеличивают вариабельность уровня в очень малых масштабах (0,1 секунды или около того). Примерно в то же самое время, родился такой стиль, как nu metal, объединивший в себе элементы фанка и рэпа. Также, во многих песнях изменился и подход к аранжировке, а именно, к переходам от одной секции к другой. Многие хиты 80-х использовали в качестве перехода достаточно гладкий брэк, сыгранный на том-томах, тогда как рэп-продюсеры 90-х предпочитали резкий «монтаж» звуков, увеличивающий вариабельность уровня в масштабах около 0,5 с.

Если воспользоваться большими масштабами, относящимися к структуре песен, можно выдвинуть идею, что современные треки используют контрасты уровня, чтобы очертить различные секции песни, тогда как старые композиции использовали для этого изменения тональности или гармонии. Сейчас часто можно услышать рэп или R&B, где куплеты настолько минималистичны, что там практически невозможно разобрать какие-то аккорды, но зато припевы похоронены под плотными вокальными гармониями и/или богатыми клавишными партиями, увеличивающими RMS-уровень. Хорошие примеры – «Lollipop» от Lil’Wayne и «Gangsta’s Paradise» от Coolio, или, до некоторой степени, «Single Ladies» от Beyonce. В таких композициях, вариации уровня используются для создания структуры песни.

Чтобы лучше иллюстрировать этот момент, давайте сравним две совершенно разные пенсии из разных эпох: Beatles «Come Together» (1969) и Lady Gaga «Telephone» (2010). На диаграмме показан анализ RMS для обеих песен. Белые линии отображают структурные границы песен, определяемые слухом. Более светлые квадраты указывают на части с отличающимся от других фрагментов уровнем, а более тёмные указывают на части с похожими уровнями. Это сравнение – показательный пример: в Telephone больше крупномасштабных изменений уровня и они сильно синхронизированы со структурой песни. Этот пример помогает объяснить идею, что в современной музыке первичная крупномасштабная RMS-вариабельность может иметь больший размах.

Часть шестая. Может ли музыка, обработанная ограничителями, иметь музыкальную динамику?
Определённо. Но путь, которым выражается музыкальная динамика, может измениться. Представьте, что Вы слушаете музыку. И захотели сделать её громче. Вы просто вращаете регулятор уровня и поднимаете его значение. Заодно Вы увеличиваете RMS и пиковый уровень, но это никак не затрагивает крест-фактор. Назовём это термином «первая парадигма громкости». Теперь предположим, что есть регион в Pro Tools, пики которого достигают 0 dBFS. Вы не можете поднять уровень традиционным способом, поскольку в результате возникнут искажения. Но мы можем вставить туда ограничитель и понизить его порог. Благодаря этому, Вы сможете поднять RMS, но при этом пиковый уровень останется стабильным. А вот крест-фактор уже будет уменьшен. Назовём это «вторая парадигма громкости».

Когда Вагнер сочинял оркестровое крещендо, то использовал первую парадигму, добавляя больше инструментов. Но при помощи ограничителя можно сделать крещендо на основе второй парадигмы. Результаты обоих подходов показаны на иллюстрации. Mike Oldfield (слева) использовал первую парадигму в конце первой части Tubular Bells, а Trent Reznor (справа) использовал вторую в «Closer».

Чтобы получить более точное представление о различиях между парадигмами, давайте возьмём шесть крещендо из шести различных треков. Трое из них будут представлять первую парадигму и трое – вторую. Теперь проанализируем их RMS, пиковый уровень и крест-фактор. Результаты показаны на нижней иллюстрации. Левый график показывает все крещендо, основанные на увеличении RMS и пикового уровня. Средний график показывает крещендо на основе второй парадигмы, когда пиковый уровень остаётся неизменным. Правый график показывает систематическое уменьшение крест-фактора для второй тройки и демонстрирует, что в первой тройке нет никакой связи между ним и громкостью.

Можно сказать, что крещендо, использующие вторую парадигму, не являются «чисто» динамическими событиями: чем громче становится музыка, тем сильнее ограничитель влияет на сигнал и тем сильнее изменяется оригинальный тембр. Но разве не это же верно и для традиционного крещендо? Исполняя крещендо на одной скрипичной ноте, мы не только изменяем уровень, но и тембр. А многие оркестровые крещендо вводят дополнительные инструменты в процессе своего развития. В результате, комбинация этих двух факторов вызывает более глубокие изменения тембра, нежели любой brickwall-ограничитель.

Часть седьмая. Случай Death Magnetic
Не столь давний альбом группы Metallica стал очень сильным раздражителем для противников текущей моды в мастеринге. Насколько я могу сказать, основная проблема Death Magnetic – это конфликт между звучанием гитар и тем способом мастеринга, которым обрабатывался этот альбом. Очень агрессивный мастеринг просто не подходит к «производственному» стилю этой группы, более характерному для 80-х и опирающемуся на плотные искажённые гитары, заполняющие собой большую часть звукового пространства. Эта музыка и так имеет достаточно стабильный уровень, а в этом случае её крест-фактор был понижен до очень малых значений. В результате, её звучание воспринимается на слух как очень «компактное» и статичное на протяжении всего времени.

P.S. Под «компактностью» здесь подразумевается такое звучание, когда всё играет очень близко к слушателю, чуть ли не прямо ему в ухо. Подобный тип звука также называется in-your-face, и в контексте данной статьи рассматривается его крайне гипертрофированный вариант.

Первая диаграмма показывает распределение крест-фактора для 4500 песен и значения этого параметра для альбомов Master Of Puppets и Death Magnetic. Анализ других альбомов Metallica, таких, как ...And Justice For All или Black, показывает, что значения их крест-фактора примерно такие же, как и в Master Of Puppets. Мы видим, что крест-фактор Death Magnetic не только значительно ниже, чем у «нормальных» альбомов Metallica, но и чрезвычайно низок по сравнению с любой другой музыкой.

Такие значения крест-фактора сопоставимы с тем, что можно обнаружить в треках My Beautiful Dark Twisted Fantasy от Kanye West или Get Rich Or Die Tryin’ от 50 Cent. Эта стилистически громкая музыка базируется на сильных перкуссионных элементах, артикулирующих текст и лучше сочетающихся с низкими значениями крест-фактора, чем постоянно гудящие гитары Metallica. Они также сопоставимы с треками из Oracular Spectacular или Congratulations от MGMT. Эти два альбома имеют настолько специфическое звучание, что постоянное использование второй парадигмы громкости и наличие артефактов динамической компрессии для них не представляют совершенно никакой проблемы. Но «классический» звук Metallica просто не сочетается с такими методами обработки.

Вторая диаграмма показывает RMS-вариабельность Death Magnetic по сравнению с их же альбомом Master Of Puppets и двумя другими альбомами с низким крест-фактором: My Beautiful Dark Twisted Fantasy и Congratulations. И вот здесь начинаются реальные проблемы. Из-за низкого крест-фактора он звучит не только очень «компактно», но и очень статично (малая RMS-вариабельность). Третья диаграмма подводит итоги, показывая, насколько необычна эта комбинация низкого крест-фактора и уменьшенного диапазона громкости. Это можно сравнить, разве что, не более чем с тремя песнями MGMT. Даже невероятно компрессированный My Beautiful Dark Twisted Fantasy не может конкурировать с ним, сохраняя в себе больше контраста, чем Death Magnetic. И, хотя низкая вариабельность его RMS примерно сравнима с музыкой группы Dagoba (исполняет индастриал-метал и специализируется на эффектно громком, компактном и «жирном» звуке), Death Magnetic компрессирован ещё более свирепо. Но, по моему мнению, Вы вряд ли захотите, чтобы традиционный хеви-метал звучал более «компактно», чем преднамеренно экстремальный industrial/death metal. Хотя, если Вы стремитесь именно к этому, то должны сами изменить свою музыку, создав в ней больше контраста. Только так Вы сможете позволить себе такую сильную компрессию и даже получить от неё какие-то дополнительные выгоды.

Часть восьмая. Так представляет ли проблему война за громкость?
Не составит труда найти массу людей, публикаций в прессе и Интернете, единодушно обвиняющих войну за громкость в том, что она разрушает музыку. Многие связывают её с уменьшением «динамического диапазона», хотя никто обычно не объясняет, каким он должен быть. Однако, как мы узнали в этой статье, война за громкость фактически не привела к уменьшению такого параметра, как диапазон громкости, определённый по методике EBU 3342 (по сути дела, это довольно близко к тому, что люди как раз и подразумевают под словами «динамический диапазон»). При этом, невозможно установить никакого уменьшения динамической вариабельности ни в каком масштабе.

Так что ж за проблема с войной за громкость? Очевидно, ограничение делает что-то «неправильное» с сигналом, иначе б люди не жаловались – даже при том, что они указывают на не совсем корректный критерий, описывающий его параметры.

Чтобы правильно ответить на этот вопрос, попробуем представить, что звук – это фотография, и сделаем анализ этого «фото» по такому параметру, как распределение яркостей. У Фотошопа это можно найти в диалоговом окне Levels. Чтобы сделать оценку, алгоритм проверяет все пиксели в картинке и затем сортирует в зависимости от яркости. В результате, получается график распределения, показывающий, включает ли изображение преимущественно светлые, средние и тёмные области, и их относительные пропорции. Тот же самый процесс можно провернуть и со звуковыми файлами: мы проверяем все сэмплы в песне и сортируем их по абсолютному уровню. Как показано на иллюстрации, кривая распределения может рассказать много интересного.

Посмотрим на кривую распределения для песен, выпущенных в 2007 году (красная кривая). Их пики имеют более высокий уровень, чем в песнях 1967 года (синяя кривая). Очевидно, что более новые песни в среднем намного громче. Следующим делом, посмотрим на ширину обеих кривых: они сравнимы, и это означает, что кое-какие вещи, близкие к динамической вариабельности, остались неизменными между 1967 и 2007 годами. Теперь посмотрим на всплеск в правой стороне красной кривой. Он показывает, что песни этого года имеют ненормально высокую плотность высокоуровневых сэмплов: кривая перестаёт следовать за «нормальным» распределением Гаусса в зоне высоких уровней. Это результат воздействия brickwall-ограничителей.

Продолжим сравнивать звук и изображение. Представим, будто последние 20 лет все картинки в журналах и книгах становились всё ярче и ярче. В них всё ещё есть глубокий чёрный цвет, контраст не повреждён, но при этом все картинки выглядят очень яркими. Подобные вещи иллюстрируют нам две фотографии Тауэра. Можно подумать, будто всё в наши дни прямо таки «сияет», хотя здравый смысл предполагает, что есть какие-то вещи, которые не могут быть настолько сияющими ни при каких условиях. Это тем более верно в случае со звуком, для которого «яркость» означает не только высокую плотность засвеченных пикселей. Это также означает уменьшенный крест-фактор, изменённую огибающую, использование второй парадигмы громкости и, в особо тяжёлых случаях, искажение. Хотя, в общем-то, эти характеристики не обязательно означают что-то плохое, но всё-таки здравый смысл нам подсказывает, что такого не должно быть буквально в каждой записи.

В конце концов, это всё – вопрос стиля. Уменьшенный крест-фактор создаёт «компактность» в звучании; и на странице MaxxBCL компания Waves описывает это как «тяжёлый in-your-face сигнал, что сотрясает дом». Подобные вещи могут подойти к Вашим песням, а может и нет. Или, может быть, Вы нарочно захотите оставить «мягкость» в своих треках. Хотя, если Вы делаете тяжёлую техно-музыку, стремление к «компактности» может быть хорошей идеей. Также, описанные ранее две парадигмы громкости обладают весьма отличающимися «ароматами», и, в зависимости от материала и художественных целей, можно предпочесть тот или иной вариант. Хотите, чтобы каждая громкая атака изменялась компрессором/ограничителем? В одних случаях это пойдёт на пользу, в других – во вред. Или, может Вы хотите просто уменьшить динамический диапазон музыки и не затронуть более ничего? В таком случае, лучше активнее пользоваться автоматизацией уровня, нежели ограничением, поскольку, как мы уже говорили ранее, диапазон громкости имеет определённую сопротивляемость к процессу ограничения.

Важно понимать, что делаете, и как это соотносится с тем звуком, к которому Вы стремитесь. И если Вам нравится компрессия, но Вы боитесь, что Боб Дилан не одобрит Ваш звук, потому что он «слишком современный» и «слишком статичный», то не волнуйтесь. Скорее всего, он просто не слушает такую музыку.

Автор статьи: Эммануэль Дерюти (Статья опубликована в журнале Sound on Sound)

Динамический диапазон и война за громкость

<div><b>Часть первая. Динамический диапазон и война за громкость</b></div> <div>«Почему музыка стала звучать хуже». «Поклонники жалуются, что Death Magnetic в Guitar Hero звучит лучше, чем на CD». «Даже фанаты хеви-метала считают, что сегодняшняя музыка слишком громкая!» «Dynamic Range Day объявляет новое движение против громкости». «Смерть Hi-Fi»… В прессе и сети растёт движение против «войны за громкость», практики, когда люди пытаются получить максимально возможную громкость в своих треках, чтобы заставить слушателей ощущать их более «горячими» по сравнению с конкурирующими релизами. Согласно этим статьям, неблагоразумные методы мастеринга и, более конкретно, злоупотребление brickwall-ограничителями, ставят музыку под угрозу. В современном производстве не хватает детальности, и оно жертвует качеством ради уровня. Боб Дилан в 2006 году в своём интервью заявил, что «Вы слушаете эти современные альбомы, и они звучат просто по-зверски. У них один звук везде. Нет никакой чёткости и детальности, ни в вокале, ни в чём-то другом. Всё статично».</div> <div> <br /> </div> <div>Но не является ли замечание Дилана отражением извечного конфликта между отцами и детьми? Это был бы не первый случай, когда старая гвардия презирает то, что делает новое поколение. Хотя, верно и то, что многие звукоинженеры присоединяются к обществу, предпочитающему «более динамичную» музыку. Но объективно ли они говорят о том, что такая музыка лучше, или они просто предпочитают какой-то определённый тип звучания? Моё исследование постарается дать ответы на эти вопросы. Мы узнаем, действительно ли стала громче современная музыка, и стало ли в ней меньше динамики. Мы также рассмотрим гипотезу, что громкость может быть стилистическим признаком специфических музыкальных жанров, а не «дурной манерой», мотивированной презренными коммерческими интересами. И, наконец, мы пристально поглядим на печально известный альбом Death Magnetic группы Metallica и выясним, почему многим людям кажется, что он звучит плохо.</div> <div> <br /> </div> <div><b>Часть вторая. Действительно ли теперь музыка стала громче?</b></div> <div>Да, это так, и здесь нет никаких сомнений. Давайте возьмём большое количество известных поп-песен, записанных в промежутке между 1969 и 2010 годами, нормализуем их так, чтобы пики стали под 0 dBFS, и измерим значение RMS. Теперь давайте рассортируем все значения согласно году релиза каждой песни. Первая диаграмма (вверху) показывает результаты эксперимента, и они реально возбуждают! Красная линия показывает усреднённые значения RMS для каждого года, а прямоугольники показывают распределение: чем темнее, тем больше песен имеет такой же уровень. Здесь, несомненно, наблюдается постоянный рост среднего уровня между 1982 и 2005 годами, и сегодняшние записи примерно на 5 dB громче, чем было в 70-х.</div> <div> <br /> </div> <div><img src="/upload/medialibrary/8ea/DR_01.jpg" title="DR_01.jpg" border="0" alt="DR_01.jpg" width="616" height="1023" /> <br /> </div> <div> <br /> </div> <div>По общему признанию, RMS даёт только информацию об «электрическом» или «физическом» уровне аудиофайла, но никак не говорит о той громкости, что мы реально воспринимаем. Для этого, согласно нормативным рекомендациям EBU 3341, мы оцениваем «интегрированную громкость». Как видно на второй диаграмме, это значение весьма сильно коррелируется с RMS, и два графика очень похожи друг на друга. Таким образом, второй набор результатов подтверждает первый.</div> <div> <br /> </div> <div>Давайте воспользуемся другими критериями и повторим эксперимент. К примеру, для описания динамического поведения музыки часто используется такой критерий, как крест-фактор. Говоря простыми словами, он показывает разницу между пиковым и RMS-уровнями на протяжении песни. Он является хорошим маркером, позволяющим оценить количество компрессии, применённой к музыке: обычно, чем больше компрессии, тем ниже крест-фактор. Некоторые профессионалы считают аккуратное обращение с крест-фактором залогом успешного мастеринга. В общих словах, опять же, чем ниже крест-фактор, тем громче музыка.</div> <div> <br /> </div> <div>Третья диаграмма показывает эволюцию крест-фактора. Основываясь на тех же самых 4500 песен, этот усреднённый график, начиная с 80-х годов, показывает падение на 3 dB. Это укрепляет нас во мнении, что увеличение громкости, явно начавшееся с 90-х, было порождено компрессией. Нетрудно заметить, что эволюцию крест-фактора можно разделить на три этапа. Первый, с 1969 по 1980-й, показывает увеличение крест-фактора, обусловленное, вероятно, совершенствованием студийного оборудования, улучшением отношения сигнал/шум и, как следствие, расширением его динамического диапазона. С 1980 по 1990-й крест-фактор остаётся довольно устойчивым. Затем, с 1990 по 2010-й – в эпоху войны за громкость – крест-фактор драматически уменьшается.</div> <div> <br /> </div> <div>Наконец, ещё один полезный и информативный критерий – это пропорция сэмплов, после нормализации близко подобравшихся к потолку 0 dBFS. Большая плотность очень громких сэмплов предполагает, что в мастер-копии был клиппинг или использовался цифровой brickwall-ограничитель. Четвёртая диаграмма отслеживает плотность пиковых сэмплов в той же самой коллекции из 4500 треков. Первые две диаграммы показывают, что музыка становится громче; третья указывает, что это происходит, вероятно, в результате компрессии динамического диапазона; а эта иллюстрирует, что компрессия, скорее всего, сопровождалась цифровым brickwall-ограничением. </div> <div> <br /> </div> <div><b>Часть третья. Что такое динамический диапазон музыки?</b></div> <div>Вы удивитесь, но на этот вопрос довольно трудно ответить. Интуитивно, мы чувствуем, что динамический диапазон это некий критерий, показывающий, насколько варьируется уровень в музыкальной композиции. Давайте попробуем материализовать эти догадки. Первая диаграмма сравнивает значения RMS в двух песнях: «Fuk» от Plastikman и «Smells Like Teen Spirit» от Nirvana. Очевидно, что уровень в Smells Like Teen Spirit более подвижен, чем в Fuk. И это не удивляет, поскольку Plastikman приверженец минимал-техно, тогда как для Nirvana характерны мягкие куплеты и громкие припевы.</div> <div> <br /> </div> <div>Однако, результат меняется просто радикально, если для анализа использовать окно не 2 секунды, а 100 миллисекунд. При большем окне музыка Plastikman демонстрирует более стабильный RMS-уровень, но, как Вы видите на второй диаграмме, при меньшем времени интеграции в ней появляются более интенсивные вариации. Это обусловлено громкими и сухими барабанами. Поэтому, если мы хотим объективно измерить «подвижность уровня», то должны тщательно подумать над тем, какой масштаб использовать.</div> <div> <br /> </div> <div>Также есть вопрос по поводу того, как фактически вычислить эту подвижность уровня. Иными словами, как получить цифровое значение, которое было бы мерой «динамического диапазона». Очевидно, мы могли бы измерить полную вертикальную амплитуду кривой RMS в заданном временном масштабе, суммируя амплитуду каждого вертикального движения. На первый взгляд, это даёт идеальную картину: снова посмотрите на первую диаграмму, на которой синяя кривая выглядит более подвижной, чем красная, и имеет большую общую вертикальную амплитуду.</div> <div> <br /> </div> <div>Однако, на практике, этот метод ненадёжен. К примеру, изолированный пик посреди плоской RMS-кривой исказит измерение, давая ложное представление подвижности уровня. Существует более надёжный метод, используемый EBU для оценки диапазона громкости. Он заключается в вычислении распределения значений RMS. Такое распределение показано в третьей диаграмме. Затем мы измерили «разброс» распределения, используя трюк, подобный методу вероятностной выборки из арсенала описательной статистики, оставив только 5% высших значений и 10% низших. Результаты анализа в двухсекундном окне показывают более широкий разброс RMS у Smells Like Teen Spirit.</div> <div> <br /> </div> <div>Давайте теперь изменим масштаб и измерим разброс RMS в окне 0,1 секунды. Итоги эксперимента показаны в четвёртой диаграмме и снова результаты прямо противоположны: разброс в Fuk намного больше, чем в Smells Like Teen Spirit. Теперь, проведём этот же эксперимент с другими размерами окна. Результаты представлены в последней диаграмме. Интересно, что вариации уровня в Smells Like Teen Spirit всегда больше, за исключением окон менее 0,18 секунды. Это как раз тот временной промежуток, где барабаны Fuk оказывают решающее влияние.</div> <div> <br /> </div> <div>То, что изображено на пятой диаграмме, является хорошей кандидатурой на роль измерителя «динамического диапазона» музыки. Теперь предположим, что вместо того, чтобы пользоваться значениями RMS, мы будем иметь дело с некой единицей измерения воспринимаемой громкости, типа той, что упомянута в рекомендации ITU BS 1770. Это и есть тот самый «диапазон громкости». Основы того, как EBU определяет «диапазон громкости» находятся в документе EBU Tech 3342 и объясняются нами в главе «Измерение диапазона громкости по методике EBU».</div> <div> <br /> </div> <div>Теперь остаётся только вопрос, нужно ли вообще использовать такой термин, как «динамический диапазон». Нет никакого официального определения для него, и это понятие можно спутать с динамическим диапазоном носителя записи, который показывает разницу между самым маленьким и самым большим уровнями, с которыми он может работать. Поэтому, в этой статье я не буду говорить о «динамическом диапазоне» музыки. Вместо этого, я буду использовать такие термины, как «RMS-вариабельность» или, в более широком смысле, «динамическая вариабельность». А термин «динамический диапазон» мы оставим для определения отношения сигнал/шум носителя записи. Я буду использовать термин «диапазон громкости» в строгом соответствии с документом EBU 3342 и термин «вариабельность громкости» во всех других случаях, вовлекающих понятие громкости вместо RMS.</div> <div> <br /> </div> <div><img src="/upload/medialibrary/074/DR_02.JPG" title="DR_02.JPG" border="0" alt="DR_02.JPG" width="472" height="1023" /><b> <br /> </b></div> <div><b> <br /> </b></div> <div><b>Часть четвертая. Так уменьшился ли диапазон громкости?</b></div> <div>А вот здесь нас уже ждут сюрпризы. Мы можем без всяких сомнений доказать, что «война за громкость» никак не уменьшила диапазон громкости, описанный в EBU 3342! И при этом никак не уменьшилась вариабельность уровня или громкости. Кажется, что музыка последнего десятилетия имеет такую же динамическую вариабельность, как и музыка из 70-х или 80-х. Давайте докажем это утверждение.</div> <div> <br /> </div> <div>Как мы уже говорили, такие параметры, как RMS-уровень, интегрированная громкость, крест-фактор и пропорция сэмплов выше -1dBFS, демонстрируют нам захватывающую эволюцию - начиная с 90-х и где-то до 2005 года. Это эффект войны за громкость. И, вроде бы, результаты измерений диапазона громкости по методике EBU тоже должны следовать за этой тенденцией? Но, как мы видим на первой диаграмме, это не так. Мы видим, что диапазон громкости уменьшается с 1969 по 1980-й годы, и затем стабилизируется до 1991-го. После 1991-го он неожиданно возрастает и в последующие годы совершенно не демонстрирует никакой предсказуемой тенденции к уменьшению.</div> <div> <br /> </div> <div>Как мы уже говорили, плотность высокоуровневых сэмплов резко возросла с начала 90-х. Это показывает, что стало использоваться больше компрессии и цифрового ограничения, в результате чего увеличился общий уровень той музыкальной коллекции, которую мы тут анализируем. Но связано ли использование цифровых ограничителей с уменьшением диапазона громкости? Давайте ответим на этот вопрос, сравнив значения, измеренные по методике EBU 3342, с плотностью высокоуровневых сэмплов. Графики представлены на второй диаграмме, и они нам очень ясно показывают, что ответ – нет. Увеличение «тяжести» ограничения, происходившее в процессе наращивания войны за громкость, в общем, никаким образом не уменьшало наблюдаемый диапазон громкости.</div> <div> <br /> </div> <div>Нельзя сказать, что brickwall-ограничители не уменьшают диапазон громкости. Как мы увидим позже, они это успешно делают. Наблюдение заключается в том, что при анализе этих треков мы приходим к выводу, что война за громкость не привела к любому заметному сокращению диапазона громкости.</div> <div> <br /> </div> <div>Однако, «диапазон громкости» по методике EBU 3342 измеряется с размером окна около 3 секунд. Давайте посмотрим, что произойдёт, если для анализа выбрать другой размер окна (блока). Для этого оценим стробированную RMS-вариабельность, основанную на размерах окна от 0,05 до 12,8 секунд. И, чтобы ещё больше конкретизировать результаты, модифицируем эту оценку так, чтобы она отражала влияние соответствующих временных окон. Этим путём мы сможем увидеть, уменьшала ли война за громкость вариабельность уровня при использовании любого окна измерения. Результаты экспериментов на третьей диаграмме. Мало того, что они подтверждают предыдущие исследования, но и идут немного далее, показывая, что война за громкость не имеет явно идентифицируемого влияния на вариабельность уровня. Это весьма решительное заключение: вопреки тому, что часто пишут в Интернете, война за громкость не вызвала никакого уменьшения вариабельности уровня. Современные песни такие же, как в 70-х или 80-х.</div> <div> <br /> </div> <div>Чтобы подтвердить эти результаты, я попросила доктора Damien Tardieu (специалиста по обработке сигналов из института IRCAM) выполнить аналогичные исследования с абсолютно другим набором музыкальных композиций. Для этого, 20000 песен были случайно выбраны из каталога EMI. Правда, эти альбомы отбирались на основании даты копирайта, что несколько уменьшило надёжность этого анализа, поскольку старые треки могут иметь недавний копирайт или ремастерённые версии. Однако, нам нужна общая оценка этого глобального явления, поэтому можно позволить небольшую погрешность. Четвёртая и пятая диаграммы показывают эволюцию диапазона громкости, измеренного в соответствии с EBU 3342, и плотность высокоуровневых сэмплов. Мы видим, что диапазон громкости не уменьшился после 1990 года, причём, несмотря на то, что ограничение стало использоваться всё тяжелее и тяжелее. Нет никаких сомнений: из-за войны за громкость не возникло никакого явного уменьшения её диапазона, и brickwall-ограничители практически не повлияли на этот параметр.</div> <div> <br /> </div> <div><b>Часть пятая. Так в чём же противоречие?</b></div> <div>Как мы уже говорили, количество компрессии/ограничения, используемого при мастеринге, резко выросло между 1990 и 2000 годами. Однако, хотя ограничение во многих случаях уменьшает диапазон громкости музыкальной композиции (глава «Диапазон громкости и ограничители»), мы не наблюдаем общее понижение этого параметра во всём музыкальном производстве. Так как же мы можем разрешить это очевидное противоречие?</div> <div> <br /> </div> <div>Возможно, мастеринг-инженеры нашли разумные щадящие методики, применяя лишь столько ограничения, чтобы не привести к очевидной потере диапазона громкости. Как показано в главе «Диапазон громкости и ограничители», это теоретически возможно, поскольку RMS-вариабельность может иметь определённую «эластичность» по отношению к этой обработке. Но я не верю, что дело обстоит именно так. Существенное ограничение можно измерить или увидеть в характерных изменениях формы звуковой волны. Кроме того, его легко услышать: звуки приобретают специфическую атаку, становятся плотнее, жёстче и зачастую ярче. Прослушав очень большое количество треков из коллекции, использованной при написании этой статьи, вполне очевидно, что значительная часть недавних песен подверглась тяжёлой динамической обработке.</div> <div> <br /> </div> <div>Остаётся только одно решение, о котором я могу думать: возможно, диапазон громкости музыки до мастеринга (или даже до микширования) также возрастал одновременно с тем, как возрастало количество компрессии и ограничения. Иными словами, исходный материал имел больше первичной вариабельности и больше эластичности к ограничению. Это подтверждается стилистическими изменениями, произошедшими в музыке во время войны за громкость. Начало 90-х (когда, в общем-то, и стартовала война за громкость), отмечено ростом популярности рэп-музыки и появлением большого количества исполнителей в этом жанре. Рэп типично имеет довольно разрежённую аранжировку с очень громкими большим и малым барабанами, которые значительно увеличивают вариабельность уровня в очень малых масштабах (0,1 секунды или около того). Примерно в то же самое время, родился такой стиль, как nu metal, объединивший в себе элементы фанка и рэпа. Также, во многих песнях изменился и подход к аранжировке, а именно, к переходам от одной секции к другой. Многие хиты 80-х использовали в качестве перехода достаточно гладкий брэк, сыгранный на том-томах, тогда как рэп-продюсеры 90-х предпочитали резкий «монтаж» звуков, увеличивающий вариабельность уровня в масштабах около 0,5 с.</div> <div> <br /> </div> <div>Если воспользоваться большими масштабами, относящимися к структуре песен, можно выдвинуть идею, что современные треки используют контрасты уровня, чтобы очертить различные секции песни, тогда как старые композиции использовали для этого изменения тональности или гармонии. Сейчас часто можно услышать рэп или R&amp;B, где куплеты настолько минималистичны, что там практически невозможно разобрать какие-то аккорды, но зато припевы похоронены под плотными вокальными гармониями и/или богатыми клавишными партиями, увеличивающими RMS-уровень. Хорошие примеры – «Lollipop» от Lil’Wayne и «Gangsta’s Paradise» от Coolio, или, до некоторой степени, «Single Ladies» от Beyonce. В таких композициях, вариации уровня используются для создания структуры песни.</div> <div> <br /> </div> <div>Чтобы лучше иллюстрировать этот момент, давайте сравним две совершенно разные пенсии из разных эпох: Beatles «Come Together» (1969) и Lady Gaga «Telephone» (2010). На диаграмме показан анализ RMS для обеих песен. Белые линии отображают структурные границы песен, определяемые слухом. Более светлые квадраты указывают на части с отличающимся от других фрагментов уровнем, а более тёмные указывают на части с похожими уровнями. Это сравнение – показательный пример: в Telephone больше крупномасштабных изменений уровня и они сильно синхронизированы со структурой песни. Этот пример помогает объяснить идею, что в современной музыке первичная крупномасштабная RMS-вариабельность может иметь больший размах.</div> <div><b> <br /> </b></div> <div><b>Часть шестая. Может ли музыка, обработанная ограничителями, иметь музыкальную динамику?</b></div> <div>Определённо. Но путь, которым выражается музыкальная динамика, может измениться. Представьте, что Вы слушаете музыку. И захотели сделать её громче. Вы просто вращаете регулятор уровня и поднимаете его значение. Заодно Вы увеличиваете RMS и пиковый уровень, но это никак не затрагивает крест-фактор. Назовём это термином «первая парадигма громкости». Теперь предположим, что есть регион в Pro Tools, пики которого достигают 0 dBFS. Вы не можете поднять уровень традиционным способом, поскольку в результате возникнут искажения. Но мы можем вставить туда ограничитель и понизить его порог. Благодаря этому, Вы сможете поднять RMS, но при этом пиковый уровень останется стабильным. А вот крест-фактор уже будет уменьшен. Назовём это «вторая парадигма громкости».</div> <div> <br /> </div> <div>Когда Вагнер сочинял оркестровое крещендо, то использовал первую парадигму, добавляя больше инструментов. Но при помощи ограничителя можно сделать крещендо на основе второй парадигмы. Результаты обоих подходов показаны на иллюстрации. Mike Oldfield (слева) использовал первую парадигму в конце первой части Tubular Bells, а Trent Reznor (справа) использовал вторую в «Closer».</div> <div> <br /> </div> <div>Чтобы получить более точное представление о различиях между парадигмами, давайте возьмём шесть крещендо из шести различных треков. Трое из них будут представлять первую парадигму и трое – вторую. Теперь проанализируем их RMS, пиковый уровень и крест-фактор. Результаты показаны на нижней иллюстрации. Левый график показывает все крещендо, основанные на увеличении RMS и пикового уровня. Средний график показывает крещендо на основе второй парадигмы, когда пиковый уровень остаётся неизменным. Правый график показывает систематическое уменьшение крест-фактора для второй тройки и демонстрирует, что в первой тройке нет никакой связи между ним и громкостью.</div> <div> <br /> </div> <div>Можно сказать, что крещендо, использующие вторую парадигму, не являются «чисто» динамическими событиями: чем громче становится музыка, тем сильнее ограничитель влияет на сигнал и тем сильнее изменяется оригинальный тембр. Но разве не это же верно и для традиционного крещендо? Исполняя крещендо на одной скрипичной ноте, мы не только изменяем уровень, но и тембр. А многие оркестровые крещендо вводят дополнительные инструменты в процессе своего развития. В результате, комбинация этих двух факторов вызывает более глубокие изменения тембра, нежели любой brickwall-ограничитель.</div> <div> <br /> </div> <div><b>Часть седьмая. Случай Death Magnetic</b></div> <div>Не столь давний альбом группы Metallica стал очень сильным раздражителем для противников текущей моды в мастеринге. Насколько я могу сказать, основная проблема Death Magnetic – это конфликт между звучанием гитар и тем способом мастеринга, которым обрабатывался этот альбом. Очень агрессивный мастеринг просто не подходит к «производственному» стилю этой группы, более характерному для 80-х и опирающемуся на плотные искажённые гитары, заполняющие собой большую часть звукового пространства. Эта музыка и так имеет достаточно стабильный уровень, а в этом случае её крест-фактор был понижен до очень малых значений. В результате, её звучание воспринимается на слух как очень «компактное» и статичное на протяжении всего времени.</div> <div> <br /> </div> <div>P.S. Под «компактностью» здесь подразумевается такое звучание, когда всё играет очень близко к слушателю, чуть ли не прямо ему в ухо. Подобный тип звука также называется in-your-face, и в контексте данной статьи рассматривается его крайне гипертрофированный вариант.</div> <div> <br /> </div> <div>Первая диаграмма показывает распределение крест-фактора для 4500 песен и значения этого параметра для альбомов Master Of Puppets и Death Magnetic. Анализ других альбомов Metallica, таких, как ...And Justice For All или Black, показывает, что значения их крест-фактора примерно такие же, как и в Master Of Puppets. Мы видим, что крест-фактор Death Magnetic не только значительно ниже, чем у «нормальных» альбомов Metallica, но и чрезвычайно низок по сравнению с любой другой музыкой.</div> <div> <br /> </div> <div>Такие значения крест-фактора сопоставимы с тем, что можно обнаружить в треках My Beautiful Dark Twisted Fantasy от Kanye West или Get Rich Or Die Tryin’ от 50 Cent. Эта стилистически громкая музыка базируется на сильных перкуссионных элементах, артикулирующих текст и лучше сочетающихся с низкими значениями крест-фактора, чем постоянно гудящие гитары Metallica. Они также сопоставимы с треками из Oracular Spectacular или Congratulations от MGMT. Эти два альбома имеют настолько специфическое звучание, что постоянное использование второй парадигмы громкости и наличие артефактов динамической компрессии для них не представляют совершенно никакой проблемы. Но «классический» звук Metallica просто не сочетается с такими методами обработки.</div> <div> <br /> </div> <div>Вторая диаграмма показывает RMS-вариабельность Death Magnetic по сравнению с их же альбомом Master Of Puppets и двумя другими альбомами с низким крест-фактором: My Beautiful Dark Twisted Fantasy и Congratulations. И вот здесь начинаются реальные проблемы. Из-за низкого крест-фактора он звучит не только очень «компактно», но и очень статично (малая RMS-вариабельность). Третья диаграмма подводит итоги, показывая, насколько необычна эта комбинация низкого крест-фактора и уменьшенного диапазона громкости. Это можно сравнить, разве что, не более чем с тремя песнями MGMT. Даже невероятно компрессированный My Beautiful Dark Twisted Fantasy не может конкурировать с ним, сохраняя в себе больше контраста, чем Death Magnetic. И, хотя низкая вариабельность его RMS примерно сравнима с музыкой группы Dagoba (исполняет индастриал-метал и специализируется на эффектно громком, компактном и «жирном» звуке), Death Magnetic компрессирован ещё более свирепо. Но, по моему мнению, Вы вряд ли захотите, чтобы традиционный хеви-метал звучал более «компактно», чем преднамеренно экстремальный industrial/death metal. Хотя, если Вы стремитесь именно к этому, то должны сами изменить свою музыку, создав в ней больше контраста. Только так Вы сможете позволить себе такую сильную компрессию и даже получить от неё какие-то дополнительные выгоды.</div> <div> <br /> </div> <div><b>Часть восьмая. Так представляет ли проблему война за громкость?</b></div> <div>Не составит труда найти массу людей, публикаций в прессе и Интернете, единодушно обвиняющих войну за громкость в том, что она разрушает музыку. Многие связывают её с уменьшением «динамического диапазона», хотя никто обычно не объясняет, каким он должен быть. Однако, как мы узнали в этой статье, война за громкость фактически не привела к уменьшению такого параметра, как диапазон громкости, определённый по методике EBU 3342 (по сути дела, это довольно близко к тому, что люди как раз и подразумевают под словами «динамический диапазон»). При этом, невозможно установить никакого уменьшения динамической вариабельности ни в каком масштабе.</div> <div> <br /> </div> <div>Так что ж за проблема с войной за громкость? Очевидно, ограничение делает что-то «неправильное» с сигналом, иначе б люди не жаловались – даже при том, что они указывают на не совсем корректный критерий, описывающий его параметры.</div> <div> <br /> </div> <div>Чтобы правильно ответить на этот вопрос, попробуем представить, что звук – это фотография, и сделаем анализ этого «фото» по такому параметру, как распределение яркостей. У Фотошопа это можно найти в диалоговом окне Levels. Чтобы сделать оценку, алгоритм проверяет все пиксели в картинке и затем сортирует в зависимости от яркости. В результате, получается график распределения, показывающий, включает ли изображение преимущественно светлые, средние и тёмные области, и их относительные пропорции. Тот же самый процесс можно провернуть и со звуковыми файлами: мы проверяем все сэмплы в песне и сортируем их по абсолютному уровню. Как показано на иллюстрации, кривая распределения может рассказать много интересного.</div> <div> <br /> </div> <div>Посмотрим на кривую распределения для песен, выпущенных в 2007 году (красная кривая). Их пики имеют более высокий уровень, чем в песнях 1967 года (синяя кривая). Очевидно, что более новые песни в среднем намного громче. Следующим делом, посмотрим на ширину обеих кривых: они сравнимы, и это означает, что кое-какие вещи, близкие к динамической вариабельности, остались неизменными между 1967 и 2007 годами. Теперь посмотрим на всплеск в правой стороне красной кривой. Он показывает, что песни этого года имеют ненормально высокую плотность высокоуровневых сэмплов: кривая перестаёт следовать за «нормальным» распределением Гаусса в зоне высоких уровней. Это результат воздействия brickwall-ограничителей.</div> <div> <br /> </div> <div>Продолжим сравнивать звук и изображение. Представим, будто последние 20 лет все картинки в журналах и книгах становились всё ярче и ярче. В них всё ещё есть глубокий чёрный цвет, контраст не повреждён, но при этом все картинки выглядят очень яркими. Подобные вещи иллюстрируют нам две фотографии Тауэра. Можно подумать, будто всё в наши дни прямо таки «сияет», хотя здравый смысл предполагает, что есть какие-то вещи, которые не могут быть настолько сияющими ни при каких условиях. Это тем более верно в случае со звуком, для которого «яркость» означает не только высокую плотность засвеченных пикселей. Это также означает уменьшенный крест-фактор, изменённую огибающую, использование второй парадигмы громкости и, в особо тяжёлых случаях, искажение. Хотя, в общем-то, эти характеристики не обязательно означают что-то плохое, но всё-таки здравый смысл нам подсказывает, что такого не должно быть буквально в каждой записи.</div> <div> <br /> </div> <div>В конце концов, это всё – вопрос стиля. Уменьшенный крест-фактор создаёт «компактность» в звучании; и на странице MaxxBCL компания Waves описывает это как «тяжёлый in-your-face сигнал, что сотрясает дом». Подобные вещи могут подойти к Вашим песням, а может и нет. Или, может быть, Вы нарочно захотите оставить «мягкость» в своих треках. Хотя, если Вы делаете тяжёлую техно-музыку, стремление к «компактности» может быть хорошей идеей. Также, описанные ранее две парадигмы громкости обладают весьма отличающимися «ароматами», и, в зависимости от материала и художественных целей, можно предпочесть тот или иной вариант. Хотите, чтобы каждая громкая атака изменялась компрессором/ограничителем? В одних случаях это пойдёт на пользу, в других – во вред. Или, может Вы хотите просто уменьшить динамический диапазон музыки и не затронуть более ничего? В таком случае, лучше активнее пользоваться автоматизацией уровня, нежели ограничением, поскольку, как мы уже говорили ранее, диапазон громкости имеет определённую сопротивляемость к процессу ограничения.</div> <div> <br /> </div> <div>Важно понимать, что делаете, и как это соотносится с тем звуком, к которому Вы стремитесь. И если Вам нравится компрессия, но Вы боитесь, что Боб Дилан не одобрит Ваш звук, потому что он «слишком современный» и «слишком статичный», то не волнуйтесь. Скорее всего, он просто не слушает такую музыку.</div> <div> <br /> </div> <div><i>Автор статьи: Эммануэль Дерюти (Статья опубликована в журнале Sound on Sound)</i></div>

2016-07-03

Топ Звук
Россия
Московская область
Москва
ул. Ботаническая, дом 3
8 (905) 506-3-506
5
5
1
5
1
Динамический диапазон и война за громкость

Динамический диапазон и война за громкость

Динамический диапазон и война за громкость

<div><b>Часть первая. Динамический диапазон и война за громкость</b></div> <div>«Почему музыка стала звучать хуже». «Поклонники жалуются, что Death Magnetic в Guitar Hero звучит лучше, чем на CD». «Даже фанаты хеви-метала считают, что сегодняшняя музыка слишком громкая!» «Dynamic Range Day объявляет новое движение против громкости». «Смерть Hi-Fi»… В прессе и сети растёт движение против «войны за громкость», практики, когда люди пытаются получить максимально возможную громкость в своих треках, чтобы заставить слушателей ощущать их более «горячими» по сравнению с конкурирующими релизами. Согласно этим статьям, неблагоразумные методы мастеринга и, более конкретно, злоупотребление brickwall-ограничителями, ставят музыку под угрозу. В современном производстве не хватает детальности, и оно жертвует качеством ради уровня. Боб Дилан в 2006 году в своём интервью заявил, что «Вы слушаете эти современные альбомы, и они звучат просто по-зверски. У них один звук везде. Нет никакой чёткости и детальности, ни в вокале, ни в чём-то другом. Всё статично».</div> <div> <br /> </div> <div>Но не является ли замечание Дилана отражением извечного конфликта между отцами и детьми? Это был бы не первый случай, когда старая гвардия презирает то, что делает новое поколение. Хотя, верно и то, что многие звукоинженеры присоединяются к обществу, предпочитающему «более динамичную» музыку. Но объективно ли они говорят о том, что такая музыка лучше, или они просто предпочитают какой-то определённый тип звучания? Моё исследование постарается дать ответы на эти вопросы. Мы узнаем, действительно ли стала громче современная музыка, и стало ли в ней меньше динамики. Мы также рассмотрим гипотезу, что громкость может быть стилистическим признаком специфических музыкальных жанров, а не «дурной манерой», мотивированной презренными коммерческими интересами. И, наконец, мы пристально поглядим на печально известный альбом Death Magnetic группы Metallica и выясним, почему многим людям кажется, что он звучит плохо.</div> <div> <br /> </div> <div><b>Часть вторая. Действительно ли теперь музыка стала громче?</b></div> <div>Да, это так, и здесь нет никаких сомнений. Давайте возьмём большое количество известных поп-песен, записанных в промежутке между 1969 и 2010 годами, нормализуем их так, чтобы пики стали под 0 dBFS, и измерим значение RMS. Теперь давайте рассортируем все значения согласно году релиза каждой песни. Первая диаграмма (вверху) показывает результаты эксперимента, и они реально возбуждают! Красная линия показывает усреднённые значения RMS для каждого года, а прямоугольники показывают распределение: чем темнее, тем больше песен имеет такой же уровень. Здесь, несомненно, наблюдается постоянный рост среднего уровня между 1982 и 2005 годами, и сегодняшние записи примерно на 5 dB громче, чем было в 70-х.</div> <div> <br /> </div> <div><img src="/upload/medialibrary/8ea/DR_01.jpg" title="DR_01.jpg" border="0" alt="DR_01.jpg" width="616" height="1023" /> <br /> </div> <div> <br /> </div> <div>По общему признанию, RMS даёт только информацию об «электрическом» или «физическом» уровне аудиофайла, но никак не говорит о той громкости, что мы реально воспринимаем. Для этого, согласно нормативным рекомендациям EBU 3341, мы оцениваем «интегрированную громкость». Как видно на второй диаграмме, это значение весьма сильно коррелируется с RMS, и два графика очень похожи друг на друга. Таким образом, второй набор результатов подтверждает первый.</div> <div> <br /> </div> <div>Давайте воспользуемся другими критериями и повторим эксперимент. К примеру, для описания динамического поведения музыки часто используется такой критерий, как крест-фактор. Говоря простыми словами, он показывает разницу между пиковым и RMS-уровнями на протяжении песни. Он является хорошим маркером, позволяющим оценить количество компрессии, применённой к музыке: обычно, чем больше компрессии, тем ниже крест-фактор. Некоторые профессионалы считают аккуратное обращение с крест-фактором залогом успешного мастеринга. В общих словах, опять же, чем ниже крест-фактор, тем громче музыка.</div> <div> <br /> </div> <div>Третья диаграмма показывает эволюцию крест-фактора. Основываясь на тех же самых 4500 песен, этот усреднённый график, начиная с 80-х годов, показывает падение на 3 dB. Это укрепляет нас во мнении, что увеличение громкости, явно начавшееся с 90-х, было порождено компрессией. Нетрудно заметить, что эволюцию крест-фактора можно разделить на три этапа. Первый, с 1969 по 1980-й, показывает увеличение крест-фактора, обусловленное, вероятно, совершенствованием студийного оборудования, улучшением отношения сигнал/шум и, как следствие, расширением его динамического диапазона. С 1980 по 1990-й крест-фактор остаётся довольно устойчивым. Затем, с 1990 по 2010-й – в эпоху войны за громкость – крест-фактор драматически уменьшается.</div> <div> <br /> </div> <div>Наконец, ещё один полезный и информативный критерий – это пропорция сэмплов, после нормализации близко подобравшихся к потолку 0 dBFS. Большая плотность очень громких сэмплов предполагает, что в мастер-копии был клиппинг или использовался цифровой brickwall-ограничитель. Четвёртая диаграмма отслеживает плотность пиковых сэмплов в той же самой коллекции из 4500 треков. Первые две диаграммы показывают, что музыка становится громче; третья указывает, что это происходит, вероятно, в результате компрессии динамического диапазона; а эта иллюстрирует, что компрессия, скорее всего, сопровождалась цифровым brickwall-ограничением. </div> <div> <br /> </div> <div><b>Часть третья. Что такое динамический диапазон музыки?</b></div> <div>Вы удивитесь, но на этот вопрос довольно трудно ответить. Интуитивно, мы чувствуем, что динамический диапазон это некий критерий, показывающий, насколько варьируется уровень в музыкальной композиции. Давайте попробуем материализовать эти догадки. Первая диаграмма сравнивает значения RMS в двух песнях: «Fuk» от Plastikman и «Smells Like Teen Spirit» от Nirvana. Очевидно, что уровень в Smells Like Teen Spirit более подвижен, чем в Fuk. И это не удивляет, поскольку Plastikman приверженец минимал-техно, тогда как для Nirvana характерны мягкие куплеты и громкие припевы.</div> <div> <br /> </div> <div>Однако, результат меняется просто радикально, если для анализа использовать окно не 2 секунды, а 100 миллисекунд. При большем окне музыка Plastikman демонстрирует более стабильный RMS-уровень, но, как Вы видите на второй диаграмме, при меньшем времени интеграции в ней появляются более интенсивные вариации. Это обусловлено громкими и сухими барабанами. Поэтому, если мы хотим объективно измерить «подвижность уровня», то должны тщательно подумать над тем, какой масштаб использовать.</div> <div> <br /> </div> <div>Также есть вопрос по поводу того, как фактически вычислить эту подвижность уровня. Иными словами, как получить цифровое значение, которое было бы мерой «динамического диапазона». Очевидно, мы могли бы измерить полную вертикальную амплитуду кривой RMS в заданном временном масштабе, суммируя амплитуду каждого вертикального движения. На первый взгляд, это даёт идеальную картину: снова посмотрите на первую диаграмму, на которой синяя кривая выглядит более подвижной, чем красная, и имеет большую общую вертикальную амплитуду.</div> <div> <br /> </div> <div>Однако, на практике, этот метод ненадёжен. К примеру, изолированный пик посреди плоской RMS-кривой исказит измерение, давая ложное представление подвижности уровня. Существует более надёжный метод, используемый EBU для оценки диапазона громкости. Он заключается в вычислении распределения значений RMS. Такое распределение показано в третьей диаграмме. Затем мы измерили «разброс» распределения, используя трюк, подобный методу вероятностной выборки из арсенала описательной статистики, оставив только 5% высших значений и 10% низших. Результаты анализа в двухсекундном окне показывают более широкий разброс RMS у Smells Like Teen Spirit.</div> <div> <br /> </div> <div>Давайте теперь изменим масштаб и измерим разброс RMS в окне 0,1 секунды. Итоги эксперимента показаны в четвёртой диаграмме и снова результаты прямо противоположны: разброс в Fuk намного больше, чем в Smells Like Teen Spirit. Теперь, проведём этот же эксперимент с другими размерами окна. Результаты представлены в последней диаграмме. Интересно, что вариации уровня в Smells Like Teen Spirit всегда больше, за исключением окон менее 0,18 секунды. Это как раз тот временной промежуток, где барабаны Fuk оказывают решающее влияние.</div> <div> <br /> </div> <div>То, что изображено на пятой диаграмме, является хорошей кандидатурой на роль измерителя «динамического диапазона» музыки. Теперь предположим, что вместо того, чтобы пользоваться значениями RMS, мы будем иметь дело с некой единицей измерения воспринимаемой громкости, типа той, что упомянута в рекомендации ITU BS 1770. Это и есть тот самый «диапазон громкости». Основы того, как EBU определяет «диапазон громкости» находятся в документе EBU Tech 3342 и объясняются нами в главе «Измерение диапазона громкости по методике EBU».</div> <div> <br /> </div> <div>Теперь остаётся только вопрос, нужно ли вообще использовать такой термин, как «динамический диапазон». Нет никакого официального определения для него, и это понятие можно спутать с динамическим диапазоном носителя записи, который показывает разницу между самым маленьким и самым большим уровнями, с которыми он может работать. Поэтому, в этой статье я не буду говорить о «динамическом диапазоне» музыки. Вместо этого, я буду использовать такие термины, как «RMS-вариабельность» или, в более широком смысле, «динамическая вариабельность». А термин «динамический диапазон» мы оставим для определения отношения сигнал/шум носителя записи. Я буду использовать термин «диапазон громкости» в строгом соответствии с документом EBU 3342 и термин «вариабельность громкости» во всех других случаях, вовлекающих понятие громкости вместо RMS.</div> <div> <br /> </div> <div><img src="/upload/medialibrary/074/DR_02.JPG" title="DR_02.JPG" border="0" alt="DR_02.JPG" width="472" height="1023" /><b> <br /> </b></div> <div><b> <br /> </b></div> <div><b>Часть четвертая. Так уменьшился ли диапазон громкости?</b></div> <div>А вот здесь нас уже ждут сюрпризы. Мы можем без всяких сомнений доказать, что «война за громкость» никак не уменьшила диапазон громкости, описанный в EBU 3342! И при этом никак не уменьшилась вариабельность уровня или громкости. Кажется, что музыка последнего десятилетия имеет такую же динамическую вариабельность, как и музыка из 70-х или 80-х. Давайте докажем это утверждение.</div> <div> <br /> </div> <div>Как мы уже говорили, такие параметры, как RMS-уровень, интегрированная громкость, крест-фактор и пропорция сэмплов выше -1dBFS, демонстрируют нам захватывающую эволюцию - начиная с 90-х и где-то до 2005 года. Это эффект войны за громкость. И, вроде бы, результаты измерений диапазона громкости по методике EBU тоже должны следовать за этой тенденцией? Но, как мы видим на первой диаграмме, это не так. Мы видим, что диапазон громкости уменьшается с 1969 по 1980-й годы, и затем стабилизируется до 1991-го. После 1991-го он неожиданно возрастает и в последующие годы совершенно не демонстрирует никакой предсказуемой тенденции к уменьшению.</div> <div> <br /> </div> <div>Как мы уже говорили, плотность высокоуровневых сэмплов резко возросла с начала 90-х. Это показывает, что стало использоваться больше компрессии и цифрового ограничения, в результате чего увеличился общий уровень той музыкальной коллекции, которую мы тут анализируем. Но связано ли использование цифровых ограничителей с уменьшением диапазона громкости? Давайте ответим на этот вопрос, сравнив значения, измеренные по методике EBU 3342, с плотностью высокоуровневых сэмплов. Графики представлены на второй диаграмме, и они нам очень ясно показывают, что ответ – нет. Увеличение «тяжести» ограничения, происходившее в процессе наращивания войны за громкость, в общем, никаким образом не уменьшало наблюдаемый диапазон громкости.</div> <div> <br /> </div> <div>Нельзя сказать, что brickwall-ограничители не уменьшают диапазон громкости. Как мы увидим позже, они это успешно делают. Наблюдение заключается в том, что при анализе этих треков мы приходим к выводу, что война за громкость не привела к любому заметному сокращению диапазона громкости.</div> <div> <br /> </div> <div>Однако, «диапазон громкости» по методике EBU 3342 измеряется с размером окна около 3 секунд. Давайте посмотрим, что произойдёт, если для анализа выбрать другой размер окна (блока). Для этого оценим стробированную RMS-вариабельность, основанную на размерах окна от 0,05 до 12,8 секунд. И, чтобы ещё больше конкретизировать результаты, модифицируем эту оценку так, чтобы она отражала влияние соответствующих временных окон. Этим путём мы сможем увидеть, уменьшала ли война за громкость вариабельность уровня при использовании любого окна измерения. Результаты экспериментов на третьей диаграмме. Мало того, что они подтверждают предыдущие исследования, но и идут немного далее, показывая, что война за громкость не имеет явно идентифицируемого влияния на вариабельность уровня. Это весьма решительное заключение: вопреки тому, что часто пишут в Интернете, война за громкость не вызвала никакого уменьшения вариабельности уровня. Современные песни такие же, как в 70-х или 80-х.</div> <div> <br /> </div> <div>Чтобы подтвердить эти результаты, я попросила доктора Damien Tardieu (специалиста по обработке сигналов из института IRCAM) выполнить аналогичные исследования с абсолютно другим набором музыкальных композиций. Для этого, 20000 песен были случайно выбраны из каталога EMI. Правда, эти альбомы отбирались на основании даты копирайта, что несколько уменьшило надёжность этого анализа, поскольку старые треки могут иметь недавний копирайт или ремастерённые версии. Однако, нам нужна общая оценка этого глобального явления, поэтому можно позволить небольшую погрешность. Четвёртая и пятая диаграммы показывают эволюцию диапазона громкости, измеренного в соответствии с EBU 3342, и плотность высокоуровневых сэмплов. Мы видим, что диапазон громкости не уменьшился после 1990 года, причём, несмотря на то, что ограничение стало использоваться всё тяжелее и тяжелее. Нет никаких сомнений: из-за войны за громкость не возникло никакого явного уменьшения её диапазона, и brickwall-ограничители практически не повлияли на этот параметр.</div> <div> <br /> </div> <div><b>Часть пятая. Так в чём же противоречие?</b></div> <div>Как мы уже говорили, количество компрессии/ограничения, используемого при мастеринге, резко выросло между 1990 и 2000 годами. Однако, хотя ограничение во многих случаях уменьшает диапазон громкости музыкальной композиции (глава «Диапазон громкости и ограничители»), мы не наблюдаем общее понижение этого параметра во всём музыкальном производстве. Так как же мы можем разрешить это очевидное противоречие?</div> <div> <br /> </div> <div>Возможно, мастеринг-инженеры нашли разумные щадящие методики, применяя лишь столько ограничения, чтобы не привести к очевидной потере диапазона громкости. Как показано в главе «Диапазон громкости и ограничители», это теоретически возможно, поскольку RMS-вариабельность может иметь определённую «эластичность» по отношению к этой обработке. Но я не верю, что дело обстоит именно так. Существенное ограничение можно измерить или увидеть в характерных изменениях формы звуковой волны. Кроме того, его легко услышать: звуки приобретают специфическую атаку, становятся плотнее, жёстче и зачастую ярче. Прослушав очень большое количество треков из коллекции, использованной при написании этой статьи, вполне очевидно, что значительная часть недавних песен подверглась тяжёлой динамической обработке.</div> <div> <br /> </div> <div>Остаётся только одно решение, о котором я могу думать: возможно, диапазон громкости музыки до мастеринга (или даже до микширования) также возрастал одновременно с тем, как возрастало количество компрессии и ограничения. Иными словами, исходный материал имел больше первичной вариабельности и больше эластичности к ограничению. Это подтверждается стилистическими изменениями, произошедшими в музыке во время войны за громкость. Начало 90-х (когда, в общем-то, и стартовала война за громкость), отмечено ростом популярности рэп-музыки и появлением большого количества исполнителей в этом жанре. Рэп типично имеет довольно разрежённую аранжировку с очень громкими большим и малым барабанами, которые значительно увеличивают вариабельность уровня в очень малых масштабах (0,1 секунды или около того). Примерно в то же самое время, родился такой стиль, как nu metal, объединивший в себе элементы фанка и рэпа. Также, во многих песнях изменился и подход к аранжировке, а именно, к переходам от одной секции к другой. Многие хиты 80-х использовали в качестве перехода достаточно гладкий брэк, сыгранный на том-томах, тогда как рэп-продюсеры 90-х предпочитали резкий «монтаж» звуков, увеличивающий вариабельность уровня в масштабах около 0,5 с.</div> <div> <br /> </div> <div>Если воспользоваться большими масштабами, относящимися к структуре песен, можно выдвинуть идею, что современные треки используют контрасты уровня, чтобы очертить различные секции песни, тогда как старые композиции использовали для этого изменения тональности или гармонии. Сейчас часто можно услышать рэп или R&amp;B, где куплеты настолько минималистичны, что там практически невозможно разобрать какие-то аккорды, но зато припевы похоронены под плотными вокальными гармониями и/или богатыми клавишными партиями, увеличивающими RMS-уровень. Хорошие примеры – «Lollipop» от Lil’Wayne и «Gangsta’s Paradise» от Coolio, или, до некоторой степени, «Single Ladies» от Beyonce. В таких композициях, вариации уровня используются для создания структуры песни.</div> <div> <br /> </div> <div>Чтобы лучше иллюстрировать этот момент, давайте сравним две совершенно разные пенсии из разных эпох: Beatles «Come Together» (1969) и Lady Gaga «Telephone» (2010). На диаграмме показан анализ RMS для обеих песен. Белые линии отображают структурные границы песен, определяемые слухом. Более светлые квадраты указывают на части с отличающимся от других фрагментов уровнем, а более тёмные указывают на части с похожими уровнями. Это сравнение – показательный пример: в Telephone больше крупномасштабных изменений уровня и они сильно синхронизированы со структурой песни. Этот пример помогает объяснить идею, что в современной музыке первичная крупномасштабная RMS-вариабельность может иметь больший размах.</div> <div><b> <br /> </b></div> <div><b>Часть шестая. Может ли музыка, обработанная ограничителями, иметь музыкальную динамику?</b></div> <div>Определённо. Но путь, которым выражается музыкальная динамика, может измениться. Представьте, что Вы слушаете музыку. И захотели сделать её громче. Вы просто вращаете регулятор уровня и поднимаете его значение. Заодно Вы увеличиваете RMS и пиковый уровень, но это никак не затрагивает крест-фактор. Назовём это термином «первая парадигма громкости». Теперь предположим, что есть регион в Pro Tools, пики которого достигают 0 dBFS. Вы не можете поднять уровень традиционным способом, поскольку в результате возникнут искажения. Но мы можем вставить туда ограничитель и понизить его порог. Благодаря этому, Вы сможете поднять RMS, но при этом пиковый уровень останется стабильным. А вот крест-фактор уже будет уменьшен. Назовём это «вторая парадигма громкости».</div> <div> <br /> </div> <div>Когда Вагнер сочинял оркестровое крещендо, то использовал первую парадигму, добавляя больше инструментов. Но при помощи ограничителя можно сделать крещендо на основе второй парадигмы. Результаты обоих подходов показаны на иллюстрации. Mike Oldfield (слева) использовал первую парадигму в конце первой части Tubular Bells, а Trent Reznor (справа) использовал вторую в «Closer».</div> <div> <br /> </div> <div>Чтобы получить более точное представление о различиях между парадигмами, давайте возьмём шесть крещендо из шести различных треков. Трое из них будут представлять первую парадигму и трое – вторую. Теперь проанализируем их RMS, пиковый уровень и крест-фактор. Результаты показаны на нижней иллюстрации. Левый график показывает все крещендо, основанные на увеличении RMS и пикового уровня. Средний график показывает крещендо на основе второй парадигмы, когда пиковый уровень остаётся неизменным. Правый график показывает систематическое уменьшение крест-фактора для второй тройки и демонстрирует, что в первой тройке нет никакой связи между ним и громкостью.</div> <div> <br /> </div> <div>Можно сказать, что крещендо, использующие вторую парадигму, не являются «чисто» динамическими событиями: чем громче становится музыка, тем сильнее ограничитель влияет на сигнал и тем сильнее изменяется оригинальный тембр. Но разве не это же верно и для традиционного крещендо? Исполняя крещендо на одной скрипичной ноте, мы не только изменяем уровень, но и тембр. А многие оркестровые крещендо вводят дополнительные инструменты в процессе своего развития. В результате, комбинация этих двух факторов вызывает более глубокие изменения тембра, нежели любой brickwall-ограничитель.</div> <div> <br /> </div> <div><b>Часть седьмая. Случай Death Magnetic</b></div> <div>Не столь давний альбом группы Metallica стал очень сильным раздражителем для противников текущей моды в мастеринге. Насколько я могу сказать, основная проблема Death Magnetic – это конфликт между звучанием гитар и тем способом мастеринга, которым обрабатывался этот альбом. Очень агрессивный мастеринг просто не подходит к «производственному» стилю этой группы, более характерному для 80-х и опирающемуся на плотные искажённые гитары, заполняющие собой большую часть звукового пространства. Эта музыка и так имеет достаточно стабильный уровень, а в этом случае её крест-фактор был понижен до очень малых значений. В результате, её звучание воспринимается на слух как очень «компактное» и статичное на протяжении всего времени.</div> <div> <br /> </div> <div>P.S. Под «компактностью» здесь подразумевается такое звучание, когда всё играет очень близко к слушателю, чуть ли не прямо ему в ухо. Подобный тип звука также называется in-your-face, и в контексте данной статьи рассматривается его крайне гипертрофированный вариант.</div> <div> <br /> </div> <div>Первая диаграмма показывает распределение крест-фактора для 4500 песен и значения этого параметра для альбомов Master Of Puppets и Death Magnetic. Анализ других альбомов Metallica, таких, как ...And Justice For All или Black, показывает, что значения их крест-фактора примерно такие же, как и в Master Of Puppets. Мы видим, что крест-фактор Death Magnetic не только значительно ниже, чем у «нормальных» альбомов Metallica, но и чрезвычайно низок по сравнению с любой другой музыкой.</div> <div> <br /> </div> <div>Такие значения крест-фактора сопоставимы с тем, что можно обнаружить в треках My Beautiful Dark Twisted Fantasy от Kanye West или Get Rich Or Die Tryin’ от 50 Cent. Эта стилистически громкая музыка базируется на сильных перкуссионных элементах, артикулирующих текст и лучше сочетающихся с низкими значениями крест-фактора, чем постоянно гудящие гитары Metallica. Они также сопоставимы с треками из Oracular Spectacular или Congratulations от MGMT. Эти два альбома имеют настолько специфическое звучание, что постоянное использование второй парадигмы громкости и наличие артефактов динамической компрессии для них не представляют совершенно никакой проблемы. Но «классический» звук Metallica просто не сочетается с такими методами обработки.</div> <div> <br /> </div> <div>Вторая диаграмма показывает RMS-вариабельность Death Magnetic по сравнению с их же альбомом Master Of Puppets и двумя другими альбомами с низким крест-фактором: My Beautiful Dark Twisted Fantasy и Congratulations. И вот здесь начинаются реальные проблемы. Из-за низкого крест-фактора он звучит не только очень «компактно», но и очень статично (малая RMS-вариабельность). Третья диаграмма подводит итоги, показывая, насколько необычна эта комбинация низкого крест-фактора и уменьшенного диапазона громкости. Это можно сравнить, разве что, не более чем с тремя песнями MGMT. Даже невероятно компрессированный My Beautiful Dark Twisted Fantasy не может конкурировать с ним, сохраняя в себе больше контраста, чем Death Magnetic. И, хотя низкая вариабельность его RMS примерно сравнима с музыкой группы Dagoba (исполняет индастриал-метал и специализируется на эффектно громком, компактном и «жирном» звуке), Death Magnetic компрессирован ещё более свирепо. Но, по моему мнению, Вы вряд ли захотите, чтобы традиционный хеви-метал звучал более «компактно», чем преднамеренно экстремальный industrial/death metal. Хотя, если Вы стремитесь именно к этому, то должны сами изменить свою музыку, создав в ней больше контраста. Только так Вы сможете позволить себе такую сильную компрессию и даже получить от неё какие-то дополнительные выгоды.</div> <div> <br /> </div> <div><b>Часть восьмая. Так представляет ли проблему война за громкость?</b></div> <div>Не составит труда найти массу людей, публикаций в прессе и Интернете, единодушно обвиняющих войну за громкость в том, что она разрушает музыку. Многие связывают её с уменьшением «динамического диапазона», хотя никто обычно не объясняет, каким он должен быть. Однако, как мы узнали в этой статье, война за громкость фактически не привела к уменьшению такого параметра, как диапазон громкости, определённый по методике EBU 3342 (по сути дела, это довольно близко к тому, что люди как раз и подразумевают под словами «динамический диапазон»). При этом, невозможно установить никакого уменьшения динамической вариабельности ни в каком масштабе.</div> <div> <br /> </div> <div>Так что ж за проблема с войной за громкость? Очевидно, ограничение делает что-то «неправильное» с сигналом, иначе б люди не жаловались – даже при том, что они указывают на не совсем корректный критерий, описывающий его параметры.</div> <div> <br /> </div> <div>Чтобы правильно ответить на этот вопрос, попробуем представить, что звук – это фотография, и сделаем анализ этого «фото» по такому параметру, как распределение яркостей. У Фотошопа это можно найти в диалоговом окне Levels. Чтобы сделать оценку, алгоритм проверяет все пиксели в картинке и затем сортирует в зависимости от яркости. В результате, получается график распределения, показывающий, включает ли изображение преимущественно светлые, средние и тёмные области, и их относительные пропорции. Тот же самый процесс можно провернуть и со звуковыми файлами: мы проверяем все сэмплы в песне и сортируем их по абсолютному уровню. Как показано на иллюстрации, кривая распределения может рассказать много интересного.</div> <div> <br /> </div> <div>Посмотрим на кривую распределения для песен, выпущенных в 2007 году (красная кривая). Их пики имеют более высокий уровень, чем в песнях 1967 года (синяя кривая). Очевидно, что более новые песни в среднем намного громче. Следующим делом, посмотрим на ширину обеих кривых: они сравнимы, и это означает, что кое-какие вещи, близкие к динамической вариабельности, остались неизменными между 1967 и 2007 годами. Теперь посмотрим на всплеск в правой стороне красной кривой. Он показывает, что песни этого года имеют ненормально высокую плотность высокоуровневых сэмплов: кривая перестаёт следовать за «нормальным» распределением Гаусса в зоне высоких уровней. Это результат воздействия brickwall-ограничителей.</div> <div> <br /> </div> <div>Продолжим сравнивать звук и изображение. Представим, будто последние 20 лет все картинки в журналах и книгах становились всё ярче и ярче. В них всё ещё есть глубокий чёрный цвет, контраст не повреждён, но при этом все картинки выглядят очень яркими. Подобные вещи иллюстрируют нам две фотографии Тауэра. Можно подумать, будто всё в наши дни прямо таки «сияет», хотя здравый смысл предполагает, что есть какие-то вещи, которые не могут быть настолько сияющими ни при каких условиях. Это тем более верно в случае со звуком, для которого «яркость» означает не только высокую плотность засвеченных пикселей. Это также означает уменьшенный крест-фактор, изменённую огибающую, использование второй парадигмы громкости и, в особо тяжёлых случаях, искажение. Хотя, в общем-то, эти характеристики не обязательно означают что-то плохое, но всё-таки здравый смысл нам подсказывает, что такого не должно быть буквально в каждой записи.</div> <div> <br /> </div> <div>В конце концов, это всё – вопрос стиля. Уменьшенный крест-фактор создаёт «компактность» в звучании; и на странице MaxxBCL компания Waves описывает это как «тяжёлый in-your-face сигнал, что сотрясает дом». Подобные вещи могут подойти к Вашим песням, а может и нет. Или, может быть, Вы нарочно захотите оставить «мягкость» в своих треках. Хотя, если Вы делаете тяжёлую техно-музыку, стремление к «компактности» может быть хорошей идеей. Также, описанные ранее две парадигмы громкости обладают весьма отличающимися «ароматами», и, в зависимости от материала и художественных целей, можно предпочесть тот или иной вариант. Хотите, чтобы каждая громкая атака изменялась компрессором/ограничителем? В одних случаях это пойдёт на пользу, в других – во вред. Или, может Вы хотите просто уменьшить динамический диапазон музыки и не затронуть более ничего? В таком случае, лучше активнее пользоваться автоматизацией уровня, нежели ограничением, поскольку, как мы уже говорили ранее, диапазон громкости имеет определённую сопротивляемость к процессу ограничения.</div> <div> <br /> </div> <div>Важно понимать, что делаете, и как это соотносится с тем звуком, к которому Вы стремитесь. И если Вам нравится компрессия, но Вы боитесь, что Боб Дилан не одобрит Ваш звук, потому что он «слишком современный» и «слишком статичный», то не волнуйтесь. Скорее всего, он просто не слушает такую музыку.</div> <div> <br /> </div> <div><i>Автор статьи: Эммануэль Дерюти (Статья опубликована в журнале Sound on Sound)</i></div>

Загрузка комментариев...