Спасение звука – дело рук реставраторов. Старая пластинка: Что такое цифровой звук и реставрация звука с помощью цифровой обработки от пользователя Удаление щелчков и кликов

Вступление...

Специальная редакция для Обсерватории

Цикл статей по реставрации звука на обычном домашнем компьютере начат мной еще в 1999 году, но тихо почил, хотя и звуковых примеров и подготовленных анимированных gif-иллюстраций было набрано порядком. Любопытно, что мои материалы на эту тему погибали и восстанавливались несколько раз. Может, оно и к лучшему - на многое я сегодня смотрю по-другому, но и, как ни странно, остались кое-какие приемы и - что самое интересное - "софт", которые пережили эту почти семилетнюю разницу (а это огромный скачок в производительности домашних PC и качестве программ). На таких моментах я буду останавливаться подробней. В этом цикле я постараюсь охватить и общий подход к цифровой реставрации (в том виде, в котором я его отработал лично для себя, нисколько не претендуя на глобальность), и "задеть" необходимые места из теории звука и практики звукозаписи (как очень близкой области), и описать программы, которые мне кажутся наиболее удобными, и... однако, к делу.

Просто удручающее качество звуковых дорожек в большинстве из самопально оцифрованных советских мульт- и фильмов при довольно сносном качестве видео (про пираЦ кие сборнички музыки просто стыдливо умолчим) убеждают меня в необходимости такого начала. Более того, даже кое-какие эээ... студийные, так сказать, работы, а также диалоги с людьми, считающими себя в этой области профи, в духе:

А ты в курсе, что у тебя полезный сигнал заканчивается на 3КГц?

Да некогда мне было возиться со всеми этими компрессорами...

Я эти 11КГц преобразую в 44КГц и со звуком все нормально! Знаешь такой редактор CoolEdit?", - наводят на мысль, что даже самые примитивные базовые понятия порой следует внедрять под дулом автомата.

Кто считает, что ему это не нужно, может сразу перейти к третьей части - но, вдруг, и в первых двух найдет для себя новое, или поправит одну из моих невольных ошибок, чему я буду только рад. Начинающие же (а статьи ориентированы в первую очередь на них) да не пропустят ни слова;)

Основных характеристик "цифрового звука" три: частота сэмплирования (или квантования, ее еще называют sample rate), разрядность (глубина) бит (или попросту битность, или sample width), и количество каналов . AudioCD по этой схеме имеет параметры 44100/16/2. Можно грубо сказать, что для получения этого формата 44100 раз в секунду замерялась громкость звука по линейке высотой 2^16=65536 условных "звуковых миллиметров", иначе - шагов квантования . По этим же делениям она была жестко "округлена" (в кавычках - потому что шаги квантования отнюдь не обязаны быть целочисленными).

Изобразим условно аналоговый звук так:

Есть циничное мнение, что источников аналогового звука в природе вообще не существует - просто его разрешающая способность куда серьезнее. А среда распространения звука - воздух, например - является естественным фильтром очень высокого порядка;). С другой стороны, любую форму сигнала, какой бы сложной или ломаной она ни была, можно "собрать" из вот таких простых синусоид.

NB: ухо человека представляет собой очень сложную систему, в центре которой - коническая резонансная трубка-мембрана. Она имеет около 25 тысяч (!) окончаний нервных клеток-"микрофонов", каждая из которых "настроена" на свой диапазон частот (это просто и гениально обусловлено ее расположением на конической, напомню, мембране). Человеческий мозг воссоздает картину звука, получив сигнал, сведенный из этого безумного 25-тысячеканального микшерного пульта. Понятно, что технически создать такую модель, мягко говоря, сложно, да и, по счастью, не является необходимостью.

В электронном же мире звук превращается в аналоговый электросигнал вслед за колебаниями тоненькой круглой (плоской или слегка выпуклой) мембраны микрофона, порождаемыми мгновенной суммой амплитуд волн всех частот, ударяющих в нее. В том числе частот и гармоник, человеческим ухом не улавливаемых. Посмотрим, что происходит с этим электрическим, но все еще аналоговым сигналом при оцифровке с низкими и высокими частотой сэмплирования и разрядностью:

Как видим, "мелкоячеистая" сетка с высокими частотой (вертикальные линии) и разрядностью (горизонтальные линии) передает сигнал намного достоверней.

Разрядность 16 бит в формат бытового аудио тоже заложена буквально по минимуму, и для профессиональной работы со звуком используются разрядности в 18, 20, 24 и 32 бит (хотя на первый взгляд разница невелика, высо " ты таких линеек резко взлетают с 65535 в 1048576 (20бит) и 16777216 (24бит) "звуковых миллиметров". Размах же 32-битной шкалы даже произнести непросто: 4.294.967.296) . С точки же зрения файловой системы занимаемый треками объем при переходе от 16 к 24 битам возрастет всего в 1,5 раза, а к 32 битам - ровно в 2.

Количество каналов.... думаю, объяснять разницу между отжившими моно и квадро, вездесущим стерео и современными 5.1 и 7.1 сегодня не нужно даже младшеклассникам.

Еще одна характеристика - громкость, более правильно - амплитуда , или размах сигнала. Хотя по определению амплитуда может быть только положительной, часто так называют и мгновенное значение напряжения сигнала (а оно вполне может быть отрицательным). Амплитуду часто измеряют в децибелах (дБ или dB), и эта единица так же непроста, как и разрядность. Дело в том, что децибелы измеряют не абсолютные, а относительные величины . Скажем, между амплитудами в 0.5 и 1 вольт разница всего в полвольта, в dB эта разница равна 6. А между амплитудами 110 и 220 вольт разница - уже 110 вольт. Тем не менее, в децибелах разница... снова равна 6! Дело в том, что 6dB означает соотношение амплитуд как 1:2, независимо от того, какие именно значения принимают в данный момент амплитуды. Более того, шкала, по которой измеряются децибелы - логарифмическая. К чему все эти сложности? Наши уши воспринимают звук по логарифмической шкале, и от этого никуда не деться. Вот краткая справочная таблица для перевода отношений амплитуд в децибелы:



dB Отношение
0 1.00
1 1.12
2 1.26
3 1.41
5 1.78
6 2.00
8 2.51
10 3.16
20 10.0
40 100.0
60 1 000.00
80 10 000.00
100 100 000.00

Кроме того, у дорожки в целом есть и такая характеристика, как динамический диапазон (разница между самым тихим и самым громким звуками, при этом совсем необязательно самый тихий звук в дорожке окажется тихим вообще;) ). Чем шире диапазон - тем естественней звучат голоса, спецэффекты и "живые" музыкальные инструменты. Сжатие динамического диапазона позволяет усилить тихие звуки, не давая при этом громким "вырваться" за очерченные пределы. Такой процесс называют компрессией звука. Звук становится более плотным, иногда более ярким, но при излишнем усердии живые инструменты заметно "опластмассятся", а голоса станут похожими на пропущенные через (достаточно качественный, правда) радиотракт; спецэффекты же потеряют часть эффективности ;), основанную на резком изменении громкости. Например, накладываемый в фильмах любительский дубляж часто подвергается довольно жесткой компрессии, порой совершенно излишней. Понятно, что динамический диапазон косвенно ограничен разрядностью сигнала.

Потери, связанные с описанными характеристиками и их преобразованиями.

Частотные. "Стандартные" компьютерные частоты сэмплирования, по счастью, кратны друг другу: 44100, 22050, 11025 и т.д. Это помогает избежать ряда проблем с искажениями при преобразованиях и, в частности, появления низкочастотных огибающих, которые мы можем получить при преобразовании "некратных" частот - к примеру, 48000 "киношных" и 44100 "компьютерных" могут дать нам, помимо прочего, искажения в районе 48000-44100=3900 герц - прямо в центре слышимого диапазона (все, кто хоть немного сталкивался со струнными инструментами, отлично знают на практике, что такое "биение частот" при подтягивании струн в унисон). Но это еще не все подарки мирового кинематографа: "благодаря" формату NTSC мы имеем т.н. "пониженные" частоты - 44056 и 47952 Гц. Вкратце, это связано с "рваной" частотой NTSC в 29.97 кадров в секунду, в то время как синхрокод SMPTE, согласующий работу устройств в студии, "отрабатывает" ровно 30. По счастью, встреча с такими оцифровщиками и их продуктами сегодня маловероятна. Цифровая спутниковая телесвязь, и за ними DAT-магнитофоны тоже не остались в стороне, присовокупив от себя частоту сэмплирования 32000 Гц, что, впрочем, на фоне проделок NTSC выглядит детской шалостью.

Далее, при передаче цифрового сигнала от одного устройства к другому мы не застрахованы от искажений в низких частотах, связанных с несовершенством цифровых интерфейсов. Обо всем этом написано столько, что мы просто обозначим для себя: насколько возможно, следует избегать преобразования частот (особенно некратного) и передачи сигнала даже по, казалось бы, чисто цифровым интерфейсам. Всем этим условиям отвечает обработка звука полностью внутри компьютера - мы теряем только на входе. (С другой стороны, если у Вас вдруг окажется профессиональный внешний, специально предназначенный для преобразования частоты сэмплирования прибор, лучше воспользоваться им. Правда, это дорогостоящая техника, да и качества программной обработки вполне достаточно для дорожек к мультикам или самодельным концертным записям).

Есть искажения, на которые мы повлиять не можем - например, зависящие от собственной частоты звука. По совести, для полноценного восстановления синусоиды частотой 20КГц частота сэмплирования должна бы быть далеко не 44КГц (44100/20000=2.205 замера явно мало для восстановления двух полуокружностей! Вместо них мы получим две "ступеньки" - см. графики в начале статьи), в идеале - несколько сот (!) килогерц. К счастью, этот тип искажений худо-бедно компенсируют современные фильтры высоких порядков, "отбрасывающие" большинство образующихся гармоник-искажений. По этой же причине микросхемы современных усилителей для качественной передачи звука работают с частотами от десятых долей мегагерц и выше .

Еще одна очень неприятная потеря - т.н. детонация частоты ("wow", "flutter"). Возникает она на аналоговых носителях в случае, если лента по каким-то причинам ("бьющий" прижимной резиновый ролик или тонвал, и т.д.) движется "рывками" или с плавным ускорением-замедлением, либо сама лента уже деформирована лентопротяжным механизмом. Это приводит к изменению высоты тона и, при более явном проявлении, к нарушению ритмического рисунка. Я однажды с ужасом наткнулся на грампластинку с записью Тони Йомми, дорожки на второй стороне которой были... отпечатаны не по центру диска (!). Качание звука было то еще, да и визуальное гуляние тонарма и самих дорожек переплюнуло целый ряд "мультяшных" граммофонов. Почему я отдельно упоминаю о пластинках? Дело в том, что автоматического способа исправления таких искажений нет, и в ближайшее время он вряд ли появится . Если фонограмма имеет неоспоримую ценность, то имеет смысл помучаться с ней вручную, "подгадав" в несколько дублей период качания по паре десятков колебаний и наложив "противофазные" искажения (подробнее об этом позже); но и это справедливо только для ленточных детонаций, т.к. пластинка по мере продвижения ее спиральной дорожки к центру диска... вот-вот. Угловая-то скорость неизменна, а линейная - увы.

Амплитудные. Следующий тип искажений связан с любыми преобразованиями, даже в виртуальных устройствах - это погрешности при необходимости снова "привязывать" полученные нами громкости сигнала к "высоте" разрядной линейки. Компьютер как таковой от них, конечно, уже не спасает, и в нашей воле - только выбор компромиссной разрядности при обработке (и хранении) сигнала. С действительно качественным звуком имеет смысл работать не ниже 24-32 бит (хотя многие даже не заметят разницы в звучании). Используемые программы при таком принципиальном подходе желательно проверять на честность обработки - так как порой она не соответствует заявленной производителями (во время обработки звук может быть пересчитан в 16 бит). Для проверки можно воспользоваться, например, BitPolicy.

Отдельный и важный разговор - об оптимальной амплитуде обрабатываемого сигнала. Работа с тихим сигналом - в небольшой "нижней" части амплитудной линейки - понижает его разрядность, так как всякий раз после любой обработки мы округляем полученный размах к нескольким, пропорционально "укрупнившимся" ее ступенькам. Так можно "уронить" разрядность до 14 бит и даже ниже. Фактически, 16-битный сигнал в -24dB (около 6% макс. амплитуды) имеет разрядность в 12 (!) бит - "высота" соответствующей ему части линейки - всего 4096 делений! Пара упомянутых мной во вступлении мультфильмов имела именно такую амплитуду, но зато звук гордо замотан в AC3 с частотой 48 КГц. Знай, мол, наших. Кстати, для достижения 12-битным звуком качества 44100/16 частоту сэмплирования пришлось бы поднять до 705.6КГц!


Чем ниже амплитуда, тем большим искажениям при обработке она подвергается.

Слишком же большая амплитуда, в свою очередь, может приводить к тому, что сигнал окажется выше самого "высокого" деления амплитудной "линейки". Это так называемый "клип" (clip) - "отрезанная", навсегда потерянная часть сигнала. "Звучат" клипы по-разному: полученные при обработке - как резкие сухие щелчки, при оцифровке - как глуховатый треск, и малозаметный "теплый" перегруз на более дорогих, профессиональных оцифровщиках, которые стараются по мере сил мягко лимитировать их до допустимого максимума. Подобные мягкие искажения близки к "живым" аналогам - скажем, к катушке динамика в акустической системе, которая дошла до максимума своего движения в магнитном поле, или магнитной пленке, попавшей в такое поле, при котором "дополнительное" намагничивание уже невозможно.

Разумным компромиссом при обработке будет выбор амплитуды, над которой останется небольшой "воздух", от -3dB или чуть больше ("на глазок" в редакторах - до 30% свободного пространства от полной высоты аудиотрека). При записи сигнала, в предсказуемости которого (или в самом звуковом тракте) нет уверенности, верхний порог следует отрегулировать уровнями записи ближе к -6dB - это наверняка защитит Вас как от перегрузок платы во время неожиданного "всплеска" в звуке, так и от "запирания" в микшерном пульте или промежуточном усилителе (NB: метку "0 VU" аналоговых выходов студийного оборудования подстраивают и под -12, и даже под -15dB уровня цифровых рекордеров!) . Альтернатива - использовать лимитер, если он у Вас, конечно, есть. Это позволит Вам не только сгладить ошибки с уровнем при оцифровке, но и снивелировать действительно ненужные пики; кроме того, при умелом подходе, Вы сможете немного "накачать" общую амплитуду, не испортив сигнал для дальнейшей обработки. Конечно, при вдумчивом и уважительном обращении.

По окончании работы со звуком (но не раньше) можно нормализовать дорожку (см. часть 2) вплоть до -0.2dB - визуально примерно на 97% от максимального размаха. По другим рекомендациям, самый мощный сигнал при финальной нормализации не должен превышать -0.5дБ. Выравнивать пики под 0dB в любом случае не стоит. Заметного изменения громкости не произойдет, а вот к проблемам такой уровень приведет запросто. Здесь неплохо поставить точку еще на одном часто возникающем вопросе - чувствительность человеческого уха: вблизи порога слышимости она составляет 2-3dB, а на средних уровнях - около 0,4dB.

Разрядность и... шум . На первый взгляд связь между ними уловить трудно, на деле же - это еще один подвох квантизованного звука. И еще один довод не работать без нужды с тихим сигналом. Для идеального (идеального, подчеркну) теоретического преобразователя всегда существует максимальное соотношение сигнал/шум, которое он может обеспечить, и оно в первую очередь зависит именно от амплитуды. Все очень просто: даже при нулевом шуме соотношение сигнал/шум не может быть больше, чем весь динамический диапазон, предоставляемый разрядностью. Существуют две формулы, более точная и упрощенная (1 и 2 соответственно):

1.76 + (число бит * 6.2) = отношение сигнал/шум

2 + (число бит * 6) = отношение сигнал/шум

Таким образом, как ни крути, а 12-битная глубина физически не сможет обеспечить сигнал/шум больше, чем 74dB (звучание магнитофонной деки или FM-радиостанции). Для сравнения: 8-битный звук дает 50dB (радиовещание "старых", средневолновых станций), а 16-битный - 98dB (полный динамический диапазон симфонического оркестра). С реальными же, а не теоретическими оцифровщиками эти цифры, конечно, еще ниже - в эту копилку подкидывают свои монетки погрешности параметров электронных компонентов, недостатки экранировки аналоговой части, помехи соседних цифровых устройств, и т.д.

Потери от уменьшения количества каналов мы рассматривать не станем:).

    Подведем итоги первой части:
  • увеличение частоты сэмплирования и разрядности сигнала хорошо отражается на его достоверности;)

  • лишние преобразования (и особенно передача сигнала между устройствами), пусть даже в цифровой форме, искажают сигнал; как следствие - частоту сэмплирования выходного трека следует выбирать сразу при оцифровке и, если целью является просмотр на компьютере, лучше сразу установить ее в 44100, чем в 48000 с последующим (да к тому же "некратным") преобразованием.

  • максимальный пик сигнала желательно "подгадывать" при записи сигнала с непредсказуемой динамикой (либо на непредсказуемой аппаратуре) под -12dB - -6dB; в процессе обработки - в -6dB - -3dB, чтобы максимально уменьшить искажения при обработке и оставить при этом безопасное пространство для будущего изменения формы сигнала. (NB: при многоканальном сведении также неплохо удерживать уровни треков в диапазоне -12dB - -6dB). Финальную нормализацию микса или обработанного трека правильно делать ниже 0dB, в диапазоне -0.5dB - -0.2dB.

P.S.: на самом деле еще многие "мелочи" и подвохи цифрового мира остались за кадром. К примеру, записывая тот же сигнал в 20КГц, вы всякий раз чудом попадаете в кнопку "Rec" именно при прохождении синусоидой нуля? Нет? Значит, каждый ваш дубль "даст" на осциллограмме (а значит, и в звуке) каждый раз совершенно различные результаты! И не только на этой частоте, но и, естесственно, на всех остальных. Остался за кадром и такой момент, как инерционность человеческого уха (а ведь оно, как и глаз, принимает свои слишком быстро сменяющиеся "слуховые кадрики" за плавное непрерывное "движение" звука), и прочее, о чем и без меня всюду и много. Мы же перейдем к

Восстанавливаем старые записи

2 Февраля 2015
Не так давно на Хабре проскакивала новость о том, что учёным удалось восстановить одну из очень старых записей, сделанную ещё в 1905 году, не повредив при этом носитель. Основным достижением тут является как раз факт целостности носителя, так как запись сделана была не абы на чём, а на восковом цилиндре. Это чуть ли не самый первый изобретённый способ записи\воспроизведения звука, который широко использовался. До этого носителем были стеклянные цилиндры с сажей (воспроизводить их правда не умели), затем покрытием стала фольга и лишь потом воск.

Я, разумеется, заинтересовался таким-то раритетом и решил послушать как там люди вообще жили-то, в далёком 1905-ом...К моему удивлению, оригинальная запись оказалась достаточно шумной, хоть и утверждалось, что она была обработана различными шумоподавляющими алгоритмами и т.д... Стоит отметить, конечно, что по сравнению с другими восстановленными с восковых цилиндров записями, эта действительно была весьма хороша - по качеству уже вполне сопоставимо с первыми пластинками. Однако, как известно, лучшее - враг хорошего.

Я вообще любитель старых довоенных песен, и зачастую приходится немного обновлять звук добытых из глубин сети экспонатов. В частности, например, этим страдают записи песен из старых фильмов, так как там и сам оригинал фильма не блещет качеством звука.

В рассматриваемом нами случае, мы имеем, фактически, слепок дорожки, сделанный лазером. Я сейчас не рассматриваю тот факт, что господа археологи тоже применяли какие-то процедуры к исходному звуку, однако буду считать что они пытались максимально точно воспроизвести оригинал. Так как линейные размеры дорожки, в данном случае, достаточно велики, говорить о погрешностях оцифровки практически не приходится, тем более для исходного файла выбрана достаточно высокая частота дискретизации, примерно в четыре раза превышающая частоту звуков в записи. Значит можно считать, что перед нами практически идеальный слепок оригинальной звуковой волны.

Тут мы сталкиваемся с особенностями материала и самого способа воспроизведения.

Факт номер раз: материал, из которого сделан цилиндр достаточно мягок (воск), на нём, даже будь он идеально новым, невозможно запечатлеть звуки с длинной волны меньше определённого значения.
Факт номер два: помимо материала вносит свои коррективы и сама технология записи на такие цилиндры - звук писался буквально иглой по цилиндру.
Факт номер три: воспроизведение такого цилиндра само по себе разрушало носитель.

Первый факт даёт нам ограничение максимальной частоты записи примерно в 5-6 кГц и, как мы увидим в дальнейшем, это очень важно. А второй и третий факт сообщают, что о сохранении крутизны фронтов и форме волн можно особо не беспокоиться - не та точность, изначально.

Для начала включим спектральное представление сигнала и возьмёмся за эквалайзер (а эквалайзер это ведь наше всё).

Что мы видим на спектрограмме? Частота дискретизации файла у нас аж 22000 кГц, при этом никаких звуков в записи, как мы видим, нет выше 4.5 кГц, чего и следовало ожидать (см. факт номер раз). Однако, если присмотреться повнимательнее, какая-то грязь всё-таки просачивается выше (чтобы лучше было видно, повысил контрастность и яркость в квадрате, обведённым красным). Откуда оно берётся непонятно, но не вдаваясь в детали мы первым же делом можем с чистой совестью порзать всё выше т.н. "частоты Найквиста" для нашей частоты дискретизации (11 кГц). Так как запас там ещё приличный, я не стал мелочиться и убрал всё выше 8 кГц, а также ниже 100 Гц, так как там, судя по спектрограмме, тоже ничего дельного не было.

Немного поразмыслив, я подошёл к этому моменту ещё более радикально, а именно - не стал морозится с эквалайзером, а начал всё с начала и сразу изменил частоту дискретизации файла до 11 кГц.

Далее, не мудрствуя лукаво, воспользуемся инструментом, который есть во многих современных аудио-редакторах: Noise Reduction. Идея проста - выделяем место в треке, где у нас нет ничего кроме шумов. Далее создаём паттерн этих шумов (Capture Profile). В простейшем случае вам будет достаточно одного единственного ползунка Noise Reduction Level.

Он там, правда, говорит, что у них, якобы движок обновился (речь о версии CS5.5) и они теперь умеют не создавать лишних артефактов при шумоподавлении, но, мы-то с вами знаем, что разница практически отсутствует. И настройки все те же, разве что окошко в новой версии перерисовали.

Есть ещё некоторые нюансы которые этот харизматичный мужик в видео не затрагивает, например "ширина окна" для преобразования Фурье (FFT Size).

Ширина окна влияет на частотное и временное разрешение сигнала - при увеличении ширины окна повышается частотное разрешение, но уменьшается временное разрешение и увеличиваются вычислительные затраты на выполнение быстрого преобразования Фурье.

Если не вдаваться в подробности, при избавлении от случайных (это важно) шумов, следует стремиться использовать как можно большее число точек (Snapshots in profile) при максимально возможном на данном отрезке FFT Size. Всё это значит, что для качественного "шумового профиля" нам нужен как можно более длинный отрезок, в котором есть только шумы. Вообще, чем хорош Noise Reduction, так это тем, что его можно использовать не только для шумов, но и для различных фоновых звуков (шум леса, дождя, etc.)

На самом деле, в том же SoundForge есть и более интересные инструменты, например возможность вычитать из сигнала волну произвольной формы, но я начинал пользоваться Audition"ом, ещё в бородатые времена, когда он звался CoolEdit, и тогда SoundForge даже близко ничего похожего не мог, а теперь мне уже лень браться за что-то новое.

Я привычно взялся искать в файле отрезок с шумами, но оказалось, что они слишком короткие и при формировании выборки по ним, можно было составить только слишком короткие паттерны. Из-за этого либо шумоподавления не было слышно вообще, либо появлялись дичайшие артефакты. Тут я стал думать как же мне с этим быть. А пока думал, решил зайти с другого конца.

Самыми раздражающими в нашем случае являются мягкие щелчки, а также периодичный шум, следующий сразу за щелчками. Я думаю этот эффект появился вследствие отклонений поперечного сечения цилиндра от формы круга, либо ось не ровно стояла. В какой-то момент, при записи, иголка слишком глубоко входила в воск (начальный щелчёк) и дальше короткий отрезок шла по неровности (продолжающийся несколько раз после щелчка характерный шум), далее цилиндр делал полный оборот и шум повторялся. Как мы увидим далее, от этого шума нам всё-таки удастся избавиться с помощью Noise Reduction, однако продвигаясь по файлу и просматривая форму волны, я заметил, что тут присутствуют ещё и достаточно странные косяки, похожие на характерные искажения A\B-усилителей. Очень характерный пример на заглавном скрине статьи, но там ещё достаточно спорно, так как у того искажения слишком длинный период (я выбрал наугад из файла). А вот на следующем скрине видно очень хорошо что я имею ввиду.

О том как эти штуки (не )надо лечить и почему, я решил написать отдельно, а чтобы статья слишком не разрослась, спрятал под спойлер. Можно пропустить этот кусок, это почти что лирическое отступление.

О том, как убирать искажения не надо и почему

На скрине выше не очень хорошо видно, так как я чуть отодвинулся для масштаба, но длительность такого колебания - жалкие 80 микросекунд. Проделываем нехитрые вычисления:

T = 0.00008 мс (период)
F = 1 / T = 12500 Гц (частота)

Самое время вспомнить первый факт, озвученный ранее: очевидно, в подобной записи 12-ти килогерцам взяться неоткуда, так что практически наверняка это тоже шумы. Тут можно было бы обратиться к спектрометру, однако, так как эти колебания имеют совсем уж мизерную амплитуду, а кроме того, их, почему-то, слишком много, на спектральном представлении они совершенно не выделяются и похожи на тёмный-тёмный точечный фон (картинка с более контрастным квадратом это как раз оно и есть).

Врядли такие косяки возникли из-за движения иглы. Я полагаю это микро-трещины на воске, которые появились, скорее всего, из-за времени.

В идеальном случае, может показаться будто было бы круто просто взять и вырезать такие места, причём целыми периодами: так как эти колебания приходятся на места, где у нас фактически дефекты записи, однозначно можно сказать, что никакой полезной информации они не несут, а так как нам не принципиально сохранение оригинального тайминга композиции, мы могли бы смело их удалять - в среднем они длятся не более 100 мкс, это совершенно мизерный промежуток, на слух такое заметить нереально.

Только вот, живём мы не в идеальном мире (хотя, это как посмотреть), так что это достаточно скверная идея. Дело в том, что при удалении участка, происходит т.н. smoothing, т.е. сглаживание уровней соседних точек. Так как это у нас цифра, такие мельчайшие неровности после сглаживания это самый натуральный В/Ч шум. Мы его немного ограничили снизив частоту дискретизации файла, но тем не менее. Тут можно было бы попробовать порезать такой шум эквалайзером после всех удалений, но, опять же, это изменит форму волны, а в силу того что звук у нас цифровой, тут всё упирается в математику - сделать эквалайзером ровный срез по нужной частоте просто так не получится. Кроме того, как я говорил выше, таких искажений слишком много, отчего ручками вот так всё править практически бессмысленно - такие фрагменты имеют длительность порядка 100 мкс, а значит для того чтобы это "улучшение" было хоть немного заметно на слух (теоретически), вам нужно удалить просто невероятное количество таких участков. При этом, так как в остальном файле эти искажения никуда не денутся, "чистый отрезок" в пару миллисекунд будет банально незаметен на фоне шумных. И ещё бочка дёгтя - результаты сглаживания сотен удалённых отрезков создадут такой шум, что первоначальный вариант (который был без правки) покажется вам даже лучше того что у вас в итоге получится.

Помимо всего перечисленного, волны порой интерферируют друг с другом совершенно невообразимым образом (простите за тавтологию), отчего однозначно понять где конкретно искажение, а где, скажем сибилянты, очень сложно - для этого, как минимум, нужно хорошо знать особенности человеческой речи, формирование гармоник и всё остально. Так что, даже если бы не smoothing, при таком удалении есть неиллюзорный шанс банально попортить изначальный звук, сломав интерференционную картину.

И тем не менее, лекарство от данных болячек есть - ниже я покажу как подчищать звук, в том числе и от подобных искажений.

В один из моментов, когда я рассматривал спектрограмму сигнала, до меня дошло, что в конце песенки, есть достаточно длительный момент, когда ничего, кроме "свиста птиц", не звучит. А свист этот на спектрограмме имеет вполне однозначную полосу.

А значит мы можем схитрить. Расчехляем эквалайзер, выставляем максимальный Range (это динамический диапазон, говоря проще, на сколько дБ будет усилена\ослаблена та или иная частота) и режем частоты на которых у нас поют птицы, а всё что ниже\выше оставляем.

Так как даже максимального динамического диапазона не хватает чтобы полностью прибить всех птиц, повторяю эквалайзер дважды. Вообще, про то как он работает, и почему так всё происходит, можно отдельную статью писать, только, боюсь, я не настолько хорошо знаю математику алгоритмов чтобы на эту тему умничать.

Итак, теперь мы имеем достаточно длинный отрезок с одним лишь шумом... и, правильно, возвращаемся к тому, с чего начинали. Захватываем профиль шума (после захвата нажимайте close, а не cancel, ибо иначе все настройки сбросятся к предыдущим использованным).

Помимо Noise Reduction, ещё есть фильтр Hiss Reduction, он, как следует из названия, поможет нам избавиться от свиста и всякого разного подобного. Настройки там почти аналогичные шумодаву, разве что FFT Size как-то по другому работает, а как именно я так и не разобрался, поэтому действую тут эмпирическим путём, чего и вам советую. Для Hiss Reduction тоже необходимо указать базовый уровень шума (кнопка Get Noise Floor), так вот, этот базовый уровень захватывать стоит на том же отрезке, на котором мы захватывали шумовой профиль.

После применения этих двух разновидностей шумодава, мы получаем уже вполне годный к потреблению результат. Разве что, небольшие артефакты на концах спектра появляются. Тут нам на помощь снова приходит эквалайзер - нещадно режем всё ниже 150 Гц и выше 4.5 кГц.

Стало заметно тише, но щелчки до сих пор слышны. Теперь в дело снова идёт спектрометр. Если на данном этапе послушать файл и наблюдать за спектрограммой, будет очевидно, что в момент щелчка шум имеет весьма широкий спектр, а вот мелодия, напротив идёт чёткими волнистыми линиями (ниже, для наглядности выделил один щелчок красным).

Для начала устраним апмлитудные всплески на местах щелчков. Для этого переключаемся в режим отображения формы сигнала. Как правило, это всего один "зашкаливающий" период волны.

В случае, если этот период был просто слишком громким, то я обычно просто делал его тише. Если он был ещё и сильно искажен, то удалял целиком (лень выправлять каждый, чего уж тут).

А тут я расскажу как буквально в два щелчка править амплитуду таких скачков.

Хинт о том, как удобно юзать избранное в Audition

Собственно, идея тривиальна. В Audition для произвольного участка записи мы можем задавать определённый график изменения громкости (Amplitude and Compression -> Envelope). Т.е. например можем сделать плавное затухание, или резкое появление. Ну в общем, нарисовать можно, что душе угодно. Обычно этот инструмент применяется для больших масштабов. Однако, я придумал как его можно использовать на микромасштабах. Открываем "Избранное" (Окно->Избранное) и создаём новый пункт. Выбираем эффект Envelope и правим настройки. В настройках создаём простейший график-дугу, с одной единственной точной-минимумом ровно по центру графика (50% время, 50% амплитуда). Придумываем имя, сохраняем и двигаемся к нашему первому щелчку.

Теперь вам надо всего лишь выбрать на максимальном приближении один период волны "щелчка", который зашкаливает и два раза щёлкнуть по созданному эффекту в избранном. Вуаля - щелчёк по уровню становится примерно равен окружающим его колебаниям. Этакий "ультрапрецизионный софтлимиттер". В принципе можно добиться аналогичного эффекта и Hard Limiter"ом, но он порежет под один уровень все звуки в треке, а нам надо резать только ненужные. Кроме того там ещё есть ряд нюансов - например часто просто невозможно подобрать такие настройки, при которых лимиттер режет только то что нужно, например, когда щелчки слишком резкие.

После того, как самые громкие щелчки были побеждены, пришло время избавляться от мелких искажений, которые есть по всему файлу. В предыдущем спойлере я уже рассказал как их удалять не стоит, а сейчас расскажу как делать это более-менее правильно.

Тут нам снова пригодится спектральное отображение сигнала. Если зорким взором окинуть панель инструментов в этом режиме, в глаза бросается вещь, вроде бы совсем не связанная с миром аудио-редакторов. Кисть. Она-то нам и нужна.

Она позволяет удалять произвольные участки на спектре. Будто динамический сверх-точный эквалайзер.

Помните я писал, что щелчки имеют широкий спектр, а вот музыкальные звуки хорошо читаются на их фоне? Сейчас мы этим и воспользуемся. Выбираем эту кисть, ищем момент где у нас идёт такой вот столбик шума на фоне музыки. Далее рисуем этой кистью в местах где у нас только шум, не затрагивая при этом музыкальную линию. Далее нажимаем del, затем передвигаем ползунок выделения чтобы просмотреть чё у нас получилось, либо просто начинаем рисовать кистью на новом месте. И видим что там, где только что удаляли, у нас теперь темнота, то есть тишина.

Только это неблагодарное занятие, на самом деле. Потому что в реальности звуки имеют гораздо более сложную природу и помимо шумов между главными гармониками часто присутствуют менее важные призвуки. Но несмотря на то, что они менее важны, они придают звуку более естественный окрас и характерность, чего можно лишиться, если приняться выпиливать вообще все не гармонические звуки.

Кстати, помните я писал про то, что при удалении периодов появляется некий шум, которому вроде как и взяться неоткуда? Долго работая кистью в спектрографе, можно заметить что даже в этом режиме такой шум тоже иногда появляется - вокруг удалённой области непонятно откуда появляются белые участки - это оно и есть.

Внимательный читатель, наверняка ещё задаётся вопросом, а почему я, для того чтобы получить профиль шумов (там где "свистят птицы") использовал эквалайзер, а не эту "кисть", коль скоро там ничего, кроме свиста нет?

На самом деле вопрос хороший, так действительно можно было бы сделать, но мне, во первых лень было обводить всю огибающую, а во вторых, т.к. свистит тут у нас не идеальный синтезатор, остаётся вероятность наличия в свисте дополнительных гармоник, которые также присутствуют и в остальной песне. А если мы посчитаем на их основе шумовой профиль, то, очевидно, ошибочно избавимся от них при обработке. Хотя, на самом деле, конечно, основную роль конкретно в этом случае сыграла моя лень...

Итак, в качестве финальных штрихов прогоняем Automatic Click remover в режиме чуть сильнее среднего (верхний ползунок 30, нижний 75) - он уберёт резкие щелчки, которые могли появиться в результате наших манипуляций. И эквалайзером ещё раз срезаем всё выше 5 кГц и ниже 100 Гц. Далее нормализуем файл до 100%. Я ещё удалил самое начало файла, буквально полсекунды где-то, там всё равно после всех наших манипуляций ничего не осталось.

Кстати, в оригинальной статье не было упоминания, да и теги в файле проставлены не были, исполнители оригинала: Harlan And Belmont.
А Byron Harlan даже есть на

ГЛАВА 1 РЕСТАВРАЦИЯ ЗВУКА

Старые аудиокассеты и виниловые пластинки у многих из нас хранятся десятками лет, они дороги нам, мы их бережем, но они бывают уже непригодны к прослушиванию. Ведь магнитная пленка, как и виниловая пластинка, с годами теряет свои свойства, что главным образом сказывается на качестве записи. Это приведет к тому, что запись может оказаться безвозвратно утраченной. В наше время это проблем решается элементарно - оцифровка позволит не только сохранить, но и оживить старый звук, например песню или музыку. В некоторых случаях простой оцифровки может оказаться недостаточно, и потребуется реставрация звука. После реставрации все дефекты звука (музыки, голоса) станут практически незаметны, а в некоторых случаях их удается убрать полностью.

Лучше всего оцифровать звук, а полученные файлы сохранить на жестком диске компьютера и записать на CD или DVD-диск. Кроме того, старые записи можно так обработать, что после сведения и мастеринга они станут звучать намного лучше, чем в оригинале.

Реставрация звука заключается в снижении заметности помех, то есть - убираются посторонние шумы, треск, щелчки и прочие дефекты записи, увеличивается громкость записи, расширяется частотный диапазон.

Восстановления качественного звучания старых аналоговых записей - это сложный процесс, который требует профессиональных навыков, музыкального слуха и специального оборудования. Для качественной реставрации звука нужна музыкальная студия, которая оборудована необходимой аппаратурой, которая наверняка потребуется для этого. Конечно, если вы хотите восстановить запись для собственного прослушивая у себя дома, то можно попытаться отреставрировать ее своими силами, используя обычный компьютер и стандартное программное обеспечение. Но если запись предназначена для публичного воспроизведения, например трансляции в радиоэфире или по телевидению, то лучше обратиться к профессионалу, который располагает специализированным оборудованием и имеет опыт восстановления старых записей. Оцифровка звука, выполненная на студийном оборудовании, подарит старой записи новую жизнь.

Аналоговый фильтр Баттерворта

Обобщенная функциональная схема цифрового тракта записи- воспроизведения, приведенная на рисунке 2.1, в равной мере относится как к магнитной, так и к оптической аппаратуре цифровой записи звука с мультиплексированием звуковых каналов ...

Запись звука к видеофильму формата Betacam с использованием цифровой технологии

Чистовая запись требует особой организации работы на съемочной площадке, поскольку записанные чистовые материалы впоследствии будут использованы непосредственно в кинофильме. Для этого нужно найти самый оптимальный подход...

Информационный процесс в автоматизированных системах

Из курса физики вам известно, что звук - это колебания воздуха. Если преобразовать звук в электрический сигнал (например, с помощью микрофона), мы увидим плавно изменяющееся с течением времени напряжение...

Исследование частотного преобразования акустического сигнала

При падении плоской звуковой волны на границу раздела двух сред, обладающих различными плоскостями и скоростями звука (т.е. с разными акустическими сопротивлениями), часть энергии отражается, а другая проходит во вторую среду. Причем...

Оборудование аудио и видео

Звук -- физическое явление, представляющее собой распространение в виде упругих волн механических колебаний в твёрдой, жидкой или газообразной среде...

Пример записи фильма в формате DVCAM

TASKAM 788 Рис 2.2 · Запись на 6 дорожек одновременно, воспроизведение 8 · Преобразователи 24-разрядные, частота дискретизации 44.1 кГц, возможна запись 16,24-разрядного звука · Жесткий диск 7...

Психоакустическое восприятие и midi-интерфейсы

Человеческое ухо номинально слышит звуки в диапазоне от 16 до 20 000 Гц. Верхний предел имеет тенденцию снижаться с возрастом. Большинство взрослых людей не могут слышать звук частотой выше 16 кГц...

Расчет телевизионного приемника

Исходные данные для расчёта: - напряжение питания UПИТ = 7 В; максимальный выходной ток = 10 мА.; - допустимый уровень частотных искажений Мн = 1.1 dB; - частота усиливаемого сигнала = 7.5 МГЦ. Выбор транзистора производим исходя заданных исходных данных...

Акустический звук представляет собой непрерывный во времени и по амплитуде процесс, то есть давление воздуха изменяется во времени плавно, а не перепрыгивает от одного значения к другому...

Системы регистрации речевой информации, используемые в настоящее время в ГА

Для хранения цифрового звука существует много различных способов. Как мы говорили, оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени. Таким образом, во-первых...

Установка звуковоспроизводящей аппаратуры в легковом автомобиле

Несмотря на огромное значение всего, что перечислено выше, необходимо признать, что наибольшее влияние на качество звука оказывают акустические системы и их основные элементы - динамические громкоговорители...

Устройство и эксплуатация телевизора LG МС-991А

Телевизионные приёмники на базе шасси МС - 991А обладают возможностью реализации трёхполосного воспроизведения звука...

Цифровая обработка сигналов

Звуковой сигнал, записываемый в реальных акустических условиях, часто содержит нежелательные шумы, которые могут порождаться окружающей средой или звукозаписывающей аппаратурой. Один из классов шумов - аддитивные стационарные шумы...

Перезапись с магнитной ленты (винила)

Для того чтобы с аудиоматериалом можно было совершать какие-либо действия (чистку, коррекцию и пр.) его необходимо переписать с оригинального носителя (катушки, пластинки, микрофона). Методика записи с CD в данной статье не рассматривается.
Я рекомендую захват аудио осуществлять посредством программы WaveLab от компании Steinberg (можно использовать любую другую программу).
Предварительно производится соответствующая коммутация выходных цепей устройства-источника сигнала с линейным (или иным доступным) входом аудиокарты компьютера.

Примечание: коммутацию лучше осуществлять при выключенной аппаратуре, т.к. высока вероятность выхода из строя оконечных каскадов звуковой карты компьютера.

Программа WaveLab запускается ярлыком, находящимся в меню «Пуск» или на «Рабочем столе». Непосредственно после первого запуска программы необходимо в настройках программы в качестве аппаратного средства воспроизведения и записи указать используемый системой драйвер. В противном случае возможны проблемы при записи или воспроизведении.

Необходимо изменить некоторые настройки, определенные по умолчанию:

  1. Выбрать в поле «File to create» опцию «Named File (.wav)», что означает осуществлять запись в финальный файл.
  2. Указать расположение, куда будет записан файл и его название.
  3. В меню «Properties» указать параметры (частота дискретизации и битрейт). По умолчанию установлено 16 bit и 44,1 kHz. С целью повышения качества записываемого материала можно (при наличии аппаратной возможности) можно установить 24 bit / 96 kHz, однако это приведет к увеличению занимаемого полученным файлом места на диске.

Примечание: ориентировочно оценить, какой объем аудиоматериала с текущими настройками еще можно записать на HDD можно по полю «Disc Capacity».

  1. Подать аудиосигнал и ползунками выставить оптимальный уровень (по пикам -3 – -5 dB, иначе возможны нелинейные искажения)

Примечание: если микшер невидим, его можно открыть кнопкой «Mixer >>».

Примечание: чтобы раздельно настраивать уровень левого и правого каналов необходимо перемещать соответствующий ползунок, зажав клавишу «Ctrl» на клавиатуре.

После того, как все настройки сделаны, можно приступать непосредственно к записи (кнопки «Record» и «Pause»).

Примечание: для того, чтобы впоследствии можно было осуществить шумокоррекцию, необходимо захватить 2-5 секунд фонограммы при отсутствии полезного сигнала (шорох виниловой массы или шелест ленты).

Вся сторона рулона (или пластинки) пишется в один прием, в один файл.

После окончания записи откроется окно с записанным файлом:

Полученный файл, как и программу WaveLab, можно закрыть (или записать еще несколько файлов – для этого сразу перейти к пункту 4).

Удаление фонового шума

Я использую программу CoolEdit2000 компании Syntrillium , можно использовать плагин для SoundForge , суть работы не изменится.
Ярлыком запускаем программу, далее необходимо открыть записанный файл, подлежащий шумоудалению:

Необходимо визуально определить стыки отдельных дорожек (обозначено желтым). Первый стык, откуда будет взят «слепок» шума, указан красными стрелками.

Ниже приведен увеличенный фрагмент.

Примечание: менять масштаб можно при помощи колеса мыши либо кнопками с изображениями лупы в окне программы.

Необходимо выделить (левой кнопкой мыши) участок, продолжительностью 1-4 секунды, не содержащий ничего, кроме шума.

Далее, чтобы загрузить профиль в буфер шумоподавителя, выбираем «Transform» -> «Noise Reduction» -> «Noise Reduction…» и выставляем опции в соответствии со следующим рисунком и в указанном порядке (с опциями можно экспериментировать и целью получения оптимального для конкретной фонограммы результата).

После закрытия окна шумоподавителя необходимо выделить всю фонограмму (кнопка с изображением лупы на фоне листа и двойной клик в область фонограммы). Далее вновь открывается окно «Noise Reduction» с уже загруженным профилем и выставленными настройками и запускается (кнопкой «OK») процесс шумоудаления, продолжительность которого зависит от вычислительных мощностей компьютера.

Примечание: оптимальные параметры лучше всего подбирать на коротких фрагментах, на слух и по спектроанализатору оценивая полученное качество.

Разбивка записанной дорожки на отдельные треки

Получившуюся дорожку, содержащую в себе несколько отдельных произведений необходимо разбить на части. Удобнее всего делать это в аудиоредакторе SoundForge 8.0 .
Запустить программу ярлыком, открыть редактируемый файл:

Непосредственно после первого запуска SoundForge необходимо указать тип аудиоустройства:

Визуально определяются стыки треков:

Место стыка масштабируется (колесом мыши) до необходимого уровня. Далее в позиции, обозначенной красной стрелкой необходимо вставить маркер. Для этого кликают правой кнопкой мыши в области, выделенной зеленым:

Появился маркер «01», который можно передвинуть ближе к началу следующего трека:

Затем в конце трека можно плавно сбросить уровень сигнала (эффект «Fade»). Для этого выделяется нужная область (длина подбирается исходя из фонограммы) и применяется сам эффект:

Примечание: длину корректируемой области можно изменять путем перетаскивания края выделения.

Аналогичным образом происходит обработка начала трека, однако, длина корректируемой области в этом случае много меньше:

Примечание: уменьшение и увеличение уровня этими опциями происходит линейно. Если требуется получить нелинейный (параболический и пр.) «Fade», используют пункт «Графическое…».

Остальные стыки правят схожим образом.
Итогом вышеперечисленных действий станут обработанные стыки (начало первого и конец последнего треков корректируют аналогично) дорожек и семейство маркеров их разделяющих.

Иногда возникает необходимость привести уровни отдельных треков к единому значению, что особенно актуально для дорожек, записанных с различных источников. Для этого нужно выделить один трек (достаточно дважды кликнуть между маркерами) и применить фильтр «Нормализация…». Настройки подбираются экспериментально.

Сразу после нормализации одного трека его можно вставить в отдельный файл. Сперва уже выделенный фрагмент (если нарезка происходит после нормализации всех треков, то трек необходимо выделить снова) копируется в буфер обмена:

Затем копированный кусок вставляется в новый документ следующим образом:

В итоге получается отдельный файл, содержащий только один трек:

Примечание: переключаться между вновь созданным и исходным файлом можно с помощью меню «Окно»:

Аналогичным образом поступают со всеми оставшимися треками, причем желательно делать нарезку в той же последовательности, что и в оригинале. Это позволит избежать путаницы с нумерацией, т.к. SoundForge автоматически нумерует вновь создаваемые файлы.

Получился набор нумерованных несжатых файлов.

Конвертирование в формат mp3

Поскольку несжатый wav-файл занимает много места, его можно ужать, естественно за счет потери части информации, в формат mp3. Существует множество других форматов компрессионного аудио, но mp3 является самым распространенным.
Пакетное конвертирование (т.е. сжимать будем сразу несколько файлов) осуществляется с помощью уже известной нам программы WaveLab, в которой необходимо активировать опцию «Batch file encoding…»:

  1. Найти папку, в которой находятся обработанные нарезанные файлы. Выделить их все.
  2. Добавить их в лист кнопкой «Открыть»
  3. Указать папку-приемник для сжатых файлов
  4. Выбрать формат mp3
  5. Установить желаемый битрейт (лучше 192 kbps и выше)
  6. Выбрать высшее качество («Highest quality»)

После установки всех настроек окно приобретет следующий вид:

После нажатия на кнопку «Start» запустится процесс кодирования. Обработанный файл отмечается зеленой меткой, обрабатываемый – красным.

После окончания процесса кодирования в папке, которая была указана в настройках, появятся сжатые mp3-файлы.

Редактирование информации в mp3-тэге

Следующим шагом будет добавление к сжатым аудио-файлам информации о его названии, авторе, альбоме и т.п. Для облегчения этой задачи воспользуемся программой TagScaner (можно использовать любой аналог).
Программа запускается ярлыком, расположенным в меню «Пуск» или на «Рабочем столе». Сразу после запуска программы необходимо указать папку, в которой находятся mp3-файлы.

На следующем рисунке видно, что mp3-тэг не содержит какой-либо информации, поэтому его необходимо заполнить. Файл, информация которого правится, подсвечивается. После внесения всех необходимых исправлений информация дописывается к существующему mp3-файлу нажатием кнопки «Сохранить», при этом для правки автоматически открывается следующий трек.

Для добавления одинаковой информации ко всем трекам (название альбома, год, стиль, артист) можно, выделив все треки в левой части окна, внести информацию в интересующее поле. При этом метка означает, что данное поле разных треков содержит отличную друг от друга информацию и что она будет сохранена. Подтверждение сделанных изменений осуществляется нажатием кнопки «Сохранить».

Далее следует изменить структуру названия mp3-файла. В качестве элементов названия может участвовать любая информация из тэга (автор, заголовок, альбом, номер трека). Структура названия задается в поле «Шаблон» (в данном случае запись «%1 - %2» означает «Имя_артиста – Название_трека.mp3»). Для предварительного просмотра полученных названий можно воспользоваться кнопкой «Проба…».

Если результаты переименования Вас устраивают, можно переименовать редактируемые файлы кнопкой «Новые имена».

В итоге вышеперечисленных действий должна получиться группа именованных сжатых mp3-файлов с добавленной в тэг дополнительной информацией.

Запись на CD

После того, как наберется достаточное количество mp3-файлов, их можно записать на CD. Рассмотрим технологию записи с помощью программы NeroBurningROM .
Программа запускается ярлыком.
После запуска пользователя спросят о характере вновь создаваемого проекта. Для диска, который записывают целиком и который планируют использовать с IBM-совместимыми компьютерами и mp3-плеерами, можно выбрать тип диска «CD-ROM(ISO)», «Нет мультисессии» (эта опция сэкономит порядка 15 MB).

В окно проекта перетаскиваются отсортированные по альбомам, исполнителю, годам файлы. Объем, занимаемый файлами на CD, ориентировочно можно оценить по шкале в нижней части окна проекта – стандартному 700 MB диску соответствует синяя и желтая шкала (до красной зоны).

После того, как mp3-диск сформирован, его необходимо записать. Перед началом процесса записи (для удобства последующей идентификации диска в коллекции) ему можно присвоить название, соответствующее содержимому (например, автор), а также выставить параметры записи. Для лучшей совместимости с аппаратными mp3-плеерами и устаревшими компьютерами скорость записи устанавливается не выше 24-й (оптимально 16), и метод записи диска – «Disc-at-once». Также нужно активировать функцию защиты буфера рекордера от опустошения («BURN-Proof» или аналогичную).

Анатолий Вейценфельд: Начнем с общих подходов к реставрации звука. Что мы в имеющейся фонограмме пытаемся спасти, стараемся вытащить, а чем мы можем пренебречь, оставить как есть? Возьмем для примера виниловые грампластинки - что мы можем с ними сделать имеющимся на сегодняшний день инструментарием?

Алексей Лукин: Виниловые пластинки - достаточно популярный случай, потому что сегодня их реставрацией занимаются не только профессионалы, которые не смогли найти мастер-ленты (или их вообще уже нет), но и любители, которые собирают пластинки, но хотят сохранить этот приятный потрескивающий звук для своей коллекции на айпаде, к примеру. Это по-английски называется needle drop, когда оцифрованные пластинки слушают на компьютере.

Первое, о чем хотелось бы сказать, говоря о виниле - что винил очень важно правильно проиграть. До того, как пойдет речь о качественном АЦП, о программах - важно хорошо очистить пластинку. Некоторые используют воду и мягкую тряпочку, другие применяют специальные клейкие составы, чтобы потом снять этот клейкий состав вместе с пылью, некоторые доходят до "мокрого прослушивания", когда проигрывание ведется с влажной и даже покрытой водой пластинки… в общем, способов много, об этом есть литература, рассказы реставраторов.

Предположим, что материал пластинки уже "снят ", оцифрован с максимальным качеством. Какая последовательность действий по реставрации?

Первое, с чем мы сталкиваемся в такой записи - это подавление щелчков. Для пластинок, особенно старых, потрепанных - это наиболее заметная помеха, которая, в свою очередь, мешает подавлять другие помехи, такие как шум, сетевая наводка. Поэтому первое, чем занимаются, - это подавление щелчков и тресков. Для этого существует множество программных продуктов, из лучших: iZotope RX, Click Repair - недорогой качественный конкурент RX в области работы со щелчками (если не нужны все функциональные возможности RX), CEDAR - это уже дорогая аппаратная Hi-End система реставрации, но существующая также в виде плагинов для SADiE, а теперь и для Pro Tools.

Начинать работу с фонограммой пластинки надо с автоматического декликера. Он в реальном времени находит щелчки и подавляет все, что смог найти. При обработке записи декликером я рекомендую сделать пару проходов, потому что иногда оказывается так, что на первом проходе после подавления одного мощного щелчка могут обнаружиться несколько мелких щелчков вблизи него, потому что декликер их не заметил. Поэтому два или даже три прохода могут улучшить качество очистки.

Второе - это удаление того, что мы на iZotope называем crakle. Так мы называем не отдельные щелчки, скажем 10 в секунду, а непрерывный поток сливающихся по времени щелчков, которые звучат уже почти как шум, но все-таки не ровный шум, а такой "песок", то есть мелкие-мелкие щелчки, идущие очень часто по времени. Для него также есть автоматический процесс De-Crackler. Он аналогично декликеру очищает очень мелкие щелчки, которые декликер мог пропустить. Однако декликер и декраклер основаны на разных принципах работы и потому могут дополнить друг друга, - если одному методу что-то оказалось не под силу, тогда другой может прийти на помощь. Вообще при обработке звука я часто советую использовать разные инструменты. Если действуют и один и другой, например, denoiser и deconstructor (это тоже модуль для шумоподавления), и оба дают хорошие результаты, можно их смешать в какой-то пропорции или последовательно прогнать с большей и меньшей силой, и тогда их достоинства складываются.

Но вернемся к винилу. После того, как подавлены щелчки и мелкий "песок", я рекомендую проверять запись на стереобаланс. Часто бывает так, что запись на виниле - монофоническая, а играется пластинка на стереопроигрывателе. Если игла проигрывателя подобрана хорошо, то такое воспроизведение - скорее достоинство, потому что царапины в канавке не симметричны и щелчки оказываются в разных каналах, в то время как полезная запись будет звучать по центру стереопанорамы. Это позволяет более эффективно подавить как щелчки, так и стационарный шум.

Как этим можно воспользоваться? Первым делом нужно удостовериться, что полезный сигнал звучит по центру стереопанорамы. Если это не так, то есть каналы не совсем сбалансированы или игла не вполне вертикальна, (это могут быть недостатки проигрывателя или предусилителя-фонокорректора), то следует выровнять баланс по амплитуде.

Еще одним важным моментом согласования каналов является выравнивание азимута. Это понятие пришло из магнитофонной записи, и означает выравнивание задержки между левым и правым каналами, чтобы запись полезного сигнала оказалась по центру не только по амплитуде, но и по времени. Можно, конечно, вручную подбирать задержку, можно использовать стереогониометр или вектороскоп, которые покажут, центрирована запись или нет, но можно воспользоваться программным инструментом, который называется азимут-корректор. Он находится в разделе канальных операций. Азимут-корректор позволяет автоматически на основе анализа фонограммы подобрать как уровни каналов, так и сдвиг по времени. Выравнивание благодаря ресемплингу и оверсемплингу производится с точностью до одной сотой отсчета (семпла), чего невозможно достичь вручную. Поэтому когда дорожки будут сложены в моно, не возникнет завала высоких частот.

После того, как мы выровняли каналы, можно применить MS-кодирование, то есть сложить дорожки и получить моно, и вычесть их друг из друга и получить разностный канал, и обработать их независимо. Если известно, что запись моно, можно Side-канал отбросить, в нем только шумы и треск, а Mid-канал, то есть полусумма левого и правого каналов, содержит полезный сигнал. Вместо MS-кодирования можно воспользоваться новой опцией RX 3 - это извлечение из записи центрального канала. Это позволяет более эффективно, чем при MS-кодировании, извлечь звуки центрального канала. Если мы применяем просто MS-кодирование, то в М-канале те шумы и щелчки, которые были в S-канале, уменьшаются на 3-6 дБ, а с помощью специального инструмента по извлечению центрального канала уровень щелчков можно уменьшить децибел на 20. Этот инструмент разработан для извлечения из песни вокала, который находится по центру. Можно просто сложить в противофазе две дорожки, но тогда аккомпанемент понизится примерно на 3 дБ, а с помощью этого инструмента можно подавить звуки не по центру стереобазы более значительно.

Все это относится к случаям, когда известно, что на пластинке запись моно. В случае с стереозаписью можно перейти к подавлению шума. Для шумоподавления существует несколько инструментов. Самый очевидный - это денойзер. Он хорошо работает в тех случаях, когда шум является стационарным или постоянным по времени, не меняется по мощности и спектру. В этом случае денойзер "обучается" по фрагменту шума из фонограммы и применяется ко всей записи. Если же на пластинке имеются фрагменты, которые повреждены сильнее других или с которыми не справился декликер на первом этапе, то необходимы дополнительные операции. Например, для плохо подавленных или длинных щелчков следует применять инструмент Spectral Repair (спектральный ремонт). Там есть несколько режимов, позволяющих как уменьшить амплитуду выделенного звука до слияния с окружающим фоном, так и полностью ресинтезировать выделенный фрагмент на основании окружающего материала, заменив его на синтетическую "заплатку", которая во многих случаях звучит вполне реалистично. Спектральный ремонт эффективно работает не только над фрагментами, выделенными по времени, но и по частоте и времени, когда помеха ограничена по спектру определенным диапазоном частот.

Но вернемся к подавлению шума. Если оказывается, что шум на виниловой пластинке существенно меняется во времени, то денойзер в этом случае будет не очень эффективен и придется поработать вручную. К тем участкам, где шум повышается по уровню, можно применить денойзер с более высоким порогом. В расширенной (advanced) версии RX 3 есть функция Dialog Denoiser. Он отличается от обычного денойзера более простым управлением и удобной автоматизацией. Он позволяет в реальном времени менять шумовой профиль, и если автоматизировать шумовой профиль согласно тому, как меняется уровень шума в пластинке, например, нарисовать периодическое изменение шумового профиля, то можно более аккуратно подавить этот шум.

Еще одно средство, которым можно пользоваться, если шум меняется по времени - это модуль Deconstructor. Он разделяет сигнал на тональные и шумовые составляющие. В отличие от денойзера, он позволяет разделить их не только по уровню, но отделяя тональные от шумовых составляющих. Например, если у нас есть запись флейты в помещении, то денойзер, проанализировав шум помещения, удалит его из записи, а Deconstructor не обращает внимания на уровень сигнала, поэтому он из флейты выберет только гармоники и позволит подавить, например, шум дыхания или звук воздуха, выходящий из клапанов.

Но такая "дистилированная очистка " уже может быть искажением реалистичности звучания…

Совершенно верно, это инструмент опасный, его нужно применять в таких местах, где известно, что весь шум - нежелательный. Если же есть шум, являющийся частью полезного сигнала, например, щетки для барабанов или согласные шипящие звуки, применение деконструктора не оправдано. Его надо применять только к выделенным фрагментам, а не ко всей записи.

Еще один инструмент, который можно применять, когда шум меняется по времени - это уже упомянутый "спектральный ремонт", можно выделять самые громкие участки шума и применять интерполяцию, горизонтальную или вертикальную, и уменьшать этот шум по уровню.

Вот это, пожалуй, самая распространенная цепочка операций по реставрации винила. По ситуации можно применять еще какие-то специфические инструменты, но подводя итог, можно сказать, что первым делом надо удалять щелчки и "краклы", а после этого удалять шум. Хотя, конечно, как и при любой реставрации, нужно соизмерять потери полезного сигнала со степенью удаления шумов. Опытные реставраторы всегда знают, что щелчки и шумы далеко не так мешают обычным слушателям, как им самим, потому что они привыкли отслеживать искажения, а для обычного слушателя щелчки и трески в старой записи привычны. Если они слишком громкие и мешают, их стоит подавить, Если они просто создают фоновую атмосферу, их не обязательно подавлять. Часто бывает достаточно просто убрать щелчки, не трогая слабый остаточный фоновый шум.

А какой формат оптимален для оцифровки винила?

Разрядность лучше брать максимальную, 24 бита, при этом формат файла может быть даже 32 бита с плавающей запятой, а может и 24 бит, это зависит от вашей рабочей станции, а частоты дискретизации 44,1 кГц вполне хватает для качественного звучания и для обработки теми инструментами, о которых я рассказывал. Высокие частоты дискретизации, 96 кГц и выше, не дают выигрыша в качестве реставрации пластинок.

Какой контроль лучше предпочесть при реставрации? Мониторы большие, маленькие, наушники?

В значительной степени это зависит от предпочтений реставратора, но большинство пользуется большими хорошими мониторами. Наушниками они пользуются только часть времени для определенных операций.

Но некоторые дефекты, мелкие щелчки, вот эту "сыпь " лучше слышно в наушниках…

Да, такие вещи лучше контролируются в наушниках, но полную картину и по завершении работы лучше слушать на хороших мониторах. Мониторы ближе к тому, на что ориентируются звукорежиссеры при создании записей. Хотя возможно, последнее время это постепенно меняется в сторону наушников.

Да, техническая реставрация - это все-таки лабораторный процесс, тут дело не в краске звука, которую могут дать мониторы, это работа непосредственно со звуковой информацией безотносительно каких-то художественных решений. Тут важно дефекты убрать, а не то, чтобы улучшить звучание, как при мастеринге. Поэтому главное, что мы должны услышать при реставрации - это все дефекты, весь мусор…

Да, я согласен. С чем удобнее звукорежиссеру-реставратору работать, то он и предпочитает. Но нужны разные виды контроля, по приборам контролировать невозможно.

Теперь поговорим о специфике и проблемах реставрации магнитной ленты. Они же тоже разные, есть ленты 1950-х годов, а есть 80-х. Есть студийные рулоны, а есть кассеты…

Да, все они значительно различаются уровнем шума, уровнем детонации. При оцифровке ленты как всегда начинаем с выбора аппаратуры. Профессиональную ленту следует проиграть на исправном профессиональном магнитофоне. Существует целая наука, как обращаться со старыми лентами, тут лучше обратиться к соответствующей литературе. Если речь идет о кассетах, то тут нужно иметь доступ к декам с низкой детонацией и профессиональным уровнем выходного сигнала.

Есть мнение, что нужно проигрывать кассету на том же экземпляре магнитофона, на котором она была записана, для полного совпадения азимутов головок…

Я с этим согласен только отчасти. Всегда важно знать, на чем кассета была записана и как это может повлиять на воспроизведение, и хорошо, если кассета оцифрована с того устройства, на котором она была записана, но бывает так, что проиграть ее на профессиональной деке лучше, чем внести детонации от проигрывания на плохом устройстве. Тут нужен компромисс и хорошо, если имеются оба варианта воспроизведения - оригинальный и профессиональный аппарат.

Когда запись уже оцифрована, то, первым делом, поскольку щелчков, как правило, нет, следует проверить, является ли запись действительно стереофонической или она близка к моно. Если это почти моно и стереокартинкой можно пожертвовать аналогично тому, как мы это проделали с винилом, следует отрегулировать азимут и амплитудный баланс каналов, а затем применить либо MS-кодирование, либо операцию по извлечению центрального канала. Это позволяет в значительной степени подавить шум, который для стереозаписи часто оказывается некоррелированным в левом и правом каналах. А далее следует подавить стационарный шум, поскольку это главный вид помех в магнитной записи. Такой шум вполне успешно подавляется денойзером.

А если запись обладает повышенным уровнем нелинейных искажений?

Если это особенность конкретной ленты или кассеты на протяжении всей записи, с этим вряд ли можно побороться, если зашкаливание имеет место только на отдельных участках, следует использовать деклиппер. Работает оно не всегда, но в большинстве случаев позволяет улучшить результат. В третьей версии RX в деклиппере были произведены некоторые улучшения как алгоритма интерполяции, так и пользовательского интерфейса. Теперь можно автоматически проанализировать гистограмму уровней звукового файла и программа предложит с помощью кнопки Suggest уровень, на котором происходит клиппирование, причем этот уровень можно установить как различным как для положительной, так и для отрицательной полуволны. Это важно для тех случаев, когда лента по-разному насыщается для положительных и отрицательных уровней намагниченности. С помощью такого независимого порога клиппирования можно более аккуратно сохранить ту информацию, которая еще не искажена и проинтерполировать только те участки, которые находятся за точкой клиппирования.

Но бывают искажения, которые возникли не от перегрузки по уровню, а по каким-то другим причинам, и находятся на невысоких уровнях - всякие рычания, хрипота, мутность. Можно ли это как-то прочистить?

Это сложная операция и, скорее всего, придется работать вручную. Я бы попытался применить два инструмента - Deconstruct и Spectral Repair. Deconstruct позволяет в целом отличить гармонические составляющие от негармонических и подавить их, хотя иногда негармонические составляющие являются частью полезного сигнала и инструмент их плохо различает. Но в целом Deconstruct позволяет "проредить" спектр и сделать его чуть менее "захламленным" мелкими звуковыми артефактами и оставить более крупные основные гармоники.

А как быть с низкоуровневыми сигналами, когда полезный сигнал слабо возвышается над уровнем шума - как здесь разделять полезный сигнал и шум - технически и, может быть, даже концептуально?

Очень сложный вопрос. Часто возникает проблема, когда кто-то говорит в петличку и задевает ее одеждой, и возникает шорох, смешивающийся с речью. Это шум нестационарный, он очень быстро меняется по времени и перекрывается речью, что не позволяет его просто уменьшить по уровню. Приходится вручную, пользуясь спектральным ремонтом, аккуратно выделять маленькие фрагменты и уменьшать амплитуду шороха. Также можно использовать Deconstruct, но опять же к выделениям, сделанным вручную. Хороших автоматических средств для таких случаев я не знаю.

Иногда при записи используют стереопетличку, в этом случае голос приходит с определенного направления, тогда с помощью азимут-коррекции можно расположить голос в центре и применить извлечение центрального канала. При этом, поскольку петличка стерео, левый и правый капсюли могут по-разному поймать шорохи и они будут более широко расположены по стереопанораме. Но это далеко не всегда срабатывает, это одна из самых тяжелых проблем при редактировании.

Не появились ли "лекарства " от детонации?

Хороших автоматических "лекарств" пока нет. Однако появились некоторые технологии, программно-аппаратные средства plunging process. Это системы для записи кассеты вместе с тоном подмагничивания. Это не только с кассетами применяется, но и для профессиональных рулонных лент. Запись производится с высокой частотой дискретизации с магнитофона, который не подавляет ток подмагничивания, и специальное программное обеспечение позволяет, используя флуктуации частоты этого тона подмагничивания, произвести ресемплинг, то есть передискретизацию записи, чтобы компенсировать детонации. Это очень правильный, я считаю, процесс, но для него требуется специальная аппаратура. К тому же он запатентован, так что реализовать это решение в других разработках не так-то просто, придется решать вопросы патентного права с авторами технологии.

Для исправления детонации без использования пилотного тона тока подмагничивания компания Celemony недавно выпустила программу Capstan. Она пытается, опираясь уже на изменения высоты собственно музыкального тона, выделить наиболее вероятную характеристику детонации и далее применить ее к записи, чтобы отменить детонацию. Здесь самое сложное, это понять - а какая же детонация была? Как отличить вибрато струнного инструмента от сползания всего оркестра? В случае если имеются проблемы со всем оркестром, факт и характер детонации установить легче, а в случае с сольным инструментом трудно отличить вибрато от детонации. По отзывам, пока эта программа не очень хорошо справляется в автоматическом режиме, но это направление перспективное и, думаю, будет дальше развиваться. Хотя по мере переноса старых носителей в цифровую форму актуальность такой работы будет уменьшаться. В целом можно сказать, что характер этой деятельности меняется от реставрации старых носителей просто к исправлению дефектов современных записей, которые вызваны не столько дефектами носителей, сколько сложными условиями записи - плохим помещением, посторонними шумами, а также клиппированием и другими отклонениями от правильной настройки тракта записи.

А мне кажется, поле деятельности для реставраторов очень широкое. Далеко не все еще оцифровано, многое находится в фондах и запасниках, всегда нуждаются в чистке даже самые последние концертные записи, есть бескрайние и часто очень интересные и ценные любительские архивы, не говоря уже о такой сфере применения, как криминалистика…

Теперь вопрос по современным носителям. В наше время нередко в качестве исходников приходится использовать компрессированные форматы файлов - МР3 и т.п. Какие здесь могут быть проблемы при реставрации?

Что интересно, значительная часть искажений, происходящих в форматах компрессии с потерей качества - это клиппирование сигнала, которое происходит при декомпрессии. Когда кодируется файл, нормализованный под 0 дБ и лимитированный с жестким порогом, то значительная часть отсчетов файла имеют амплитуду 0 дБ. И хотя в исходном файле клиппинга нет, то, поскольку компрессия файла в МР3 включает в себя и фильтрацию, и аппроксимацию более простым сигналом, то в итоге уровни сигнала также меняются. И за счет этого пиковые уровни могут повыситься. Когда такой файл декодируется, происходит клиппирование, которого в исходном файле не было.

Первый совет, который в таком случае можно дать - пользоваться декомпрессором, который позволяет записать в формат с плавающей запятой, чтобы клиппирование за счет компрессии не возникало. В программах, использующих QuickTime, то есть на компьютерах Mac и многих РС декомпрессия производится из МР3 в формат с плавающей запятой, и все пики, которые при этом восстановились, оказываются сохраненными в файле и находятся выше 0 дБ. Если такой файл проиграть, он будет клиппировать, но его можно ограничить лимитером или просто уменьшить уровень, чтобы форма этих пиков была сохранена. Это самое первое и важное, что приходит в голову.

Но дальше все, к сожалению, значительно трудней. Я не знаю ни одного хорошего алгоритма для восстановления качества записей, которые были скомпрессированы в МР3, АС3, ААС или какой-либо другой формат с потерями. Есть некоторые программные средства, о которых заявлено, что они являются восстановителями качества МР3-файлов, но в реальности там применяются операции, которые не реставрируют сигнал, а являются неким "творческим" улучшением звука. Например, Transient Shaper, то есть формирователь переходных компонентов сигнала. Подчеркивание транзиентов некоторым образом повышает четкость атак и ударных инструментов в фонограмме, но называть такую операцию восстановлением от артефактов в МР3 вряд ли можно.

Есть также эксайтеры, которые пытаются синтезировать высокие частоты, потерянные при кодировании в МР3, но они могут вносить искажения и ниже частоты среза. Поскольку у эксайтера нет информации о том, какие эти верхние частоты были на самом деле, он пытается восстановить их так, как предполагает и считает нужным, и это не обязательно приближает нас к оригиналу. Хотя это может выглядеть как некоторое улучшение звучания.

Поэтому, повторюсь, лучше всего воспользоваться декомпрессором, который позволяет декодировать без клиппирования файл, ограниченный в оригинале под 0 дБ, а дальше уже - по ситуации. Есть информация, что в iTunes записи нормализуются под -1 дБ, чтобы при воспроизведении избежать клиппирования. Вообще качество алгоритмов и работы конкретных программ-кодеров МР3 исключительно важно, они сильно различаются по качеству звука при одинаковых параметрах битрейта и разрядности.

Потому и известно общее правило - при реставрации дела с компрессированными файлами по возможности не иметь.

Полностью согласен - при наличии некомпрессированного файла предпочтение следует отдавать ему.

Но есть огромный массив материала, связанный с аудиовизуальной продукцией - всякие сетевые ролики, клипы с YouTube и т.п., где с саундтреком, увы, происходят непредсказуемые вещи, и в итоге звук может очень сильно измениться по характеру сигнала.

Да, это отдельная большая тема. Я сам не исследовал специально этот вопрос, но я знаю, что действительно применяется сильная компрессия как для видео, так и для аудио, причем характер компрессии аудио может зависеть от того, какая компрессия выбрана пользователем для видео. Например, если выбрано видео HD, то и аудио будет передаваться более качественное, а если выбрано SD 360, то и аудио будет с низким битрейтом. Видимо, на серверах хранятся варианты высокого и низкого качества. Тут уже больше вопрос к программистам YouTube - может ли пользователь влиять на то, как сервис будет обрабатывать вашу дорожку. Может быть, вскоре там будет применяться автоматическая компрессия, шумоподавление или нормализация. Понятно, что для пользователя, который никогда со звуком не работал, всякая автоматизация может казаться благом, но для звукорежиссеров и создателей профессионального медиа-контента это, конечно, большая проблема - не знать, что происходит с твоей записью на сервере.

Сейчас внедряются новые методы измерения аудиосигналов. В третьей версии RX появилось окно статистики, где, помимо привычного RMS , указываются такие параметры, как True Pick Level , Sample Peak Level , LU и LUFS . Несколько слов о том, как "читать " эти показатели?

  • Peak Level - это максимальный уровень цифровых отсчетов, тот пиковый уровень, который покажет большинство рабочих станций, а True Pick Level - это уровень аналогового сигнала, который будет восстановлен ЦАП по цифровым отсчетам. Поскольку ЦАП включает в себя фильтр передискретизации, он генерирует не ступеньки и не отрезки прямой между семплами, а плавную кривую, которая, осциллируя между цифровыми отсчетами, может в том числе и превышать их по уровню. Поэтому пиковый уровень аналогового сигнала, восстановленный по цифровым отсчетам, также следует контролировать, для чего отображается истинно-пиковый уровень. Он чаще всего оказывается несколько выше, порой до децибела, чем цифровой пиковый уровень. Величина превышения зависит от обилия высоких частот и резких сильных транзиентов в сигнале.
  • - это измерения громкости сигнала согласно современным стандартам IEC 1770 и др. В отличие от объективного измерения сигнала по электрическому уровню, измерение по громкости приближено к слуховому восприятию и особенностям слуха. Это измерение по специальной кривой, учитывающей кривые равной громкости, измерение с учетом особенностей интеграции по времени: длинное, короткое (соответствующе показаниям VU), и общее для всей фонограммы или выделенного фрагмента. Эти показатели лучше учитывают тональный баланс и характер звучания, чем чисто физический показатель давления RMS. Особенно важно, что вычисляется величина динамического диапазона - насколько фонограмма "сплющена". Все это позволяет проверить фонограмму на соответствие стандартам, которые сейчас внедряются в вещании.

Выше мы затронули вопросы творческого подхода к реставрации, улучшения - мне тоже приходилось на одной старой зашумленной фонограмме прорисовывать вручную удары по тарелке и хайхэту, при этом тоже вручную выделять отрезки между ударами и вносить в них некоторое затухание, и тогда удары становились более "читаемыми ", яркими и отчетливыми. Но это чрезвычайно трудоемкая работа! Порой на одну секунду звучания уходит несколько минут работы! Можно ли ее как-то автоматизировать?

Я не уверен, что операция, которую вы делали, универсальна и подойдет для всех, она применима при определенных видах звучания определенных инструментов. Пока ее трудно автоматизировать, потребуется много настроек, и результат может оказаться хуже, чем при ручной редакции.

Насколько реставрация - чисто техническая, инженерная работа и насколько творческая? Каковы рамки того, что может позволить себе реставратор и чего он не должен себе позволять?

Это очень субъективный вопрос. Все зависит от слушателей. Есть люди, которые будут недовольны любым вмешательством в запись, даже самым минимальным подавлением шумов и щелчков. Но большинство слушателей придерживается некоей середины. Они готовы принять значительное подавление шумов, конечно, если при этом не страдает тембр. Они будут рады преобразованию моно в стерео. Я считаю, это вполне допустимо и соответствует духу времени.

Слово "реставрация " означает восстановление. Вправе ли мы добиваться воссоздания утраченных информационных элементов звучания с помощью таких методов, как эксайтер и т.п.?

Думаю, это должен решать каждый звукорежиссер. Сам я, если меня просят, ограничиваюсь устранением дефектов и шумов, а затем передаю материал звукорежиссеру, и он решает, что делать дальше. Я считаю, что все допустимо, но надо быть честным со слушателем. Надо писать на обложках альбомов, что сделано - творческая реставрация или минимальное шумоподавление. В этом случае пуристы купят один ремастеринг, а обычные слушатели, которые не знают, как звучал нетронутый оригинал - другой.

Я считаю, что реставратор вправе "помочь " исполнителю преодолеть недостатки старой записывающей техники. Мастера прошлого не виноваты, что порой в их записях не слышно половину звуков или микрофон изменил тембр голоса. В третьей версии RX появился полезный инструмент, позволяющий выделить первые десять гармоник, и можно приподнять, скажем, верхнюю певческую форманту и вернуть голосу певца яркость, утраченную при записи. Понятно, что это уже совсем не инженерное решение.

Да, эквализация - это уже часть реставрации, ее творческая часть. Такие вещи требуют хороших музыкальных знаний от реставратора, знания теории и гармонии, знания истории музыки и стилей.

И спасибо вашей компании и ее разработчикам, что они дали в руки реставраторов такие мощные и глубокие инструменты реставрации, а не только возможность щелчки убирать. Я думаю, что развитие такого инструментария, такого функционала в будущем даст невероятные возможности восстановления утраченного звука, и вам следует и далее двигаться в этом направлении.

Да, мы над этим работаем, и в научном сообществе такие направления и результаты появляются, и наша задача в iZotope заключается в том, чтобы свести вместе научные исследования и практические разработки, чтобы дать реставраторам как можно больше возможностей для работы.

Спасибо вам за ваш труд, и будем ждать новинок!

Анатолий Вейценфельд

error: Content is protected !!