24 бита: заблуждения

24 бита: заблуждения

Введение

В последнее десятилетие все больше и больше музыки стало доступно в таких цифровых форматах высокой четкости (HD), как 24-бита 192 кГц (файлы для загрузки), 24-бита 192 кГц потоковые MQA и DSD.Все чаще звучат разговоры о разработке нового 32-битного стандарта 384 кГц для музыки в формате HD. Самое интересное, что не все согласны с тем, что большая разрядность и более высокая частота дискретизации — это хорошо.

Эта статья объяснит математику и физику цифровой записи и музыкального воспроизведения с точки зрения непрофессионала, с тем чтобы вы сами могли решить, является ли это прогрессом в цифровом аудио или просто маркетинговым безумием.

Если вы не склонны верить утверждениям, содержащимся в этой статье и противоречащим многим рекламным заявлениям, мифам и легендам в аудиофильской индустрии, не стесняйтесь проверять ссылки на материалы в конце статьи, написанные такими инженерами, как Dan Lavry и компаниями, которые производят электронику, используемую в студиях звукозаписи, таких как Antelope Audio.

Если вы не хотите разбираться со множеством технических данных, вы можете сразу перейти к выводам, где я затронул все основные моменты. А также вы также можете обратиться к другой моей статье на тему « DSD и PCM: Мифы и правда».

Биты, байты и цифровые слова:

Так почему же же 24-битное преобразование стало новым стандартом?

Когда цифровые данные передаются и обрабатываются, они перемещаются как байты, а не как отдельные биты. Байт содержит 8 бит, а байт известен как цифровое слово. Вот почему все в цифровом мире делится на 8. Таким образом,16 бит равны2 байтам и 24 бита равны 3 байтам. Соответственно 16 бит и 24 бита стали стандартом, потому что каждый из них представляет собой цифровое слово.

Историческая справка: 16-битный формат существовал задолго до того, как 16-битные цифро-аналоговые преобразователи (ЦАП) стали коммерчески доступными. То же самое относится и к 24-битному формату.

Частота дискретизации и битовая разрядность:

Процесс преобразования аналоговых звуковых волн в цифровой вид известен как «квантование», которое часто представляется в виде точек, нанесенных на ось XY. Горизонтальная ось X представляет собой время или частоту дискретизации, а вертикальная ось Y амплитуду или битовую разрядность. На графике ниже форма белой волны представляет квантованный музыкальный сигнал, а зеленый шаговый шаблон, наложенный на форму белой волны, представляет квантованные значения.

24 бита: заблуждения, изображение №1

Частота дискретизации - это частота, на которой дискретизируется амплитуда аналоговой звуковой волны. Частота дискретизации 44,1 кГц, применяемая для компакт-дисков, дискретизирует амплитуду музыки 44100 раз в секунду. Частота дискретизации 96 кГц, используемая в 7.1-канальном аудио, встроенном в DVD и Blu-Ray, дискретизирует амплитуду 96000 раз в секунду. А частота дискретизации 192 кГц, используемая в музыкальных файлах HD и MQA, дискретизирует амплитуду 192000 раз в секунду.

Битовая разрядность (или битовая глубина) понимается как число шагов, на которые амплитуда аналоговой звуковой волны делится в каждой выборке. 16-битная запись имеет 65 536 шагов, 20-битная запись - 1 048 576 шагов, а 24-битная запись -16 777 216 шагов. Да, вы правильно прочитали: 24-битная запись имеет 256 раз больше, чем 16-битная. Больше в 256 раз?!?!? Разве это не кажется слишком большой цифрой?

Чем больше бит и/или чем выше частота дискретизации, используемая при квантовании, тем выше теоретическое разрешение аудио. Таким образом, 16-битный CD Red Book с частотой 44,1 кГц имеет 28 901 376 потенциальных точек выборки каждую секунду (44 100 x 65 536). 20-битная запись с частотой 96 кГц имеет 1 006 632 900 потенциальных точек выборки каждую секунду (96 000 x 1 048 576).

Это означает, что 20-битная запись 96 кГц имеет разрешение примерно в 33 раза большее, чем 16-битная 44,1 кГц, а 24-битная запись 192 кГц в 256 раз больше. Согласитесь, немалая разница.

Так почему же записи в формате HD звучат лишь немногим лучше, чем записи в 16-бит 44,1 кГц? Позже в этой статье я объясню разницу между теоретическим и фактическим разрешением.

Динамический диапазон и битовая разрядность:

Динамический диапазон - это разница в громкости между самым тихим и самым громким пассажем, обычно измеряемая в децибелах (дБ).

1 бит = 6 дБ:

• 16-битные CD- диски Red Book имеют динамический диапазон более 96 дБ.

• 20-битная цифровая мастер-лента имеет динамический диапазон более 120 дБ.

• Современные 24-битные HD форматы имеют динамический диапазон более 144 дБ.

Но подождите, разве фоновый шум в тихой комнате не составляет 30 дБ?

Итак, на самом деле вы не можете услышать разницу между динамическим диапазоном 16-битной записи и 20-битной записи, если вы не увеличите громкость достаточно высоко, выше фонового шума в 30 дБ, что приведет к необратимой потере слуха. А прослушивание динамического диапазона 24-битной записи (144 дБ) на самом деле изначально может привести к необратимой потере слуха.

Так с какой стати на земле создали цифровой формат записи музыки, который даже нельзя слушать?!?!?!?!?

Позже в этой статье я объясню, как использование безумно высокой битовой разрядности и частоты дискретизации, значительно превышающей диапазон человеческого слуха, используется во время процесса редактирования, микширования и мастеринга для снижения шума в коммерческих записях значительно более низкого разрешения, которые мы слушаем.

Для справки. Вот несколько примеров динамического диапазона, которые большинство из нас может представить:

• Звук комара, летящего в 3 метрах, составляет 0 дБ.

• Гул лампы накаливания на расстоянии 1 метра составляет 10 дБ.

• Фоновый шум в тихой студии звукозаписи составляет 20 дБ.

• Фоновый шум в обычной тихой комнате составляет около 30 дБ.

• Ранняя аналоговая мастер-лента имела динамический диапазон всего 60 дБ.

• Лонгплей формата microgroove имеют динамический диапазон 65 дБ.

• Dolby увеличил динамический диапазон аналоговой мастер-ленты до 90 дБ.

• Звук отбойного молотка на расстоянии 1 метра составляет 110 дБ.

• Звук полного оркестра на расстоянии 1 метра составляет 120 дБ.

• Громкость более 130 дБ вызывает непоправимую потерю слуха.

• Звук реактивного самолета при взлете составляет 140 дБ.

Конечно, динамический диапазон и шум квантования не являются единственными факторами, которые необходимо учитывать, наряду с этим минимальный уровень шума в источнике питания вашего ЦАП будет определять наименьшие значащие биты (LSB), которые могут быть разрешены на выходе вашего ЦАП, несмотря на любую битовую глубину, которую указал производитель.

Извините, что разрываю чей-то шаблон и привожу к выводам, противоречащим рекламной шумихе, мифам и легендам в индустрии аудиофилов.Однако делаю это только потому, что если ЦАП способен декодировать 24-битный код, это вовсе не означает, что он способен на самом деле реализовать данную битовую глубину на выходном каскаде.

И даже не просите меня рассматривать ЦАП с выходными ламповыми каскадами: минимальный уровень шума на выходном каскаде лампы составляет около 90 дБ, что означает, что бы не утверждали производители, они не смогут реализовать даже 16-битную запись.

Уровень шума:

Показатель динамического диапазона выражает самый громкий звук, а минимальный уровень шума - самый тихий. Если вы хотите услышать LSB на записи, громкость (или напряжение) этого бита должна быть выше минимального уровня шума как комнаты, так и оборудования вашей системы.

Мы уже знаем, что в тихой комнате уровень фонового шума около 30 дБ, что заставляет вас делать громкость выше. Даже после того, как оборудование воспроизводит шум, превышающий 30 дБ, источник питания электроники будет маскировать LSB, если пиковое напряжение шума в источнике питания не меньше, чем напряжение LSB.

С учетом того, что выходное напряжение на ЦАП равно 2,5 В (выше среднего), ниже приведены напряжения источника питания, шум которого должен быть ниже, чтобы слышать LSB:

• 16-бит, напряжение минимального шума LSB = 76 мкВ

• 18-бит, напряжение минимального шума LSB = 19 мкВ

• 20-бит, напряжение минимального шума LSB = 4,75 мкВ

• 24-бит, напряжение минимального шума LSB = 0,3 мкВ

Для примера, обычный регулятор LM317, который является промышленным стандартом качества и используется в большинстве коммерческих электронных устройств, имеет пиковый шум около 150 мкВ, а самые низкие в мире источники шума (мы сейчас говорим о НАСА, а не аудиофильском оборудовании) имеют напряжение пикового шума около 5 мкВ.

По мнению экспертов, которые производят лучшие микросхемы ЦАП, резисторы и регуляторы мощности, теоретически нет способа создать электронику, способную различать разрешение более 20 бит (динамический диапазон 120 дБ). Любая компания, которая заявляет о более чем 20-битном разрешения своего ЦАПа, просто вводит всех в заблуждение. Да, они могут декодировать 24 бита, потому что 24-битное разрешение существует в программном обеспечении, но выход их ЦАП имеет разрешение и динамический диапазон менее 20 бит.

Теоретическое и фактическое разрешение:

Согласно математической теории, при дискретизации более чем в два раза превышающей максимальную слышимую частоту, на тех же кривых отображается только больше точек, когда цифровой сигнал преобразуется обратно в аналоговый сигнал. Поэтому для правильного сэмплирования ноты с частотой 20 кГц (максимальной частоты, которую может слышать человеческое ухо) вам необходимо сэмплировать с частотой выше 40 кГц. Частота дискретизации 44,1 кГц на CD была разработана для точной записи звука с частотой 20 кГц.

Так почему же возникла необходимость в более высоких частотах дискретизации, чем 44,1 кГц, если эти математические теории верны?

Одной из причин является шум квантования. Поскольку шум квантования присутствует около частоты дискретизации записи PCM, запись 44,1 кГц имеет шум квантования на одну октаву выше предела человеческого слуха -20 кГц. Этот шум квантования необходимо отфильтровать, поэтому все ЦАП имеют фильтр нижних частот на выходе. Поскольку шум квантования всего на одну октаву выше слышимого диапазона, используемые фильтры должны иметь очень крутой срез, чтобы не отфильтровывать нужные высокие частоты. Эти крутые наклонные цифровые фильтры низких частот широко известны как "brick wall"-фильтры.

Хотя вы много слышали о «brick wall»-фильтрах в ранних высококлассных CD-плеерах, вызывающих слышимое искажение, факт в том, что это являлось причиной неестественно звучащих высоких частот. Большая жесткого, резкого, неестественного звучания высоких частот в ранних цифровых записях связана с недостатками источников питания и проблемами в процессе записи, а не с «brick wall»-фильтрами/

Извините, что разорвал ваш шаблон, но, несмотря на то, во что верят многие аудиофилы, менее одного человека из тысячи могут слышать что-либо выше 20 кГц в детстве, и почти нет людей старше 40 лет, которые могли бы слышать намного выше 15кГц.

Конечно, если для записи, микширования и мастеринга используются более высокая частота дискретизации и большая битовая разрядность,тогда существует гораздо меньше шумов квантования, что используется для последующего преобразования в коммерческие форматы, которые мы слушаем и которые имеют значительно более низкое разрешение.

Вот почему профессиональные форматы, такие как 24-битный DXD с частотой 352,8 кГц, были изначально разработаны для студий звукозаписи. Одна из причин, по которой были разработаны 24-битные микросхемы ЦАП, заключалась в том, чтобы инженеры могли редактировать, микшировать и делать мастеринг в режиме реального времени, не уменьшая частоту дискретизации. На самом деле нет никакой рациональной необходимости в использовании 24-битного динамического диапазона в коммерческих записях, и ни одна компания никогда не выпускала коммерческую запись сколь либо близкую к динамическому диапазону 24 бита( 144дБ).

Несмотря на то, что многие записи преподносятся нам как 24-битные, все 24 бита динамического диапазона используются только в студии звукозаписи для уменьшения шума квантования. Потребительская версия большинства так называемых 24-битных записей обрабатывается с динамическим диапазоном 16-битной записи (96 дБ) или меньше. Обратитесь к приведенному выше разделу о динамическом диапазоне. Если бы продавались коммерческие записи с динамическим диапазоном более 96 дБ, вы бы не услышали ни одной детали нижнего диапазона выше уровня шума в 30 дБ вашей комнаты, и пики могли бы отправить в перегрузку большинство усилителей на очень низкой громкости. Подробнее о том, как динамический диапазон влияет на электронику, см. В следующем разделе «Требования к воспроизводящему оборудованию».

Так что же студии делают с коммерчески доступными так называемыми 24-битными записями? Они просто заполняют некоторые из наиболее значимых бит (MSB) единицами, а некоторые из наименее значимых битов (LSB) - нулями, чтобы увеличить общую громкость до заявленного уровня. Они могли бы выпустить запись с идентичным звучанием в 16 битах, но наивные потребители настаивают на 24 битах, поэтому звукозаписывающие компании обманывают их, помещая 16-битный динамический диапазон в 24-битный фрейм. Как же это глупо…

DSD не исключение. Любой тип цифровой записи производит шум квантования, который требует фильтра нижних частот на выходе преобразователя. Но вместо того, чтобы шум квантования был сосредоточен вокруг частоты дискретизации, такие форматы, как PCM и DSD64 SACD имеют значительное количество шума чуть выше 25 кГц, что показано на рисунке ниже.

24 бита: заблуждения, изображение №2



Чтобы обойти эту проблему, однобитные DSD ЦАПы имеют алгоритмы формирования шума и повышают дискретизацию до неоправданно высоких частот, чтобы переместить шум квантования далеко за пределы человеческого слуха. Это позволит фильтровать шум квантования с минимальным искажением в слышимом спектре частот. Вот одна из причин, почему программный проигрыватель, который преобразует SACD PCM или DSD64 в Double-Rate DSD или Quad-Rate DSD, приводит к такому улучшению производительности ЦАП с одним битом. Более подробную информацию по этой теме можно найти в нашей статье «DSD и PCM: Мифы и правда».

Еще одной проблемой применения более высокой частоты дискретизации и большей битовой глубины являются системные ресурсы. Оба этих параметра требуют больше места для хранения, больше оперативной памяти и более быстрых процессоров. Хотя оптимальная частота дискретизации и битовая глубина, необходимые для детального воспроизведения музыки, являются предметом острых дискуссий, нет сомнений в том, что чрезмерное высокое разрешение расходует системные ресурсы и излишне увеличивает размер и стоимость компонентов.

Требования к воспроизводящему оборудованию:

Существует очень мало систем (даже среди самых лучших), которые могут точно воспроизводить полный динамический диапазон 120 дБ 20-битной записи. Вот почему так мало записей выпускается в динамическом диапазоне 96 дБ 16-битной записи, не говоря уже о динамическом диапазоне 144 дБ 24-битной записи. Имейте в виду, что максимальный динамический диапазон записей LP составляет всего около 60 дБ. Даже аналоговые мастер-ленты Dolby имели максимальный динамический диапазон около 90 дБ.

Итак, чтобы музыка в 120 дБ могла воспроизводиться на большинстве высококачественных аудиофильских систем, студии звукозаписи необходимо ограничить динамический диапазон, используя процесс, называемый «динамическое сжатие». Процесс динамического сжатия делает более тихие пассажи относительно громче, а более громкие – относительно тише. Это облегчает распознавание деталей в нижнем диапазоне более громких пассажей. Динамическое сжатие является частью того, что дает записанной музыке иллюзию большей детализации и фокусировки, чем у живой музыки.

В записи LP и стандартизированных аналоговых лент существовало четкое правило: соотношение между мощностью усилителя и его громкости в децибелах являлось логарифмическим, а не линейным. Производители знали, что для увеличения потребляемой мощности на 3 дБ потребителям необходимо удвоить мощность усилителя и удвоить мощность динамиков. Таким образом, сохранение динамического диапазона домашнего аудио ниже 60 дБ было главной вещью, которая позволяла оборудованию для домашних развлечений быть доступным по цене, иметь скромный размер и относительно высокую точность воспроизведения. Правда заключается в том, что большинство коммерческих HD-записей имеют динамический диапазон, который намеренно меньше половины динамического диапазона 144 дБ 24-битной записи и даже значительно меньше динамического диапазона 96 дБ 16-битной записи.

Задумайтесь. Динамический диапазон 60 дБ поверх фонового шума 30 дБ равен 90 дБ. Насколько громче 90 дБ вы хотите слушать музыку у себя дома? Что еще более важно, для каждого дополнительного 3 дБ, на который вы увеличиваете динамический диапазон, вам потребуется удвоить мощность вашего усилителя и удвоить выходную мощность ваших динамиков.

При прочих равных условиях, для перехода от 90 дБ до 99 дБ вам потребуется усилитель с 8-кратной мощностью и динамики с 8-кратным выходом. Чтобы точно воспроизвести запись при 120 дБ, вам понадобится усилитель с 1000-кратной мощностью и громкоговорители с 1000-кратной выходной мощностью, нежели при воспроизведении той же записи при 90 дБ. Не знаю как вам, но такая система точно не подойдет ни моей комнате, ни моему бюджету.

Резюме:

Итак, открыт ли ваш слух по-настоящему?

Когда цифровые данные передаются и обрабатываются, они перемещаются в байтах, а не как отдельные биты. Байт содержит 8 бит и известен как цифровое слово. И 16 бит, и 24 бита стали стандартом, потому что каждый представлял следующее цифровое слово.

Битовая глубина представлена как число шагов в амплитуде цифровой записи. 16-битная запись имеет 65 536 шагов, 20-битная запись имеет 1 048 576 шагов, а 24-битная запись имеет 16 777 216 шагов.

Частота дискретизации - это частота, на которой дискретизируется амплитуда аналоговой звуковой волны. При частоте дискретизации 44,1 кГц, амплитуда музыки дискретизируется 44100 раз в секунду. При частоте дискретизации 96 кГц - 96 000 раз в секунду. При частоте дискретизации 192 кГц - 192 000 раз в секунду.

Чем больше бит и/или чем выше частота дискретизации, используемая при квантовании, тем выше теоретическое разрешение. Таким образом, 16-битный CD Red Book с частотой 44,1 кГц имеет 28 901 376 потенциальных точек выборки в секунду (44 100 x 65 536). 20-битная запись с частотой 96 кГц имеет 1 006 632 900 потенциальных точек выборки в секунду (96 000 x 1 048 576). Это означает, что 20-битные записи 96 кГц имеют разрешение примерно в 33 раза выше 16-битной записи 44,1 кГц, а 24-битная запись 192 кГц примерно в 256 раз выше 16-битной записи 44,1 кГц. Немаленькая разница.

По мнению экспертов, которые производят лучшие микросхемы ЦАП, резисторы и регуляторы мощности, теоретически нет способа создать электронику, способную различать разрешение более 20 бит (динамический диапазон 120 дБ). Любая компания, которая заявляет о более чем 20-битном разрешения своего ЦАПа, просто вводит всех в заблуждение. Да, они могут декодировать 24 бита, потому что 24-битное разрешение существует в программном обеспечении, но выход их ЦАП имеет разрешение и динамический диапазон менее 20 бит.

Для воспроизведения в любом месте вблизи динамического диапазона, предлагаемого этими форматами с высоким разрешением, вам потребуется усиление, в несколько раз превышающее мощность и долю минимального уровня шума по сравнению с тем, что в настоящее время доступно для аудиофилов на рынке.

Конечно, это не учитывает ни значительного количества искажений, добавляемых сигнальными кабелями, усилителями и динамиками, ни фонового шума в комнате для прослушивания, которые не позволяют слышать полное разрешение и динамический диапазон даже на 16-битной записи.

Чтобы услышать разницу в динамическом диапазоне между 16-битной и 20-битной записью в обычной тихой комнате для прослушивания, вам придется воспроизводить музыку настолько громко, что это приведет к постоянной потере слуха.

Когда люди утверждают, что слышат разницу между 16-битной, 20-битной и 24-битной записью, на самом деле они ощущают разницу не в глубине звука, а в качестве цифрового мастеринга. Дело в том, что даже большинство так называемых 24-битных записей справляются с динамическим диапазоном менее чем 96 дБ 16-битной записи (и это правильно).

Так что же они делают с так называемыми коммерческими 24-битными записями? Они просто заполняют некоторые из наиболее значимых битов (MSB) единицами, а некоторые из наименее значимых битов (LSB) - нулями, чтобы увеличить общую громкость до необходимого уровня. Они могли бы выпустить запись с идентичным звучанием в 16 битах, но наивные потребители настаивают на 24 битах, поэтому звукозаписывающие компании обманывают их, помещая 16-битный динамический диапазон в 24-битном фрейме. Как же это глупо.

Отчасти причина, по которой некоторые HD записи звучат стерильно, связана с более низким динамическим сжатием, которое не позволяет тонким деталям низкочастотного спектра подниматься выше минимального уровня шума. Когда музыка динамически сжимается, тогда вы получаете возможность слушать ее с разумной громкостью и при этом слышать все тонкие гармонические сигналы, раскрывающие тон, тембр и акустику помещения в записи.

Еще одной проблемой применения более высокой частоты дискретизации и большей битовой глубины являются системные ресурсы. Оба этих параметра требуют больше места для хранения, больше оперативной памяти и более быстрых процессоров. Хотя оптимальная частота дискретизации и битовая глубина, необходимые для детального воспроизведения музыки, являются предметом острых дискуссий, нет сомнений в том, что чрезмерное высокое разрешение расходует системные ресурсы и излишне увеличивает размер и стоимость компонентов.

Конечно, большинство записей созданы таким образом, чтобы они лучше всего звучали на автомобильной стереосистеме или портативном устройстве, а не на высококачественной аудиофильском оборудовании. Общеизвестно, что артисты и продюсеры часто прослушивают треки на MP3-плеере или автомобильной стереосистеме, прежде чем одобрить финальный микс.

Качество записи играет гораздо более важную роль, чем формат или разрешение, в котором она распространяется на рынке. Чтобы увеличить прибыль, руководители современных студий звукозаписи настаивали на исправлении ошибок лишь на этапе постпроизводства, что значительно ухудшало качество оригинальных мастер-лент.

И напротив, некоторые из моих любимых цифровых записей были созданы в цифровом виде из аналоговых записей 1950-х годов. Они не имеют такого низкого фонового шума, как современные. Все потому, что эти записи «Золотого века» часто делались за один раз с минимумом пост-продакшна и редактирования. Этот метод старой школы дает органический характер звука и когерентные гармоники помещения, которые невозможно воспроизвести любым другим способом. Понятно почему так много аудиофилов ценят эти записи.

И наконец, чем проще тракт прохождения сигнала и чем меньше шум источника питания, тем лучше цифро-аналоговое преобразование.

Источники:

http://www.lavryengineering.com/lavry-white-papers/

http://www.homestudiocorner.com/24-bit-vs-16-bit/

http://electronics.forumsee.com/a/m/s/p12-37984-047253–24bit-16bit-the-myth-exploded.html

http://www.tested.com/tech/1905-the-real-differences-between-16-bit-and-24-bit-audio/

http://www.highendnews.info/technology/oversampling_and_bitstream_metho.htm

http://www.grimmaudio.com/site/assets/files/1088/dsd_myth.pdf

http://bitperfectsound.blogspot.com/2014/12/dst-compression.html

http://www.soundonsound.com/sos/sep07/articles/digitalmyths.htm

http://www.digitalpreservation.gov/formats/fdd/fdd000230.shtml

https://en.wikipedia.org/wiki/Direct_Stream_Digital

http://hometheaterreview.com/super-audio-compact-disc-sacd/

http://en.antelopeaudio.com/blog/

http://benchmarkmedia.com/blogs/news/15121729-audio-myth-24-bit-audio-has-more-resolution-than-16-bit-audio

Оригинальный текст: Бенджамин Звикель

Перевод и локализация: Марк Витковский

К списку новостей Следующая новость