По материалам
www.pitonelab.ru.
Stanley P. Lipshitz, John Vanderkooy
Общество инженеров по звуковой технике
- Статья 5395
- Представлена на 110 Конференции
- 12-15 мая 2001 г., Амстердам, Нидерланды
Краткое содержание
Однокаскадные одноразрядные сигма-дельта преобразователи принципиально несовершенны. Мы это докажем. Попросту говоря, причина состоит в том, что при надлежащем сглаживании они постоянно перегружаются. Чтобы избежать перегрузки, существует возможность провести только частичное сглаживание. В результате, невозможно полностью избежать искажений, предельных циклов, нестабильности и модуляции шума. Мы представляем эти эффекты и, используя методы когерентного усреднения способны показать множество вытекающих из этого нелинейных наведенных помех, обычно скрытых в уровне шума. Таким образом, системы записи, редактирования, хранения или преобразования, использующие однокаскадные одноразрядные сигма-дельта модуляторы, наносят ущерб высококачественному аудио. В отличие от них, многоразрядные сигма-дельта модуляторы, на выходе которых создается линейный ИКМ код, принципиально можно совершенствовать бесконечно. (Здесь "многоразрядный" означает наличие в преобразователе, по меньшей мере, двух битов.) В них можно осуществлять надлежащее сглаживание с гарантированным отсутствием каких-либо искажений, предельных циклов и модуляции шумов. Звукозаписывающая индустрия совершит ошибку, если вместо многоразрядного линейного ИКМ примет одноразрядное сигма-дельта преобразование в качестве основного формата для высококачественной обработки, архивирования или распространения.
Введение
Эта статья представляет собой расширенную версию работы [1], а полученные в ней результаты, относящиеся к одноразрядным сигма-дельта модуляторам, более детально исследуются в статье [2].
За последние 20 лет мы наблюдаем, как в многоразрядных преобразователях для профессиональной и бытовой аппаратуры использует все более высокое разрешение - 14, 16, 18, 20 и более битов. Действительно, 16-разрядный линейный ИКМ-формат стал стандартом для компакт-дисков и в течение многих лет был основой для большинства цифровых устройств хранения аудио материалов. Все аналого-цифровые и цифро-аналоговые преобразования и промежуточная обработка сигналов выполнялись с использованием линейного многоразрядного ИКМ-формата, при этом на этапах внутренней обработки применялись слова с разрядностью большей, чем требуемая точность выходных данных. Одним из основных преимуществ такого формата является то, что такие системы можно сделать полностью линейными с конечным разрешением ниже последнего значащего бита (LSB) за счет соответствующего сглаживания на каждом этапе квантования или (в случае редактирования и обработки сигналов) на каждом этапе восстановления. Принципиально такое сглаживание с оптимальной треугольной плотностью распределения вероятности (TPDF) добавочного псевдослучайного сигнала, полностью устраняет все искажения, модуляцию шума и другие наведенные помехи, зависящие от сигнала, в результате чего получается система хранения данных с постоянным, не зависящим от сигнала и, следовательно, низким уровнем шума (см. [3] и [4]). Сейчас это понятно всем, и такая методика является обычной для индустрии уже в течение десяти лет. Конечно, на практике никакая аналоговая аппаратура не может достичь этого теоретического идеала, но в цифровых приложениях отклонение от идеальных характеристик может быть действительно сведено к нулю за счет точности используемых арифметических операций.
В последние годы можно наблюдать, как производители бытовой аудиоаппаратуры умело выводят на рынок одноразрядные преобразователи, заявляя, что они лучше многоразрядных, и с успехом продвигают продукты на основе одноразрядных преобразователей как наиболее приемлемые для получения наивысших технических характеристик. Побудительным фактором для разработки одноразрядной архитектуры являлась не возможность получения лучших характеристик, а скорее тот факт, что их производство дешевле, потребляют меньше мощности и хорошо работают при напряжениях, используемых в переносном оборудовании с батарейным питанием. В настоящее время это отошло на второй план, поскольку одноразрядные преобразователи в настоящее время используются в бытовой аппаратуре всех ценовых категорий и всех уровней качества. Производители высококачественных преобразователей прикладывают колоссальные усилия для выпуска одноразрядных устройств, удовлетворяющих по своим характеристикам потребности индустрии. Но им никак не удается полностью устранить все нежелательные наведенные помехи таких преобразователей, и после десятилетних усилий, они пришли к пониманию того, что лучшие характеристики получаются при использовании в аппаратуре архитектуры с многоразрядным преобразователем. Единственное явное достоинство, присущее одноразрядной архитектуре - избежание проблем с согласованием уровней, возникающих в многоразрядных преобразователях - оказалось и не таким важным. Если ознакомиться с действующими спецификациями всех основных производителей высококачественных преобразователей, можно обнаружить, что почти все они отказались от одноразрядной сигма-дельта топологии в пользу преобразователей с повышенной частотой дискретизации, в которых используется более двух уровне. Такие архитектуры преобразователей могут устранить сложности, возникающие как в одноразрядных системах, так и в системах с разрядностью более 20 битов. Здесь можно осуществить соответствующее сглаживание и, таким образом, гарантированно устранить колебания низкого уровня и предельного цикла ("свисты высокого тона"). Кроме того, не возникают проблемы нестабильности высокого уровня высокого порядка, характерные для одноразрядных сигма-дельта преобразователей.
В свете вышесказанного хотелось бы предостеречь от принятия однокаскадного одноразрядного сигма-дельта преобразователя как стандарта кодирования для следующего поколения (и, вероятно, высококачественных) бытовых цифровых аудио форматов. Мы имеем в виду, конечно, непосредственное кодирование цифрового потока (Direct Stream Digital (DSD) ), которое является основой формата Super Audio CD , недавно введенного компаниями Philips и Sony (см., например, работы [5] и [6]). Первоначальное намерение - сохранять в одноразрядном формате DSD цифровые аудио данные на всех стадиях обработки, от исходного аналого-цифрового преобразования до редактирования и изготовления мастер-копии - судя по всему, уже забыто. И это разумно. Однако преобразование в окончательный одноразрядный формат DSD все еще требуется, а это сопряжено с ухудшением качества аудио сигнала. Каждое отдельное одноразрядное преобразование данных влечет за собой неизбежные потери качества сигнала, отсутствующие в многоразрядном линейном ИКМ. В настоящее время рациональное зерно в хранении сигнала в одноразрядном формате DSD в Super Audio CD полностью потеряло силу. Аналого-цифровые и цифро-аналоговые преобразования и все промежуточные операции обработки цифрового сигнала, скорее всего, будут производиться с использованием многоразрядных преобразователей и форматов хранения. В действительности, отсутствуют проблемы ухудшения качества сигнала при сжатии его в одноразрядный формат Super Audio CD для передачи потребителю, но только в том случае, если при воспроизведении используется многоразрядная ИКМ. Ниже мы подробно объясним ход наших рассуждений.
Сравнение многоразрядных и одноразрядных преобразователей
По идее, в обычной многоразрядной цифровой аудио системе АЦП - квантизатор (т.е. в сущности - цифровая система) никогда специально не устанавливается в режим насыщения. На практике обеспечение достаточного количества уровней квантования, устраняющих насыщение, не слишком серьезная проблема. Кроме того, несложно зарезервировать несколько младших разрядов, чтобы гарантировать соответствующее сглаживание ошибок квантования. При прямом линейном ИКМ-кодировании соответствующий (т.е. TPDF) подмешиваемый псевдослучайный сигнал занимает точно 2 младших разряда. Например, в 16-разрядной системе подмешиваемый псевдослучайный сигнал занимает только 2 из 65 536 доступных уровней. Это приводит к пренебрежимо малому уменьшению рабочего диапазона системы при сохранении всех преимуществ работы с сигналом с с надлежащим добавленным псевдослучайным сигналом. Если нужно уменьшить длину слова, снижение отношения сигнал-шум можно скомпенсировать за счет использования комбинации избыточной дискретизации и соответствующего ограничения шума. Альтернативным решением может явиться увеличение отношения сигнал-шум системы за счет использования избыточной дискретизации и ограничение шума при неизменной длине слова. Ограничение шума позволяет увеличить отношение сигнал-шум в звуковом диапазоне за счет его уменьшения на частотах выше этого диапазона. Можно даже использовать даже внутриполосное ограничение шума без избыточной дискретизации для существенного увеличения воспринимаемого на слух отношения сигнал-шум (см. работы [7] и [8]). До тех пор, пока устройство квантования в ограничителе шума не работает в режиме насыщения и осуществляется соответствующее подмешивание сигнала, можно гарантировать, что этот процесс полностью прозрачен в том смысле, что он полностью свободен от искажений.
Ограничение шума влечет за собой отрицательную обратную связь ошибки в квантизаторе. В ограничителе шума для спектрального ограничения ошибки квантования Е используется фильтр H(z). На рис. 1 показана архитектура простого квантизатора с ограничением шума добавленным псевдослучайным сигналом.
На этом рисунке Х - входной сигнал, N -добавляемый псевдослучайный сигнал, W - полный сигнал на входе квантизатора Q, а Y - выходной сигнал. Ошибка квантования Е выделяется из квантизатора с добавленный псевдослучайным сигналом (который может быть многоразрядным или одноразрядным) и вычитается из входного сигнала, пройдя через фильтр ограничения шума H(z). H(z) может быть рекурсивным или нерекурсивным. Это контур обратной связи ошибки. Пока квантизатор не перегружен, сигнал в этом контуре очень мал. Добавляемый псевдослучайный сигнал N управляет статистическими характеристиками сигнала ошибки E так, чтобы при добавлении псевдослучайного сигнала с функцией распределения вероятности треугольной формы (TPDF) E имела нулевое значение, постоянную дисперсию и постоянную белую спектральную плотность рассеиваемой мощности, не зависящую от входного сигнала - в действительности в этом случае Е не коррелирует с X. Это означает, что отсутствуют искажения или модуляция шума (см. работы [3] и [4]). Кроме того, петля отрицательной обратной связи стабильна, пока отсутствует перегрузка, что легко достижимо при использовании многоразрядного квантизатора Q. Теоретическое описание таких ограничителей шума с добавлением псевдослучайного сигнала можно найти, например, в работах [7], [8] и [9]. При проведении дискретизации данных z-преобразования входного сигнала X(z), выходного сигнала Y(z) и сигнала ошибки E(z) связаны между собой следующим выражением:
Y(z)=X(z) + {l-H(z)}E(z).
Таким образом, сигнал проходит через систему неизменным, а ошибка квантования E(z), получаемая на выходе, ограничивается эффективной передаточной функцией шума {1 - H(z) таким образом, чтобы полная ошибка системы стала равной {1 - H(z)}E(z). Соответствующий добавляемый псевдослучайный сигнал TPDF N определяет статистические свойства и спектр мощности сигнала ошибки Е и, следовательно, спектр мощности ошибки ограниченного выходного сигнала {1 -H(z)}E(z). Для обеспечения стабильной работы и минимально возможного шума при данной кривой ограничения шума эквивалентный ограничивающий шум фильтр {1 -H(z)} должен иметь минимальную фазу. Конечно, для вычислимости, H(z) должен вводить, по меньшей мере, одну задержку выборки.
Следует отметить, что, вследствие нелинейности Q в петле обратной связи, в отсутствие надлежащего добавляемого псевдослучайного сигнала, приведенного на рис. 1, схема будет демонстрировать не только ожидаемые зависимые от сигнала искажения квантования и модуляции шумов, но и колебания на низком уровне с предельными циклами. Эти "свисты" зависят от смещения постоянной составляющей входного сигнала и модулируются по частоте аудио сигналом. Они могут быть достаточно пагубными и слышимыми и являются, вообще говоря, наведенной помехой, создаваемой шумами без добавления псевдослучайного сигнала, но полностью устраняются при использовании соответствующего сглаживания. Рассмотрим квантователи с ненулевой ступенью Q(W), представленные на рис. 2, поскольку данная характеристика наиболее приемлема для случая одноразрядного преобразования, к которому мы вскоре перейдем.
На рис. 2 величина, соответствующая младшему значащему биту, обозначается как Δ, поэтому выходные уровни квантованного выходного сигнала равны +Δ/2, +3Δ/2, +5Δ/2 и т. д. В квантизаторе с разрядностью N битов имеется 2N уровней (т.е. младших значащих битов). Однако в одноразрядном квантизаторе имеются только два показанных на рисунке центральных уровня, а именно, +Δ/2.
Теперь следует отметить два очень важных вопроса:
1) Если суммарный входной сигнал W квантизатора всегда находится в диапазоне -Δ < W < Δ, то не будет наблюдаться никаких дополнительных выходных уровней свыше +Δ/2, и одноразрядный квантизатор будет вести себя как многоразрядный. При этих условиях для описания поведения таких систем можно полностью применить теорию многоразрядных квантизаторов с добавлением псевдослучайного сигнала. Однако если W находится вне этого диапазона, наблюдается перегрузка одноразрядного квантизатора (т.е. насыщение) и теория многоразрядных квантизаторов не действует.
2) Схема ограничения шума, показанная на рис. 1, функционально полностью эквивалентна однокаскадному сигма-дельта преобразователю, являющемуся сердцем одноразрядного DSD-шифратора в Super Audio CD. Простое изменение схем позволяет преобразовать одну конфигурацию в другую. Это представлено на рис. 3, на котором показаны (а) наиболее общая топология ограничителя шума и (b) эквивалентная ему схема сигма-дельта преобразователя. В отличие от обратной связи ошибки топологии ограничителя шума (а), можно утверждать, что эквивалентная топология (b) представляет непосредственную отрицательную обратную связь. (Для получения чаще всего используемой структуры сигма-дельта преобразователя, в которой фильтрация производится исключительно в прямом тракте, установим F ≡ 1 и тогда фильтр в прямом тракте сигнала примет вид {G/(1 - G)}.) Преимущество рассмотрения этой схемы как ограничителя шума состоит в том, что такой ограничитель проще для понимания, чем схема сигма-дельта преобразователя. Кроме того, в первой топологии, в отличие от второй, сигнал ошибки Е доступен в явном виде. Для последующих экспериментов будем использовать схему ограничителя шума, показанную на рис. 1. Таким образом, все сказанное об этом ограничителе шума полностью применимо к соответствующему сигма-дельта преобразователю при преобразовании, показанном на рис. 3. Следовательно, если последний имеет достаточную разрядность, чтобы отсутствовала перегрузка при соответствующем добавлении псевдослучайного сигнала, то, принципиально, он в будет идеальным. Но его поведение должно быть значительно хуже при наличии только двух уровней. И именно это мы собираемся доказать.
Мы утверждаем, что одноразрядный сигма-дельта преобразователь должен перегружаться при соответствующем добавлении псевдослучайного сигнала. Справедливость этого утверждения непосредственно вытекает из того факта, что при добавлении TPDF-сигнала N, требуемого для полной линеаризации квантизатора, он создает колебания входного сигнала квантизатора W, выходящие за пределы полного диапазона при отсутствии перегрузки +Δ. Это показано на рис. 2. Чтобы получить полный входной сигнал квантизатора W, необходимо добавить к N как входной сигнал X, так и сигнал обратной связи ошибки {-HE} (см. рис. 1). Теперь, выборки добавленного псевдослучайного сигнала статистически независимы от других сигналов в петле, таким образом, становится ясно, что если имеется какой-либо входной сигнал или сигнал обратной связи, полный входной сигнал квантизатора W будет вынужден создавать перегрузку и, как следствие, искажения, модуляцию шумов и нестабильности. Можно было бы решить, что существует возможность сохранить большинство преимуществ, предотвратив перегрузку, вызываемую полным добавляемым псевдослучайным сигналом TPDF, посредствам использования только частично сглаженного и/или уменьшенного максимального входного сигнала. Это так. Но уменьшение максимального уровня сигнала нежелательно, поскольку он непосредственно влияет на отношение сигнал-шум; а необходимое уменьшение уровня добавляемого псевдослучайного сигнала, как будет видно дальше, оказывается настолько велико, что основным оставшимся преимуществом является предотвращение предельных циклов и модуляции шума, а не уменьшение искажений. В частном случае одноразрядного сигма-дельта модулятора можно доказать, что существует ограниченный диапазон уровней добавляемого псевдослучайного сигнала и уровней входного сигнала, при которых гарантируется отсутствие перегрузки квантизатора. Такие результаты труднее обнаружить в случае преобразователя высокого порядка. Математическое доказательство этого приведено в Приложении, к которому мы адресуем заинтересованного читателя. Важным фактором является то, что полный добавляемый псевдослучайный сигнал TPDF ни в коем случае недопустим в одноразрядном ограничителе шума или сигма-дельта модуляторе и, следовательно, полная линейность никогда недостижима ни теоретически, ни, конечно, практически.
Хотелось бы отметить, что авторы - не первые, кто отмечал эту особенность одноразрядных сигма-дельта преобразователей со сглаживанием. В этом отношении наиболее исчерпывающей является работа Norsworthy [10]. Hawksford [11] и Stuart [12] тоже приводили ранее ряд критических замечаний и комментариев, подобных изложенным авторами в настоящей статье.
Моделирование
Для пояснения сделанных утверждений прибегнем к моделированию. Для определенности будем использовать сигма-дельта архитектуру с 64-кратной избыточной дискретизацией, предложенную компаниями Philips и Sony в работах [5] и [6] для их DSD-преобразователя. В нашей конструкции, названной Lip7ZP, сделана попытка ограничить уровень шума с учетом психоакустических характеристик, за счет подавления шума в диапазонах 3-4 и 12 кГц, в которых человеческое ухо обладает наибольшей чувствительностью (см. [7] и [8]). Эта конструкция основана на передаточной функции ограничения шума {1 - H(z)} 7 порядка, имеющей 7 нулей и 7 полюсов на комплексной z-плоскости. Имеется один действительный нуль для напряжения с нулевой частотой и три комплексно сопряженных пары нулей внутри единичной окружности, соответствующих частотам 4, 12 и 20 кГц. В результате получается ограничение шума в области звуковых частот с учетом психоакустических параметров. Семь полюсов внутри единичной окружности приблизительно соответствуют выравниванию Баттерворта и обеспечивают ограничения возрастания шума на частотах выше 70 кГц с целью подержания стабильности даже в одноразрядном режиме. (Эта конструкция не оптимизирована, она предназначена только для иллюстрации метода ограничения шума с учетом психоакустических характеристик.) На частотах выше 20 кГц спектральная плотность мощности шума увеличивается на 140 дБ на декаду. Форма теоретического спектра показана на рис. 4.
Выражение в явном виде для фильтра ограничения шума H(z) Lip7ZP приведено ниже, так что читатель может провести исследования и подтвердить приводимые ниже результаты:
H(z) =
0.67147148261434210554
*(z^2 - 1.8188518739882731732*z + 0.82800290523865701387)
*(z^2 - 1.8703147300286237302*z + 0.88232721441979615814)
*(z^2 - 1.9638172195444934487*z + 0.98421718272643295544)/
((z^2 - 1.9124580000000000000*z + 0.93559300000000000000)
*(z^2 - 1.8047140000000000000*z + 0.82640000000000000000)
*(z^2 - 1.7373740000000000000*z + 0.75810400000000000000)
*(z - 0.85521900000000000000))
Во всех расчетах принимается эталонная частота выборки, соответствующая стандарту для CD - 44,1 кГц, следовательно, частота дискретизации для DSD равна 64 x 44,100 Гц = 2.8224 МГц. Для упрощения расчетов также полагаем, что Δ = 1, поэтому младший значащий бит равен 1 В (см. рис. 2). На всех приводимых ниже рисунках для временной области по оси времени откладывается количество выборок при частоте дискретизации DSD, равной 2,8224 МГц, а по вертикальной оси отложены значения в LSB. На всех графиках спектров по горизонтальной оси откладывается частота (в логарифмическом или линейном масштабе) до частоты Найквиста 1,4112 МГц. На вертикальной оси 0 дБ соответствуют спектральной плотности мощности белого шума квантования для квантизатора с соответственным добавляемым псевдослучайным сигналом TPDF. Это сигнал Е на рис. 1, имеющий полную мощность шума Δ2/4 вплоть до частоты Найквиста при добавлении в квантизатор псевдослучайного сигнала TPDF N. Спектральные кривые представляют один из двух следующих случаев:
- Усреднение по 64 последовательным точкам спектра, каждая из которых получена с использованием БПФ выходного сигнала ограничителя шума по 16384 точкам с использованием окна Ганна 3 порядка. В результате усреднения мощности получается более гладкая кривая (т.е. уменьшается дисперсия), но это не влияет на уровень шумов.
- БПФ когерентного (или синхронного) усреднения 65536 (т.е. 216) записей, каждая из которых содержит 16384 точек. Это усреднение уменьшает компоненты некоррелированного сигнала, оставляя неизменными компоненты сигнала коррелированного. При этом уровень шума некоррелированной части сигнала понижается на 16 х 3 = 48 дБ, а дисперсия остается неизменной. Этот метод позволяет увидеть коррелированные нелинейные компоненты, которые в противном случае были бы скрыты шумами БПФ по 16384 точкам. С точки зрения шума это эквивалентно усреднению 65536 комплексных спектров или выполнению БПФ на невообразимо длинной временной записи в 216 x 214 = 230 = 1,073,741,824 точек с последующей децимацией результатов! Здесь также использовалось окно Ганна 3 порядка. (Дополнительные сведения об использовании синхронного усреднения можно будет найти в статье [2].)
В отсутствие добавленного псевдослучайного сигнала Lip7ZP обладает всеми недостатками ограничителей шума и сигма-дельта преобразователей без добавленного псевдослучайного сигнала. Ему требуется только два выходных уровня, даже при полном диапазоне DSD, равном +Δ/4, при условии, что добавление псевдослучайного сигнала производится не в полном масштабе. Также он стабилен (при отсутствии перегрузки), даже при работе в одноразрядном режиме. Будет показано, что без добавления псевдослучайного сигнала он способен:
- иметь слышимые предельные циклы;
- демонстрировать в диапазоне звуковых частот значительную модуляцию уровня шумов, зависящую от входного сигнала; и
- создавать гармонические и интермодуляционные искажения и другие нелинейные эффекты.
Все эти недостатки, безусловно, исчезают, если в Lip7ZP добавлен полный псевдослучайный сигнал TPDF, но при этом для предотвращения перегрузки и нестабильности требуется, по меньшей мере, восемь уровней. Это невозможно в одноразрядном режиме и поэтому невозможна и полная линеаризация, если система используется в одноразрядном сигма-дельта преобразователе. Частичное сглаживание, тем не менее, позволяет подавить колебания предельного цикла, влияет на модуляцию шумов и в определенной степени уменьшает нелинейности в звуковом диапазоне. Теперь продемонстрируем эти эффекты.
В отсутствие добавляемого псевдослучайного сигнала и при нулевых начальных условиях Lip7ZP демонстрирует колебаний предельного цикла низкого уровня с периодом 328 выборок (и очень хорошо различимой основной частотой 8,605 кГц). Этот "свист" создается в течение почти 16 000 выборок, но после того, как он установился, он оказывается очень устойчивым. Это показывает, что в отличие от мнения ряда других авторов, предельные циклы могут возникать и быть хорошо слышимыми даже в модуляторах высокого порядка без добавления псевдослучайного сигнала. На рис. 5 точно показаны два периода этого сложного колебания, выявленных при скрупулезном исследовании.
Рис. 5. Выходной сигнал ограничителя шума Lip7ZP без добавления псевдослучайного сигнала и без входного сигнала. Показаны точно 2 периода его предельных циклов.
Усредненный спектр мощности ясно демонстрирует эту периодичность. На рис. 6 результаты показаны на логарифмической шкале частот. Видно, что гармоники присутствуют во всем диапазоне вплоть до частоты Найквиста. Непрерывная кривая, построенная на этом графике, демонстрирует, что данный предельный цикл изменяется при добавлении к квантизатору псевдослучайного сигнала с амплитудным значением 0.0013Δ, имеющего функцию плотности вероятности прямоугольной формы (RPDF) - это минимум, необходимый для подавления предельного цикла. (Эта величина добавляемого псевдослучайного сигнала на 60,7 дБ меньше, чем полный TPDF-сигнал.) Отметим, что форма кривой не слишком правильная (сравните с рис. 4), но этот небольшой добавляемый псевдослучайный сигнал обеспечивает (в данном случае) получение более приемлемого фонового "шума".
Рис. 6. Усредненный спектр мощности для рис. 5. (Объяснение непрерывной кривой на графике приведено в тексте.)
Итак, установив, что добавление небольшого псевдослучайного сигнала играет положительную роль, попробуем использовать добавляемый псевдослучайный сигнал соответствующей величины, а именно, полный TPDF-сигнал амплитудой +1 LSB. Мы уже знаем, что системе потребуется более двух уровней квантования, и это действительно справедливо. Из рис. 7 видно, что время от времени ей требуется до +4 уровней; т.е. для избежания перегрузки требуется 3-разрядный квантизатор. На самом деле, если ограничить данный квантизатор с полным псевдослучайным сигналом только двумя уровнями, то система будет нестабильной. Теперь характер изменений во времени полностью апериодический и это подтверждается тем фактом, что спектр шума стал непрерывным, а не линейчатым (дискретным) спектром.
Рис. 7. Выходной сигнал ограничителя шума Lip7ZP с добавлением TPDF-сигнала в отсутствие входного сигнала. Ясно видно, что необходим 3-разрядный квантизатор (8 уровней).
Спектральная плотность мощности шума, соответствующая рис. 7, показана на рис. 8; она идеально соответствует теоретической кривой ограничителя шума (сравните с рис. 4). Все предельные циклы полностью устранены, а спектр выходного сигнала соответствует спектру шума, а не тонального сигнала. Действительно, на рис. 8 показаны две наложенные друг на друга кривые для ограничителя шума Lip7ZP с добавлением TPDF-сигнала. Одна - спектр мощности для случая нулевого входного сигнала, а другая - спектр мощности, когда на вход Х подается соответствующий по амплитуде полной шкале синусоидальный сигнал частотой 22,05 кГц (т.е. попадающий в элемент дискретизации 128 БПФ). (В соответствии со спецификацией DSD, амплитуда сигнала, соответствующего полной шкале, устанавливается равной Δ/4 и ей соответствует значение +26,5 дБ на вертикальной оси, нормированной по амплитуде TPDF.) Обратите внимание на полное отсутствие какой-либо модуляции шумов - две кривые идеально накладываются друг на друга. Единственно отличие между ними - это изменение, возникающее из-за присутствия синусоидального входного сигнала.
Рис. 8. Наложенные друг на друга частотные характеристики ограничителя шума Lip7ZP с добавленным псевдослучайным TPDF-сигналом - без входного сигнала и с синусоидальным входным сигналом частотой 22,05 кГц с амплитудой, соответствующей полной шкале по спецификации DSD. Уровень шумов не меняется при изменении амплитуды входного сигнала от 0 до полной шкалы.
Эти превосходные характеристики сохраняются для любого входного сигнала в полосе, ограниченной частотой Найквиста, не приводящего к насыщению преобразователя. Это означает, что такой многоразрядный ограничитель шумов/сигма-дельта модулятор принципиально представляет собой идеальную конструкцию, требующую только добавления небольшого постоянного спектра фонового шума. Это лучшее, что может сделать любая цифровая или аналоговая система. (Добавление шума неизбежно в любой области, в отличие от добавления нелинейных наведенных помех.)
Синхронное усреднение поможет показать полное отсутствие нелинейных искажений в этом преобразователе при использовании добавления псевдослучайного TPDF-сигнала. На рис. 9 показаны два спектра выходного сигнала при одновременной подаче на вход двух синусоидальных сигналов с амплитудой, равной половине полной шкалы (т.е. Δ/8 каждый), частоты которых соответствуют элементам дискретизации БПФ 32 (5512,5 Гц) и 48 (8268,75 Гц). Размещение этих сигналов точно на частоте элементов дискретизации БПФ безусловно гарантирует полную синхронность с преобразуемым временем записи. Требуется только 8 уровней квантования. Верхняя кривая - результат некогерентного усреднения 64 спектров мощности, а нижняя - результат БПФ 65536 (= 216) когерентно усредненных наборов данных. Шум, соответствующий нижней кривой, имеет такую же дисперсию, что и набор данных после одиночного преобразования, но его уровень снизился на 48 дБ ( = 16 х 3 дБ). Каждое удвоение числа когерентно усредняемых наборов данных снижает уровень шума на 3 дБ, при условии, что шум некогерентный, как это и имеет место при сглаживании TPDF. С другой стороны, синхронные входные сигналы после усреднения остаются неизменными. Отметим полное отсутствие каких-либо наведенных помех, связанных с сигналом и выходящих за уменьшенный уровень шума. Правильное сглаживание сигнала - это прекрасно! Искажений нет.
Рис. 9. Здесь в Lip7ZP добавляется псевдослучайный TPDF-сигнал и одновременно подаются два синусоидальных сигнала с амплитудой, соответствующей половине полной шкалы. Верхняя кривая - результаты усреднения по 64 спектрам мощности на выходе квантизатора. Нижняя кривая показывает, как 65536 синхронных усреднений равномерно понижает уровень некоррелированного шума на ожидаемые 48 дБ.
Теперь проведем тот же самый эксперимент без добавления какого-либо псевдослучайного сигнала, т.е. так, как очень часто используются сигма-дельта преобразователи. На рис. 10 показаны полученные результаты. Эти две кривые соответствуют кривым, показанным на рис.9. Видно, что в результате когерентного усреднения появляется гребенка гармонических и интермодуляционных компонентов, лежащих в зоне под полученной путем некогерентного усреднения (верхней) шумовой кривой. В действительности, только три из них выступают над этой верхней кривой, таким образом, если бы мы отказались от преимуществ синхронного усреднения, мы считали бы, что создаются очень маленькие искажения. Теперь можно увидеть множество суммарных и разностных компонентов, включая и ожидавшийся сильный разностный тон первого порядка, соответствующий элементу дискретизации 16 (2756,25 Гц). Отметим также, что высокочастотная часть нижней кривой (в действительности - все верхняя половина диапазона до частоты Найквиста) при когерентном усреднении не опускается вниз. Это указывает на полную корреляцию этих компонентов с входным сигналом и в действительности представляет собой величину полной мощности выходного сигнала ошибки. На рис. 11 показаны те же данные, что и на рис. 10, но с линейным масштабом по оси частот; это сделано для лучшей демонстрации наведенных помех в области частоты Найквиста. В этом, несомненно, есть кое-что интересное, что было бы незаметно, если бы мы не выполнили синхронное усреднение. В работе [2] будет показано, что эти спектральные линии представляют собой боковые полосы ЧМ холостого тона, частота которого модулируется входным сигналом. Наконец, сравнивая верхние кривые на рис. 9 и 10, можно заметить, что и уровень, и форма спектра шума на рис. 10 неправильные (см. также рис. 4).

Рис. 10. Результаты для Lip7ZP без добавления псевдослучайного сигнала и при тех же входных сигналах, что и на рис. 9. Верхняя кривая - результаты усреднения по 64 кривым спектра на выходе квантизатора. Нижняя кривая показывает, как 65536 синхронных усреднений выявляют массу нелинейных наведенных помех ниже уровня шума.

Рис. 11. То же, что и на рис. 10, но с линейным масштабом по оси частот.
Рис. 9 и 10 представляют, соответственно, наилучший и наихудший случаи изменения характеристик Lip7ZP. На самом деле, как показано в [2], это достаточно типичное поведение, свойственное всем одноразрядным ограничителям шума. На рис. 9 квантизатор работает в многоразрядном режиме, так как имеет место добавление псевдослучайного TPDF-сигнала. В случае, показанном на рис. 10, он работает как одноразрядное устройство, только на двух центральных уровнях. Давайте добавим максимально возможный псевдослучайный сигнал, при котором не возникает перегрузка одноразрядного устройства. Мы обнаружили, что при добавлении RPDF-сигнала можно добавить сигнал с размахом только 0,17 от младшего значащего разряда, после этого необходимо использовать дополнительные уровни. Это составляет только 1/69 мощности полного добавляемого псевдослучайного TPDF-сигнала(т.е. -18,4 дБ относительно мощности добавляемого псевдослучайного TPDF-сигнала). Сколь значительные преимущества обеспечивает добавление такого небольшого сигнала? На рис. 12 показаны результаты. При сравнении с рис. 10 видно, что в высокочастотном диапазоне звукового сигнала наблюдается общее сокращение, в то время как в большинстве областей низкого порядка, которые располагаются вблизи частоты входного сигнала, имеются только незначительные уменьшения. (Интересно отметить, что, как будет понятно при более подробном рассмотрении, при частичном сглаживании некоторые компоненты искажений на самом деле увеличиваются - посмотрите шестую спектральную линию справа от двух входных сигналов на рис. 10 и сравните ее с рис. 12!) Теперь ни одна наведенная помеха во всей полосе аудио частот не располагается выше верхней кривой, поэтому они невидимы при прямом усреднении спектра мощности по 16384 точкам. Вследствие этого можно было бы прийти к ошибочному выводу о том, что этот одноразрядный сигма-дельта преобразователь с максимально возможным добавляемым псевдослучайным сигналом не имеет искажений в полосе звуковых частот. Однако он, несомненно, все еще нелинеен.
Рис. 12. Результаты для Lip7ZP с максимально допустимым добавляемым псевдослучайным сигналом, при котором еще не вызывается перегрузка одноразрядного преобразователя (а именно, при добавлении псевдослучайного RPDF-сигнала с максимальным размахом 0,17Δ), при тех же входных сигналах, что и на рис. 9. Верхняя кривая - результаты усреднения по 64 кривым спектра мощности на выходе квантизатора. Нижняя кривая (65536 синхронных усреднений) показывает умеренное ослабление компонентов искажений по сравнению со случаем без добавления псевдослучайного сигнала (рис. 10).
Таким образом, частичное сглаживание до максимально возможной величины, не вызывающей перегрузки, конечно помогает, но не слишком значительно. Тем не менее, это крайне желательно делать по двум причинам: уменьшается модуляция шума, зависящая от сигнала, и предотвращается возникновение колебаний предельного цикла. Последнее преимущество уже было показано на рис. 6. Чтобы продемонстрировать первый из названных полезных эффектов, выполним еще два эксперимента. Во-первых, сравним непрерывную кривую на рис. 6, соответствующую случаю отсутствия входного сигнала при добавлении минимального возможного псевдослучайного сигнала (полный размах 0,013Δ, RPDF-сигнал), предотвращающего образование предельного цикла при нулевом входном сигнале, со случаем подачи синусоидального сигнала с полной амплитудой 22,05 кГц (т.е. элемент дискретизации БПФ 128) без добавления псевдослучайного сигнала. Эти кривые, полученные усреднением спектров мощности, наложены друг на друга на рис. 13; хорошо заметны степень модуляции уровня шума вследствие присутствия сигнала (практически 10 дБ по всему диапазону аудио частот) и большие изменения формы кривой выше 50 кГц. Отметим также присутствие искажений третьей и четвертой гармоник входного сигнала, выходящих за кривую без добавления псевдослучайного сигнала (верхняя кривая) и множество спектральных линий вблизи частоты Найквиста. Третья гармоника меньше основной только на 32 дБ.
Рис. 13. Степень модуляции шума в Lip7ZP без добавления псевдослучайного сигнала. Подробности см. в тексте. Обе кривые получены путем усреднения по 64 спектрам мощности.
Во-вторых, мы подаем максимальный псевдослучайный сигнал RPDF, соответствующий критерию отсутствия перегрузки одноразрядного устройства, а именно, RPDF с максимальным размахом 0,17 младшего значащего разряда. На рис. 14 показаны два наложенных друг на друга усредненных спектра мощности, один из которых соответствует случаю отсутствия входного сигнала, а другой - подачи синусоидального сигнала с частотой, соответствующей элементу дискретизации 128 (т.е. 22,05 кГц) с максимальной амплитудой. Из сравнения с рис. 13 видно, что модуляция шумов резко уменьшилась (приблизительно до 2 дБ), но пик третьей гармоники и компоненты с частотой, близкой к частоте Найквиста, уменьшились незначительно (третья гармоника уменьшилась лишь на 2 дБ). Тем не менее, эти результаты подтверждают выгоды, получаемые от использования добавления псевдослучайного сигнала с максимально допустимой амплитудой.
Рис. 14. То же, что на рис. 13, но использовано добавление псевдослучайного сигнала с максимально допустимой амплитудой, не вызывающей перегрузки (RPDF с размахом 0,17Δ). Модуляция шума снизилась приблизительно на 2 дБ.
Таким образом, из результатов этого моделирования можно заключить, что для работы без нелинейных наведенных помех сигма-дельта преобразователю высокого порядка требуется более двух уровней, чтобы можно было использовать добавление соответствующего псевдослучайного сигнала. Если же ограничиться только двумя центральным уровнями, он постоянно будет находиться в состоянии перегрузки и, вероятно, будет нестабильным. При этих условиях можно осуществить только частичное добавление псевдослучайного сигнала и, следовательно, такой преобразователь не может быть полностью линеаризован. Оставшаяся нелинейность не фиксирована, независимо от того, какой величины отрицательная обратная связь (т.е. ограничение шума), используется в квантизаторе. (Дополнительное обсуждение этого вопроса см. в работе [2].) Повышенная обратная связь предоставит возможность уменьшить ошибки в некоторых участках полосы частот при некоторых условиях сигнала, но не во всем аудио диапазоне и не для всех допустимых входных сигналов. Отрицательная обратная связь может показать отличные результаты, но не обольщайтесь: она не может уменьшить все ошибки до нуля! В таком случае наилучшей альтернативой является многоразрядный преобразователь. Одноразрядный сигма-дельта преобразователь принципиально несовершенен, в то время как возможность улучшения многоразрядного сигма-дельта преобразователя теоретических ограничений не имеет. Так и хочется немного перефразировать фразу Альберта Эйнштейна: "Система должна быть простой, насколько это возможно, но не проще". Однокаскадный одноразрядный сигма-дельта преобразователь слишком простой! Его можно сделать неожиданно хорошим для системы с большой нелинейностью, но эта высокая нелинейность серьезно ограничивает предельно достижимые характеристики. Многоразрядные преобразователи таких ограничений не имеют.
Дополнительные замечания о DSD и сигма-дельта преобразовании
Рассмотрим теперь более подробно формат кодирования DSD. Напомним, что для него предписывается ([5], [6]) использование однокаскадного одноразрядного преобразователя, работающего со скоростью 2,8225 млн. выборок/сек на канал.
Это значение в четыре раза превосходит скорость передачи данных одного канала компакт-диска и слишком неэкономична с точки зрения теории информации [10], если сравнить ее с информационной пропускной способностью системы слуха человека. Тем не менее, интересно отметить, что линейный многоразрядный ИКМ может обеспечить такую же или более низкую скорость передачи данных. Имеется множество различных способов сравнения. С использованием "теоремы ограничения шумов" Герцона-Кравена [9] легко сконструировать возможные сценарии. Здесь мы рассмотрим четыре таких сценария. Вспомним, что одноразрядный квантизатор, переключаясь между двумя выходными уровнями +Δ/2, имеет постоянную полную мощность выходного сигнала Δ2/4. Поскольку выходная мощность постоянна, компонента сигнала на выходе должна образовываться за счет остатка. Из этого следует, что работа этого устройства неизбежно должна сопровождаться корреляцией шума и модуляцией ошибки. Лучшее, на что можно надеяться - что все такие модуляционные эффекты возникают только выше звуковых частот. Гарантировать это, однако, невозможно. DSD определяет, что соответствующий полному диапазону синусоидальный сигнал будет на 9 дБ ниже этой полной выходной мощности (т.е. полная выходная мощность равна +9 dBFS). Это соответствует пиковой амплитуде Δ/4 для синусоидального сигнала, соответствующего полной шкале. Считая это уровнем, равным 0 дБ FS (дБ полной шкалы) для DSD, и учитывая, что система создает уровень шума, по меньшей мере, на 120 дБ ниже уровня полной шкалы в диапазоне до 20 кГц с последующим быстрым возрастанием выше этой частоты, можно рассчитать, что спектральная плотность шума должна быть ограничена значением более 115 дБ. Такой огромный уровень шума является платой за использование одноразрядного преобразователя. Именно ограничение шума определяет отношение сигнал-шум в полосе частот. Чтобы получить эквивалентный результат для любого многоразрядного преобразователя, требуется намного меньшее ограничение шума, поскольку для такого преобразователя отправная точка соответствует намного лучшему отношению сигнал-шум.
- Рассмотрим 16-разрядный ИКМ с ограничением шума, обладающий четырехкратной избыточностью частоты дискретизации. Одним из обоснований превосходства DSD является его частотный диапазон, составляющий 100 кГц. В этом вопросе необходима определенная сдержанность. Быстро нарастающая (от 5 до 7 порядка) кривая шума делает необходимым либо использование в АЦП фильтра нижних частот с еще более крутой характеристикой, что требуется для подавления потенциально разрушительного влияния высокочастотного шума, либо ограничение полосы частот ниже 100 кГц. Кажется, последнее представляет собой наиболее распространенный в настоящее время подход, принятый авторами DSD, поскольку в их продуктах частотная полоса обрезается выше 50 кГц. С 16-разрядным ИКМ с частотой дискретизации 4 х 44100 = 176 400 Гц (что соответствует скорости передаче данных, используемой в DSD) и при соответствующем добавлении псевдослучайного сигнала возможны следующие сценарии:
* Уровень шума на 123 дБ ниже полной шкалы во всем диапазоне до 40 кГц при использовании ограничения шума на 48 дБ, и полная мощность шумового сигнала -72 дБ FS.
* Уровень шума на 123 дБ ниже полной шкалы во всем диапазоне до 20 кГц при использовании ограничения шума только на уровне 32 дБ, и полная мощность шумового сигнала -86 дБ FS.
В обоих сценариях получается плоская частотная характеристика в полосе до 80 кГц. Любой из этих сценариев обеспечивает получение характеристик, превосходящих характеристики DSD при одинаковой скорости передачи данных.
- Теперь рассмотрим 16-разрядный ИКМ с ограничением шума, обладающий двукратной избыточностью частоты дискретизации. Это соответствует скорости передачи данных, в два раза меньшей скорости в DSD, при частоте дискретизации 2 x 44100 = 88 200 Гц. Здесь достигается уровень шума на 120 дБ ниже полной шкалы во всем диапазоне до 20 кГц при использовании ограничения шума только на уровне 48 дБ, а полная мощность шума составляет -72 дБ FS. Частотная характеристика будет плоской до 40 кГц.
- Наконец, рассмотрим 8-разрядный ИКМ с ограничением шума, обладающий четырехкратной избыточностью частоты дискретизации. Это также соответствует скорости передачи данных, в два раза меньшей скорости в DSD и в два раза превосходящей скорость для компакт-дисков, при частоте дискретизации 4 x 44100 = 176 400 Гц. Здесь достигается уровень шума на 120 дБ ниже полной шкалы во всем диапазоне до 20 кГц при использовании ограничения шума только на уровне 96 дБ, а полная мощность шума составляет -19 дБ FS. Частотная характеристика будет плоской до 80 кГц. Последний пример, по-видимому, наиболее поучителен. При скорости передачи данных, составляющей половину скорости DSD, достигается сравнимая полоса пропускания с аналогичным уровнем спектральной плотности шума вплоть до частоты 20 кГц, но с намного меньшим значением спектральной плотности выше этой частоты, и с полной мощностью шума на 28 дБ ниже. В таком преобразователе используется добавление полного псевдослучайного сигнала TPDF и поэтому в нем полностью отсутствуют наведенные помехи. При вдвое меньшей скорости передачи данных он превосходит DSD по всем параметрам! DSD - это расточительный мот с точки зрения производительности.
Полезно посмотреть, каким образом получаются приведенные выше цифры. Для иллюстрации этого рассмотрим приведенный выше пример (с). Четырехкратная избыточность по частоте дискретизации обеспечивает разброс мощности шумов квантования по диапазону, в четыре раза превышающему полосу пропускания для компакт-дисков, в результате чего спектральная плотность мощности (PSD) шума уменьшается на 6 дБ. Таким образом, такая 8-разрядная система без ограничения шума, но с добавлением полного TPDF-сигнала будет обеспечивать PSD шума на уровне -51,1 дБ FS (= 49,9 дБ для 8-разрядной системы + 6 дБ за счет избыточности частоты дискретизации - 4,8 дБ за счет добавления псевдослучайного сигнала). Выделяя дополнительное сокращение на 3 дБ, вызываемое добавлением псевдослучайного сигнала, получаем, что PSD составляет -48,1 дБ FS. Из "теоремы ограничения шума" Герцона-Кравена [9] следует, что области любой кривой оптимального ограничения шума выше и ниже значения PSD без ограничения, должны быть равны при построении графика с линейным масштабом частот и логарифмическим масштабом амплитуд. Поскольку мы хотим снизить уровень при ограничении шума до значения ниже -120 дБ FS приблизительно в четверти полосы Найквиста (скажем, до 22,05 кГц), идеальное требуемое ограничение имеет вид, показанный на рис. 15.

PSD шума для частот ниже 20 кГц необходимо опустить на 72 дБ (= 120 - 48 дБ). В соответствии с накладываемым теоремой условием равенства площадей, на оставшихся 3/4 полосы Найквиста PSD будет выше нулевого уровня на 24 дБ (= 72/3 дБ), следовательно, полное значение ограничения составляет 96 дБ (= 72 + 24 дБ). Теперь получаем, что полная мощность шума равна -19 дБ FS. В этих расчетах для ограничения шума используется идеальная кривая прямоугольной формы, показанная на рис. 15. Это, конечно, недостижимо при использовании фильтров конечного порядка, поэтому при реальной разработке устройства полученные цифры следует использовать только в качестве отправной точки. Мы реализовали конструкцию, рассмотренную в примере (с), с использованием для H(z) рекурсивного фильтра 12 порядка, а также использовали некоторое приблизительное (не оптимизированное) психоакустическое формирование кривой с провалами около 3 и 12 кГц. Реальные результаты показаны на рис. 16. Обратите внимание на то, что для кривой выполняется условие равных площадей. Полученные в результате моделирования характеристики этой системы дают отношение сигнал-шум 120,4 дБ до частоты 20 кГц. Для добавления псевдослучайного сигнал TPDF использовалось около 70 из 256 уровней, доступных в восьмиразрядной системе, так что наши допущения действительно можно считать консервативными.
Рис. 16. Реализация примера (с), включающая попытку приближенного формирования частотной характеристики с учетом психо-акустических параметров. Этот рисунок нужно сравнивать с идеализированной схемой, показанной на рис. 15, использованной в качестве основы для разработки.
Заключение
В заключение хотелось бы привести некоторые соображения:
Многокаскадные преобразователи с многоразрядной квантизацией в первом каскаде не обладают недостатками, свойственными однокаскадному одноразрядному сигма-дельта преобразователю, при условии, что их квантизаторы не перегружаются.
Повторяющееся обратное преобразование с использованием одноразрядного сигма-дельта преобразователя обычно влечет за собой желание после каждого этапа преобразования сохранять данные в формате DSD, в результате чего аккумулируется значительно больший шум и нелинейные наведенные помехи, чем в любой многоразрядной системе с добавлением псевдослучайного сигнала при аналогичных условиях. Это не простой вопрос, поскольку каждая операция обработки сигнала (даже тривиальная, такая как изменение усиления) в результате превращает поток данных одноразрядного DSD в многоразрядный!
Ввиду неразрешимых теоретических проблем, обсужденных в настоящей статье, у нас нет уверенности в возможности создать тестовый диск в формате Super Audio CD, который был бы свободен от искажений и имел бы постоянный и независящий от сигнала уровень шума! В многоразрядной области это легко выполняется с применением стандартных методов сглаживания. Действительно, стандарты измерений для аудио на основе ИКМ, разработанные Audio Engineering Society, предполагают обязательное добавление псевдослучайного TPDF-сигнала. Это невозможно для цифрового аудио с использованием одноразрядных преобразователей.
Отрицательная обратная связь в одноразрядном сигма-дельта модуляторе обеспечивает некоторое улучшение передаточной характеристики квантизатора и одновременно - достижение отношения сигнал-шум 120 дБ, что намного превышает любые требования, ранее предъявляемые к высококачественными системами. Как ни странно, в промышленности для получения высокого качества широко используются низкие коэффициенты обратной связи, что полностью противоречит полученным здесь результатам.
Поскольку именно сильная отрицательная обратная связь на низких частотах снижает в одноразрядной системе искажения в звуковом диапазоне, едва ли будет неожиданностью найденное нами увеличение искажений на высоких частотах, где корректирующая отрицательная обратная связь фактически превращается в положительную обратную связь!
Значительные уровни шума в ультразвуковом диапазоне и ложные компоненты, создаваемые одноразрядным сигма-дельта преобразователем при использовании несоответствующей фильтрации, создают серьезные проблемы для усилителей звуковых сигналов и громкоговорителей, которые, если не учитывать этот факт, могут создавать компоненты нелинейных искажений в основной полосе частот. Интересно, в какой степени воспринимаемые на слух "отличия" при прослушивании записей в формате Super Audio CD могут определяться именно такими нелинейными эффектами.
Не исключено, что возможно прослушивание ультразвуковых сигналов, коррелированных с сигналом основной полосы частот, а поэтому компоненты искажений, имеющие низкую амплитуду, но коррелированные с сигналом (существующие, как показано в настоящей статье, в основной полосе частот), будут восприниматься на слух, хотя при обычных условиях их уровень находится ниже порога слышимости. Здесь необходимы дополнительные исследования.
Поскольку "теорема ограничения шумов" Герцона-Кравена подразумевает существование равных площадей выше и ниже уровня шумов без ограничения (при использовании логарифмического масштаба по вертикальной оси), из нее вытекает, что, если придерживаться теоретической кривой, в результате ограничения шума всегда будет происходить увеличение полной мощности шума. Поскольку полная выходная мощность одноразрядного ограничителя постоянна, то даже в отсутствие сигнала PSD шума такого устройства не может соответствовать теоретической кривой. Полная выходная мощность шума в этом случае должна быть меньше предсказываемой. Тогда при добавлении входного сигнала мощность шума в выходном сигнале должна снизиться еще больше, что приводит к дальнейшему изменению PSD шума.
В качестве общего правила можно принять, что неоднократное ограничение шума на различных стадиях обработки сигнала нежелательно вследствие накопления мощности полного высокочастотного шума. Это означает, что независимо от длины слова на входе, в идеале всегда следует поддерживать длину слова сигнала, по меньшей мере, не ниже, чем необходимая для сохранения уровня шума в основной полосе. Таким образом, сигнал с отношением сигнал-шум в основной полосе частот 120 дБ в процессе цифро-аналогового преобразования никогда не должен обрабатываться и сохраняться с использованием длины слова менее 24 битов. Это должно соблюдаться независимо от того, является ли он сигналом одноразрядного DSD с ограничением шума, сигналом 8-разрядного преобразователя, описанного в примере (с), или сигналом 20- или 24-разрядного преобразователя без ограничения шума. Этот принцип в одинаковой степени применим как для бытового, так и для профессионального цифрового аудио. Ограничение шума следует использовать, только если необходимо снижение скорости передачи данных вследствие ограничений, накладываемых процессом хранения или передачи данных. (Между прочим, кажется необязательным, что DSD необязательно идет в противоположном направлении, фактически увеличивая скорость передачи данных).
То, что для одноразрядного преобразователя характерны достаточно сильные искажения, вытекает и из следующих аргументов. Классическая модель для ошибки квантования Е многоразрядного квантизатора без добавления псевдослучайного сигнала предполагает, что ее мощность равна Δ2/12. Мощность сигнала ошибки одноразрядного квантизатора равна (Δ/2)2 = Δ2/4 при условии отсутствия сигнала, т.е. в три раза больше. Более того, данная мощность ошибки не зависит от того, выполняется ли или нет в одноразрядном преобразователе добавление псевдослучайного сигнала. [Интересно, что мощность сигнала ошибки квантизатора с добавлением TPDF-сигнала тоже равна Δ2/4 (= 3Δ2/12).] В разделе 3 уже отмечалось, что мощность "шума" одноразрядного квантизатора должна падать при наличии входного сигнала, поскольку его полная выходная мощность является абсолютно постоянной; именно этот неизбежно и вызывает модуляцию шума. Теперь мы видим, что когда на выход подается какой-либо сигнал, его мощность ошибки должна быть меньше мощности ошибки Δ2/4 многоразрядного квантизатора с добавлением псевдослучайного TPDF-сигнала. Кроме того, его спектр мощности ошибки только приблизительно можно назвать спектром белого шума, в то время как в соответствии с теорией добавления сигнала ([3], [4]), в многоразрядном квантизаторе с добавлением псевдослучайного TPDF-сигнала этот шум действительно белый. Следовательно, можно ожидать, что в результате модуляции спектр шума в среднем будет располагаться ниже и параллельно спектру, соответствующему многоразрядному квантизатору с добавлением псевдослучайного TPDF-сигнала. (В случае если спектр Е для одноразрядного квантизатора действительно является спектром белого шума, эти две кривые должны располагаться точно параллельно, если выходная ошибка соответствует именно Е, прошедшему ограничение с использованием линейного фильтра {1 - H}.) Это подтверждается результатами раздела 2 и может быть продемонстрировано наложением верхних кривых, показанных на рис. 9 и 10. Результаты такого наложения показаны на рис. 17, где для каждого случая выходной сигнал ограничителя Lip7ZP представляет собой два синусоидальных сигнала с амплитудой, равной половине полного диапазона ( т.е. для каждого - Δ/8), и частотой, соответствующей элементам дискретизации 32 и 48 БПФ. Также отметим значительное расхождение между формой верхней кривой, полученной в случае добавления псевдослучайного TPDF-сигнала (которая, собственно, и является искомой кривой шума) и нижней кривой шума, реально полученной для одноразрядного сигма-дельта модулятора без добавления псевдослучайного сигнала.
Рис. 17. Наложение верхних кривых из рис. 9 и 10, показывающее, что спектр шума одноразрядного сигма-дельта модулятора в среднем располагается ниже, чем спектр многоразрядного ограничителя шума с добавлением псевдослучайного TPDF-сигнала. Каждая кривая - результат усреднения по 64 спектрам мощности выходного сигнала соответствующего квантизатора.
Список литературы
- S. P. Lipshitz and J. Vanderkooy, "Why Professional 1-Bit Sigma-Delta Conversion is a Bad Idea", presented at the 109th Convention of the Audio Engineering Society, Los Angeles, CA, 2000 Sept. 22-25, preprint 5188; a Supplementary Information booklet (9 pp.), handed out at the presentation, is obtainable from SPL by e-mail at spl@audiolab.uwaterloo.ca. (This reference should be considered superseded by the present paper.)
- J. Vanderkooy and S. P. Lipshitz, "Towards a Better Understanding of 1-Bit Sigma-Delta Modulators", presented at the 110th Convention of the Audio Engineering Society, Amsterdam, The Netherlands, 2001 May 12-15. (Companion to the present paper.)
- S. P. Lipshitz, R. A. Wannamaker, and J. Vanderkooy, "Quantization and Dither: A Theoretical Survey", J. Audio Eng. Soc., vol. 40, pp. 355-375 (1992 May).
- R. A. Wannamaker, S. P. Lipshitz, J. Vanderkooy, and J. N. Wright, "A Theory of Nonsubtractive Dither", IEEE Transactions On Signal Processing, vol. 48, pp. 499-516 (2000 Feb.); erratum ibid., p. 3258 (2000 Nov.).
- A. Nishio, G. Ichimura, Y. Inazawa, N. Horikawa, and T. Suzuki, "Direct Stream Digital Audio System", presented at the 100th Convention of the Audio Engineering Society, Copenhagen, 1996 May 11-14, preprint 4163.
- "Super Audio Compact Disc: A Technical Proposal", Philips/Sony white paper, 12 pp. (1997).
- S. P. Lipshitz, J. Vanderkooy, and R. A. Wannamaker, "Minimally Audible Noise Shaping", J. Audio Eng. Soc., vol. 39, pp. 836-852 (1991 Nov.).
- R. A. Wannamaker, "Psychoacoustically Optimal Noise Shaping", J. Audio Eng. Soc., vol. 40, pp. 611-620 (1992 July/Aug.).
- M. A. Gerzon and P. G. Craven, "Optimal Noise Shaping and Dither of Digital Signals", presented at the 87th Convention of the Audio Engineering Society, J. Audio Eng. Soc. (Abstracts), vol. 37, p. 1072 (1989 Dec.), preprint 2822.
- J. R. Stuart, "Coding High Quality Digital Audio", presented to the Japan Audio Society (1998 June); available for download at http://www.meridian-audio.com/ara/.
- S. R. Norsworthy, "Quantization Errors and Dithering in ? Modulators", being Chapter 3 of Delta-Sigma Data Converters: Theory, Design, and Simulation, S. R. Norsworthy, R. Schreier, and G. С Temes, eds (IEEE Press, New York, NY, 1997).
- M. O. J. Hawksford, "Bitstream versus PCM Debate for High-Density Compact Disc", private publication (1995 April) available for download at http://www.meridian-audio.com/ara/.
- R. M. Gray, "Oversampled Sigma-Delta Modulation", IEEE Trans. Commun., vol. COM-35, pp. 481-489 (1987 May).
Приложение
Доказательство неизбежности перегрузки сигма-дельта модулятора в случае 1-го порядка
Ниже представлено полное математическое доказательство неизбежности перегрузки квантизатора в случае одноразрядного ограничителя шума первого порядка. Это доказательство представляет собой развитие аргументов, приведенных в работе Gray [13]. На рис. 1 это соответствует случаю H(z) = z-1, задержке на одну выборку и насыщению Q при уровнях +Δ/2. Как уже упоминалось, эта схема точно соответствует однокаскадному одноразрядному сигма-дельта преобразователю первого порядка. В данном приложении мы используем символы в нижнем регистре для обозначения величины сигнала во временной области, а индексы для обозначения различных моментов дискретизации 0, 1, 2, :, n, : . Таким образом, xn обозначает входной сигнал X в момент времени n; yn обозначает выходной сигнал Y; v обозначает добавляемый псевдослучайный сигнал N; wn обозначает входной сигнал квантизатора W; а εn обозначает сигнал ошибки квантования E. Выходной сигнал квантизатора определим выбором уровня Q(0) = +Δ/2. Из рис. 1 получаем, что эти сигналы связаны уравнениями
wn = xn - εn-1 + νn для n = 1, 2, :, (A.1)
и
yn = wn+ εn + νn для n = 1, 2, . (A.2)
Без потери общности можно предположить, что начальное состояние равно
ε0 = 0. (A.3)
(Если начальное состояние вызывает перегрузку квантизатора, то схема может за конечное число шагов перейти в состояние без перегрузки, после чего и может быть применен приведенный ниже анализ.) Как уже обсуждалось, одноразрядный квантизатор Q будет работать без перегрузки, если для каждого k = 1, 2, .:. , имеем
-Δ ≤ wk < Δ, (A.4)
или, что эквивалентно,
-Δ/2 < yk - wk < Δ/2;
т.е., в соответствии с (A.2), если
-Δ/2 + νk < εk ≤Δ/2 + νk для k = 1, 2, .:. . (A.5)
Случай(1): Нет добавления псевдослучайного сигнала: νn = 0
В соответствии с (A.1) и (A.3), wI = xI- ε0 = xI и, в соответствии с (A.4), в шаге 1 не возникает никакой перегрузки, при условии, что
-Δ ≤ xI ≤ Δ
и, следовательно, то же самое будет и при более жестком условии
-Δ/2 ≤ xI ≤ Δ/2. (A.6)
Теперь прибегнем к математической индукции. Предположим, что на этапах k = 1, 2, .: , n не возникало никакой перегрузки при входном сигнале, подчиняющемся следующему ограничению:
-Δ/2 ≤ xI ≤ Δ/2. (A.7)
т.е. при условии, включающем (A.6). Тогда, в соответствии с этой гипотезой и уравнением (A.5), получаем
-Δ/2 < εk ≤ Δ/2 для k = 1, 2, .: , n,
и, таким образом, в соответствии с уравнением (A.1),
xn - Δ/2 ≤ wn+1 < xn+1 + Δ/2;
т.е. также
-Δ ≤ wn+1 < Δ
при условии (A.7). Таким образом, по индукции, перегрузка не возникает для всех k при условии (A.7). В этом случае одноразрядный сигма-дельта преобразователь первого порядка работает без перегрузки. Но, поскольку добавление псевдослучайного сигнала не проводится, он нелинеен; он обладает искажениями, модуляцией шума и колебаниями предельного цикла малой амплитуды, точно так же, как и любой многоразрядный ограничитель шума без добавления псевдослучайного сигнала.
Теперь посмотрим, что произойдет, если добавим в модулятор псевдослучайный сигнал.
Случай (2): -μ ≤ νn < μ для всех n
Здесь μ обозначает пиковую амплитуду добавляемого сигнала. В соответствии с уравнениями (A.1) и (A.3),
w1 = x1 - ε0 + ν1 = x1 + ν1,
и, таким образом,
x1 - μ < w1 < x1 + μ ;
т.е., в соответствии с (A.4), на этапе 1 не возникает никакой перегрузки, при условии, что
-Δ + μ ≤ x1 ≤ Δ-μ. (A.8)
Теперь предположим, что никакой перегрузки не возникает для k = 1, 2, :, n при некотором условии на входе xk, которое также удовлетворяет условию (A.8). Тогда в соответствии с (A.5) имеем
-Δ/2 + νk < εk ≤ Δ/2 + νk для k = 1, 2, .:. , n,
и, таким образом, в соответствии с (A.1),
xn+1 - Δ/2 - νn + νn+1 ≤ wn+1 < xn+1 + Δ/2 - νn + νn+1.
Но поскольку
-μ ≤ νk < μ для всех k,
получаем
-2μ ≤ νn+1 - νn< 2μ,
и, таким образом,
xn+1 - Δ/2 -2μ ≤ wn+1 < xn+1 + Δ/2 + 2μ.
Таким образом, выполняется условие отсутствия перегрузки
-Δ ≤ wn+1 < Δ
при условии, что
-Δ/2 + 2μ ≤ xk ≤ ?/2 - 2μ для всех k. (A.9)
Отметим также, что это условие гарантирует выполнение (A.8). Поскольку (A.9) тоже требует, чтобы Δ - 4μ ≥ 0, для совместимости необходимо μ ≤ Δ/4. Это условие совместимости ограничивает добавляемый псевдослучайный сигнал, который может быть приложен к преобразователю до возникновения перегрузки.
Таким образом, метод математической индукции приводит нас к следующему заключению:
- Для μ = 0: В соответствии с (A.9) мы снова приходим к условию (A.7) случая (1).
- Для 0 < μ < Δ/4: Перегрузка не возникает, при условии, что входной сигнал ограничен в соответствии с уравнением (А.9). Диапазон входного сигнала теперь меньше, чем в (A.7), и поскольку μ < Δ/4, добавление будет только частичное (добавление полного псевдослучайного TPDF-сигнала требует μ = Δ), и поэтому все еще могут возникать искажения, модуляция шумов и колебания предельных циклов.
- μ = Δ/4: Чтобы перегрузка не возникала, мы не должны вообще подавать входной сигнал; т.е. должно быть xk ≡ 0 для всех k.
- μ > Δ/4: Теперь условие совместимости нарушено, и перегрузка обязательно возникнет (даже без входного сигнала) на некотором шаге n.
Заключение. Одноразрядный сигма-дельта квантизатор первого порядка с добавлением псевдослучайного сигнала (или эквивалентный ограничитель шума первого порядка) может работать без перегрузки, только если μ < Δ/4, и только если входной сигнал xk подчиняется ограничению (A.9). Поскольку это случай работы без добавления искажения, модуляция шумов и колебания предельного уровня не устраняются. [Интересно отметить, что при выборе μ = Δ/6 получается максимально возможный диапазон работы без перегрузки -Δ/6 ? xk ? Δ/6.] При использовании соответствующего добавления (приведенный выше случай (2d) с μ = Δ для добавления псевдослучайного TPDF-сигнала) перегрузку квантизатора предотвратить невозможно.
Теперь, показав, что даже для простейшего (т.е. первого порядка) одноразрядного сигма-дельта преобразователя невозможно использовать добавление соответствующего псевдослучайного сигнала и, следовательно, полностью линеаризовать, рассмотрим ситуацию с однокаскадным одноразрядным сигма-дельта модулятором более высокого порядка. Как уже говорилось, такой модулятор эквивалентен ограничителю шумов общего назначения, показанному на рис. 1, но с более сложными фильтрами H(z). С учетом проведенного выше анализа нас не должно удивить, что для схем более высокого порядка, с их более высоким усилением шумов, вероятность перегрузки даже выше, чем в случае обсужденного здесь простого примера. Мы не будем приводить полный анализ. На такие преобразователи без перегрузки можно подавать только очень маленький добавляемый псевдослучайный сигнал - намного меньше, чем полный добавляемый псевдослучайный TPDF-сигнал. Пример Lip7ZP седьмого порядка, использованный в качестве иллюстрации в разделе 2, показывает тип ограничения шума, необходимого для DSD-модулятора, при котором возможно достижение отношения сигнал-шум 120 дБ в полосе до 20 кГц с использованием 64-кратной избыточности по дискретизации. Для такого модулятора без перегрузки можно использовать добавление псевдослучайного RPDF-сигнала с полным размахом только 0,17Δ. Это соответствует мощности добавляемого шума, на 18,4 дБ меньшей, чем полный TPDF-сигнал. И это общая ситуация: невозможно линеаризовать одноразрядный квантизатор за счет допустимого добавления псевдослучайного сигнала.