×
10.04.2019
219.017.0431

ЗАВИСЯЩЕЕ ОТ ЭНЕРГИИ КВАНТОВАНИЕ ДЛЯ ЭФФЕКТИВНОГО КОДИРОВАНИЯ ПРОСТРАНСТВЕННЫХ ПАРАМЕТРОВ ЗВУКА

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится к квантованию пространственных параметров звука. Квантование параметров, являющихся мерой, характеризующей канал или пару каналов, причем параметр представляет собой меру, характеризующую канал или пару каналов относительно другого канала многоканального сигнала, может быть выполнено более эффективно с использованием правила квантования, генерация которого осуществляется на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала. При генерации правила квантования, учитывающего психоакустический подход, объем закодированного представления многоканального сигнала может быть уменьшен за счет более грубого квантования без существенного нарушения качества восприятия многоканального сигнала, восстановленного из закодированного представления. Технический результат - обеспечение более эффективного сжатия без существенного ухудшения качества восприятия звукового сигнала. 18. н. и 29 з.п. ф-лы, 18 ил.
Реферат Свернуть Развернуть

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение относится к квантованию пространственных параметров звука и, в частности, к концепции, обеспечивающей возможность более эффективного сжатия без существенного ухудшения качества восприятия звукового сигнала, восстановленного с использованием квантованных пространственных параметров звука.

УРОВЕНЬ ТЕХНИКИ

В последнее время способы многоканального воспроизведения звука становятся все более и более важными. Учитывая необходимость обеспечения эффективной передачи многоканальных звуковых сигналов, имеющих пять или большее количество раздельных звуковых каналов, было разработано несколько способов сжатия стереофонического или многоканального сигнала. В современных подходах к решению проблемы параметрического кодирования многоканальных звуковых сигналов (параметрическое стерео (PS), "бинауральное кодирование сигнала" ("Binaural Cue Coding" (BCC)) и т.д.) многоканальный звуковой сигнал представляют посредством смикшированного (down-mix) сигнала (который может представлять собой монофонический сигнал или содержать несколько каналов) и дополнительной параметрической информации, также именуемой "пространственными сигналами" ("spatial cues"), которая характеризует стадию ее пространственного звукового восприятия.

Устройство многоканального кодирования обычно принимает в качестве входного сигнала, по меньшей мере, два канала и осуществляет вывод одного или большего количества каналов несущей частоты и параметрических данных. Параметрические данные получены таким образом, что в устройстве декодирования может быть вычислено приближенное значение исходного многоканального сигнала. Канал (каналы) несущей частоты обычно содержит (содержат) выборки из поддиапазона частот, спектральные коэффициенты, выборки, произведенные во временной области, и т.д., которые обеспечивают сравнительно точное представление исходного сигнала, а параметрические данные не содержат такие выборки спектральных коэффициентов, но вместо этого содержат параметры управления для управления определенным алгоритмом восстановления. Такое восстановление может содержать умножение на весовой коэффициент, сдвиг по времени, сдвиг по частоте, сдвиг по фазе и т.д. Таким образом, параметрические данные содержат только сравнительно грубое представление сигнала или связанного с ним канала.

Способ "бинаурального кодирования сигнала" ("binaural cue coding" (BCC)) описан в нескольких публикациях, таких как публикация "Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression", C. Faller, F. Baumgarte, AES convention paper 5574, May 2002, Munich, в двух публикациях Международной конференции по акустике и обработке речи и сигналов (ICASSP): "Estimation of auditory spatial cues for binaural cue coding" и "Binaural cue coding: a normal and efficient representation of spatial audio", Orlando, FL, May 2002, авторами обеих из которых являются C. Faller и F. Baumgarte.

При кодировании способом BCC несколько входных звуковых каналов преобразовывают в их спектральное представление с использованием преобразования на основе дискретного преобразования Фурье (ДПФ) с перекрывающимися окнами. Результирующий равномерный спектр затем разделяют на неперекрывающиеся части. Каждая часть имеет ширину полосы частот, пропорциональную эквивалентной прямоугольной ширине полосы частот (ERB). Затем производят оценку пространственных параметров, именуемых ICLD (разность между каналами по уровню) и ICTD (разность между каналами по времени) для каждой части. Параметр ICLD описывает разность уровней между двумя каналами, а параметр ICTD описывает разность по времени (сдвиг фазы) между двумя сигналами различных каналов. Разности уровней и разности по времени обычно являются заданными для каждого канала относительно опорного канала. После вычисления этих параметров эти параметры квантуют и, наконец, кодируют для передачи.

Несмотря на то что параметры ICTD и ICLD представляют собой наиболее важные параметры локализации источника звука, пространственное представление с использованием этих параметров может быть усовершенствовано путем введения дополнительных параметров.

Родственный способ, именуемый "параметрическое стерео", описывает параметрическое кодирование двухканального стереофонического сигнала на основании переданного монофонического сигнала плюс дополнительной информации о параметре. В этом способе введены пространственные параметры трех типов, именуемые "разностью интенсивности между каналами" (IIDs), "разностями между каналами по фазе" (IPDs) и "когерентность между каналами" (IC). Расширение пространственного параметра, заданного параметром когерентности (параметром корреляции), обеспечивает возможность параметризации пространственной "расплывчатости" или пространственной "компактности" звукозаписи при восприятии. Более подробное описание параметрического стерео приведено в следующих публикациях: в публикации "Parametric Coding of stereo audio", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers (2005) Eurasip, J. Applied Signal Proc. 9, страницы 1305-1322", в публикации "High-Quality Parametric Spatial Audio Coding at Low Bitrates", J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, AES 116 th Convention, Preprint 6072, Berlin, May 2004 и в публикации "Low Complexity Parametric Stereo Coding", E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, AES 116 th Convention, Preprint 6073, Berlin, May 2004.

В международной публикации заявки на изобретение WO 2004/008805 A1 изложено то, каким образом может быть осуществлено целесообразное сжатие многоканального звукового сигнала путем объединения нескольких модулей параметрического стерео, обеспечивая таким образом реализацию иерархической структуры для получения представления исходного многоканального звукового сигнала, содержащего смикшированный сигнал и дополнительную параметрическую информацию.

В подходе, основанном на BCC и параметрическом стерео (PS), представление разностей уровней (также именуемых разностями интенсивности (ICLD) или разностями энергии (IID)) между звуковыми каналами является существенной частью параметрического представления стереофонического/многоканального звукового сигнала. Такую информацию и иные пространственные параметры передают из устройства кодирования в устройство декодирования для каждого временного/частотного интервала. Следовательно, с точки зрения эффективности кодирования большой интерес вызывает представление этих параметров в настолько более сжатом виде, насколько это возможно при сохранении качества звука.

При кодировании способом BCC разности уровней представлены относительно так называемого "опорного канала" и их квантование осуществляют на равномерной шкале, выраженной в единицах децибел (дБ), относительно опорного канала. Это не обеспечивает оптимальное использование того факта, что каналы с низким уровнем сигнала относительно опорного канала подвергаются существенному эффекту маскирования при их прослушивании людьми-слушателями. В предельном случае наличия канала, вообще не имеющего никакого сигнала, ширина полосы частот, используемая параметрами, описывающими этот конкретный канал, расходуется совершенно бесполезно. В более общем случае, когда один канал является намного более слабым, чем другой канал, то есть, когда во время воспроизведения слушатель может почти не слышать слабый канал, менее точное воспроизведение слабого канала также привело бы к тому же самому качеству восприятия слушателем, поскольку слабый сигнал является, в основном, замаскированным более сильным сигналом.

Для объяснения ситуации и проблем, возникающих при кодировании многоканального сигнала, приведена ссылка на Фиг. 10А, на которой проиллюстрирован обычно используемый 5-канальный сигнал. 5-Канальная конфигурация содержит левый тыловой канал 101 (A, имеющий сигнал a(t)), левый передний канал 102 (B, имеющий сигнал b(t)), центральный канал 103 (C, имеющий сигнал c(t)), правый передний канал 104 (D, имеющий сигнал d(t)) и правый тыловой канал 105 (E, имеющий сигнал e(t)). Соотношения интенсивности между одиночными каналами или парами каналов отмечены стрелками. Следовательно, распределение интенсивности левым передним каналом 102 и правым передним каналом 104 обозначено как r1 (110), распределение интенсивности между левым тыловым каналом и правым тыловым каналом обозначено как r4 (112). Распределение интенсивности между комбинацией каналов, состоящей из левого переднего канала 102, правого переднего канала 104 и центрального канала 103, обозначено как r2 (114), а распределение интенсивности между комбинацией тыловых каналов и комбинацией передних каналов обозначено как r3 (116). Когда, например, записан простой монолог, то большая часть энергии содержится в центральном канале 103. В этом примере в особенности тыловые каналы содержат всего лишь незначительную (или нулевую (0)) энергию. Следовательно, в этом примере имеет место просто непроизводительное расходование параметров, описывающих свойства тыловых каналов, поскольку во время воспроизведения активными будут в основном центральный канал 102 или передние каналы.

В следующем абзаце приведено описание способов вычисления распределения энергии между каналами или комбинациями каналов на основании Фиг. 10А.

На Фиг. 10А проиллюстрирована многоканальная параметризация для пятиканальной акустической системы, в которой различные звуковые каналы обозначены номерами позиций со 101 по 105; a(t) 101 представляет собой сигнал левого канала объемного звучания, b(t) 102 представляет собой сигнал левого переднего канала, c(t) 103 представляет собой сигнал центрального канала, d(t) 104 представляет собой сигнал правого переднего канала, e(t) 105 представляет собой сигнал правого канала объемного звучания. Акустическая система разделена на переднюю часть и тыловую часть. Распределение энергии между всеми передними каналами (102, 103 и 104) акустической системы и тыловыми каналами (101 и 105) проиллюстрировано на Фиг. 10А стрелками и обозначено параметром r3. Распределение энергии между центральным каналом 103, левым передним каналом 102 и правым передним каналом 103 обозначено как r2. Распределение энергии между левым каналом 101 объемного звучания и правым каналом 105 объемного звучания проиллюстрировано как r4. Наконец, распределение энергии между левым передним каналом 102 и правым передним каналом 104 задано параметром r1. Поскольку параметры r1-r4 представляют собой параметризации различных областей, то также понятно, что помимо распределения энергии также могут быть параметризованы и другие существенные свойства зоны, например корреляция между зонами. Кроме того, для каждого параметра r1-r4 может быть вычислена локальная энергия. Например, локальная энергия r4 равна суммарной энергии канала A 101 и канала E 105.

где E[.] - ожидаемое значение, определяемое следующим выражением:

.

На Фиг. 10Б показано устройство декодирования многоканального звука, построенное путем иерархического упорядочения модулей параметрического стерео, например, так, как описано в публикации международной заявки WO 2004/008805 A1. Звуковые каналы 101-105, представленные на Фиг. 10А, здесь воспроизводят поэтапно из одиночного монофонического смикшированного сигнала 120 (M) и соответствующей дополнительной информации посредством первого устройства 122 двухканального декодирования, второго устройства 124 двухканального декодирования, третьего устройства 126 двухканального декодирования и четвертого устройства 128 двухканального декодирования. Как видно из чертежа, в древовидной структуре, показанной на Фиг. 10Б, первое устройство двухканального декодирования разлагает монофонический смикшированный сигнал 120 на два сигнала, которые подают во второе и в третье устройства 124 и 126 двухканального декодирования. При этом канал, подаваемый в третье устройство 126 двухканального декодирования, представляет собой объединенный канал, который получен путем объединения левого тылового канала 101 и правого тылового канала 105. Канал, подаваемый во второе устройство 124 двухканального декодирования, представляет собой объединение центрального канала 103 и объединенного канала, который снова представляет собой объединение левого переднего канала 102 и правого переднего канала 104.

Таким образом, после второго этапа иерархического декодирования оказываются восстановленными следующие каналы: левый тыловой канал 101, правый тыловой канал 105, центральный канал 103 и объединенный канал, являющийся объединением левого переднего канала 102 и переднего правого канала 104, с использованием переданных пространственных параметров, содержащих параметр уровня для его использования каждым из устройств 122, 124 и 126 двухканального декодирования.

На третьем этапе иерархического декодирования четвертое устройство 128 двухканального декодирования получает левый передний канал 102 и правый передний канал 104 с использованием информации об уровне, переданной в качестве дополнительной информации для четвертого устройства 128 двухканального декодирования. При использовании устройства иерархического декодирования из известного уровня техники, которое показано на Фиг. 10Б, желательная энергия для каждого одиночного выходного канала является следствием наличия многих различных модулей параметрического стерео между входным сигналом и каждым из выходных сигналов. Другими словами, энергия конкретного выходного канала может зависеть от параметров IID/ICLD множества модулей параметрического стерео. В такой древовидной структуре из соединенных друг с другом модулей параметрического стерео также может быть применено неравномерное квантование параметров IID в каждом модуле параметрического стерео для создания значений IID, которые затем используются устройством декодирования в качестве части дополнительной информации. Это обеспечило бы использование преимуществ неоднородного квантования IID в локальном масштабе (то есть отдельно в каждом модуле параметрического стерео), но, тем не менее, субоптимально, поскольку квантование в каждом модуле (в "листах" древовидной структуры) выполняют независимо от энергий/уровня других звуковых каналов, которые могут иметь высокий относительный уровень и, следовательно, создавать маскирование.

Это возможно потому, что модули, являющиеся "листьями" древовидной структуры, не имеют сведений о глобальном распределении уровней на более высоком уровне древовидной структуры (например, в "корневом" модуле). Каждый лист древовидной структуры имеет свой собственный соответствующий параметр IID/ICLD, который указывает распределение энергии от его входа до выходных каналов. Например, параметр IID/ICLD листа "r3" древовидной структуры (обработку которого производит первое устройство 122 двухканального декодирования) может указывать, что 90% поступающей энергии должно быть передано в лист r2 древовидной структуры, а остальная энергия (10%) должна быть передана в лист r4 древовидной структуры. Этот процесс повторяют для каждого листа в древовидной структуре. Так как каждый параметр распределения энергии представлен с ограниченной точностью, то отклонение между желательной и фактической энергией для каждого выходного канала от А до E зависит от погрешностей квантования в параметрах IID/ICLD, а также от распределения энергии (и, следовательно, от распространения погрешностей квантования). Другими словами, поскольку для параметра определенного типа, например для ICC (корреляция/когерентность между каналами) или IID, ту же самую таблицу квантования используют на всех стадиях параметризации с r1 по r4, то квантование IID/ICLD выполнено оптимальным образом только лишь на локальном уровне. Это означает, что в реализациях из предшествующего уровня техники для каждой стадии параметризации с r1 по r4 погрешность выходной энергии для (локальных) выходных каналов является максимальной для самого слабого выходного канала.

Как подробно изложено в предыдущих абзацах, квантование параметров уровня (IID или ICLD) или иных параметров, например ICC, разностей по фазе или разностей по времени, описывающих пространственное восприятие многоканального звукового сигнала, по-прежнему является субоптимальным, так как ширина полосы частот может непроизводительно расходоваться для пространственных параметров, описывающих те каналы, которые в основном являются замаскированными вследствие низкой энергии в канале.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Задачей настоящего изобретения является создание усовершенствованной концепции для квантования пространственных параметров многоканального звукового сигнала.

Согласно первому объекту настоящего изобретения эта задача достигнута посредством устройства квантования параметра, предназначенного для квантования входного параметра, причем входной параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, которое содержит: генератор правила квантования, предназначенный для генерации правила квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и устройство квантования значения, предназначенное для получения квантованного параметра из входного параметра с использованием сгенерированного правила квантования.

Согласно второму объекту настоящего изобретения эта задача достигнута посредством устройства обращения квантования параметра, предназначенного для обращения квантования квантованного параметра для получения параметра, при этом параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, которое содержит: генератор правила обращения квантования, предназначенный для генерации правила обращения квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и устройство обращения квантования значения, предназначенное для получения параметра из квантованного параметра с использованием сгенерированного правила обращения квантования.

Согласно третьему объекту настоящего изобретения эта задача достигнута посредством способа квантования входного параметра, при этом входной параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, а способ содержит следующие операции: осуществляют генерацию правила квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и получают квантованный параметр из входного параметра с использованием сгенерированного правила квантования.

Согласно четвертому объекту настоящего изобретения эта задача достигнута посредством способа обращения квантования квантованного параметра для получения параметра, при этом параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, а способ содержит следующие операции: осуществляют генерацию правила обращения квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и получают параметр из квантованного параметра с использованием сгенерированного правила обращения квантования.

Согласно пятому объекту настоящего изобретения эта задача достигнута посредством представления многоканального сигнала, имеющего квантованный параметр, представляющий собой квантованное представление параметра, являющегося мерой, характеризующей одиночный канал или пару каналов, при этом параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, а квантованный параметр получен с использованием правила квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала.

Согласно шестому объекту настоящего изобретения эта задача достигнута посредством считываемого компьютером носителя информации, содержащего запомненное на нем вышеописанное представление многоканального сигнала.

Согласно седьмому объекту настоящего изобретения эта задача достигнута посредством передатчика или устройства записи звука, снабженного устройством квантования параметра, предназначенным для квантования входного параметра, при этом входной параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, которое содержит: генератор правила квантования, предназначенный для генерации правила квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и устройство квантования значения, предназначенное для получения квантованного параметра из входного параметра с использованием сгенерированного правила квантования.

Согласно восьмому объекту настоящего изобретения эта задача достигнута посредством приемника или проигрывателя звукозаписей, снабженного устройством обращения квантования параметра, предназначенным для обращения квантования квантованного параметра для получения параметра, при этом параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, который содержит: генератор правила обращения квантования, предназначенный для генерации правила обращения квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и устройство обращения квантования значения, предназначенное для получения параметра из квантованного параметра с использованием сгенерированного правила обращения квантования.

Согласно девятому объекту настоящего изобретения эта задача достигнута посредством способа передачи или записи звука, причем этот способ содержит способ квантования входного параметра, при этом входной параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, и этот способ содержит следующие операции: осуществляют генерацию правила квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и получают квантованный параметр из входного параметра с использованием сгенерированного правила квантования.

Согласно десятому объекту настоящего изобретения эта задача достигнута посредством способа приема или воспроизведения звука, причем этот способ содержит способ обращения квантования квантованного параметра для получения параметра, при этом параметр представляет собой меру, характеризующую одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, а способ содержит следующие операции: осуществляют генерацию правила обращения квантования на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала; и получают параметр из квантованного параметра с использованием сгенерированного правила обращения квантования.

Согласно одиннадцатому объекту настоящего изобретения эта задача достигнута посредством системы передачи, содержащей передатчик и приемник, причем передатчик снабжен устройством квантования параметра, предназначенным для квантования входного параметра; а приемник снабжен устройством обращения квантования параметра, предназначенным для обращения квантования квантованного параметра.

Согласно двенадцатому объекту настоящего изобретения эта задача достигнута посредством способа передачи и приема, причем этот способ содержит способ передачи, включающий в себя способ квантования входного параметра; и содержит способ приема, включающий в себя способ обращения квантования квантованного параметра.

Согласно тринадцатому объекту настоящего изобретения эта задача достигнута посредством компьютерной программы, предназначенной для выполнения одного из вышеупомянутых способов при ее исполнении в компьютере.

Настоящее изобретение основано на том установленном факте, что квантование параметров, являющихся мерой, характеризующей одиночный канал или пару каналов относительно другого одиночного канала или пары каналов многоканального сигнала, может быть произведено более эффективно с использованием правила квантования, генерация которого осуществлена на основании соотношения меры величины энергии канала или пары каналов и меры величины энергии многоканального сигнала.

Основное преимущество идеи изобретения состоит в том, что генерацию правила квантования или выбор надлежащего правила квантования из группы имеющихся правил квантования осуществляют в зависимости от энергии сигнала, подлежащего описанию. Следовательно, для устройства квантования при кодировании или для устройства обращения квантования при декодировании может быть применена психоакустическая модель для того, чтобы использовать правило квантования, приспособленное к потребностям реального сигнала. В особенности в тех случаях, когда канал содержит очень малую величину энергии по сравнению с другими каналами в многоканальном сигнале, квантование может быть намного более грубым, чем для сигналов, имеющих высокие значения энергии. Это обусловлено тем, что при воспроизведении сигналы с высокой энергией маскируют сигналы с низкой энергией, то есть слушатель почти не распознает какие-либо детали сигнала с низкой энергией, и, таким образом, сигнал с низкой энергией может быть еще более ухудшен за счет грубого квантования, при этом слушатель не способен распознать искажение вследствие высокой степени маскирования сигнала с низкой энергией.

В одном из вариантов осуществления настоящего изобретения устройство квантования параметра, предназначенное для квантования параметров, содержит генератор правила квантования, предназначенный для генерации правила квантования, и устройство квантования значения, предназначенное для получения квантованных параметров из входных параметров с использованием сгенерированного правила квантования. Для генерации надлежащего правила квантования устройство выбора, имеющееся в устройстве квантования, принимает в качестве входных данных полную энергию многоканального звукового сигнала, подлежащего кодированию, и локальную энергию канала или пары каналов, пространственные параметры которых подлежат квантованию. Зная полную энергию и локальную энергию, устройство выбора, имеющееся в устройстве квантования, может принять решение о том, какое правило квантования следует использовать, то есть выбрать правила более грубого квантования для каналов или пар каналов, имеющих сравнительно низкую локальную энергию. В качестве альтернативы, устройство выбора, имеющееся в устройстве квантования, также может получать алгоритмическое правило для видоизменения существующего правила квантования или вычислять совершенно новое правило квантования в зависимости от локальной и полной энергии. Например, одним из возможных вариантов является вычисление общего масштабного коэффициента, применяемого к сигналу до устройства линейного квантования или устройства нелинейного квантования для достижения целевой задачи, заключающейся в уменьшении объема дополнительной информации, подлежащей передаче.

В еще одном варианте осуществления настоящего изобретения многоканальный сигнал закодирован попарным способом, то есть с использованием иерархической структуры, имеющей несколько устройств микширования, сводящих 2 канала в один, которые упорядочены в виде древовидной структуры, при этом каждое устройство микширования осуществляет генерацию монофонического канала из двух каналов, подаваемых на вход устройства микширования. Согласно идее изобретения зависящее от энергии квантование может быть теперь реализовано не только в локальном масштабе, то есть в каждом устройстве микширования, сводящем 2 канала в один, который имеет только ту информацию, которая является доступной на входе устройства микширования, сводящего 2 канала в один, но и на основании сведений о сумме энергий сигнала в глобальном масштабе. Это значительно улучшает качество восприятия воспринимаемого сигнала.

Очевидно, что согласно идее изобретения объем дополнительной информации может быть уменьшен почти без воздействия на качество закодированного многоканального звукового сигнала.

В еще одном варианте осуществления настоящего изобретения устройство квантования параметра, предложенное в изобретении, включено в состав устройства кодирования параметра перед устройством дифференциального кодирования и устройством кодирования по алгоритму Хаффмана, оба из которых используют для дополнительного кодирования квантованных параметров для получения потока битов, описывающих параметр. Такое устройство кодирования, предложенное в настоящем изобретении, имеет большое преимущество, заключающееся в том, что в дополнение к уменьшению размера кодовых слов, необходимых для описания квантованных параметров, более грубое квантование автоматически увеличивает относительное количество идентичных кодовых слов, подаваемых в устройство дифференциального кодирования и в устройство кодирования Хаффмана, что обеспечивает возможность лучшего сжатия квантованных параметров, еще более уменьшая объем дополнительной информации.

В еще одном варианте осуществления настоящего изобретения устройство квантования параметра, предложенное в изобретении, содержит генератор коэффициентной функции для устройства квантования и умножитель параметра. Генератор коэффициентной функции для устройства квантования получает в качестве входных данных сведения о полной энергии и о локальной энергии и вычисляет, исходя из поданных на вход величин, одно значение для устройства масштабирования. На вход умножителя параметра поступают параметры и вычисленный коэффициент f для устройства квантования, предназначенный для деления параметров на этот коэффициент для устройства квантования перед передачей измененных параметров в устройство квантования, которое применяет к измененным параметрам установленное правило квантования.

В видоизмененном варианте этого варианта осуществления изобретения умножитель параметра расположен после устройства квантования и, следовательно, вычисленный коэффициент f для устройства квантования используют для деления результирующего индекса, полученного на выходе устройства квантования. Результат этой операции затем вновь должен быть округлен до целочисленного индекса.

Применение масштабного коэффициента для параметров имеет тот же самый эффект, как и выбор различных правил квантования, так как, например, деление на большой коэффициент сжимает пространство входного параметра таким образом, что действующей фактически является только лишь меньшая часть уже существующего правила квантования. Это решение имеет преимущество, заключающееся в том, что на стороне устройства декодирования и устройства кодирования может быть сэкономлен дополнительный объем памяти, поскольку необходимо производить запоминание или обработку только одного правила квантования, так как вычисление выполняют просто путем умножения, требующего всего лишь ограниченного дополнительного аппаратного или программного обеспечения. Дополнительное преимущество состоит в том, что при применении коэффициента для устройства квантования этот коэффициент для устройства квантования может быть получен с использованием любой возможной функциональной зависимости. Следовательно, вместо выбора заранее заданных правил квантования из заданного шаблона может производиться непрерывная регулировка чувствительности устройства квантования или устройства обращения квантования в пределах всего возможного пространства входного параметра.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Ниже приведено описание предпочтительных вариантов осуществления настоящего изобретения со ссылкой на сопроводительные чертежи, на которых изображено следующее:

на Фиг. 1 показана блок-схема устройства квантования параметра, которое предложено в настоящем изобретении;

на Фиг. 2A - Фиг. 2В показано несколько возможных правил квантования, подлежащих применению;

на Фиг. 3 показано устройство кодирования параметра, содержащее устройство квантования параметра, которое предложено в настоящем изобретении;

на Фиг. 4А и Фиг.4Б показан альтернативный вариант осуществления устройства кодирования параметра, содержащего устройство квантования параметра, которое предложено в настоящем изобретении;

на Фиг. 5 показаны примеры функций масштабного коэффициента;

на Фиг. 6 показано правило нелинейного квантования;

на Фиг. 7 показано устройство обращения квантования параметра, которое предложено в настоящем изобретении;

на Фиг. 8 показано устройство распаковки параметра, содержащее устройство обращения квантования параметра, которое предложено в настоящем изобретении;

на Фиг. 9А показан вариант осуществления устройства обращения квантования параметра, которое предложено в настоящем изобретении;

на Фиг. 9Б показан еще один вариант осуществления устройства обращения квантования параметра, которое предложено в настоящем изобретении;

на Фиг. 9В показан пример реализации обращения квантования в зависимости от энергии;

на Фиг. 9Г показан еще один пример реализации обращения квантования в зависимости от энергии;

на Фиг. 9Д показаны примеры квантования параметров и обращения квантования параметров;

на Фиг. 10А показано представление многоканального звукового сигнала с пятью каналами; и

на Фиг. 10Б показано устройство иерархического многоканального параметрического декодирования из известного уровня техники.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

На Фиг. 1 показано предложенное в изобретении устройство 199 квантования параметра, содержащее устройство 200 квантования и устройство 202 выбора для устройства квантования. Устройство 202 выбора для устройства квантования получает сведения о локальной энергии канала или пары каналов, лежащие в основе параметров, подлежащих кодированию, и сведения о полной энергии многоканального звукового сигнала. На основании информации об обеих энергиях устройство 202 выбора для устройства квантования осуществляет генерацию правила квантования, используемого устройством 200 квантования для получения квантованного параметра 204 из параметра 206, введенного в устройство 200 квантования. Следовательно, в этом случае устройство 202 выбора для устройства квантования служит в качестве генератора правила квантования.

Входными параметрами, подаваемыми в устройство 202 выбора для устройства квантования, являются полная энергия исходного многоканального сигнала и локальная энергия для канала, описанного параметром, подлежащим квантованию. В предпочтительном варианте осуществления настоящего изобретения соотношение между локальной энергией и полной энергией дает тот критерий, который может быть использован для принятия решения о том, какое именно устройство квантования следует использовать. В качестве примера, это соотношение, обозначенное как q (относительная локальная энергия), может быть вычислено в децибелах (дБ) с использованием приведенного ниже уравнения:

Выбранное устройство квантования затем используют для квантования параметра 206 посредством устройства квантования.

Идея настоящего изобретения состоит в том, что может быть использовано более грубое квантование параметров IID/ICLD (и т.п.) в том случае, если энергия на стадии параметризации является более низкой по сравнению с полной энергией, то есть когда относительная локальная энергия q является малой. В настоящем изобретении использовано психоакустическое соотношение, которое является более важным для параметризации доминирующих сигналов/сигналов с высокой энергией, выполняемой с высокой точностью, чем звукового сигнала, имеющего меньшую значимость/более низкую энергию. Чтобы это стало еще более понятным, снова приведена ссылка на чертеж Фиг. 10А. Когда в звуковой сцене в исходном многоканальном сигнале энергия/сигнал в основном присутствует в переднем изображении, что означает его наличие в левом переднем канале 102, в центральном канале 103 и в правом переднем канале 104, то квантование каналов объемного звучания может быть осуществлено с меньшей точностью, так как каналы объемного звучания имеют намного меньшую энергию. Дополнительная погрешность квантования, вносимая вследствие более грубого квантования, не может восприниматься, так как передние каналы имеют намного более высокую энергию, и, следовательно, погрешность r4 квантования (и результирующие погрешности определения энергии для каналов A и E объемного звучания) является замаскированной каналами B, D и/или C.

В примере, описывающем самый предельный случай, каналы A и E объемного звучания имеют только лишь некоторый слабый шум, а передние каналы B, C и D имеют сигналы с полной амплитудой. В этом случае исходный сигнал с 16-битной импульсно-кодовой модуляцией (ИКМ) указывал бы, что разность значений энергии превышает 80 дБ. Следовательно, может быть произведено сколь угодно грубое квантование параметра r4 без внесения каких-либо слышимых различий вследствие (грубого) квантования.

На Фиг. 2A - Фиг. 2В показаны три возможных правила квантования, которые вносят погрешности квантования различного уровня. На всех чертежах по оси X показан исходный параметр, а по оси Y показаны целочисленные значения, присвоенные параметрам. Кроме того, на Фиг. 2A - Фиг. 2В показаны пунктирные линии, которые соответствуют индексам для каждого этапа квантования, и, следовательно, могут быть использованы для передачи или запоминания. Переданные индексы могут быть затем использованы на стороне устройства декодирования, например, совместно со справочной таблицей, для обращения квантования.

Наиболее точное квантование показано на Фиг. 2A кривой 230 квантования, которая отображает преобразование дискретных интервалов значений параметра по оси X в 13 целочисленных значений. Квантование с промежуточной точностью реализовано посредством кривой 232 квантования, показанной на Фиг. 2Б, а самое грубое квантование реализовано посредством кривой 234 квантования, показанной на Фиг. 2В. Очевидно, что внесенная погрешность квантования является наибольшей в примере, показанном на Фиг. 2В, и наименьшей в примере, показанном на Фиг. 2A.

Эти три правила квантования представляют собой примеры правил квантования, которые могут быть выбраны устройством 202 выбора для устройства квантования. Другими словами, на Фиг. 2A - Фиг. 2В проиллюстрированы три различных правила линейного квантования, где ось X описывает входное значение, а ось Y дает соответствующее квантованное значение. Все чертежи Фиг. 2A - Фиг. 2В имеют одинаковый масштаб по оси X и по оси Y, и, следовательно, квантование, показанное на Фиг. 2A, является самым точным из трех и, следовательно, имеет наименьшую погрешность квантования. Квантование, показанное на Фиг. 2В, является самым грубым и, следовательно, имеет наибольшую погрешность квантования. Это также привело бы к наименьшей скорости передачи двоичной информации после дифференциального кодирования и кодирования по алгоритму Хаффмана вследствие наименьшего количества этапов квантования.

В качестве примера, генерация возможного правила квантования могла бы быть основана на относительной локальной энергии q, представляющей собой отношение между локальной энергией и полной энергией, понятие которой введено выше. Возможные интервалы значений q с соответствующими вариантами выбора правил квантования, которые служат в качестве примера, обобщены в приведенной ниже таблице.

Значение q [дБ] Выбранное устройство квантования
0 ≤ q < -10 Точное квантование, показанное на Фиг. 2A
-10 ≤ q < -20 Квантование средней точности, показанное на Фиг. 2Б
-20 ≤ q Грубое квантование, показанное на Фиг. 2В

На Фиг. 3 показано предложенное в настоящем изобретении устройство сжатия параметра, содержащее устройство 199 квантования параметра, которое предложено в настоящем изобретении, устройство 220 дифференциального кодирования и устройство 222 кодирования по алгоритму Хаффмана. Устройство кодирования параметра из Фиг. 3, которое предложено в настоящем изобретении, расширяет возможности устройства квантования параметра из Фиг. 1 за счет использования квантованных параметров в качестве входных данных для устройства 220 дифференциального кодирования, которое осуществляет дифференциальное кодирование квантованных параметров 204 для получения дифференциально закодированных квантованных параметров, которые затем подают на вход устройства 222 кодирования по алгоритму Хаффмана, которое применяет алгоритм кодирования Хаффмана к дифференциально закодированным квантованным параметрам, получая в качестве выходных данных элемент 224 потока битов, описывающий параметр, для окончательного потока битов, описывающих параметр.

Объединение устройства квантования параметра, которое предложено в настоящем изобретении, с устройством дифференциального кодирования и с устройством кодирования по алгоритму Хаффмана является особенно привлекательным потому, что более грубое квантование приводит к более высокому относительному количеству одинаковых символов (квантованных параметров). Объединение устройства 220 дифференциального кодирования и устройства 222 кодирования по алгоритму Хаффмана, очевидно, обеспечит такое закодированное представление квантованных параметров (элемента 224 потока битов, описывающего параметр), которое является более компактным тогда, когда максимальное количество возможных входных символов уменьшено за счет более грубого квантования.

На Фиг. 4А показан еще один вариант осуществления предложенного в настоящем изобретении устройства кодирования параметра, в котором использовано устройство 250 квантования параметра, предложенное в настоящем изобретении, устройство 252 дифференциального кодирования и устройство 254 кодирования по алгоритму Хаффмана.

Устройство 250 квантования параметра содержит генератор 256 коэффициента для устройства квантования, устройство 258 масштабирования параметра и устройство 260 квантования. В этом случае генератор 256 коэффициента для устройства квантования, устройство квантования вместе с устройством 258 масштабирования параметра служит в качестве генератора правила квантования.

В генератор 256 функции для устройства квантования в качестве входных данных поступают сведения о полной энергии многоканального звукового сигнала и о локальной энергии канала или пары каналов для параметра, подлежащего квантованию. Генератор 256 коэффициента для устройства квантования осуществляет генерацию масштабного коэффициента 262 (f) на основании локальной энергии и полной энергии. В предпочтительном варианте осуществления изобретения это выполняют на основании отношения локальной энергии к полной энергии, в результате чего получают относительную локальную энергию q, выраженную в следующем виде:

Этот коэффициент q может быть использован в генераторе 256 коэффициента для устройства квантования для вычисления коэффициента f (262) для устройства квантования, который используют в качестве входных данных для устройства 258 масштабирования параметра, в которое, кроме того, поступает параметр, подлежащий квантованию.

Устройство 258 масштабирования параметра применяет для входного параметра масштабирование, которым, например, может являться деление параметра на коэффициент 262 для устройства квантования. Масштабирование параметра эквивалентно выбору различных правил квантования. Масштабированный параметр затем вводят в устройство 260 квантования, которое в этом варианте осуществления настоящего изобретения применяет установленное правило квантования. Кроме того, обработка квантованного параметра эквивалентна процедуре обработки, показанной из Фиг. 3, при которой осуществляют дифференциальное кодирование параметра и последующее его кодирование по алгоритму Хаффмана, для получения, в конечном счете, элемента потока битов, описывающего параметр.

Применение масштабного коэффициента для параметров имеет преимущество, заключающееся в том, что может быть реализована непрерывная адаптация правила квантования к потребностям, так как аналитическая функция, посредством которой получают коэффициент 262 для квантования, может иметь, по существу, любой вид.

На Фиг. 4Б показан еще один вариант осуществления устройства 270 кодирования параметра, предложенного в настоящем изобретении, которое является аналогичным предложенному в настоящем изобретении устройству 250 кодирования параметра, которое показано на Фиг. 4А. Следовательно, в приведенном ниже абзаце будет приведено краткое объяснение только лишь его отличий от устройства 250 кодирования параметра.

Устройство 270 кодирования параметра, предложенное в настоящем изобретении, не содержит устройство масштабирования параметра (устройство 258 масштабирования параметра для устройства 250 кодирования параметра). Для реализации зависимости квантования от энергии устройство 270 кодирования параметра содержит вместо него устройство 272 сжатия. Это означает, что в этом случае генератор 256 коэффициента для устройства квантования вместе с устройством 258 сжатия служат в качестве генератора правила квантования. Устройство 272 сжатия соединено с устройством 260 квантования и с генератором 256 коэффициента для устройства квантования. В устройство 272 сжатия в качестве входных данных поступает квантованный параметр, квантование которого осуществлено устройством 260 квантования, соответственно, с использованием установленной схемы квантования. Для реализации зависимости от энергии устройство сжатия использует квантованный параметр в качестве входных данных и масштабирует квантованный параметр с использованием масштабного коэффициента 262. Это обеспечивает экономию скорости передачи информации в битах за счет уменьшения возможного количества квантованных параметров, предназначенных для передачи в устройство 252 дельта-кодирования. Это сжатие может быть достигнуто, например, путем деления индекса квантованного параметра на масштабный коэффициент 262.

Возможные функции для вычисления масштабного коэффициента 262 из коэффициента q относительной локальной энергии показаны на Фиг. 5. На Фиг. 5 в качестве примера показаны четыре различные возможные функции 300, 302, 303 и 304, которые могут быть использованы для получения масштабного коэффициента f. Первая коэффициентная функция 300 является постоянной функцией и, следовательно, не зависит от энергии.

Коэффициентные функции 302 и 304 демонстрируют две возможности реализации коэффициентных функций, где коэффициентная функция 302 является менее агрессивной и, следовательно, увеличивает внесенную погрешность квантования в меньшей степени, чем при использовании коэффициентной функции 304. С другой стороны, коэффициентная функция 302 в меньшей степени обеспечивает экономию скорости передачи информации в битах, чем коэффициентная функция 304. Коэффициентная функция 303 демонстрируют четвертую возможность получения коэффициента для устройства квантования из доли q энергии, тогда как коэффициентная функция 303 по своей форме подобна ступенчатой функции и, следовательно, присваивает интервалы доли q энергии тому же самому коэффициенту для устройства квантования.

На Фиг. 6 проиллюстрировано устройство неравномерного квантования, которое производит квантование входного сигнала, изображенного по оси x в децибелах (дБ), согласно функции 310, получая в результате выходной сигнал y, выраженный в децибелах (дБ), который изображен по оси y. Такая функция устройства неравномерного квантования может быть использована для квантования также и пространственных параметров. Особый интерес вызывает тот случай, когда в схеме кодирования способом BCC в качестве наиболее сильного канала в многоканальном сигнале выбран опорный канал. Устройство неравномерного квантования, показанное на Фиг. 6, иллюстрирует такую функцию 310 устройства квантования, которая удовлетворяла бы потребностям, поскольку при уменьшении уровня энергии по сравнению с опорным каналом увеличено количество этапов квантования. Это свойство является особенно привлекательным потому, что для каналов с меньшей энергией, чем для самых сильных каналов, погрешности квантования уровня энергии могут быть более значительными.

На Фиг. 7 показано предложенное в настоящем изобретении устройство 500 обращения квантования параметра, содержащее устройство 502 обращения квантования и устройство 504 выбора для устройства обращения квантования. Устройство выбора 504 для устройства обращения квантования получает сведения о полной энергии многоканального звукового сигнала и о локальной энергии канала или пар каналов вместе с квантованным параметром 505, обращение квантования которого следует выполнить. На основании полученной информации об энергии устройство 504 выбора для устройства обращения квантования получает правило обращения квантования, используемое устройством 502 обращения квантования для обращения квантования квантованного параметра 505. Следовательно, в этом случае устройство выбора 504 для устройства обращения квантования служит в качестве генератора правила обращения квантования.

Можно отметить, что устройство 504 выбора для устройства обращения квантования может функционировать различным образом. Первая возможность состоит в том, что устройство 504 выбора для устройства обращения квантования непосредственно создает правило квантования и передает созданное правило квантования в устройство 502 обращения квантования. Другая возможность состоит в том, что устройство 504 выбора для устройства обращения квантования принимает решение относительно правила обращения квантования, которое передают в устройство 502 обращения квантования, которое может использовать решение относительно правила обращения квантования для выбора надлежащего правила обращения квантования из нескольких правил квантования, которые, например, запомнены в устройстве 502 обращения квантования.

На Фиг. 8 показано предложенное в настоящем изобретении устройство декодирования параметра, содержащее устройство 500 обращения квантования параметра, устройство 510 дифференциального декодирования и устройство 512 декодирования по алгоритму Хаффмана.

Устройство 512 декодирования по алгоритму Хаффмана принимает элемент 513 потока битов, описывающий параметр, и в соответствии с этим устройство 504 выбора для устройства обращения квантования получает сведения о локальной энергии канала или пары каналов, описанных элементом 513 потока битов, характеризующим параметр, и о полной энергии многоканального звукового сигнала. Элемент 513 потока битов, описывающий параметр, создан предложенным в настоящем изобретении устройством кодирования параметра, показанным на Фиг. 3. Следовательно, перед подачей элемента 513 потока битов, описывающего параметр, в устройство 502 обращения квантования осуществляют его декодирование по алгоритму Хаффмана устройством 512 декодирования по алгоритму Хаффмана и его дифференциальное декодирование устройством 510 дифференциального декодирования. После декодирования, выполняемого устройством 512 декодирования по алгоритму Хаффмана и устройством 510 дифференциального декодирования, предложенное в настоящем изобретении устройство 500 обращения квантования параметра, которое было уже описано выше в описании предложенного в настоящем изобретении устройства обращения квантования параметра из Фиг. 7, выполняет обращение квантования.

Другими словами, на Фиг. 8 проиллюстрировано устройство декодирования, в котором использовано устройство обращения квантования 500 в зависимости от энергии, причем это устройство декодирования соответствует устройству кодирования, предложенному в настоящем изобретении. Выполняют декодирование элемента потока битов, описывающего параметр, по алгоритму Хаффмана и его дифференциальное декодирование в индексы. Выбор надлежащего устройства обращения квантования осуществляют в устройстве 504 выбора для устройства обращения квантования с использованием того же самого правила и той же самой функции, которые были использованы в устройстве кодирования, в котором полная энергия и локальная энергия использовались в качестве входных данных. Выбранное устройство обращения квантования затем используют для обращения квантования (с использованием устройства 502 обращения квантования) индексов с преобразованием в параметры с обращением квантования.

На Фиг. 9А показан еще один вариант осуществления предложенного в настоящем изобретении устройства декодирования параметра, содержащего предложенное в настоящем изобретении устройство 520 обращения квантования в зависимости от энергии, устройство 512 декодирования по алгоритму Хаффмана и устройство 510 дифференциального декодирования. Устройство 520 обращения квантования параметра содержит генератор 522 коэффициента для устройства обращения квантования, устройство 524 обращения квантования и устройство 526 масштабирования параметра. В этом случае генератор 522 коэффициента для устройства обращения квантования вместе с устройством 526 масштабирования параметра служат в качестве генератора правила обращения квантования.

После декодирования элемента 513 потока битов, описывающего параметр, устройством декодирования по алгоритму Хаффмана и устройством дифференциального декодирования осуществляют обращение квантования квантованного параметра посредством устройства 524 обращения квантования, при этом устройство 524 обращения квантования использует правило обращения квантования, совпадающее с тем правилом квантования, которое было использовано для генерации квантованного параметра. Генератор 522 коэффициента для устройства обращения квантования вычисляет масштабный коэффициент 528 (f), исходя из отношения локальной энергии к полной энергии многоканального звукового сигнала. Затем устройство 526 масштабирования параметра применяет масштабный коэффициент 528 к деквантованному параметру путем умножения деквантованного параметра на масштабный коэффициент.

После масштабирования посредством устройства 526 масштабирования параметра распакованные деквантованные параметры поступают на выход устройства декодирования параметра, которое предложено в настоящем изобретении.

На Фиг. 9Б показан еще один вариант осуществления предложенного в настоящем изобретении устройства 530 декодирования параметра, которое является аналогичным устройству 520 декодирования параметра, предложенному в настоящем изобретении. Следовательно, в приведенном ниже абзаце будут изложены только его отличия от устройства декодирования параметра 520.

Устройство 530 декодирования параметра, предложенное в настоящем изобретении, содержит устройство 532 распаковки, причем устройство 532 распаковки обеспечивает достижение того же самого функционального результата, что и устройство 526 масштабирования параметра в предложенном в настоящем изобретении устройстве 520 декодирования параметра. На вход устройства 532 распаковки поступают квантованные параметры и в качестве дополнительных входных данных поступает масштабный коэффициент 528, полученный из генератора 522 коэффициента. Это означает, что в этом случае генератор 522 коэффициента вместе с устройством 532 распаковки служат в качестве генератора правила обращения квантования. Для реализации функциональной возможности обращения квантования с весовыми коэффициентами, зависящими от энергии, осуществляют масштабирование квантованного параметра посредством устройства 532 распаковки перед вводом полученного таким способом масштабированного квантованного параметра в устройство 524 обращения квантования. Затем устройство 524 обращения квантования осуществляет обращение квантования масштабированного квантованного параметра для получения деквантованного параметра с использованием установленного правила обращения квантования. Эта распаковка может быть, например, реализована путем умножения квантованного индекса параметра на масштабный коэффициент 528.

Несмотря на то что масштабирование, осуществляемое устройством 258 масштабирования параметра и устройством 526 масштабирования параметра при кодировании и декодировании, описано таким образом, что представляет собой деление при кодировании и умножения при декодировании, для параметров при их кодирования или декодирования может быть применено масштабирование любого иного типа, которое оказывает тот же самый эффект, как и использование иного правила квантования.

Следует отметить, что поскольку в случае многоуровневой параметризации (иерархическое кодирование или декодирование), которая проиллюстрирована, например, на Фиг. 10Б, устройство декодирования может декодировать распределение энергии, начиная с корней древовидной структуры (смикшированного канала) до ее "листьев", то на каждом этапе параметризации с r1 по r4 (устройства 122, 124, 126 и 128 двухканального декодирования) имеется четко определенная локальная энергия, которая может быть использована в качестве локальной энергии со стороны устройства декодирования. Кроме того, если устройство кодирования также осуществляет квантование от корня древовидной структуры до ее "листьев", то в устройстве кодирования может быть использована в точности та же самая локальная энергия, что и локальная энергия, использованная в устройстве выбора для устройства квантования и в функции коэффициента для устройства квантования.

Другими словами, устройство декодирования, используя сведения о полной энергии и локальной энергии, может либо автономно принимать решение том, какое именно правило обращения квантования следует использовать, либо в альтернативном варианте, об этом может быть сообщено в устройство декодирования посредством некоторой дополнительной информации о том, какое именно правило обращения квантования является подходящим для обращения квантования параметров.

Несмотря на то, что применение масштабного коэффициента и выбор надлежащего правила обращения квантования были описаны в различных вариантах осуществления настоящего изобретения, они могут быть также объединены в рамках одного варианта осуществления устройства кодирования или устройства декодирования, предложенного в настоящем изобретении.

Для того чтобы дать более подробный пример, на чертежах Фиг. 9В и Фиг. 9Г показаны два возможных способа реализации обращения квантования в зависимости от энергии для восстановления многоканального сигнала из переданного монофонического сигнала М с использованием дополнительно переданных пространственных параметров (CLD, ICC). Перед обсуждением чертежей может быть отмечено следующее: древовидная структура, показанная на чертежах, важна только лишь для восстановления пространственных параметров, при этом фактическое обращение сведения каналов для генерации отдельных каналов многоканального сигнала обычно выполняют за один этап.

На Фиг. 9В показана ситуация, когда параметры CLD получены с предположением того, что параметр CLD0 описывает распределение энергии между каналами, которые объединены с использованием нескольких каналов исходного сигнала.

В первом иерархическом положении 1000 обращения микширования (up-mix) параметр CLD0 описывает соотношение энергии между двумя каналами, при этом первый канал представляет собой объединение 1002 левого переднего канала, правого переднего канала, центрального канала и канала усиления низких частот. Второй канал представляет собой объединение левого тылового канала и правого тылового канала. Другими словами, параметр CLD0 описывает распределение энергии между всеми тыловыми каналами и всеми передними каналами.

Следовательно, очевидно следующее: когда параметр CLD0 указывает, что тыловые каналы содержат только лишь небольшие величины энергии, то может быть выполнено более сильное квантование параметров, описывающих пространственные свойства между левым тыловым каналом и правым тыловым каналом, так как дополнительно внесенное искажение вследствие грубого квантования является почти неслышимым при одновременном воспроизведении всех каналов.

Предложенное в настоящем изобретении устройство обращения квантования параметра, показанное на Фиг. 9Б, для реализации обращения квантования, например, перед выполнением фактического обращения квантования вычисляет масштабный коэффициент 528 путем умножения параметра, обращение квантования которого следует выполнить, на индекс параметра. Следовательно, если передан параметр CLD0, то при использовании устройства декодирования из Фиг. 9Б, например, можно вычислить окончательно используемые параметры CLD других иерархических этапов согласно приведенной ниже формуле.

В приведенных ниже формулах член "DEQ" описывает применение таблицы обращения квантования установленного вида для параметра, над которым выполняют операцию DEQ. Это означает, что обращение квантования переданного параметра IDX CLD (0,L) может быть осуществлено непосредственно, что показано следующим выражением:

Так как параметр CLD описывает распределение энергии между двумя каналами, а каналами являются комбинации каналов, показанные на Фиг. 9В, то теперь может быть получена относительная локальная энергия FC согласно следующему уравнению:

Соответственно, относительная локальная энергия S тыловых каналов равна:

Принимая во внимание то, что описано выше, и идею изобретения, теперь может быть вычислен параметр CLD1 с учетом полной энергии, содержащейся в объединенном сигнале 1002:

В приведенной выше формуле член "facFunc" описывает функцию, дающую независимость вещественного значения от относительной локальной энергии FC. Другими словами, формула 4 описывает, что перед обращением квантования, переданный индекс параметра CLD IDX (1,l,m) умножен на масштабный коэффициент (facFunc) для получения промежуточного квантованного параметра. Так как промежуточный квантованный параметр не обязательно является целочисленным, то промежуточный квантованный параметр промежуточного звена должен быть округлен для получения параметра IdxCLDEdQ, для которого затем выполняют обращение его квантования с преобразованием в окончательный параметр, используемый в приведенной ниже операции:

Обращение квантования выполняют при помощи стандартной таблицы обращения квантования, такой как, например, следующая таблица:

Idx -15 -14 -13 -12 -11 -10 -9 -8 -7 -6 -5
CLD[idx] -150 -45 -40 -35 -30 -25 -22 -19 -16 -13 -10
Idx -4 -3 -2 -1 0 1 2 3 4 5 6
CLD[idx] -8 -6 -4 -2 0 2 4 6 8 10 13
Idx 7 8 9 10 11 12 13 14 15
CLD[idx] 16 19 22 25 30 35 40 45 150

Как можно увидеть из разложения каналов на втором иерархическом этапе 1004, полученный параметр CLD1 описывает соотношение энергии между каналом, являющимся объединением левого переднего канала и правого переднего канала, и каналом, являющимся объединением центрального канала и канала усиления низких частот. Таким образом, относительная локальная энергия F, описывающая энергию, содержащуюся в передних каналах, а именно в левом переднем канале и в правом переднем канале, может быть вычислена согласно следующей формуле:

Относительная локальная энергия S, описывающая энергию тыловых каналов, была получена ранее таким образом, что для иерархического блока 1006 может быть вычислен промежуточный квантованный параметр IDX CLD EDQ согласно следующим формулам:

Поскольку, как описано выше, теперь доступна относительная локальная энергия, описывающая энергию только передних каналов (F5151), то теперь может быть получен параметр CLD3, описывающий соотношение энергии между левым передним каналом и правым передним каналом, зависящим от энергии способом согласно следующим формулам:

В одном возможном варианте реализации теперь может быть получен параметр CLD4, описывающий соотношение энергии между центральным каналом и каналом усиления низких частот, без использования коэффициентной функции:

Конечно же, в альтернативных вариантах осуществления изобретения зависимость от энергии может быть реализована также и при вычислении параметра CLD4.

На Фиг. 9Г показан другой возможный вариант определения иерархической структуры для получения пространственных параметров.

По аналогии с описанием Фиг. 9В, отдельные параметры CLD могут быть получены согласно приведенным ниже формулам:

Можно отметить, что для реализации идеи изобретения могут быть использованы различные коэффициентные функции, например одна из функций, показанных на Фиг. 5.

Как уже упомянуто выше, в общем случае, идея изобретения состоит в применении квантования, зависящего от энергии, в том смысле, что квантование параметров (CLD) тех частей сигнала, которые содержат относительно низкую энергию по сравнению с другими частями сигнала, осуществляют более грубым способом. То есть коэффициентная функция должна быть такой, что для компонент с низкой энергией применяемый коэффициент является большим.

Для более подробной иллюстрации этого на Фиг. 9Д приведен один из примеров, в котором показаны манипуляции, выполняемые при кодировании и декодировании, дополнительно демонстрирующие концепцию настоящего изобретения. Кроме того, приведена ссылка на ранее представленную таблицу квантования для вычисления продемонстрированных примеров.

В таблице из Фиг. 9Г в левом столбце 1100 показаны манипуляции с индексом квантования, выполняемые на стороне устройства квантования, а в столбце 1102 показано восстановление переданного параметра на стороне устройства квантования. Передаваемый параметр приведен в столбце 1104. Показаны два примера для комбинации каналов, имеющих относительно низкую энергию. Это указано посредством общего масштабного коэффициента, равного 4,5, который является значительно большим, чем 1 (см. Фиг. 4). Согласно идее изобретения, после квантования на стороне устройства квантования индекс IDX квантования делят на масштабный коэффициент. После этого результат должен быть округлен до целочисленного значения для его дифференциального кодирования и кодирования по алгоритму Хаффмана (см. Фиг. 4А). Следовательно, оба индекса 10 и 9, которые приведены в качестве примера, приводят к передаче индекса IDXtransm, равного 2.

Устройство обращения квантования умножает переданный индекс на масштабный коэффициент для получения восстановленного индекса IDXrek, который используют для обращения квантования. Из первого примера индекса, равного 10 на стороне устройства квантования, можно увидеть, что вследствие округления индекса после деления на стороне устройства квантования возникает дополнительная погрешность, равная 1.

С другой стороны, когда в результате операции деления масштабного коэффициента на стороне устройства квантования случайно получено целочисленное значение индекса IDXtransm, предназначенного для передачи, то дополнительная погрешность не вносится.

Очевидно, что опасность внесения дополнительных погрешностей повышается при увеличении масштабного коэффициента f. Это означает, что вероятность добавления дополнительных погрешностей к сигналам с низкой энергией является весьма высокой. Когда сигналы, описываемые рассматриваемым параметром CLD, имеют сравнительно одинаковую энергию, то значение CLD будет близким к единице, и масштабный коэффициент так же будет близким к единице (см., например, Фиг. 5). Это означает, что когда каналы, для которых параметры закодированы способом, зависящим от энергии, имеют приблизительно одинаковую энергию, то при квантовании обычно не вносятся какие-либо дополнительные погрешности. Это, конечно, является наиболее подходящим вариантом, так как в том случае, когда каждый канал в многоканальном сигнале имеет приблизительно одинаковую энергию, каждый отдельный канал является слышимым при одновременном воспроизведении, и, следовательно, внесенная погрешность была бы ясно слышимой для слушателей.

Очевидно, что огромным преимуществом настоящего изобретения является допустимость погрешностей только для тех каналов, которые имеют сравнительно низкую энергию. С другой стороны, для этих каналов деление индексов связанных с ними параметров на несколько большие числа приближает значения индексов этих каналов в среднем к нулю. Это может быть великолепно использовано приведенной ниже процедурой дифференциального кодирования и кодирования по алгоритму Хаффмана для эффективного уменьшения скорости передачи информации в битах, которая затрачивается на передачу параметров многоканального сигнала.

Соотношение между локальной и полной энергией, на котором основано решение о том, какое именно правило квантования/обращения квантования следует использовать, описано в предыдущих абзацах таким образом, что является логарифмической мерой. Она, конечно же, не является единственной возможной мерой, которая может быть использована для реализации идеи изобретения. Для принятия решения может быть использована любая иная мера, описывающая разность энергии между локальной энергией или полной энергией, например простая разность.

Другим важным отличительным признаком настоящего изобретения является то, что в совокупности со схемой с двумя устройствами декодирования канала (параметрического стерео (PS)), распределяющей поступающую энергию на два выходных канала, управление которыми обычно осуществляют, например, посредством такого параметра, как CLD (подразумевая при этом, что входная энергия равна сумме энергий этих двух выходных каналов), что разность по энергии, то есть относительная локальная энергия между полной энергией и локальной энергией для каждого из устройств (122, 124, 126, и 128) двухканального декодирования, определяется параметрами CLD. Это означает, что отсутствует какая-либо необходимость реально измерять полную энергию и локальную энергию, так как разность по энергии, выраженная в децибелах (дБ), которую обычно используют для вычисления масштабного коэффициента, определена параметрами CLD.

В зависимости от определенных требований по реализации способов, предложенных в настоящем изобретении, предложенные в настоящем изобретении способы могут быть реализованы аппаратными средствами или в виде программного обеспечения. Реализация может быть выполнена с использованием носителя цифровой информации, в частности диска, универсального цифрового диска (DVD) или компакт-диска (CD), содержащего запомненные на нем управляющие сигналы, которые могут быть считаны с помощью электронных средств, взаимодействующих с программируемой компьютерной системой таким образом, что обеспечивают выполнение способов, предложенных в настоящем изобретении. Следовательно, в общем случае настоящее изобретение представляет собой компьютерный программный продукт с программным кодом, запомненным на машинно-считываемом носителе, при этом программный код функционирует таким образом, что реализует способы, предложенные в настоящем изобретении, при выполнении компьютерного программного продукта в компьютере. Другими словами, предложенные в настоящем изобретении способы представляют собой компьютерную программу, имеющую программный код для выполнения, по меньшей мере, одного из предложенных в настоящем изобретении способов при запуске компьютерной программы в компьютере.

Несмотря на то что изложенное выше было подробно продемонстрировано и описано со ссылкой на конкретные варианты его осуществления, для специалистов в данной области техники понятно, что могут быть произведены различные иные изменения формы и подробностей, не выходя за пределы сущности и объема настоящего изобретения. Следует понимать, что могут быть произведены различные изменения для адаптации к различным вариантам осуществления изобретения, не отступая от более широких концепций, которые здесь раскрыты и охвачены приведенной ниже формулой изобретения.

Источник поступления информации: Роспатент

Showing 1-10 of 336 items.
20.08.2013
№216.012.5f96

Способ сварки и конструктивный элемент

Изобретение может быть использовано при ремонте конструктивных элементов с заполнением сваркой углублений поврежденной области. Углубление (4) имеет контур (16), который ограничивает наружную поверхность (13) конструктивного элемента относительно углубления (4). Углубление (4) заполняют слоями...
Тип: Изобретение
Номер охранного документа: 0002490102
Дата охранного документа: 20.08.2013
10.09.2013
№216.012.6915

Силовой полупроводниковый модуль с боковыми стенками слоистой конструкции

Изобретение относится к силовому полупроводниковому модулю. Технический результат - предложение силового полупроводникового модуля, обладающего высокой взрывоустойчивостью и изготавливаемого с особенно оптимальными затратами. Достигается тем, что в силовом полупроводниковом модуле (1),...
Тип: Изобретение
Номер охранного документа: 0002492548
Дата охранного документа: 10.09.2013
20.09.2013
№216.012.6d3e

Устройство, способ и компьютерная программа для обеспечения набора пространственных указателей на основе сигнала микрофона и устройство для обеспечения двухканального аудиосигнала и набора пространственных указателей

Устройство для обеспечения набора пространственных указателей, связанных с аудиосигналом повышающего микширования, имеющим более двух каналов, на основе двухканального сигнала микрофона, содержит анализатор сигнала и генератор дополнительной пространственной информации. Анализатор сигнала...
Тип: Изобретение
Номер охранного документа: 0002493617
Дата охранного документа: 20.09.2013
20.11.2013
№216.012.827b

Способ получения прозрачного проводящего покрытия из оксида металла путем импульсного высокоионизирующего магнетронного распыления

Прозрачное проводящее покрытие из оксида металла наносят на подложку путем распыления, по меньшей мере, одного компонента покрытия из оксида металла импульсным магнетронным методом и конденсирования его на подложке. Пиковая плотность мощности импульсов магнетрона составляет свыше 1,5 кВт/см,...
Тип: Изобретение
Номер охранного документа: 0002499079
Дата охранного документа: 20.11.2013
20.08.2014
№216.012.eb94

Транспортное средство с отражателем звуковых волн

Группа изобретений относится к области транспортного машиностроения. Транспортное средство по первому варианту содержит потолок и один динамик. Потолок имеет первую часть, отражающую звуковые волны и имеющую первую характеристику отражения звуковых волн, и вторую часть, имеющую вторую...
Тип: Изобретение
Номер охранного документа: 0002526116
Дата охранного документа: 20.08.2014
10.09.2014
№216.012.f1d9

Устройство, способ и компьютерная программа для выработки широкополосного сигнала с использованием управляемого расширения ширины полосы и слепого расширения ширины полосы

Изобретение относится к средствам для выработки широкополосного сигнала с использованием входного сигнала низкой полосы. Технический результат заключается в расширении полосы при низкой скорости передачи битов и сохранении высокого качества сигнала. Процессор выполняет операции управляемого...
Тип: Изобретение
Номер охранного документа: 0002527735
Дата охранного документа: 10.09.2014
20.02.2015
№216.013.28a7

Аудио или видео кодер, аудио или видео и относящиеся к ним способы для обработки многоканальных аудио или видеосигналов с использованием переменного направления предсказания

Изобретение относится к средствам обработки многоканальных аудио или видеосигналов с использованием переменного направления предсказания. Технический результат заключается в повышении качества аудио или видео. Объединяют два аудио или видео канала для получения первого сигнала объединения в...
Тип: Изобретение
Номер охранного документа: 0002541864
Дата охранного документа: 20.02.2015
10.04.2015
№216.013.3ad7

Поставщик транспортного потока, поставщик сигнала dab, анализатор транспортного потока, приемник dab, способ, компьютерная программа и сигнал транспортного потока

Изобретение относится к поставщикам транспортного потока. Технический результат заключается в повышении безопасности передачи данных. Поставщик транспортного потока конфигурируется для предоставления пакета транспортного потока первого типа пакета, содержащего таблицу взаимосвязи программ и...
Тип: Изобретение
Номер охранного документа: 0002546551
Дата охранного документа: 10.04.2015
10.04.2015
№216.013.3b0a

Способ и кодер и декодер для воспроизведения без промежутка аудио сигнала

Заявленное изобретение относится к средствам для выдачи информации относительно достоверности закодированных аудиоданных. Технический результат заключается в обеспечении возможности обрезания недостоверных данных. Каждый блок закодированных аудиоданных может содержать информацию относительно...
Тип: Изобретение
Номер охранного документа: 0002546602
Дата охранного документа: 10.04.2015
10.04.2015
№216.013.3d89

Аудиокодек, поддерживающий режимы кодирования во временной области и в частотной области

Изобретение относится к средствам, поддерживающим режимы кодирования во временной области и в частотной области. Технический результат заключается в уменьшении задержки и повышении эффективности кодирования с точки зрения отношения скорость/искажения. Конфигурируют аудиокодер таким образом, что...
Тип: Изобретение
Номер охранного документа: 0002547241
Дата охранного документа: 10.04.2015
Showing 1-10 of 119 items.
10.01.2013
№216.012.1a9e

Устройство и способ для извлечения сигнала окружающей среды в устройстве и способ получения весовых коэффициентов для извлечения сигнала окружающей среды

Изобретение относится к устройствам и способам извлечения сигнала окружающей среды и получения весовых коэффициентов для извлечения сигнала окружающей среды. Техническим результатом является упрощение извлечения сигнала окружающей среды. Указанный результат достигается тем, что устройство для...
Тип: Изобретение
Номер охранного документа: 0002472306
Дата охранного документа: 10.01.2013
10.02.2013
№216.012.24a9

Аудиокодирование с использованием повышающего микширования

Изобретение относится к аудиокодерам, использующим повышающее микширование аудиосигналов. Техническим результатом является возможность разделения отдельных аудиообъектов при микшировании аудиосигналов с понижением количества каналов и с повышением количества каналов. Указанный результат...
Тип: Изобретение
Номер охранного документа: 0002474887
Дата охранного документа: 10.02.2013
27.05.2013
№216.012.457c

Низкоскоростная аудиокодирующая/декодирующая схема с общей предварительной обработкой

Изобретение относится к области звукового кодирования и, в частности, к низкоскоростным схемам кодирования аудио сигнала. Устройство звукового кодирования, имеющее стадию общей предварительной обработки (100), приемник информации на основе ветви кодирования (400), которая является ветвью...
Тип: Изобретение
Номер охранного документа: 0002483365
Дата охранного документа: 27.05.2013
20.06.2013
№216.012.4e37

Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования

Изобретение относится к декодированию множественных объектов путем преобразования закодированного многообъектного сигнала на базе доступного многоканального понижающего микширования и вспомогательных управляющих данных. Техническим результатом является обеспечение осуществления повышающего...
Тип: Изобретение
Номер охранного документа: 0002485605
Дата охранного документа: 20.06.2013
27.08.2013
№216.012.660e

Улучшение звукового сигнала fm-стереофонического радиоприемника путем использования параметрического стереофонического кодирования

Изобретение относится к устройству для улучшения стереофонического звукового сигнала FM-стереофонического радиоприемника. Устройство включает этап оценки параметров параметрического стереофонического кодирования (PS). Этап оценки параметров сконфигурирован для определения одного или нескольких...
Тип: Изобретение
Номер охранного документа: 0002491763
Дата охранного документа: 27.08.2013
20.02.2014
№216.012.a3a6

Способ и дискриминатор для классификации различных сегментов сигнала

Способ и дискриминатор для классификации различных сегментов сигнала, предназначенный для того, чтобы классифицировать различные сегменты сигнала, включающий сегменты, по крайней мере, первого и второго типов, например музыкальные и речевые сегменты, сигнал краткосрочной классификации (150) на...
Тип: Изобретение
Номер охранного документа: 0002507609
Дата охранного документа: 20.02.2014
10.04.2014
№216.012.b52b

Шумовой фон, устройство обработки шумового фона, метод обеспечения параметров шумового фона, метод обеспечения спектрального представления шумового фона аудиосигнала, компьютерная программа и кодированный аудиосигнал

Шумозаполнитель для создания шумозаполненного спектрального представления звукового сигнала на основе входного спектрального представления звукового сигнала состоит из идентификатора спектральной области, созданного для идентификации спектральных областей входного спектрального представления,...
Тип: Изобретение
Номер охранного документа: 0002512103
Дата охранного документа: 10.04.2014
10.04.2014
№216.012.b540

Бинауральная визуализация мультиканального звукового сигнала

Описывается бинауральная визуализация многоканального звукового сигнала в бинауральный выходной сигнал (24). Многоканальный звуковой сигнал включает сигнал стерео понижающего микширования (18), в который множество звуковых сигналов микшируется с понижением; и дополнительная информация включает...
Тип: Изобретение
Номер охранного документа: 0002512124
Дата охранного документа: 10.04.2014
10.06.2014
№216.012.d032

Устройство аудио кодирования, устройство аудио декодирования, методы кодирования и декодирования аудио-сигнала, аудио поток и компьютерная программа

Изобретение относится к средствам кодирования и декодирования аудио потока на основе преобразования входного звукового сигнала. Технический результат заключается в уменьшении объема закодированных данных. Получают аудио поток, содержащий информацию, описывающую диапазон частот аудио контента, и...
Тип: Изобретение
Номер охранного документа: 0002519069
Дата охранного документа: 10.06.2014
10.06.2014
№216.012.d114

Транскодировщик аудио формата

Изобретение относится к транскодировщику аудиоформата (100) для транскодирования входного аудиосигнала. Технический результат заключается в эффективном объединении возможностей направленного и пространственного аудиокодирования. Входной звуковой сигнал имеет не менее двух направленных...
Тип: Изобретение
Номер охранного документа: 0002519295
Дата охранного документа: 10.06.2014
+ добавить свой РИД