29.06.2019
219.017.9ea0

АУДИОКОДИРОВАНИЕ

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть

Правообладатели

БРЕБАРТ Дирк Й. (NL)

№ охранного документа
0002363116
Дата охранного документа
27.07.2009
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится к кодированию многоканального аудиосигнала, в частности к кодированию многоканального сигнала, содержащего первый, второй и третий компоненты сигнала. Способ кодирования многоканального аудиосигнала, включающего в себя, по меньшей мере, первый компонент (LF) сигнала, второй компонент (LR) сигнала и третий компонент (RF) сигнала, заключается в том, что кодируют первый и второй компоненты сигнала посредством первого параметрического кодера (202) для получения первого кодированного сигнала (L) и первого набора (Р2) параметров кодирования, кодируют первый кодированный сигнал и дополнительный сигнал (R) посредством второго параметрического кодера для получения второго кодированного сигнала (Т) и второго набора (Р1) параметров кодирования, при этом дополнительный сигнал получают из, по меньшей мере, третьего компонента сигнала и представляют многоканальный аудиосигнал в виде, по меньшей мере, результирующего кодированного сигнала (Т), полученного из, по меньшей мере, второго кодированного сигнала, первого набора параметров кодирования и второго набора параметров кодирования. Технический результат - повышение эффективности кодирования. 7 н. и 6 з.п. ф-лы, 11 ил.
Реферат Свернуть Развернуть

Настоящее изобретение относится к кодированию многоканального аудиосигнала, в частности к кодированию многоканального аудиосигнала, содержащего, по меньшей мере, первый компонент сигнала, второй компонент сигнала и третий компонент сигнала.

В последнее время возрос интерес к параметрическим описаниям аудиосигналов, особенно в области аудиокодирования. Было обнаружено, что передача (квантованных) параметров, которые описывают аудиосигналы, не требует большой пропускной способности и что эти параметры позволяют осуществлять декодирование на приемном конце для получения аудиосигнала, который по восприятию незначительно отличается от исходного сигнала.

В европейской заявке ЕР 1107232 описана схема параметрического кодирования для стереосигнала, содержащего сигналы левого (L) и правого (R) каналов. Данная схема кодирования формирует представление стереосигнала, которое включает в себя информацию, касающуюся только одного из L и R сигналов, и параметрическую информацию, на основании которой вместе с упомянутой информацией, касающейся одного из L и R сигналов, можно восстановить другой сигнал.

Однако в упомянутом выше документе не рассматривается проблема эффективного кодирования многоканальных сигналов, содержащих более двух каналов.

Упомянутую выше проблему, а также другие проблемы позволяет решить способ кодирования многоканального аудиосигнала, содержащего, по меньшей мере, первый компонент сигнала, второй компонент сигнала и третий компонент сигнала, заключающийся в том, что

кодируют первый и второй компоненты сигнала посредством первого параметрического кодера для получения первого кодированного сигнала и первого набора параметров кодирования,

кодируют первый кодированный сигнал и дополнительный сигнал посредством второго параметрического кодера для получения второго кодированного сигнала и второго набора параметров кодирования, причем дополнительный сигнал получают из, по меньшей мере, третьего компонента сигнала и

представляют многоканальный аудиосигнал в виде, по меньшей мере, результирующего кодированного сигнала, полученного из, по меньшей мере, второго кодированного сигнала, первого набора параметров кодирования и второго набора параметров кодирования.

Таким образом, посредством каскадного включения нескольких параметрических кодеров, таких как стереокодеры, обеспечивается эффективная кодирующая схема для многоканальных аудиосигналов. В данной каскадной схеме выходной сигнал первого этапа параметрического кодирования подается в качестве ввода на следующий второй этап кодирования вместе с дополнительным входным сигналом, например, выходным сигналом другого второго этапа параметрического кодирования.

Следовательно, согласно данному изобретению многоканальный сигнал, содержащий n>2 аудиоканалов, можно закодировать как один канал кодированного сигнала и несколько битовых потоков параметров кодирования в параметрических кодерах, обеспечив тем самым высокую эффективность кодирования.

В предпочтительном варианте осуществления изобретения многоканальный аудиосигнал дополнительно содержит четвертый компонент сигнала, при этом дополнительно кодируют третий и четвертый компоненты сигнала посредством третьего параметрического кодера для получения упомянутого дополнительного сигнала и третьего набора параметров кодирования и на этапе представления многоканального аудиосигнала представляют многоканальный аудиосигнал в виде, по меньшей мере, результирующего кодированного сигнала, полученного из, по меньшей мере, второго кодированного сигнала, первого набора параметров кодирования, второго набора параметров кодирования и третьего набора параметров кодирования. Следовательно, дополнительный входной сигнал, поступающий во второй параметрический кодер, также является выходным сигналом предыдущего кодера.

Понятие "параметрический кодер" относится к кодеру, выполненному с возможностью кодирования, по меньшей мере, двух аудиоканалов для получения одного кодированного аудиоканала и набора параметров кодирования, которые позволяют декодеру декодировать кодированный аудиоканал в виде двух декодированных аудиоканалов. Примеры таких схем параметрического кодирования включают в себя кодирование стереосигнала как основного компонента сигнала и соответствующего угла поворота, кодирование стереосигнала в виде объединенного сигнала и ряда параметров, соответствующих пространственным атрибутам стереосигнала, и т.д. Однако можно использовать любую другую подходящую известную схему параметрического кодирования. Первый и второй модули параметрического кодирования могут реализовывать одну и ту же или различные схемы параметрического кодирования.

Результирующий кодированный сигнал можно получить из всего одного второго кодированного сигнала, т.е. он может быть идентичен второму кодированному сигналу или быть результатом его преобразования. Альтернативно, полученный кодированный сигнал можно получить из комбинации второго кодированного сигнала и дополнительного сигнала. Например, второй кодированный сигнал может служить в качестве ввода в другой модуль кодирования, соответствующий другой стадии каскадирования.

В области аудиокодирования особое значение имеет кодирование четырехканальных сигналов, содержащих левый передний канал, левый задний канал, правый передний канал и правый задний канал. Согласно изобретению такой сигнал можно эффективно кодировать с помощью каскадной цепи из трех параметрических кодеров: первый кодер кодирует левый передний и левый задний каналы для получения объединенного левого канала и соответствующих параметров кодирования. Второй канал кодирует правый передний и правый задний каналы для получения объединенного правого канала и соответствующих параметров кодирования. Третий кодер принимает объединенный правый канал и объединенный левый канал и формирует один кодированный сигнал и соответствующий третий набор параметров кодирования.

Кроме того, развивающиеся в настоящее время технологии цифровых универсальных дисков (DVD) и супераудиокомпакт-дисков (SACD) содержат пять аудиоканалов: четыре упомянутых выше канала и дополнительный центральный канал. Согласно изобретению такой сигнал можно эффективно кодировать с помощью четырех параметрических кодеров: три кодера кодируют левый и правый каналы, как в описанном выше случае с четырьмя каналами, а четвертый кодер принимает выходной сигнал описанной выше каскадной цепи и центральный сигнал в качестве ввода и формирует конечный кодированный сигнал.

В другом предпочтительном варианте многоканальный сигнал представляет собой пятиканальный аудиосигнал, при этом первый компонент сигнала содержит левый передний канал пятиканального аудиосигнала, второй компонент сигнала содержит левый задний канал пятиканального аудиосигнала, третий компонент сигнала содержит правый передний канал пятиканального аудиосигнала, четвертый компонент сигнала содержит правый задний канал пятиканального аудиосигнала, пятиканальный аудиосигнал дополнительно содержит центральный сигнал, и на этапе кодирования первого кодированного сигнала и дополнительного сигнала дополнительно объединяют первый кодированный сигнал и дополнительный сигнал с центральный сигналом. Следовательно, согласно данному варианту изобретения центральный сигнал объединяют с кодированным левым каналом и кодированным правым каналом, прежде чем кодировать левый и правый каналы как конечный кодированный сигнал.

Дополнительное преимущество данного варианта состоит в том, что он обеспечивает эффективное кодирование пятиканального сигнала всего тремя стереокодерами.

Еще одно преимущество изобретения состоит в том, что предложена схема кодирования, позволяющая декодеру на приемной стороне адаптироваться к числу каналов воспроизведения, имеющихся на приемном конце.

Настоящее изобретение может быть реализовано различными путями, включая описанный выше способ, и в дальнейшем будут описаны системы для кодирования и декодирования, а также другие производные средства, каждое из которых обеспечивает одно или более преимуществ, описанных в связи с первым упомянутым способом, и каждое из которых имеет один или более предпочтительных вариантов, соответствующих предпочтительным вариантам, описанным в связи с первым упомянутым способом, и раскрытых в зависимых пунктах формулы изобретения.

Следует отметить, что признаки описанного выше способа могут быть реализованы программными средствами и выполняться в системе обработки данных или другом процессорном средстве посредством выполнения исполняемых машиной команд. Эти команды могут быть программным кодом, загружаемым в память, например в ОЗУ, с носителя данных или из другого компьютера через вычислительную сеть. Альтернативно, описанные выше признаки можно реализовать в аппаратной схеме вместо программных средств или в комбинации с ними.

Изобретение также относится к способу декодирования кодированного многоканального аудиосигнала, согласно которому

получают первый кодированный сигнал, первый набор параметров кодирования и второй набор параметров кодирования из кодированного многоканального аудиосигнала,

получают первый и второй декодированные сигналы из первого кодированного сигнала и первого набора параметров кодирования, причем второй декодированный сигнал представляет, по меньшей мере, первый компонент сигнала многоканального сигнала, и

получают третий и четвертый декодированные сигналы из первого декодированного сигнала и второго набора параметров кодирования.

Изобретение также относится к системе для кодирования многоканального аудиосигнала, включающего в себя первый компонент сигнала, второй компонент сигнала и третий компонент сигнала, содержащей

первый параметрический кодер, выполненный с возможностью кодирования первого и второго компонентов сигнала, для получения первого кодированного сигнала и первого набора параметров кодирования,

второй параметрический кодер, выполненный с возможностью кодирования первого кодированного сигнала и дополнительного сигнала, для получения второго кодированного сигнала и второго набора параметров кодирования, причем дополнительный сигнал получен из, по меньшей мере, третьего компонента сигнала.

Изобретение также относится к системе для декодирования кодированного многоканального аудиосигнала, содержащей

средство для получения первого кодированного сигнала, первого набора параметров кодирования и второго набора параметров кодирования из кодированного многоканального аудиосигнала,

первый декодер, выполненный с возможностью получения первого и второго декодированных сигналов из первого кодированного сигнала и первого набора параметров кодирования, причем второй декодированный сигнал представляет, по меньшей мере, первый компонент сигнала многоканального сигнала, и

второй декодер, выполненный с возможностью получения третьего и четвертого декодированных сигналов из первого декодированного сигнала и второго набора параметров кодирования.

Изобретение также относится к устройству для подачи кодированного аудиосигнала, содержащему

блок для приема многоканального аудиосигнала,

систему для кодирования, такую как описанная выше, предназначенную для кодирования многоканального аудиосигнала, и

выходной блок для предоставления кодированного аудиосигнала.

Изобретение также относится к устройству для подачи декодированного аудиосигнала, содержащему

входной блок для приема кодированного аудиосигнала,

систему для декодирования, такую как описанная выше, предназначенную для декодирования кодированного аудиосигнала, и

выходной блок для предоставления декодированного аудиосигнала.

Изобретение также относится к кодированному многоканальному сигналу, включающему в себя аудиосигнал, а также первый и второй наборы параметров, причем аудиосигнал и первый набор параметров формируются первым параметрическим кодером после ввода первого кодированного сигнала и дополнительного сигнала, первый кодированный сигнал и второй набор параметров формируются вторым параметрическим кодером после ввода первого и второго компонентов многоканального сигнала, и дополнительный сигнал получают из, по меньшей мере, третьего компонента многоканального сигнала.

Изобретение также относится к носителю с сохраненным на нем кодированным аудиосигналом, описанным выше.

Эти и другие аспекты изобретения будут понятны из описанных ниже вариантов его осуществления со ссылками на прилагаемые чертежи, на которых

фиг.1 изображает схематический вид системы для передачи многоканальных аудиосигналов согласно одному варианту изобретения,

фиг.2 изображает структурную схему кодера для кодирования четырехканального аудиосигнала согласно одному варианту изобретения,

фиг.3 изображает структурную схему декодера для декодирования кодированного четырехканального аудиосигнала согласно одному варианту изобретения,

фиг.4 изображает структурную схему кодера для кодирования пятиканального аудиосигнала согласно одному варианту изобретения,

фиг.5 изображает структурную схему декодера для декодирования кодированного пятиканального аудиосигнала согласно одному варианту изобретения,

фиг.6 схематически иллюстрирует первый пример кодирующего модуля,

фиг.7 схематически иллюстрирует второй пример кодирующего модуля,

фиг.8 изображает структурную схему кодера для кодирования пятиканального аудиосигнала согласно одному варианту изобретения,

фиг.9 изображает структурную схему декодера для декодирования кодированного пятиканального аудиосигнала согласно одному варианту изобретения,

фиг.10 изображает структурную схему декодера 901 по фиг.9 согласно одному варианту изобретения,

фиг.11 схематически иллюстрирует функциональные формы трех функций, используемых для определения весовых коэффициентов в варианте по фиг.10.

На фиг.1 изображен схематический вид системы для передачи многоканальных сигналов согласно одному варианту изобретения. Система содержит кодирующее устройство 101 для формирования кодированного четырехканального сигнала и декодирующее устройство 105 для декодирования принятого кодированного сигнала в четырехканальный сигнал. Каждое из кодирующего устройства 101 и декодирующего устройства 105 может быть электронным прибором или частью такого прибора.

В данном контексте под электронным прибором подразумеваются вычислительные машины, например стационарные и портативные персональные компьютеры, стационарные и портативные приборы радиосвязи и другие карманные или портативные устройства, такие как мобильные телефоны, пейджеры, аудиоплееры, мультимедиаплееры, коммуникаторы, например электронные органайзеры, смартфоны, персональные цифровые помощники, карманные компьютеры, или т.п. Следует отметить, что кодирующее устройство 101 и декодирующее устройство могут быть объединены в одном электронном приборе, в котором аудиосигналы хранятся на машиночитаемом носителе для последующего воспроизведения.

Кодирующее устройство 101 содержит входной блок 111 для приема многоканального сигнала, кодер 102 для кодирования четырехканального аудиосигнала, при этом четырехканальный сигнал содержит левый передний компонент LF, левый задний компонент LR, правый передний компонент RF и правый задний компонент RR. Кодер 102 принимает четыре компонента сигнала через входной блок 111 и формирует кодированный сигнал Т. Четырехканальный сигнал может исходить из набора микрофонов, например, через дополнительную электронную аппаратуру, например микширующие устройства и т.п. Эти сигналы можно также принимать с выхода другого аудиоплеера, из эфира в виде радиосигнала или любыми другими подходящими средствами. Предпочтительные варианты такого кодера согласно изобретению будут описаны ниже.

Согласно данному варианту кодер 102 подключен к передатчику 103 для передачи кодированного сигнала Т через канал 109 связи в декодирующее устройство 105. Передатчик 103 может содержать схемы, пригодные для обеспечения передачи данных, например, через проводную или беспроводную линию 109 связи. Примеры такого передатчика включают в себя сетевой интерфейс, сетевую карту, радиопередатчик, передатчик для других пригодных электромагнитных сигналов, такой как светодиод для передачи инфракрасного излучения, например, через порт IrDa, для высокочастотных передач, например, через приемопередатчик Bluetooth или т.п. Другие примеры подходящих передатчиков включают в себя кабельный модем, телефонный модем, адаптер цифровой сети с интегрированными услугами (ISDN), адаптер цифровой абонентской линии (DSL), спутниковый приемопередатчик, адаптер Ethernet или т.п. Соответственно, канал 109 связи может быть любой пригодной проводной или беспроводной линией передачи данных, например сетью с коммутацией пакетов, такой как Интернет или другая сеть стандарта TCP/IP, линией связи ближнего действия, такой как инфракрасная линия связи, соединение Bluetooth или другая линия на основе радиопередачи.

Другие примеры канала связи включают в себя компьютерные сети и беспроводные телекоммуникационные сети, такие как сеть сотовой цифровой пакетной передачи данных (CDPD), сеть глобальной системы подвижной связи (GSM), сеть множественного доступа с кодовым разделением каналов (CDMA), сеть множественного доступа с временным разделением каналов (TDMA), сеть общей службы пакетной радиосвязи (GPRS), сеть третьего поколения, такая как сеть UMTS, или т.п.

Альтернативно или дополнительно кодирующее устройство может содержать один или более других интерфейсов 104 для передачи кодированного сигнала Т в декодирующее устройство 105. Примеры таких интерфейсов включают в себя накопитель для сохранения данных на машиночитаемом носителе 110, например дисковод на гибких магнитных дисках, читающий/пишущий дисковод для компакт-дисков (CD-ROM), дисковод для цифровых универсальных дисков (DVD) и т.п. Другие примеры включают в себя слот для карты памяти, устройство для записи/чтения магнитных карт, интерфейс для доступа к смарт-картам и т.д.

Соответственно, декодирующее устройство 105 содержит приемник 108 для приема сигнала, передаваемого передатчиком и/или другим интерфейсом 106, для получения кодированного сигнала, передаваемого через интерфейс 104 и машиночитаемый носитель 110. Декодирующее устройство дополнительно содержит декодер 107, который принимает принятый сигнал Т и декодирует его в соответствующие компоненты LF', LR', RF' и RR' декодированного четырехканального сигнала. Предпочтительные варианты такого декодера согласно изобретению будут описаны ниже. Декодирующее устройство дополнительно содержит выходной блок 112 для выдачи декодированных сигналов, которые можно затем подавать в аудиоплеер для воспроизведения через набор из четырех динамиков или т.п.

На фиг.2 показана структурная схема кодера для кодирования четырехканального аудиосигнала согласно одному варианту изобретения. Кодер принимает четырехканальный аудиосигнал как ввод, при этом четыре вводимых канала, подлежащих кодированию, названы как левый передний (LF), правый передний (RF), левый задний (LR) и правый задний (RR) каналы в соответствии с динамиками четырехканальной аудиосистемы. Кодер содержит модули 201, 202 и 203 параметрического кодирования. Кодирующий модуль 202 формирует один аудиоканал L из сигналов LF и LR левого динамика, объединенных с битовым потоком Р2 соответствующих параметров. Аналогично, кодирующий модуль формирует один аудиоканал R из сигналов RF и RR правых динамиков, объединенных с битовым потоком P3 соответствующих параметров.

Затем кодирующий модуль 201 формирует один широкополосный аудиосигнал Т из суммарного левого и суммарного правого сигналов L и R соответственно. Кроме того, в результате этого соединения формируется третий битовый поток Р1 параметров, который описывает пространственные свойства между суммарным левым и суммарным правым каналами.

Кодер также содержит объединительную схему 206 для выполнения соответствующего кодирования сигнала Т, например, согласно стандарту MPEG, в частности MPEG I layer 3 (MP3), синусоидальному кодированию (SSC) или другой подходящей схеме кодирования или их комбинации. Объединительная схема 206 также осуществляет кадрирование, назначение скорости передачи и кодирование без потерь, в результате чего формируется объединенный сигнал 207 для передачи. Альтернативно, объединительная схема 206 может подавать аудиосигнал Т и битовые потоки как два или более раздельных сигналов, как мультиплексированный сигнал или т.п.

Следовательно, кодер на фиг.2 формирует выходной сигнал, включающий в себя один широкополосный аудиосигнал Т и три битовых потока Р1, Р2 и Р3 параметров для передачи в приемник и/или для сохранения на носителе и/или т.п. Следует отметить, что хотя в примере на фиг.2 использовано 4 аудиоканала, аналогичный принцип можно использовать и для другого количества аудиоканалов.

Понятно, что альтернативно кодер 202 может кодировать сигналы LR и RR для формирования суммарного заднего сигнала, в то время как кодер 203 может кодировать сигналы LF и RF для формирования суммарного переднего сигнала. После этого суммарный передний и суммарный задний сигналы объединяются другим кодером. Параметры, сформированные этим кодером, можно затем использовать для двухмерного представления параметров, т.е. параметры из этого кодера можно использовать как общие параметры для декодирования переднего канала из заднего для левого и правого каналов. На фиг.3 показана структурная схема декодера для декодирования кодированного четырехканального аудиосигнала согласно изобретению. Этот декодер содержит схему 306 для извлечения кодированного сигнала Т и потоков Р1, Р2 и Р3 параметров из полученного сигнала 307, т.е. схема 306 выполняет операцию, обратную операции объединительной схемы 206 на фиг.2.

Декодер также содержит модули 301, 302 и 303 параметрического декодирования, соответствующие кодирующим модулям 201, 202 и 203 соответственно. Каскадный процесс кодирования, описанный в связи с фиг.2, в декодере изменяется на обратный: декодер принимает широкополосный аудиосигнал Т и три битовых потока Р1, Р2 и Р3 параметров. Сначала декодирующий модуль 301 синтезирует суммарный левый и суммарный правый сигналы L и R соответственно из одного входящего аудиосигнала Т, используя соответствующие параметры Р1. Если текущий конечный пользователь имеет всего два динамика, процесс декодирования на этом заканчивается.

Если конечный пользователь имеет 4 динамика, выполняется дополнительный этап декодирования: декодер 302 принимает суммарный левый сигнал L и битовый поток Р2 параметров и синтезирует из них левый передний и левый задний сигналы LF и LR соответственно.

Аналогично, декодер 303 принимает суммарный правый сигнал R и битовый поток Р3 параметров и синтезирует из них правый передний и правый задний сигналы RF и RR соответственно.

В одном варианте осуществления изобретения одни и те же параметры можно использовать для декодера 302 и 303, тем самым дополнительно уменьшается ширина полосы, необходимая для передачи многоканального сигнала, так как из кодера в декодер должен передаваться только один из битовых потоков Р2 и Р3 параметров (или их комбинация). В этом варианте параметры Р1, которые подаются в декодер 301, определяют левую и правую пространственную фонограмму, а параметры, которые поступают в декодер 302 и 303, определяют переднюю и заднюю пространственную фонограмму.

На фиг.4 показана структурная схема кодера для кодирования пятиканального сигнала согласно изобретению. Кодер содержит кодирующие модули 401, 402, 403 и 404. Кодер принимает пятиканальный аудиосигнал в качества ввода, при этом пять входных каналов, подлежащих кодированию, обозначены как левый передний (LF), правый передний (RF), левый задний (LR), правый задний (RR) и центральный (С) в соответствии с пятью динамиками пятиканальной аудиосистемы.

Кодирующие модули 402 и 403 формируют суммарный левый и суммарный правый сигналы L и R соответственно и соответствующие битовые потоки Р2 и Р3 из входных сигналов LF, LR и RF, RR соответственно.

Затем кодирующий модуль 401 формирует аудиосигнал S и соответствующий битовый поток Р1 из суммарного левого и суммарного правого сигналов L и R соответственно. Следовательно, кодирующие модули 401, 402 и 403 соответствуют кодирующим модулям 201, 202 и 203 на фиг.2.

Кодер на фиг.4 содержит дополнительную ступень каскада, содержащую кодирующий модуль 404, который принимает выходной сигнал S кодера 401 и центральный сигнал М. Кодирующий модуль 404 формирует широкополосный аудиосигнал Т и битовый поток параметров, представляющий характеристику средней части аудиосигнала.

Кодер дополнительно содержит объединительную схему 406, формирующую выходной сигнал 407, как было описано в связи со схемой 206 на фиг.2. Следовательно, кодер на фиг.4 формирует выходной сигнал 407, включающий в себя один широкополосный аудиосигнал Т и четыре битовых потока Р1, Р2, Р3 и Р4 параметров для передачи в приемник, и/или сохранения на носителе, и/или т.п.

На фиг.5 показана структурная схема декодера для декодирования кодированного пятиканального аудиосигнала согласно одному варианту изобретения. Декодер содержит схему 506 для извлечения кодированного сигнала Т и битовых потоков Р1, Р2, Р3 и Р4 параметров из принятого сигнала 507, т.е. схема 506 выполняет операцию, обратную операции объединителя 406 на фиг.4.

Декодер дополнительно содержит модули 501, 502, 503 и 504 параметрического декодирования, соответствующие кодирующим модулям 401, 402, 403 и 404, при этом процесс каскадного кодирования, описанный в связи с фиг.4, в декодере заменен на обратный: декодер принимает широкополосный аудиосигнал Т и три битовых потока Р1, Р2, Р3 и Р4 параметров. Сначала декодирующий модуль 504 синтезирует суммарный боковой сигнал S и боковой сигнал С, используя параметры Р4.

Затем модули 501, 502 и 503 синтезируют левый передний, левый задний, правый передний и правый задний сигналы LF, LR, RF и RR соответственно из суммарного бокового сигнала S и потоков Р1, Р2, Р3, как было описано выше в связи с декодером на фиг.3.

Понятно, что альтернативно пятиканальную передачу звука можно осуществлять посредством передачи двух аудиоканалов, объединенных с тремя битовыми потоками параметров, например, посредством передачи кодированного четырехканального сигнала, как описано в связи с фиг.2 и 3, и одного дополнительного моноканала.

На фиг.6 схематически проиллюстрирован первый пример модуля параметрического кодирования. Эта система принимает аудиосигнал, имеющий два компонента L и R сигнала. Например, эти компоненты могут быть двумя входящими компонентами многоканального сигнала, такими как компоненты LF и LR или компоненты RF и RR четырехканального сигнала, или кодированными суммарным левым и суммарным правым сигналами, сформированными кодерами 402 и 403 соответственно, показанными на фиг.4. Модуль параметрического кодирования содержит схему 601 для выполнения поворота входящего сигнала в пространстве L-R на угол α, чтобы получить повернутые компоненты y и r сигнала согласно следующему преобразованию:

y = L cos α + R sin α = wL + wR R

r = - L sin α + R cos α = - wRL +wLR,

где wL=cosα и wR=sinα будут называться весовыми коэффициентами.

Предпочтительно угол α определяется так, чтобы он соответствовал направлению высокой дисперсии сигнала. Направление максимальной дисперсии сигнала, т.е. основной компонент, можно оценивать с помощью анализа основного компонента, чтобы повернутый компонент у соответствовал сигналу основного компонента, который содержит большую часть энергии сигнала, и r был остаточным сигналом. Соответственно, кодирующий модуль на фиг.6 дополнительно содержит схему 602, которая определяет угол α или, альтернативно, весовые коэффициенты wL и wR, например, путем выполнения анализа основного компонента (АОК) выборок входящего сигнала.

В одном варианте кодирующий модуль на фиг.6 выдает основной компонент у и параметр поворота α или один из wL и wR. В другом варианте параметрический кодер может определить параметры адаптивного линейного фильтра, чтобы адаптивный фильтр формировал оценку остаточного сигнала r, когда основной компонент у подается в фильтр в качестве ввода. Согласно этому варианту входящий сигнал кодируется как сигнал основного компонента у, параметр поворота и набор параметров фильтра, что позволяет декодеру в приемнике предсказывать остаточный сигнал r на основании полученного основного компонента у и поворачивать сигнал обратно в направлении L и R (см., например, европейскую заявку № 02076410.6, поданную 10 апреля 2002 г.).

На фиг.7 схематически проиллюстрирован второй пример кодирующего модуля. Кодирующий модуль на фиг.7 описывает пространственные атрибуты многоканального аудиосигнала посредством указания интераурального различия уровня, интераурального временного (или фазового) различия и максимальной корреляции как функции времени и частоты, как описано в европейской заявке № 02076588.9, поданной 22 апреля 2002 г. Кодирующий модуль принимает компоненты L и R стереосигнала как вводы. Сначала схемы 702 и 703 разделения времени/частоты делят компоненты R и L соответственно на несколько временных/частотных слотов, например, посредством временного кадрирования, за которым следует операция преобразования.

Затем в схеме 704 анализа для каждого временного/частотного слота анализируются следующие свойства входящих сигналов:

интерауральное различие уровня (ILD), определяемое относительными уровнями соответствующих ограниченных по полосе сигналов, полученных из двух вводов,

интерауральное временное различие (ITD или IPD), определяемое интерауральной задержкой (или фазовым сдвигом), соответствующей пику интерауральной взаимно корреляционной функции, и

подобие (неподобие) форм сигнала, которые невозможно учесть в ITD или ILD и которые можно параметризировать максимальным значением взаимно корреляционной функции (т.е. значением взаимно корреляционной функции в положении максимального пика).

Описанные выше три параметра изменяются во времени, однако поскольку известно, что бинауральная слуховая система характеризуется большой медлительностью в своей работе, скорость обновления этих свойств будет очень низкой (обычно десятки миллисекунд).

Схема 704 анализа затем формирует сигнал S суммы (или доминанты), содержащий совокупность левого и правого сигналов. Сигналы L и R закодированы как сигнал S суммы и набор Р параметров как функции частоты и времени, при этом параметры Р содержат ILD, ITD/IPD и максимальное значение взаимно корреляционной функции.

На фиг.8 представлена структурная схема кодера для кодирования пятиканального аудиосигнала согласно одному варианту изобретения. Кодер содержит кодирующие модули 801, 802 и 803. Кодер принимает пятиканальный аудиосигнал как ввод, при этом подлежащие кодированию пять вводимых каналов обозначены как левый передний (LF), правый передний (RF), левый задний (LR), правый задний (RR) и боковой (С) в соответствии с динамиками пятиканальной аудиосистемы.

Кодирующие модули 802 и 803 формируют суммарный левый и суммарный правый сигналы L и R соответственно и соответствующие битовые потоки Р2 и Р3 из соответствующих входных сигналов LF, LR и RF, RR.

Затем кодирующий модуль 801 формирует аудиосигнал Т и соответствующий битовый поток Р1 из суммарного левого и суммарного правого сигналов, полученных из кодирующих модулей 802 и 803 соответственно. Таким образом, кодирующие модули 801, 802 и 803 соответствуют кодирующим модулям 201, 202 и 203 на фиг.2.

Однако, в отличие от предыдущего варианта, боковой сигнал С объединяется с обоими левым суммарным и суммарным правым сигналами L и R, сформированными модулями 802 и 803 соответственно. Кодер на фиг.8 содержит суммирующие схемы 804 для прибавления бокового сигнала к каждому из суммарного левого и суммарного правого сигналов L и R, чтобы получить суммарные сигналы L' и R' соответственно, которые подаются в кодирующий модуль 801. Этот кодер также содержит объединительную схему 806 для формирования конечного выходного сигнала 807, как было описано в связи со схемой 206 на фиг.2.

Преимущество данного варианта осуществления изобретения состоит в том, что он обеспечивает более экономичный способ кодирования пятиканального звука.

На фиг.9 показана структурная схема декодера для декодирования кодированного пятиканального аудиосигнала согласно изобретению. Декодер на фиг.9 пригоден для декодирования сигнала, закодированного кодером на фиг.8. Декодер содержит схему 906 для извлечения кодированного сигнала Т и потоков Р1, Р2 и Р3 параметров из принятого сигнала 907, т.е. схема 906 выполняет операцию, обратную операции объединителя 806 на фиг.8.

Декодер также содержит декодирующие модули 901, 902 и 903. Декодирующий модуль 901 получает кодированный аудиосигнал Т и соответствующий набор Р1 параметров. Сначала декодирующий модуль 901 анализирует переданные параметры Р1. Если параметры Р1 показывают, что сигнал является моносигналом, декодер выдает принятый сигнал как боковой сигнал. Следовательно, в данном случае этот сигнал подается в боковой динамик, и ни одного сигнала не подается на выходы L и R ни левого, ни правого каналов декодера.

Если переданные параметры Р1 показывают, что сигнал является стереосигналом, он кодируется путем распределения сигнала на левый и правый выходы.

Способ, используемый для определения моно- или стереосодержания, зависит от конкретной конструкции кодера и битового потока параметров. Например, в одном варианте изобретения с использованием параметрического кодирования пространственного стереосигнала, описанного в связи с фиг.7, ITD, ILD и корреляционные параметры определяют пространственные свойства сигнала как функцию частоты. Следовательно, для каждой полосы частот соответствующий ограниченный по полосе сигнал подается в центральный динамик, если ITD и ILD близки к нулю, например меньше заданной постоянной величины, и если корреляция близка к +1, т.е. если разность 1 минус корреляция меньше, чем заданная постоянная величина, например меньше 0,1. Например, заданная постоянная величина для ITD может быть выбрана порядка 50-100 микросекунд, а для ILD - от 1 до 3 дБ. Для всех других значений параметров этот сигнал распределяется на левый и правый выходы. Предпочтительный вариант кодирующего модуля 901 будет описан ниже в связи с фиг.10.

Декодирующие модули 902 и 903 декодируют суммарный правый и суммарный левый сигналы, как было описано выше, чтобы получить левый передний, левый задний, правый передний и правый задний компоненты LF, LR, RF и RR сигнала соответственно.

На фиг.10 представлена структурная схема декодера 901 по фиг.9 согласно изобретению. Кодирующий модуль 901 принимает кодированный аудиосигнал Т и соответствующий набор Р1 параметров. Основная идея декодирующего модуля 901 состоит в том, что он подает входной сигнал (конкретную полосу частот) в центральный динамик только в том случае, если пространственные параметры показывают, что выходные сигналы являются моносигналами (что означает, что ILD=0, ITD=0, корреляция = +1). Для других значений пространственных параметров сигнал должен посылаться на левый и правый выходы с использованием параметрического декодера.

Однако более желательно обеспечить плавный переход между распределением на центральный выход и левый и правый выходы в зависимости от пространственных параметров. Соответственно, декодирующие модули содержат схему 1002, которая принимает параметры Р1 и вычисляет весовые функции wc и wlr. В данном случае wc означает относительную величину входного моносигнала, который следует послать на центральный выход, а wlr означает относительную величину входного сигнала, который следует декодировать согласно пространственным параметрам и послать в пару выходов, состоящую из левого и правого выхода. В одном варианте отношение между весами задается на основании следующего ограничения:

wcn + wlrn = 1.

В данном случае n означает мощность, которая показывает, должна ли система сохранять общую амплитуду (n=1), суммарную величину мощности (n=2) или любую другую общую меру уровня сигнала. Значит, если wc известно, можно получить wlr согласно приведенному выше уравнению и наоборот.

Декодирующий модуль дополнительно содержит схему 1003, которая делит каждый поддиапазон входного сигнала согласно весовым коэффициентам wc и wlr между центральным выходом С и входом TLR в параметрический декодер 1004. Этот параметрический декодер декодирует масштабированный сигнал TLR, как было описано выше, в результате чего получаются суммарный левый и суммарный правый сигналы L и R соответственно.

Предпочтительно, схема 1002 определяет вес wc таким образом, что wc = 1, если ILD и ITD определенного поддиапазона равны 0 и если корреляция равна +1. Для других значений параметров wc должно стремиться к нулю. В одном варианте такое поведение достигается следующим образом: wc формируется из произведения трех функций Р1, Р2 и Р3. Р1 зависит только от значения ILD этого поддиапазона, Р2 зависит только от значения ITD текущего поддиапазона, и Р3 зависит только от взаимной корреляции этого поддиапазона. Следовательно:

wc = P1(ILD)·P2(ITD)·P3(ρ).

На фиг.11а-с схематически проиллюстрированы примеры функциональных форм трех функций, использованных для определения весовых коэффициентов в варианте на фиг.10.

Предпочтительно, функциональная форма функций Р1, Р2 и Р3 должна отвечать следующим ограничениям: Р1 и Р2 имеют максимум +1 для ILD (соответственно ITD), равного нулю, и стремятся к нулю для меньших и больших значений. Р3 имеет максимум +1 при корреляции +1 и стремится к нулю для более низких значений. На фиг.11а-с проиллюстрированы примеры функций Р1, Р2 и Р3 соответственно, которые удовлетворяют приведенным выше условиям.

Следует отметить, что можно использовать альтернативные способы распределения декодированного сигнала Т между центральным выходом С, левым выходом L и правым выходом R. Например, сначала сигнал Т можно декодировать с получением сигнала L и R с помощью параметров Р1, как было описано выше. Затем можно использовать алгоритм перераспределения двух входных сигналов на три выхода (левый, центральный и правый). Следовательно, сначала вычисляются левый и правый выходные сигналы декодера с помощью известного параметрического стереодекодера, после чего выполняется перераспределение (матрицирование) сигналов на три выхода (левый, правый и центральный). Такие методы известны для 2-5-канальных процессоров, как описано в международной заявке WO 02/07481.

Следует отметить, что описанные выше системы можно реализовать в универсальных или специализированных программируемых микропроцессорах, цифровых процессорах сигналов (ЦПС), интегральных схемах прикладной ориентации (ASIC), программируемых логических матрицах (PLA), вентильных матрицах, программируемых в условиях эксплуатации (FPGA), электронных схемах специального назначения и т.п. или их комбинации.

Следует также отметить, что описанные выше варианты служат для иллюстрации изобретения без ограничения его объема, и специалисты смогут предложить множество альтернативных вариантов, не выходя за рамки объема изобретения, определенного прилагаемой формулой изобретения.

Любые ссылочные обозначения, приведенные в формуле изобретения в скобках, не следует считать ограничивающими объем, определенный данным пунктом. Слово "содержащий" не исключает присутствия других элементов или этапов кроме перечисленных в данном пункте формулы изобретения. Неопределенные артикли перед названиями элементов не исключают наличия нескольких таких элементов.

Изобретение может быть реализовано с помощью аппаратных средств, содержащих несколько отдельных элементов, или компьютера, запрограммированного соответствующим образом. В формуле изобретения, характеризующей устройство с перечислением нескольких средств, несколько этих средств могут быть реализованы в одном и том же элементе. Сам факт, что определенные признаки указываются в различных зависимых пунктах, не исключает возможности использования комбинации этих признаков.

Источник поступления информации: Роспатент

Всего документов: 7