29.03.2019
219.016.f127

МНОГОКАНАЛЬНЫЙ КОДИРОВЩИК

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
№ охранного документа
0002390857
Дата охранного документа
27.05.2010
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится к методам обработки сигналов объемного звука в многоканальных кодировщиках и также относится к декодерам, совместимым с таким многоканальным кодировщиком. Многоканальный кодировщик (10; 600) для обработки входных сигналов, передаваемых по N входным каналам, предназначен для формирования соответствующих выходных сигналов, передаваемых по М выходным каналам вместе с добавочными параметрическими данными; М и N являются целыми числами, причем N>M. Кодировщик (10; 600) включает в себя смеситель с понижением частоты для смешивания с понижением частоты выходных сигналов для формирования соответствующих выходных сигналов, кодировщик также содержит анализатор для обработки входных сигналов для формирования параметрических данных, причем упомянутые параметрические данные описывают взаимные различия между N каналами входного сигнала для обеспечения восстановления в ходе декодирования одного или более N каналов входных сигналов из М каналов выходных сигналов. Технический результат - обеспечение высокоэффективного кодирования данных. 5 н. и 18 з.п. ф-лы, 3 ил., 1 табл.
Реферат Свернуть Развернуть

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение относится к многоканальным кодировщикам, например многоканальным звуковым кодировщикам, использующим параметрические описания объемного звука. Более того, изобретение также относится к методам обработки сигналов, например сигналов объемного звука в таких многоканальных кодировщиках. Кроме того, изобретение относится к декодерам, выполненным с возможностью декодировать сигналы, сформированные такими многоканальными кодировщиками.

УРОВЕНЬ ТЕХНИКИ ИЗОБРЕТЕНИЯ

Запись и воспроизведение звука в последние годы продвинулись от монофонического одноканального формата к двухканальному стереоформату и совсем недавно к многоканальному формату, например пятиканальному звуковому формату, который часто используется в системах домашних кинотеатров. Введение носителей данных на улучшенных аудио компакт-дисках (SACD) и цифровых дисках универсального назначения (DVD) привело к возрастающему в настоящее время интересу к такому пятиканальному воспроизведению звука. Многие пользователи сейчас владеют аппаратурой, обеспечивающей пятиканальное воспроизведение звука у себя дома; соответственно, программное содержимое пятиканального звука на подходящих носителях данных становится более доступным, например, на вышеупомянутых типах носителей данных SACD и DVD. Из-за возрастающего интереса к пятиканальному программному содержимому более эффективное кодирование программного содержимого многоканального звука становится важной проблемой, например, для обеспечения одного или более улучшенного качества, более продолжительной длительности воспроизведения или еще большего числа каналов.

Известны кодировщики, позволяющие представлять объемную звуковую информацию такую же, как для звукового программного содержимого, в виде параметрического описания. Например, в опубликованной международной заявке PCT № PCT/IB2003/002858 (WO 2004/008805) описывается кодирование многоканального звукового сигнала, включающего в себя, по меньшей мере, первую составляющую сигнала (LF-левую фронтальную), вторую составляющую сигнала (LR-левую заднюю) и третью составляющую сигнала (RF-правую фронтальную). Кодирование использует способ, содержащий этапы:

(а) кодирования первой и второй составляющих сигнала с использованием первого параметрического кодировщика для формирования первого кодированного сигнала (L-левого) и первого набора кодирующих параметров (P2);

(б) кодирование первого кодированного сигнала (L) и следующего сигнала (R-правого) с использованием второго параметрического кодировщика для формирования второго кодированного сигнала (Т) и второго набора кодирующих параметров (P1), при этом следующий сигнал (R) получается, по меньшей мере, из третьей составляющей сигнала (RF); и

(в) представление многоканального звукового сигнала, по меньшей мере, результирующим кодированным сигналом (Т), полученным, по меньшей мере, из второго кодированного сигнала (Т), первого набора кодирующих параметров (Р2) и второго набора кодирующих параметров (P1).

Параметрическое описание звукового сигнала вызывало интерес в последние годы, потому что было показано, что для передачи дискретных параметров, которыми описывается звуковой сигнал, нужна относительно небольшая пропускная способность. Эти дискретные параметры могут приниматься и обрабатываться в декодерах для восстановления звуковых сигналов, по восприятию незначительно отличающихся от соответствующих им исходных звуковых сигналов.

Современные многоканальные кодировщики преобразуют выходные кодированные данные со скоростью передачи битов, которая устанавливается, по существу, линейно по отношению к числу звуковых каналов, передаваемых в выходные кодированные данные. Такая особенность делает включение дополнительных каналов проблематичным, потому что емкость памяти исходного носителя данных или качество звукового воспроизведения должно, соответственно, быть принесено в жертву при предоставлении дополнительных каналов.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Задача настоящего изобретения состоит в том, чтобы предоставить многоканальный кодировщик, который выполнен с возможностью обеспечивать более эффективное кодирование содержимого многоканальных данных, например содержимого многоканальных звуковых данных.

Изобретатели оценили, что при использовании соответствующих способов кодирования выходные кодированные данные способны передавать информацию, соответствующую, например, содержимому пятиканальной звуковой программы, пока используя скорость передачи битов, обычно необходимую для передачи содержимого двухканальной звуковой программы, а именно стерео.

Следовательно, согласно первому аспекту настоящего изобретения, обеспечивается многоканальный кодировщик, выполненный с возможностью обрабатывать входные сигналы, передаваемые по N входным каналам, для формирования соответствующих выходных сигналов, передаваемых по M выходным каналам вместе с параметрическими данными, при условии, что M и N - целые числа и N больше чем M при этом кодировщик включает в себя:

(а) понижающий смеситель для смешивания с понижением частоты входных сигналов и формирования соответствующих выходных сигналов; и

(б) анализатор для обработки входных сигналов либо при смешивании с понижением частоты, либо в качестве отдельного процесса, при этом упомянутый анализатор выполнен с возможностью формировать упомянутые параметрические данные дополнительно к выходным сигналам, при этом упомянутые параметрические данные описывают взаимные различия между N каналами входного сигнала так, чтобы сделать возможным, по существу, восстановление при декодировании одного или более N каналов входного сигнала из M каналов выходного сигнала, причем упомянутые выходные сигналы получаются в форме, пригодной для восстановления в декодерах, предусматривающих N или меньше чем N выходных каналов для обеспечения обратной совместимости.

Преимущество изобретения состоит в том, что многоканальный кодировщик способен более эффективно кодировать многоканальные входные сигналы в выходной поток, который, например, может формироваться так, чтобы быть совместимым с двухканальной аппаратурой для стереовоспроизведения.

Такая обратная совместимость кодировщика с более ранними моделями соответствующего декодера обеспечивается тремя способами:

а) выходные сигналы после смешивания с понижением частоты от кодировщика преобразуются таким образом, что воспроизведение этих сигналов, то есть без дополнительной обработки или декодирования, дает пространственное изображение, которое хорошо аппроксимируется, например 5-канальным пространственным изображением, заданным ограничениями соответствующего ограниченного числа громкоговорителей. Это свойство гарантирует обратную совместимость воспроизведения;

(б) пространственные параметры, соответствующие смешанным с понижением частоты сигналам, размещаются во вспомогательных порциях данных потока битов. Декодер, который не способен декодировать вспомогательные порции данных, будет, тем не менее, способен декодировать передаваемый сигнал. Это свойство гарантирует обратную совместимость воспроизведения; и

(с) параметры сохраняются во вспомогательный части потока битов, и система декодера разработана таким образом, что параметрический декодер способен восстанавливать соответствующие 2-, 3- и 4-канальные сигналы. Это свойство обеспечивает гибкость с точки зрения используемой системы воспроизведения и, следовательно, обеспечивает обратную совместимость с 2-, 3- и 4-канальными системами.

Предпочтительно, в кодировщике анализатор включает в себя средство обработки для конвертирования входного сигнала путем преобразования из временной области в частотную область и для обработки этих преобразованных сигналов для формирования параметрических данных. Обработка входных сигналов в частотной области имеет преимущество при обеспечении эффективного кодирования внутри кодировщика. Наиболее предпочтительно, в кодировщике, по меньшей мере, один из понижающего смесителя и анализатора выполняются с возможностью обрабатывать сигналы как последовательность частотно-временных мозаичных изображений для формирования выходного сигнала.

Предпочтительно, в кодировщике мозаичные изображения получаются преобразованием взаимно перекрывающихся окон анализа. Такое наложение предполагает лучшую связность и, следовательно, уменьшение дефектов кодирования, когда выходные сигналы последовательно декодируются для восстановления отображения входного сигнала.

Предпочтительно, кодировщик включает в себя кодер для обработки входных сигналов для формирования М каналов промежуточных звуковых данных для включения в М выходных сигналов, причем анализатор выполняется с возможностью вывода информации в параметрических данных, относящихся, по меньшей мере, к одному из:

(а) межканальным отношениям мощностей входного сигнала или логарифмическим разностям уровней;

(б) межканальной когерентности между входными сигналами;

(в) отношению мощностей между входными сигналами одного или более каналов и сумме мощностей входных сигналов одного или более каналов; и

(г) разностям фаз или разностям времени между парами сигналов.

Более предпочтительно, разности фаз в (г) являются разностями средних фаз.

Предпочтительно, в кодировщике за вычислением, по меньшей мере, одной из разностей фаз, данных когерентности и отношения мощности следует анализ главных компонент (РСА) и/или межканальная фазовая синхронизация для формирования выходных сигналов.

Предпочтительно, для обеспечения большего сходства с исходными входными сигналами, когда входные данные восстанавливаются, в кодировщике, по меньшей мере, один из входных сигналов, передаваемых по N каналам, соответствует каналу спецэффектов.

Предпочтительно, кодировщик выполнен с возможностью формирования выходных сигналов в форме, пригодной для воспроизведения на обычных системах воспроизведения.

Согласно второму аспекту настоящего изобретения, обеспечивается способ кодирования входных сигналов, передаваемых по N входным каналам в многоканальный кодировщик для формирования соответствующих выходных сигналов, передаваемых по M выходным каналам вместе с параметрическими данными, такими, что M и N - целые числа и N больше чем M, при этом способ включает в себя этапы, на которых

а) смешивают с понижением частоты входные сигналы для формирования соответствующих выходных сигналов; и

б) обрабатывают в анализаторе входные сигналы либо при смешивании с понижением частоты, либо отдельно, при упомянутой обработке обеспечивают упомянутые параметрические данные дополнительно к выходным сигналам, причем упомянутые параметрические данные описывают взаимные различия между N каналами входных данных так, чтобы сделать возможным, по существу, восстановление N каналов входного сигнала из M каналов выходного сигнала при декодировании, причем упомянутые выходные сигналы представляются в форме, пригодной для восстановления в декодерах, предусматривающих N или меньше чем N выходных каналов.

Предпочтительно, способ осуществляется с возможностью для кодирования входных сигналов, соответствующих 5-ти каналам, и формирования выходных сигналов и параметрических данных в форме, совместимой с одним или более соответствующими 2-канальными стереодекодерами, 3-канальными декодерами и 4-канальными декодерами.

Предпочтительно, в способе обработка включает в себя конвертирование входных сигналов путем преобразования из временной области в частотную область.

Предпочтительно, в способе, по меньшей мере, один из входных сигналов обрабатывается как последовательность частотно-временных мозаичных изображений для формирования выходных сигналов.

Предпочтительно, в способе мозаичные изображения соответствуют взаимно перекрывающимся окнам анализа.

Предпочтительно, способ включает в себя этапы использования кодера для обработки входных сигналов для формирования М каналов промежуточных звуковых данных для включения в выходные сигналы, причем кодер выполнен с возможностью выводить информацию в параметрических данных, относящихся, по меньшей мере, к одному из:

(а) межканальным отношениям мощностей входного сигнала или логарифмическим разностям уровней;

(б) межканальной когерентности между входными сигналами;

(в) отношению мощностей между входными сигналами одного или более каналов и суммой мощностей входных сигналов одного или более каналов; и

(г) разностям фаз или разностям времени между парами сигналов.

Более предпочтительно, разности фаз в (г) являются разностями средних фаз.

Предпочтительно, в способе за вычислением, по меньшей мере, одной из разностей уровней, данных когерентности и отношения мощности следует анализ главных компонент и/или фазовый сдвиг для формирования выходных сигналов.

Предпочтительно, в способе, по меньшей мере, один из входных сигналов, передаваемых по N каналам, соответствует каналу спецэффектов.

Согласно третьему аспекту настоящего изобретения, обеспечивается сохранение содержимого кодированных данных на носителе данных, причем упомянутое содержимое данных формируется, используя способ согласно второму аспекту изобретения.

Согласно четвертому аспекту настоящего изобретения, обеспечивается декодер, выполненный с возможностью декодирования выходных данных кодировщика как сформированные кодировщиком согласно первому аспекту изобретения, причем упомянутые кодированные выходные данные, включающие М каналов и соответствующие параметрические данные, сформированы из входных сигналов N каналов, так что М<N, где М и N - целые числа, этот декодер включает в себя процессор:

(а) для приема кодированных выходных данных и конвертирования их из временной области в частотную область;

(б) для использования параметрических данных в частотной области для выделения содержимого из М каналов для восстановления из М каналов восстановленного содержимого данных, соответствующего входным сигналам одного или более N каналов, непосредственно не включенных или не представленных в кодированных выходных данных; и

(в) для обработки содержимого восстановленных данных для вывода одного или более восстановленных входных сигналов N каналов на одном или более выходе декодера.

Предпочтительно, в декодере процессор выполняется с возможностью использования широкополосного декорреляционного фильтра для получения некоррелированных версий сигналов для использования при восстановлении упомянутых одного или более входных сигналов N каналов на декодере.

Предпочтительно, в декодере процессор выполняется с возможностью использования инверсного поворота декодера для разделения сигналов М каналов и некоррелированных их версий на составляющие их компоненты для восстановления упомянутых одного или более входных сигналов N каналов на декодере.

Будет оценено, что отличительные признаки изобретения допускают объединение в любой комбинации без отступления от содержания изобретения.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

Сейчас будут описаны варианты осуществления изобретения путем только примеров со ссылкой на следующие чертежи, при этом:

Фигура 1 является блок-схемой первого многоканального кодировщика согласно изобретению;

Фигура 2 является блок-схемой второго многоканального кодировщика, согласно изобретению включающего в себя обеспечение спецэффектами, например низкочастотными спецэффектами, и

Фигура 3 является блок-схемой многоканального декодера согласно изобретению, декодер является дополнительным к кодировщикам Фигуры 1 и Фигуры 2 и способен декодировать выходные данные, подготовленные такими декодерами.

ОПИСАНИЕ ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Чтобы улучшить кодирование, выполняемое в многоканальном кодировщике, обеспечивающем N каналов входных данных и выполненном с возможностью кодировать входные данные для формирования соответствующего кодированного потока выходных данных, изобретатели предусмотрели, чтобы кодировщик выполнялся с возможностями, обеспечивающими преимущества:

(а) при смешивании с понижением частоты входных данных N каналов в М каналов таких, что М<N; и

(б) при формировании относительно небольшого количества параметрических служебных данных для объединения с данными М каналов, когда формируется поток выходных данных, параметрические данные выполняются с возможностью осуществлять восстановление данных, соответствующих N каналам, в последующем на декодере, обеспечивающем поток выходных данных.

Например, многоканальный кодировщик является, предпочтительно, пятиканальным кодировщиком, то есть N=5. Пятиканальный кодировщик сконфигурирован так, чтобы смешивать с понижением частоты данные, соответствующие пяти входным каналам для формирования двух каналов промежуточных данных, то есть М=2. Более того, пятиканальный кодировщик выполняется с возможностью формировать соответствующие параметрические служебные данные для объединения с данными двух каналов для формирования потока выходных данных, параметрические данные являются достаточными для осуществления декодером восстановления отображения пяти входных каналов. Преимущество декодера в том, что он обратно совместим при работе в случаях, когда N=2, 3, 4, то есть обратно совместим в случаях 2-канального, 3-канального и 4-канального вывода.

В предпочтительном варианте осуществления кодировщик выполняется с возможностью обрабатывать N входных каналов. N входных каналов, предпочтительно, соответствуют центру звукового канала данных, левому переднему звуковому каналу, левому заднему звуковому каналу, правому переднему звуковому каналу и правому заднему звуковому каналу; эти пять каналов способны создать кажущееся трехмерное распределение звука при домашнем воспроизведении программного содержимого типа кино. N каналов входных данных смешиваются с понижением частоты в два канала промежуточных звуковых данных, например, кодированных с использованием современного звукового стереокодера. Кодер преимущественно применяет анализ главных компонент и/или фазовую синхронизацию правого переднего и левого заднего каналов данных. Кодировщик также выполнен с возможностью применения раздельного анализа главных компонент и/или фазовой синхронизации правого переднего и правого заднего входных каналов. Более того, кодировщик выполнен с возможностью формировать параметрические служебные данные, включающие в себя информацию, относящуюся к нижеследующему:

(а) межканальным разностям уровней между левым передним и левым задним каналами данных;

(б) межканальным разностям уровней между правым передним и правым задним каналами данных;

(в) межканальной когерентности данных, относящихся к левому переднему и левому заднему каналами данных;

(г) межканальной когерентности данных, относящихся к правому переднему и правому заднему каналами данных; и

(д) отношение мощности между центральным каналом данных и суммой мощностей левого переднего, левого заднего, правого переднего, правого заднего каналов данных.

Два канала промежуточных данных и параметрические служебные данные объединяются для формирования кодированных выходных данных из кодировщика. По выбору, данные, относящиеся к межканальным разностям фаз и, предпочтительно, общим разностям фаз между левым передним и левым задним каналами данных, с одной стороны, и правым передним и правым задним каналами данных, с другой стороны, включаются в кодированные выходные данные из кодировщика.

Параметрический анализ, выполняемый в (а) вплоть до (д), в отношении варианта изобретения, предпочтительно включает в себя пространственный и частотный анализы; более предпочтительно, анализ выполняется посредством частотно-временных мозаичных изображений так, как будет дополнительно объяснено позднее.

Работа кодировщика в предпочтительном варианте осуществления изобретения сейчас будет описана очень подробно в выражениях, связанных с математическими функциями, со ссылками на Фиг.1, детали и сигналы на которой определяются в соответствии с таблицей 1.

Таблица 1
10 Декодер 320 Центральный сигнал, Sc
20 Первый канал 330 Правый передний сигнал, Srf
30 Второй канал 340 Правый задний сигнал, Srr
40 Третий канал 350 Левый передний преобразованный сигнал, TSlf
100 Блок сегментации и преобразования 360 Левый задний преобразованный сигнал, TSlr
110 Блок параметрического анализа 370 Первый набор параметров, PS1
120 Блок вектора параметров смешивания с понижением частоты 380 Левый промежуточный сигнал, LI
130 Блок смешивания с понижением частоты 400 Центральный промежуточный сигнал, CI
140 Блок сегментации и преобразования 410 Правый передний преобразованный сигнал, TSrf
150 Блок сегментации и преобразования 420 Правый задний преобразованный сигнал, TSrr
160 Блок параметрического анализа 430 Второй набор значений параметра, PS2
170 Блок вектора параметров смешивания с понижением частоты 440 Правый промежуточный сигнал, RI
180 Блок смешивания с понижением частоты 450 Третий набор значений параметра, PS3
200 Блок смешивания и выделения параметров 460 Правый предвыходной сигнал, PRout
210 Блок обратного преобразования и ОЛА 470 Левый предвыходной сигнал, PLout
300 Левый передний входной сигнал, Slf 480 Правый выходной сигнал, Rout
310 Левый задний входной сигнал, Slr 490 Левый выходной сигнал, Lout

На Фигуре 1 показан кодировщик, обозначенный, в целом, цифрой 10. Кодировщик 10 содержит первый, второй и третий входные каналы 20, 30, 40, соответственно. Выходные сигналы 380, 400, 440, то есть LI, CI, RI из этих трех каналов 20, 30, 40, соответственно, передаются в блок 200 смешивания и выделения параметров. Блок 200 выделения содержит соответствующий правый и левый предвыходной сигналы 460, 470, то есть PRout, PLout, которые передаются в блок 210 обратного преобразования и ОЛА для формирования кодированного правого и левого выходных сигналов 480, 490, то есть Rout, Lout, соответственно.

Первый канал 20 включает в себя блок 100 сегментации и преобразования для приема левого переднего и левого заднего входных сигналов 300, 310, соответственно, то есть Slf, Slr. Соответствующий левый передний и левый задний преобразованные сигналы 350, 360, то есть TSlf, TSlr передаются в блок 130 смешивания с понижением частоты канала 20, а также в блок 110 параметрического анализа канала 20. Сигнал первого набора 370 параметров, то есть PS1 передается на вход блока 120 конвертирования вектора параметров смешивания с понижением частоты, соответствующий выход которого связан с блоком 130 смешивания с понижением частоты.

Второй канал 30 включает в себя блок 140 сегментации и преобразования, выполненный с возможностью принимать центральный входной сигнал 320, то есть Sc. Центральный промежуточный сигнал 400, то есть CI, передается от блока 140 преобразования к блоку 200 выделения параметров так, как было описано выше.

Третий канал 40 включает в себя бок 150 сегментации и преобразования для приема правого переднего и правого заднего входных сигналов 330, 340, соответственно, то есть Srf, Srr. Соответствующий правый передний и правый задний преобразованные сигналы TSrf, TSrr передаются в блок 180 смешивания с понижением частоты канала 40, а также в блок 160 параметрического анализа канала 40. Сигнал 430 второго набора 430 параметров, то есть PS2, передается на вход блока 170 конвертирования вектора параметров смешивания с понижением частоты, соответствующий выход которого связан с блоком 180 смешивания с понижением частоты.

Блок 200 выделения параметров выполнен с возможностью принимать сигналы 380, 400, 440 из каналов 20, 30, 40 для формирования третьего набора 450 параметров, то есть PS3, а также предвыходные сигналы 460, 470, то есть PRout, PLout для блока 210 ОЛА.

Допускается осуществление кодировщика 10 в отдельном аппаратном средстве. Альтернативно, кодировщик 10 может размещаться на аппаратных средствах компьютера, выполненного с возможностью исполнения программного обеспечения, осуществляющего функции обработки кодировщика 10. В качестве дополнительной альтернативы, кодировщик 10 может осуществляться посредством объединения соответствующих аппаратных средств, соединенных с аппаратными средствами компьютера, работающего под управлением программного обеспечения.

Работа кодировщика 10 будет сейчас описана со ссылкой на Фиг.1. Сигналы Slf[n], Slr[n], Srf[n], Srr[n], Sc[n] описывают временные формы сигнала левого переднего, левого заднего, правого переднего, правого заднего и центрального звуковых сигналов, соответственно. В каналах 20, 30, 40 эти пять сигналов сегментируются с использованием обычной сегментации, предпочтительно, с использованием перекрывающихся окон анализа. Потом каждый сегмент конвертируется из временной области в частотную область с использованием комплекса преобразований, например преобразований Фурье или эквивалентного типа преобразований; альтернативно, конструкций блоков фильтров, например, осуществленных с использованием, по меньшей мере, одного из аппаратных устройств или смоделированных с помощью программного обеспечения, которые могут применяться для получения временных/частотных мозаичных изображений. Такая обработка сигнала приводит к сегментированию поддиапазона отображений входного сигнала в частотной области, обозначаемому Lf[k], Lr[k], Rf[k], Rr[k], при этом параметр k обозначает индекс частоты, L обозначает левый, R обозначает правый, f обозначает передний, r обозначает задний, C обозначает центральный.

В блоке 200 выделения параметров обработка данных выполняется на первом этапе для оценки значимых параметров между левым передним и левым задним сигналами. Эти параметры включают в себя разницу уровней IIDL, разницу фаз IPDL и когерентность ICCL. Предпочтительно, разница фаз IPDL соответствует средней разнице фаз. Более того, эти параметры IIDL, IPDL и ICCL вычисляются, как показано в уравнениях 1-3 (Ур.1 по 3):

где знак * обозначает комплексное сопряжение.

Процессы, описываемые уравнениями 1-3, также повторяются для правого переднего и правого заднего сигналов, в результате такой обработки получаются соответствующие параметры IIDR, IPDR и CCDR, относящиеся к разнице уровней, разнице фаз и когерентности, соответственно.

В блоке 120 конвертирования вектора параметров смешивания с понижением частоты обработка данных выполняется в два этапа для расчета комплексных весовых коэффициентов для смешивания с понижением частоты двух сигналов левого переднего Lf и левого заднего Lr. В предпочтительном варианте осуществления блок 130 вектора смешивания с понижением частоты выполняется так, чтобы максимально увеличить энергию сигнала смешивания с понижением частоты Y[k] применением вращения α пространства входного сигнала и/или комплексной фазовой синхронизации.

Смешивание с понижением частоты выполняется, как изложено ниже. Два сигнала Lf и Lr поворачиваются для получения основного сигнала Y[k] и соответствующего остаточного сигнала Q[k] с использованием угла α вращения, который максимально увеличивает энергию основного сигнала Y[k], как описывается в уравнении 4 (Ур.4):

Ур.4

где угол OPDL обозначает полный угол поворота фазы, тогда как разница фаз IPDL вычисляется для обеспечения максимального значения фазовой синхронизации двух сигналов Lf, Lr. Угол α поворота вычисляется по полученным параметрам при помощи уравнений 5 и 6 (Ур.5 и 6):

Ур.5

где

Ур.6

Сигнал Q[k] из уравнения 4 последовательно отбрасывается в блоке выделения параметров, сигнал Y[k] масштабируется с помощью скаляра β для получения сигнала L[k] таким образом, что сигнал L[k] имеет мощность, подобную мощности сигнала Q[k] плюс мощность сигнала Y[k]; другими словами, сигнал Q[k] отбрасывается, а соответствующие потери в мощности сигнала компенсируются изменением масштаба сигнала Y[k]. Скаляр β вычисляется при помощи уравнения 7 и 8 (Ур.7 и 8):

Ур.7

где

Ур.8

Первый и второй этапы также повторяются для правого переднего и правого заднего пар сигналов, приводя к формированию соответствующего сигнала R[k]. Следует отметить, что использование РСА поворота можно обойти, используя фиксированное значение для угла α поворота.

Третий этап обработки, выполняемой внутри кодировщика, использует смешение центрального сигнала C[k] с обоими сигналами L[k] и R[k], приводящее к формированию предвыходных сигналов 470, 460 соответственно, то есть PLout, PRout. Такое смешение выполняется в соответствии с уравнением 9 (Ур.9):

Ур.9

где параметр ε обозначает вес, обусловленный интенсивностью сигнала C[k] при смешении, соответствующем уравнению 9, например, обычно ε=0,707. Предпочтительно, соответствующая комбинация L, C и R выравнивается по фазе, иначе произошла бы потеря фазы.

Параметр IIDC, описывающий мощность сигнала С по отношению к мощности сигналов L и К, вычисляется из уравнения 10 (Ур.10):

Ур.10

Вышеупомянутый процесс, содержащий вышеупомянутые первый, второй и третий этапы, повторяется в кодировщике 10 для каждого временного/частотного мозаичного изображения.

Сигналы PLout[k] и PRout[k] впоследствии преобразуются в кодировщике во временную область и объединяются с предыдущими сегментами посредством использования сложения с наложением типа суммирования для формирования вышеупомянутых выходных сигналов 490, 480 соответственно, то есть Lout, Rout.

Выходные данные из кодировщика 10 могут передаваться по сетям связи, например через Интернет или другие аналогичные сети вещания.

Альтернативно или дополнительно, выходные данные могут передаваться посредством носителей данных, например оптических дисков данных DVD или других аналогичных типов носителей данных.

Выходной сигнал может декодироваться в декодере, совместимом с кодировщиком 10, например в декодере, обозначенном в целом ссылкой 800 на Фигуре 3. Декодер 800 включает в себя блок 810 для представления выходных сигналов 480, 490 и соответствующих параметров данных 370, 430, 450, 690, принимаемых из кодировщиков 10, 600 для различных математических операций для формирования соответствующих декодированных выходных сигналов (ДВС).

Для того чтобы обеспечить обратную совместимость, такие декодеры могут быть, по меньшей мере, одним из стерео-, 3-канальным или 5-канальным аппаратом. В декодере типа стерео, совместимом с кодировщиком 10, то есть, когда декодер 800 включает в себя только два выхода декодирования для ДВС, поскольку декодер типа стерео имеет два канала воспроизведения, то сигналы Rout, Lout, подготовленные кодером 10, воспроизводятся в декодере типа стерео по двум каналам воспроизведения без выполнения дополнительной обработки.

В 3-канальном декодере, совместимом с кодировщиком 10, поскольку декодер имеет три канала воспроизведения, то есть когда декодер 800 включает в себя три выхода декодирования для ДВС, то сигналы Rout, Lout, например, считанные с носителя данных, такого как оптический диск DVD, сегментируются и затем преобразуются в вышеупомянутую частотную область.

Соответственно, восстановленные сигналы L[k], R[k] и C[k] тогда получаются с помощью уравнений 11-16 (Ур.11 по 16):

Ур.11

где

Ур.12

Ур.13

Ур.14

Ур.15

Ур.16

Трехканальный звуковой сигнал для оценки пользователем затем получается из сигналов L[k], R[k] и C[k] способом, аналогичным способу, описанному выше.

В пятиканальном декодере, совместимом с кодировщиком 10, то есть если декодер 800 обеспечивает пять выходов декодирования, то трехканальное восстановление воспроизведения, как описывалось выше, используется, приводя в итоге к восстановлению сигналов L[k], R[k] и C[k] в декодере. В пяти канальном декодере выполняется дополнительный этап, который включает в себя разбиение сигнала L[k] на составляющие его части, то есть переднюю левую часть Lf[k] и заднюю левую часть Lr[k]; аналогично сигнал R[k] также разбивается на составляющие его части, то есть переднюю правую часть Rf[k] и заднюю правую часть Rr[k]. При таком разбиении сигнала используется инверсная операция поворота кодировщика дополнительно к повороту, выполненному в кодировщике, как описывалось выше. Основной сигнал Y[k] и остаточный сигнал Q[k], необходимый для инверсного поворота, получаются в пятиканальном декодере из уравнений 17 и 18 (Ур.17 и 18):

Ур.17

где

Ур.18

в которых параметр μ предварительно определяется из уравнения 8 (Ур.8), приведенного выше. В уравнении 17 H[k] обозначает широкополосный декорреляционный фильтр для получения декорреляционной версии сигнала L[k]. Потом сигналы Lf[k] и Lr[k] формируются с использованием функции инверсного поворота кодировщика, как описывается в уравнении 19 (Ур.19):

Ур.19

Аналогичная обработка также выполняется с правосторонними частями канала.

В четырехканальном декодере, совместимом с кодировщиком 10, четырехканальный декодер выполняется с возможностью сначала декодировать пять каналов способом, похожим на способ, применяемый в вышеупомянутом пятиканальном декодере для формирования пяти звуковых сигналов Slf, Slr, Srf, Srr и Sc. После этого простое смешение происходит в соответствии с уравнениями 20 и 21 (Ур.20, 21):

Ур.20

Ур.21

где коэффициент q=0,707.

Коэффициент q гарантирует для четырехканального декодера то, что полная мощность центральных частей сигналов, по существу, постоянна, независимо от воспроизведения через один центральный громкоговоритель или в качестве эквивалентного мнимого источника звука, созданного левым передним и правым передним громкоговорителями, соединенными с четырехканальным декодером для пользователя.

Будет оценено, что предпочтительная реализация изобретения, описанная выше, допускает модификацию без отклонения от сути изобретения, как определяется в приложенной формуле изобретения.

Изобретатели установили, что кодировщик не обеспечивает кодирование канала спецэффектов (LFE), например низкочастотный канал спецэффектов. Такой LFE канал имеет преимущество, например, при передаче данных звуковых спецэффектов, таких как данные звука грома или данные звука взрыва, которые преимущественно сопровождают видеоданные, одновременно представляемые пользователям, например, в системе домашнего кинотеатра. Таким образом, изобретатели оценили в предпочтительном варианте настоящего изобретения, что выгодно модифицировать кодировщик для улучшения его второго канала и, таким образом, создать кодировщик, как изображенный на Фиг.2 и обозначенный там, в целом, ссылкой 600. По выбору, LFE канал имеет относительно ограниченный частотный диапазон, по существу, 120 кГц, хотя выборочный относительно больший диапазон также может обеспечиваться.

Кодировщик 600 в целом подобен кодировщику 10 за исключением того, что второй канал 30 кодировщика 600 оснащен блоком 630 параметрического анализа, блоком 640 вектора параметров смешивания с понижением частоты и боком 650 смешивания с понижением частоты, связанных подобным способом, как и соответствующие компоненты первого и третьего каналов 20, 40, соответственно; канал 30 кодировщика 600 выполнен с возможностью выводить четвертый набор 690 параметров, то есть PS4. Более того, второй канал 30 кодировщика 600 включает в себя ввод 610 низкочастотных спецэффектов (LFE) для приема сигнала низкочастотных спецэффектов Slfe и также ввод 620 для приема вышеупомянутого центрального сигнала Sc. Предпочтительно, обработка сигнала Slfe огранивается частотным диапазоном 120 кГц от нижних звуковых частот вверх и, вследствие этого, потенциально пригодным для вывода на современных громкоговорителях низкочастотного типа. Однако, варианты осуществления изобретения выполняются с осуществлением второго канала 30, имеющего намного больший частотный диапазон, чем 120 кГц, например, для обеспечения данных высокочастотного сигнала, соответствующего звукам, похожим на импульс.

Добавление данных низкочастотных спецэффектов на выходе из кодировщика 600 требует использования дополнительных параметров по сравнению с кодировщиком 10. Сигнал, поданный на ввод 610, анализируется в кодировщике 600 для определения репрезентативных параметров, которые анализируются на основе временных/частотных мозаичных изображений подобным способом, как и другие вышеупомянутые звуковые сигналы, обработанные кодировщиком 10. Соответствующие кодировщики предпочтительно выполнены с возможностью включать дополнительные признаки для декодирования низкочастотных данных, чтобы восстановить, например, сигнал, подходящий для усиления при выводе на современных низкочастотных громкоговорителях в системах домашних кинотеатров.

В приложенную формулу изобретения числовые и другие символы, заключенные в скобки, включены для облегчения понимания формулы изобретения и не употребляются с намерением ограничить объем формулы изобретения каким-либо образом.

Выражения, такие как «содержать», «включать в себя», «объединяться», «ограничивать», «быть» и «иметь», должны толковаться не единственным способом при интерпретации описания и соответствующей ему формулы изобретения, то есть толковаться с учетом других элементов или составляющих, которые не определены точно, но могут быть представлены. Указание на единственное число может также толковаться как указание на множественное число и наоборот.

Источник поступления информации: Роспатент

Всего документов: 10

Похожие РИД в системе