×
17.06.2023
223.018.7dfc

Результат интеллектуальной деятельности: МНОГОКАНАЛЬНОЕ КОДИРОВАНИЕ АУДИО

Вид РИД

Изобретение

№ охранного документа
0002778832
Дата охранного документа
25.08.2022
Аннотация: Изобретение относится к параметрическому многоканальному кодированию аудио. При многоканальном кодировании аудио достигается повышенная эффективность вычислений посредством вычисления параметров для сравнения для компенсации ITD между любыми двумя каналами в частотной области для параметрического аудиокодера. Это позволяет смягчать отрицательные последствия для оценок параметров кодера. 4 н. и 11 з.п. ф-лы, 3 ил., 2 табл.

Настоящая заявка относится к параметрическому многоканальному кодированию аудио.

Способ из уровня техники для параметрического кодирования стереосигналов с потерями на низких скоростях передачи битов основан на параметрическом стерео согласно стандартизации в MPEG-4, часть 3 [1]. Общая идея состоит в уменьшении числа каналов многоканальной системы посредством вычисления сигнала понижающего микширования из двух входных каналов после извлечения стерео-/пространственных параметров, которые отправляются в декодер в качестве вспомогательной информации. Эти стерео-/пространственные параметры могут обычно содержать межканальную разность ILD уровней, межканальную разность IPD фаз и межканальную когерентность ICC, которые могут вычисляться в подполосах частот и которые в определенной степени захватывают пространственное изображение.

Однако этот способ не допускает компенсацию или синтезирование межканальных разностей времен (ITD), что является, например, желательным для понижающего микширования или воспроизведения речи, записанной с настройкой микрофонов AB, либо для синтезирования сцен, подготовленных посредством бинаурального рендеринга. Cинтез ITD рассматривается в бинауральном кодировании по сигнальным меткам (BCC) [2], которое, как правило, использует параметры ILD и ICC, в то время как оцениваются ITD и выполняется канальное совмещение в частотной области.

Хотя существуют модули оценки ITD во временной области, для оценки ITD обычно предпочтительно применять частотно-временное преобразование, которое обеспечивает спектральную фильтрацию взаимной корреляционной функции и также является вычислительно эффективным. По причинам сложности, желательно использовать одинаковые преобразования, которые также используются для извлечения стерео-/пространственных параметров и возможно для понижающего микширования каналов, что также достигается в подходе с BCC.

Тем не менее, это сопровождается недостатком: точная оценка стереопараметров в идеальном случае выполняется для совмещенных каналов. Но если каналы совмещаются в частотной области, например, посредством кругового сдвига в частотной области, это может вызывать смещение в окнах анализа, что может отрицательно влиять на оценки параметров. В случае BCC, это главным образом влияет на измерение ICC, причем увеличение смещений окна в конечном счете направляет значение ICC к нулю, даже если входные сигналы фактически являются полностью когерентными.

Таким образом, задача состоит в создании концепции для вычисления параметров в многоканальном кодировании аудио, которое допускает компенсацию межканальных разностей времен при недопущении отрицательных эффектов на оценки пространственных параметров.

Данная задача решается посредством объекта изобретения по независимым пунктам прилагаемой формулы изобретения.

Настоящая заявка основана на заключении о том, что в многоканальном кодировании аудио повышенная эффективность вычислений может достигаться посредством вычисления по меньшей мере одного параметра для сравнения для компенсации ITD между любыми двумя каналами в частотной области, которые должны использоваться посредством параметрического аудиокодера. Упомянутый по меньшей мере один параметр для сравнения может использоваться параметрическим кодером для смягчения вышеупомянутых отрицательных последствий для оценок пространственных параметров.

Вариант осуществления может содержать параметрический аудиокодер, который направлен на представление стерео- или в общем пространственного контента посредством по меньшей мере одного сигнала понижающего микширования и дополнительных стереопараметров или пространственных параметров. В числе этих стерео-/пространственных параметров могут быть предусмотрены ITD, которые могут оцениваться и компенсироваться в частотной области, до вычисления оставшихся стерео-/пространственных параметров. Эта процедура может смещать другие стерео-/пространственные параметры, что представляет собой проблему, которая в ином случае должна была бы решаться затратным способом путём повторного вычисления частотно-временного преобразования. В упомянутом варианте осуществления эта проблема может в достаточной степени смягчаться посредством применения вычислительно незатратной схемы коррекции, которая может использовать значение ITD и определенные данные базового преобразования.

Вариант осуществления относится к параметрическому аудиокодеру с потерями, который может быть основан на подходе на основе взвешенного среднего/бокового преобразования, может использовать стерео-/пространственные параметры IPD, ITD, а также два коэффициента усиления и может работать в частотной области. Другие варианты осуществления могут использовать другое преобразование и могут использовать другие пространственные параметры надлежащим образом.

В варианте осуществления, параметрический аудиокодер может быть способен как компенсировать, так и синтезировать ITD в частотной области. Он может содержать вычислительно эффективную схему коррекции усиления, которая смягчает отрицательные последствия вышеуказанного смещения окна. Также предлагается схема коррекции для кодера BCC.

Предпочтительные варианты реализации настоящей заявки являются предметом зависимых пунктов формулы изобретения. Предпочтительные варианты осуществления настоящей заявки описаны ниже с обращением к чертежам, на которых:

Фиг. 1 показывает блок-схему устройства сравнения для параметрического кодера согласно варианту осуществления настоящей заявки;

Фиг. 2 показывает блок-схему параметрического кодера согласно варианту осуществления настоящей заявки;

Фиг. 3 показывает блок-схему параметрического декодера согласно варианту осуществления настоящей заявки;

Фиг. 1 показывает устройство 100 сравнения для многоканального аудиосигнала. Как показано, оно может содержать ввод для аудиосигналов для пары стереоканалов, а именно, для сигнала l(τ) левого аудиоканала и сигнала r(τ) правого аудиоканала. Другие варианты осуществления, конечно, могут содержать множество каналов, чтобы захватывать пространственные свойства источников звука.

До преобразования аудиосигналов временной области l(τ), r(τ) в частотную область, одинаковые перекрывающиеся оконные функции 11, 21 w(τ) могут применяться к сигналам l(τ), r(τ) левого и правого входных каналов, соответственно. Кроме того, в вариантах осуществления, определенное значение дополнения нулями может добавляться, что обеспечивает сдвиги в частотной области. Затем прошедшие оконное преобразование аудиосигналы могут передаваться в соответствующие блоки 12, 22 дискретного преобразования Фурье (DFT), чтобы выполнять соответствующие частотно-временные преобразования. Они могут давать в результате частотно-временные элементы Lt,k и Rt,k разрешения, , в качестве преобразований частоты аудиосигналов для пары каналов.

Упомянутые преобразования Lt,k и Rt,k частоты могут передаваться в блок 20 обнаружения и компенсации ITD. Он может быть выполнен с возможностью извлечения параметра ITD для представления ITD между аудиосигналами для пары каналов, здесь ITDt, с использованием преобразований Lt,k и Rt,k частоты аудиосигналов пары каналов в упомянутых окнах анализа w(τ). Другие варианты осуществления могут использовать другие подходы для извлечения параметра ITD, который также может определяться перед блоками DFT во временной области.

Извлечение параметра ITD для вычисления ITD может заключать в себе вычисление (возможно взвешенной) авто- или взаимной корреляционной функции. Традиционно, она может вычисляться из частотно-временных элементов Lt,k и Rt,k разрешения посредством применения обратного дискретного преобразования Фурье (IDFT) к члену .

Надлежащий способ компенсации измеренной ITD состоит в выполнении совмещения каналов во временной области и затем в применении вновь того же самого частотно-временного преобразования к сдвинутому каналу(ам) для получения частотно-временных элементов разрешения с компенсацией ITD. Однако для снижения сложности эта процедура может аппроксимироваться посредством выполнения кругового сдвига в частотной области. Соответственно, компенсация ITD может выполняться посредством блока 20 обнаружения и компенсации ITD в частотной области, например, посредством выполнения круговых сдвигов посредством блоков 13 и 23 кругового сдвига, соответственно, что дает в результате:

(1)

и:

(2),

где ITDt может обозначать ITD для кадра t в выборках.

В варианте осуществления, это позволяет продвигать вперед отстающий канал и позволяет задерживать отстающий канал на ITDt/2 выборок. Тем не менее, в другом варианте осуществления (если задержка является критичной), может быть преимущественным только продвигать вперед отстающий канал на ITDt выборок, что не увеличивает задержку системы.

Как результат, блок 20 обнаружения и компенсации ITD может компенсировать ITD для пары каналов в частотной области посредством кругового сдвига(ов) с использованием параметра ITD ITDt для формирования пары преобразований Lt,k,comp, Rt,k,comp частоты с компенсацией ITD на выходе. Кроме того, блок 20 обнаружения и компенсации ITD может выводить извлеченный параметр ITD, а именно, ITDt, например, для передачи посредством параметрического кодера.

Как показано на фиг. 1, блок 30 вычисления параметров для сравнения и пространственных параметров может принимать параметр ITD ITDt и пару преобразований Lt,k,comp, Rt,k,comp частоты с компенсацией ITD в качестве своих входных сигналов. Блок 30 вычисления параметров для сравнения и пространственных параметров может использовать часть или все свои входные сигналы для того, чтобы извлекать стерео-/пространственные параметры многоканального аудиосигнала, такие как межфазная разность IPD.

Кроме того, блок 30 вычисления параметров для сравнения и пространственных параметров может формировать (на основании параметра ITD ITDt и пары преобразований Lt,k,comp, Rt,k,comp частоты с компенсацией ITD) по меньшей мере один параметр для сравнения, здесь два коэффициента gt,b и rt,b,corr усиления, для параметрического кодера. Другие варианты осуществления дополнительно или альтернативно могут использовать преобразования Lt,k, Rt,k частоты и/или пространственные/стереопараметры, извлеченные в блоке 30 вычисления параметров для сравнения и пространственных параметров, для того, чтобы формировать по меньшей мере один параметр для сравнения.

По меньшей мере, один параметр для сравнения может выступать в качестве части вычислительно эффективной схемы коррекции, чтобы смягчать отрицательные последствия вышеуказанного смещения в окнах анализа w(τ) для оценок пространственных/стереопараметров для параметрического кодера, причем упомянутое смещение вызывается посредством совмещения каналов посредством круговых сдвигов в области DFT в блоке 20 обнаружения и компенсации ITD. В варианте осуществления по меньшей мере один параметр для сравнения может вычисляться для восстановления аудиосигналов пары каналов в декодере, например, из сигнала понижающего микширования.

Фиг. 2 показывает вариант осуществления такого параметрического кодера 200 для стереоаудиосигналов, в котором устройство 100 сравнения по фиг. 1 может использоваться для получения параметра ITD ITDt, пары преобразований Lt,k,comp, Rt,k,comp частоты с компенсацией ITD и параметров и gt,b для сравнения.

Параметрический кодер 200 может формировать сигнал DMXt,k понижающего микширования в блоке 40 понижающего микширования для сигналов l(τ), r(τ) левого и правого входных каналов с использованием преобразований Lt,k,comp, Rt,k,comp частоты с компенсацией ITD в качестве ввода. Другие варианты осуществления дополнительно или альтернативно могут использовать преобразования Lt,k, Rt,k частоты для того, чтобы формировать сигнал DMXt,k понижающего микширования.

Параметрический кодер 200 может вычислять стереопараметры (такие как, например, IPD) на основе кадров в блоке 30 вычисления параметров для сравнения и пространственных параметров. Другие варианты осуществления могут определять другие или дополнительные стерео-/пространственные параметры. Процедура кодирования варианта осуществления параметрического кодера 200 на фиг. 2 может примерно выполнять следующие этапы, которые подробно описываются ниже.

1. Частотно-временное преобразование входных сигналов с использованием прошедших оконное преобразование DFT

в блоках 11, 12, 21, 22 оконного преобразования и обработки DFT

2. Оценка и компенсация ITD в частотной области

в блоке 20 обнаружения и компенсации ITD

3. Извлечение стереопараметров и вычисление параметров для сравнения

в блоке 30 вычисления параметров для сравнения и пространственных параметров

4. Понижающее микширование

в блоке 40 понижающего микширования

5. Частотно-временное преобразование с последующим оконным преобразованием и суммированием с перекрытием

в блоке 50 IDFT

Вариант осуществления параметрического аудиокодера 200 на фиг. 2 может быть основан на взвешенном среднем/боковом преобразовании входных каналов в частотной области с использованием преобразований Lt,k,comp, Rt,k,comp частоты с компенсацией ITD, а также ITD в качестве ввода. Оно позволяет дополнительно вычислять стерео-/пространственные параметры, такие как IPD, а также два коэффициента усиления, захватывающие стереоизображение. Оно позволяет смягчать отрицательные последствия вышеуказанного смещения окна.

Для извлечения пространственных параметров в блоке 30 вычисления параметров для сравнения и пространственных параметров, частотно-временные элементы Lt,k,comp и Rt,k,comp разрешения с компенсацией ITD могут группироваться на подполосы частот, и для каждой подполосы частот могут вычисляться межфазная разность IPD и два коэффициента усиления. Пусть Ib обозначает индексы частотных элементов разрешения в подполосе b частот. В таком случае, IPD может вычисляться следующим образом:

(3).

Два вышеуказанных коэффициента усиления могут быть связаны с компенсированными по фазе средними/боковыми преобразованиями для каждой полосы частот пары преобразований Lt,k,comp и Rt,k,comp частоты с компенсацией ITD, заданных посредством уравнений (4) и (5) следующим образом:

(4)

и:

(5)

для .

Первый коэффициент gt,b усиления из упомянутых коэффициентов усиления может рассматриваться в качестве оптимального усиления для прогнозирования для прогнозирования для каждой полосы частот преобразования St боковых сигналов из преобразования Mt средних сигналов в уравнении (6):

(6)

таким образом, что энергия остатка прогнозирования в уравнении (6), задаваемая посредством уравнения (7) следующим образом:

, (7)

является минимальной. Этот первый коэффициент gt,b усиления может упоминаться как боковое усиление.

Второй коэффициент rt,b усиления описывает отношение энергии остатка прогнозирования к энергии преобразования Mt,k средних сигналов, заданной посредством уравнения (8) следующим образом:

, (8)

и может упоминаться как остаточное усиление. Остаточное усиление rt,b может использоваться в декодере, например, в варианте осуществления декодера на фиг. 3, для формирования подходящей замены для остатка прогнозирования.

В варианте осуществления кодера, показанном на фиг. 2, оба коэффициента gt,b и rt,b усиления могут вычисляться в качестве параметров для сравнения в блоке 30 вычисления параметров для сравнения и пространственных параметров с использованием энергий и преобразований Lt,k,comp и Rt,k,comp частоты с компенсацией ITD, заданных в уравнениях (9) следующим образом:

(9)

и абсолютного значения их внутреннего произведения:

, (10)

заданного в уравнении (10).

На основе упомянутых энергий и вместе с внутренним произведением , коэффициент gt,b бокового усиления может вычисляться с использованием уравнения (11) следующим образом:

(11).

Кроме того, коэффициент rt,b остаточного усиления может вычисляться на основе упомянутых энергий и вместе с внутренним произведением и коэффициента gt,b бокового усиления с использованием уравнения (12) следующим образом:

(12).

В других вариантах осуществления, другие подходы и/или уравнения могут использоваться для того, чтобы вычислять коэффициент gt,b бокового усиления и коэффициент rt,b остаточного усиления и/или другие параметры для сравнения надлежащим образом.

Как упомянуто выше, компенсация ITD в частотной области, как правило, снижает сложность, но без дополнительных мер это сопровождается недостатком. В идеальном случае, для чистой безэховой речи, записанной с помощью AB-компоновки микрофонов, сигнал l(τ) левого канала фактически представляет собой задержанную (посредством задержки d) и масштабированную (посредством усиления c) версию сигнала r(τ) правого канала. Эта ситуация может выражаться посредством следующего уравнения (13), в котором:

(13).

После надлежащей компенсации ITD не прошедших оконное преобразование входных канальных аудиосигналов l(τ) и r(τ), оценка для коэффициента gt,b бокового усиления должна задаваться в уравнении (14) следующим образом:

(14)

с исчезающим коэффициентом rt,b остаточного усиления, заданным следующим образом:

(15).

Тем не менее, если канальное совмещение выполняется в частотной области, аналогично варианту осуществления на фиг. 2, посредством блока 20 обнаружения и компенсации ITD с использованием блоков 13 и 23 кругового сдвига, соответственно, надлежащие окна анализа w(τ) DFT также сдвигаются по кругу. Таким образом, после компенсации ITD в частотной области, преобразование частоты Rt,k,comp с компенсацией ITD для правого канала может определяться в форме частотно-временных элементов разрешения посредством DFT:

(16),

тогда как преобразование Lt,k,comp частоты с компенсацией ITD для левого канала может определяться в форме частотно-временных элементов разрешения в качестве DFT:

(17),

где w является окном анализа DFT.

Обнаружено, что такое канальное совмещение в частотной области главным образом влияет на коэффициент rt,b остаточного усиления прогнозирования, который растет с увеличением ITDt. Без дополнительных мер, канальное совмещение в частотной области в силу этого должно добавлять дополнительное объемное окружение в выходной аудиосигнал в декодере, как показано на фиг. 3. Это дополнительное объемное окружение является нежелательным, в частности, когда аудиосигнал, который должен кодироваться, содержит чистую речь, поскольку искусственное объемное окружение ухудшает понятность речи.

Следовательно, вышеописанное последствие может смягчаться посредством коррекции коэффициента rt,b остаточного усиления (прогнозирования) при наличии ненулевых ITD с использованием дополнительного параметра для сравнения.

В варианте осуществления, это может осуществляться посредством вычисления смещения усиления для остаточного усиления rt,b, которое направлено на согласование с ожидаемым остаточным сигналом e(τ), когда сигнал является когерентным и временно плоским. В этом случае, предполагается глобальное усиление для прогнозирования, заданное посредством уравнения (18) следующим образом:

(18)

и исчезающая глобальная , заданная посредством . Следовательно, ожидаемый остаточный сигнал e(τ) может определяться с использованием уравнения (19) следующим образом:

(19).

В варианте осуществления, дополнительный параметр для сравнения, помимо коэффициента gt,b бокового усиления и коэффициента rt,b остаточного усиления, может вычисляться на основе ожидаемого остаточного сигнала e(τ) в блоке 30 вычисления параметров для сравнения и пространственных параметров с использованием параметра ITD ITDt и функции, равной или аппроксимирующей автокорреляционную функцию для окна анализа w, заданной в уравнении (20) следующим образом:

(20).

Если Mr обозначает кратковременное среднее значение , энергия ожидаемого остаточного сигнала e(τ) может приблизительно вычисляться посредством уравнения (21) следующим образом:

(21).

С прошедшим оконное преобразование средним сигналом, заданным посредством уравнения (22) следующим образом:

(22),

энергия этого прошедшего оконное преобразование среднего сигнала может аппроксимироваться посредством уравнения (23) следующим образом:

(23).

В варианте осуществления, вышеуказанная функция, используемая при вычислении параметра для сравнения в блоке 30 вычисления параметров для сравнения и пространственных параметров, равна или аппроксимирует нормализованную версию автокорреляционной функции для окна анализа, заданную в уравнении (23a) следующим образом:

(23a).

На основе этой нормализованной автокорреляционной функции , упомянутый дополнительный параметр для сравнения может вычисляться с использованием уравнения (24) следующим образом:

(24)

для получения оцененного параметра коррекции для остаточного усиления rt,b. В варианте осуществления, параметр для сравнения может использоваться в качестве оценки для локальных остаточных усилений rt,b в подполосах b частот. В другом варианте осуществления, коррекция остаточных усилений rt,b может затрагиваться посредством использования параметра для сравнения в качестве смещения. Иными словами, значения остаточного усиления rt,b могут заменяться посредством скорректированного остаточного усиления rt,b,corr, заданного в уравнении (25) следующим образом:

(25).

Таким образом, в варианте осуществления, дополнительный параметр для сравнения, вычисленный в блоке 30 вычисления параметров для сравнения и пространственных параметров, может содержать скорректированное остаточное усиление rt,b,corr, которое соответствует остаточному усилению rt,b, скорректированному посредством параметра коррекции остаточного усиления, заданного в уравнении (24) в форме смещения, заданного в уравнении (25).

Следовательно, дополнительный вариант осуществления относится к параметрическому кодированию аудио с использованием прошедшего оконное преобразование DFT и [поднабора] параметров IPD согласно уравнению (3), бокового усиления gt,b согласно уравнению (11), остаточного усиления rt,b согласно уравнению (12) и ITD, при этом остаточное усиление rt,b регулируется согласно уравнению (25).

При эмпирической оценке, оценки остаточного усиления могут тестироваться с различными вариантами выбора для правого канального аудиосигнала r(τ) в уравнении (13). Для входных сигналов r(τ) белого шума, которые удовлетворяют предположению по временной равномерности, оценки остаточного усиления являются достаточно близкими к среднему остаточных усилений rt,b, измеренных в подполосах частот, как показано на нижеприведенной таблице 1.

ITD\c 1 2 4 8 16 32
мс 0,0893 0,0793 0,0569 0,0351 0,0196 0,0104
(0,0885) (0,0785) (0,0565) (0,0349) (0,0195) (0,0104)
мс 0,1650 0,1460 0,1045 0,0640 0,0357 0,0189
(0,1631) (0,1458) (0,1039) (0,0640) (0,0357) (0,0189)
мс 0,2348 0,2073 0,1472 0,0896 0,0498 0,0263
(0,2327) (0,2062) (0,1473) (0,0904) (0,0504) (0,0267)
мс 0,3005 0,2644 0,1862 0,1125 0,0621 0,0327
(0,2992) (0,2627) (0,1885) (0,1151) (0,0641) (0,0339)

Таблица 1. Среднее измеренных остаточных усилений rt,b для панорамированного белого шума с ITD и оценками остаточного усиления (указаны в скобках).

Для речевых сигналов r(τ), часто нарушается предположение временной равномерности, что типично увеличивает среднее остаточных усилений rt,b (см. нижеприведенную таблицу 2 в сравнении с вышеприведенной таблицей 1). Способ регулирования остаточного усиления или коррекции согласно уравнению (25) в силу этого может считаться достаточно консервативным. Тем не менее, он по-прежнему позволяет удалять большую часть нежелательного объемного окружения для записей чистой речи.

ITD\c 1 2 4
мс 0,1055 0,1022 0,0874
(0,0885) (0,0785) (0,0565)
мс 0,1782 0,1634 0,1283
(0,1631) (0,1458) (0,1039)
мс 0,2435 0,2191 0,1657
(0,2327) (0,2062) (0,1473)
мс 0,3050 0,2720 0,2014
(0,2992) (0,2627) (0,1885)

Таблица 2. Среднее измеренных остаточных усилений rt,b для панорамированной моноречи с ITD и оценками остаточного усиления (указаны в скобках).

Нормализованная автокорреляционная функция , заданная в уравнении (23a), может считаться независимой от индекса t кадра в случае, если используется одно окно анализа w. Кроме того, нормализованная автокорреляционная функция может считаться варьирующейся очень медленно для типичных окон анализа w. Следовательно, может интерполироваться точно из небольшой таблицы значений, что обеспечивает высокую эффективность этой схемы коррекции с точки зрения сложности.

Таким образом, в вариантах осуществления, функция для определения оценок остаточного усиления или смещения коррекции остаточного усиления в качестве параметра для сравнения в блоке 30, может получаться посредством интерполяции нормализованной версии автокорреляционной функции для окна анализа, сохраненного в таблице поиска. В другом варианте осуществления, другие подходы для интерполяции нормализованной автокорреляционной функции могут использоваться надлежащим образом.

Для BCC, как описано в [2], аналогичная проблема может возникать при оценке межканальной когерентности ICC в подполосах частот. В варианте осуществления, соответствующая может оцениваться посредством уравнения (26) с использованием энергий и уравнения (9) и внутреннего произведения уравнения (10) следующим образом:

(26).

По определению, ICC измеряется после компенсации ITD. Тем не менее, несовпадающие оконные функции w могут смещать ICC-измерение. В вышеуказанной настройке чистой безэховой речи, описанной посредством уравнения (13), ICC должна быть равна 1 при вычислении для надлежащим образом совмещенных входных каналов.

Тем не менее, смещение, вызываемое посредством вращения окон анализа w(τ) в частотной области при компенсации ITD ITDt в частотной области посредством кругового сдвига(ов), может смещать измерение ICC к , заданной в уравнении (27) следующим образом:

(27).

В варианте осуществления, смещение ICC может корректироваться аналогично по сравнению с коррекцией остаточного усиления rt,b в уравнении (25), а именно, посредством проведения замены, заданной в уравнении (28) следующим образом:

(28).

Таким образом, дополнительный вариант осуществления относится к параметрическому кодированию аудио с использованием прошедшего оконное преобразование DFT и [поднабора] параметров IPD согласно уравнению (3), ILD, ICC согласно уравнению (26) и ITD, при этом ICC регулируется согласно уравнению (28).

В варианте осуществления параметрического кодера 200, показанного на фиг. 2, блок 40 понижающего микширования может уменьшать число каналов многоканальной, здесь стерео-, системы посредством вычисления сигнала DMXt,k понижающего микширования, заданного посредством уравнения (29) в частотной области. В варианте осуществления, сигнал DMXt,k понижающего микширования может вычисляться с использованием преобразований Lt,k,comp и Rt,k,comp частоты с компенсацией ITD согласно следующему:

(29).

В уравнении (29), β может представлять собой параметр регулирования реальной абсолютной фазы, вычисленный из стерео-/пространственных параметров. В других вариантах осуществления, схема кодирования, как показано на фиг. 2, также может работать с любым другим способом понижающего микширования. Другие варианты осуществления могут использовать преобразования Lt,k и Rt,k частоты и необязательно дополнительные параметры для того, чтобы определять сигнал DMXt,k понижающего микширования.

В варианте осуществления кодера по фиг. 2, блок 50 обратного дискретного преобразования Фурье (IDFT) может принимать сигнал DMXt,k понижающего микширования в частотной области из блока 40 понижающего микширования. блок 50 IDFT может преобразовывать частотно-временные элементы DMXt,k разрешения для понижающего микширования, , из частотной области во временную область, что дает в результате сигнал dmx(τ) понижающего микширования во временной области. В вариантах осуществления, синтезирующая оконная функция ws(τ) может применяться и суммироваться с сигналом dmx(τ) понижающего микширования во временной области.

Кроме того, аналогично варианту осуществления на фиг. 2, базовый кодер 60 может принимать сигнал dmx(τ) понижающего микширования в области, чтобы кодировать одноканальный аудиосигнал согласно MPEG-4, часть 3 [1] или любому другому подходящему алгоритму кодирования аудио надлежащим образом. В варианте осуществления по фиг. 2, подвергнутый базовому кодированию сигнал dmx(τ) понижающего микширования во временной области может комбинироваться с параметром ITD ITDt, боковым усилением gt,b и скорректированным остаточным усилением rt,b,corr, надлежащим образом обработанными и/или дополнительно кодированными для передачи в декодер.

Фиг. 3. показывает вариант осуществления многоканального декодера. Декодер может принимать комбинированный сигнал, содержащий входной сигнал dmx(τ) моно/понижающего микширования во временной области и параметры для сравнения и/или пространственные параметры в качестве вспомогательной информации на основе кадров. Декодер, как показано на фиг. 3, может выполнять следующие этапы, которые подробно описываются ниже.

1. Частотно-временное преобразование ввода с использованием прошедших оконное преобразование DFT

в блоке 80 DFT

2. Прогнозирование отсутствующего остатка в частотной области

в блоке 90 повышающего микширования и пространственного восстановления

3. Повышающее микширование в частотной области

в блоке 90 повышающего микширования и пространственного восстановления

4. Синтез ITD в частотной области

в блоке 100 синтеза ITD

5. Преобразование из частотной во временную область, оконное преобразование и суммирование с перекрытием

в блоках 112, 122 IDFT и блоках 111, 121 оконного преобразования

Частотно-временное преобразование входного сигнала dmx(τ) моно/понижающего микширования может выполняться аналогично входным аудиосигналам кодера на фиг. 2. В конкретных вариантах осуществления, подходящее значение дополнения нулями может добавляться для восстановления ITD в частотной области. Эта процедура может давать в результате преобразование частоты сигнала понижающего микширования в форме частотно-временных элементов DMXt,k разрешения, .

Чтобы восстанавливать пространственные свойства сигнала DMXt,k понижающего микширования, может требоваться второй сигнал, независимый от передаваемого сигнала DMXt,k понижающего микширования. Этот сигнал, например, может (ре)конструироваться в блоке 90 повышающего микширования и пространственного восстановления с использованием скорректированного остаточного усиления rt,b,corr в качестве параметра для сравнения (передаваемого посредством кодера, такого как кодер на фиг. 2) и частотно-временных элементов разрешения с временной задержкой сигнала DMXt,k понижающего микширования, заданных в уравнении (30):

(30)

для .

В других вариантах осуществления, другие подходы и уравнения могут использоваться для того, чтобы восстанавливать пространственные свойства сигнала DMXt,k понижающего микширования на основе передаваемого по меньшей мере одного параметра для сравнения.

Кроме того, блок 90 повышающего микширования и пространственного восстановления может выполнять повышающее микширование посредством применения инверсии к среднему/боковому преобразованию в кодере с использованием сигнала DMXt,k понижающего микширования и бокового усиления gt,b, передаваемых посредством кодера, а также восстановленного остаточного сигнала . Это может давать в результате декодированные преобразования и частоты с компенсацией ITD, заданные посредством уравнений (31) и (32) следующим образом:

(31)

и:

(32)

для , где β является параметром абсолютного вращения фаз, равным параметру в процедуре понижающего микширования в уравнении (29)

Кроме того, как показано на фиг. 3, декодированные преобразования и частоты с компенсацией ITD могут приниматься посредством блока 100 синтеза/декомпенсации ITD. Он может применять параметр ITD ITDt в частотной области посредством вращения и , как задано в уравнениях (33) и (34), что дает в результате декодированные преобразования и частоты с декомпенсацией ITD:

(33)

и:

(34).

На фиг. 3, преобразование из частотной во временную область декодированных преобразований частоты с декомпенсацией ITD в форме частотно-временных элементов и разрешения, , может выполняться посредством блоков 112 и 122 IDFT, соответственно. Результирующие сигналы временной области затем могут подвергаться оконному преобразованию посредством блоков 111 и 121 оконного преобразования, соответственно, и суммироваться с восстановленными выходными аудиосигналами и временной области левого и правого аудиоканала.

Вышеописанные варианты осуществления являются просто иллюстративными в отношении принципов настоящего изобретения. Следует понимать, что модификации и изменения компоновок и подробностей, описанных в данном документе, должны быть очевидными для специалистов в данной области техники. Следовательно, они подразумеваются как ограниченные только посредством объема нижеприведенной формулы изобретения, а не посредством конкретных подробностей, представленных посредством описания и пояснения вариантов осуществления в данном документе.

Библиографический список

[1] MPEG-4 High Efficiency Advanced Audio Coding (HE-AAC) v2.

[2] Jürgen Herre "FROM JOINT STEREO TO SPATIAL AUDIO CODING – RECENT PROGRESS AND STANDARDIZATION", Proc. of the 7th Int. Conference on digital Audio Effects (DAFX-04), Неаполь, Италия, 5-8 октября 2004 года.

[3] Christoph Tourney и Christof Faller "Improved Time Delay Analysis/Synthesis for Parametric Stereo Audio Coding", AES Convention Paper 6753, 2006 год.

[4] Christof Faller и Frank Baumgarte "Binaural Cue Coding Part II: Schemes and Applications", IEEE Transactions on Speech and Audio Processing, издание 11, номер 6, ноябрь 2003 года.

Источник поступления информации: Роспатент

Показаны записи 1-10 из 331.
20.08.2013
№216.012.5f96

Способ сварки и конструктивный элемент

Изобретение может быть использовано при ремонте конструктивных элементов с заполнением сваркой углублений поврежденной области. Углубление (4) имеет контур (16), который ограничивает наружную поверхность (13) конструктивного элемента относительно углубления (4). Углубление (4) заполняют слоями...
Тип: Изобретение
Номер охранного документа: 0002490102
Дата охранного документа: 20.08.2013
10.09.2013
№216.012.6915

Силовой полупроводниковый модуль с боковыми стенками слоистой конструкции

Изобретение относится к силовому полупроводниковому модулю. Технический результат - предложение силового полупроводникового модуля, обладающего высокой взрывоустойчивостью и изготавливаемого с особенно оптимальными затратами. Достигается тем, что в силовом полупроводниковом модуле (1),...
Тип: Изобретение
Номер охранного документа: 0002492548
Дата охранного документа: 10.09.2013
20.09.2013
№216.012.6d3e

Устройство, способ и компьютерная программа для обеспечения набора пространственных указателей на основе сигнала микрофона и устройство для обеспечения двухканального аудиосигнала и набора пространственных указателей

Устройство для обеспечения набора пространственных указателей, связанных с аудиосигналом повышающего микширования, имеющим более двух каналов, на основе двухканального сигнала микрофона, содержит анализатор сигнала и генератор дополнительной пространственной информации. Анализатор сигнала...
Тип: Изобретение
Номер охранного документа: 0002493617
Дата охранного документа: 20.09.2013
20.11.2013
№216.012.827b

Способ получения прозрачного проводящего покрытия из оксида металла путем импульсного высокоионизирующего магнетронного распыления

Прозрачное проводящее покрытие из оксида металла наносят на подложку путем распыления, по меньшей мере, одного компонента покрытия из оксида металла импульсным магнетронным методом и конденсирования его на подложке. Пиковая плотность мощности импульсов магнетрона составляет свыше 1,5 кВт/см,...
Тип: Изобретение
Номер охранного документа: 0002499079
Дата охранного документа: 20.11.2013
20.08.2014
№216.012.eb94

Транспортное средство с отражателем звуковых волн

Группа изобретений относится к области транспортного машиностроения. Транспортное средство по первому варианту содержит потолок и один динамик. Потолок имеет первую часть, отражающую звуковые волны и имеющую первую характеристику отражения звуковых волн, и вторую часть, имеющую вторую...
Тип: Изобретение
Номер охранного документа: 0002526116
Дата охранного документа: 20.08.2014
10.09.2014
№216.012.f1d9

Устройство, способ и компьютерная программа для выработки широкополосного сигнала с использованием управляемого расширения ширины полосы и слепого расширения ширины полосы

Изобретение относится к средствам для выработки широкополосного сигнала с использованием входного сигнала низкой полосы. Технический результат заключается в расширении полосы при низкой скорости передачи битов и сохранении высокого качества сигнала. Процессор выполняет операции управляемого...
Тип: Изобретение
Номер охранного документа: 0002527735
Дата охранного документа: 10.09.2014
20.02.2015
№216.013.28a7

Аудио или видео кодер, аудио или видео и относящиеся к ним способы для обработки многоканальных аудио или видеосигналов с использованием переменного направления предсказания

Изобретение относится к средствам обработки многоканальных аудио или видеосигналов с использованием переменного направления предсказания. Технический результат заключается в повышении качества аудио или видео. Объединяют два аудио или видео канала для получения первого сигнала объединения в...
Тип: Изобретение
Номер охранного документа: 0002541864
Дата охранного документа: 20.02.2015
10.04.2015
№216.013.3ad7

Поставщик транспортного потока, поставщик сигнала dab, анализатор транспортного потока, приемник dab, способ, компьютерная программа и сигнал транспортного потока

Изобретение относится к поставщикам транспортного потока. Технический результат заключается в повышении безопасности передачи данных. Поставщик транспортного потока конфигурируется для предоставления пакета транспортного потока первого типа пакета, содержащего таблицу взаимосвязи программ и...
Тип: Изобретение
Номер охранного документа: 0002546551
Дата охранного документа: 10.04.2015
10.04.2015
№216.013.3b0a

Способ и кодер и декодер для воспроизведения без промежутка аудио сигнала

Заявленное изобретение относится к средствам для выдачи информации относительно достоверности закодированных аудиоданных. Технический результат заключается в обеспечении возможности обрезания недостоверных данных. Каждый блок закодированных аудиоданных может содержать информацию относительно...
Тип: Изобретение
Номер охранного документа: 0002546602
Дата охранного документа: 10.04.2015
10.04.2015
№216.013.3d89

Аудиокодек, поддерживающий режимы кодирования во временной области и в частотной области

Изобретение относится к средствам, поддерживающим режимы кодирования во временной области и в частотной области. Технический результат заключается в уменьшении задержки и повышении эффективности кодирования с точки зрения отношения скорость/искажения. Конфигурируют аудиокодер таким образом, что...
Тип: Изобретение
Номер охранного документа: 0002547241
Дата охранного документа: 10.04.2015
Показаны записи 1-10 из 14.
19.01.2018
№218.016.09eb

Устройство и способ выбора одного из первого алгоритма кодирования и второго алгоритма кодирования с использованием уменьшения гармоник

Изобретение относится к средствам для выбора алгоритма кодирования. Технический результат заключается в уменьшении сложности выбора между первым алгоритмом кодирования и вторым алгоритмом кодирования. Устройство для выбора одного из первого алгоритма кодирования и второго алгоритма кодирования,...
Тип: Изобретение
Номер охранного документа: 0002632151
Дата охранного документа: 02.10.2017
08.07.2018
№218.016.6da4

Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем разделения огибающей аудиосигнала с использованием квантования и кодирования распределения

Изобретение относится к области радиосвязи и предназначено для кодирования, обработки и декодирования аудиосигнала, для получения восстановленной огибающей аудиосигнала. Технический результат – предоставление улучшенных концепций для кодирования и декодирования огибающей аудиосигнала и...
Тип: Изобретение
Номер охранного документа: 0002660633
Дата охранного документа: 06.07.2018
30.03.2019
№219.016.f9f4

Сокращенное декодирование

Изобретение относится к области вычислительной техники для декодирования аудиоданных. Технический результат заключается в повышении точности аудиодекодирования. Технический результат достигается за счет подавления искажений во временной области, подвергая обработанный с помощью оконной функции...
Тип: Изобретение
Номер охранного документа: 0002683487
Дата охранного документа: 28.03.2019
01.11.2019
№219.017.dc7d

Устройство и способ кодирования или декодирования многоканального сигнала с использованием параметра широкополосного выравнивания и множества параметров узкополосного выравнивания

Изобретение относится к области технологий для кодирования многоканального сигнала. Технический результат заключается в повышении точности кодирования многоканального сигнала. Технический результат достигается за счет определения параметра широкополосного выравнивания и множества параметров...
Тип: Изобретение
Номер охранного документа: 0002704733
Дата охранного документа: 30.10.2019
04.11.2019
№219.017.de44

Устройство и способ для кодирования или декодирования многоканального сигнала с использованием сихронизации управления кадрами

Изобретение относится к области обработки многоканальных сигналов. Технический результат заключается в повышении точности обработки многоканального сигнала. Технический результат достигается за счет преобразования последовательностей блоков значений дискретизации двух каналов в представление...
Тип: Изобретение
Номер охранного документа: 0002705007
Дата охранного документа: 01.11.2019
18.04.2020
№220.018.15d5

Аудиокодер для кодирования аудиосигнала, способ для кодирования аудиосигнала и компьютерная программа, учитывающие детектируемую спектральную область пиков в верхнем частотном диапазоне

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в повышении эффективности кодирования. Детектируют (802) спектральную область пиков в верхнем частотном диапазоне аудиосигнала. Формируют (804) нижний частотный диапазон аудиосигнала с...
Тип: Изобретение
Номер охранного документа: 0002719008
Дата охранного документа: 16.04.2020
03.07.2020
№220.018.2dfa

Устройство и способ для кодирования или декодирования многоканального сигнала с использованием коэффициента передачи побочного сигнала и коэффициента передачи остаточного сигнала

Изобретение относится к кодированию многоканального сигнала 100. Технический результат - улучшение концепции для обработки многоканальных данных. Для этого предусмотрено по меньшей мере два канала 101, 102 и устройство содержит понижающий микшер 120 для расчета сигнала 122 понижающего...
Тип: Изобретение
Номер охранного документа: 0002725178
Дата охранного документа: 30.06.2020
24.07.2020
№220.018.37fc

Устройство и способ кодирования аудиосигнала с использованием значения компенсации

Изобретение для кодирования аудиосигналов. Технический результат заключается в повышении эффективности кодирования. Осуществляют базовое кодирование первых аудиоданных в первой спектральной полосе. Осуществляют параметрическое кодирование вторых аудиоданных во второй спектральной полосе,...
Тип: Изобретение
Номер охранного документа: 0002727728
Дата охранного документа: 23.07.2020
26.07.2020
№220.018.381f

Устройство и способ понижающего или повышающего микширования многоканального сигнала с использованием фазовой компенсации

Изобретение относится к средствам для повышающего и понижающего микширования. Технический результат заключается в повышении эффективности обработки многоканальных данных. Вычисляют микшированный с понижением сигнал на основе многоканального сигнала, причем вычисление содержит вычисление...
Тип: Изобретение
Номер охранного документа: 0002727799
Дата охранного документа: 24.07.2020
26.07.2020
№220.018.3833

Понижающий микшер и способ для понижающего микширования по меньшей мере двух каналов, и многоканальный кодировщик и многоканальный декодер

Изобретение относится к области обработки аудиосигналов. Технический результат заключается в минимизации типичного подавления сигнала и нестабильностей, наблюдаемых в традиционном понижающем микшировании. Технический результат достигается за счет вычисления сигнала неполного понижающего...
Тип: Изобретение
Номер охранного документа: 0002727861
Дата охранного документа: 24.07.2020
+ добавить свой РИД