17.06.2023

№223.018.7dfc

Результат интеллектуальной деятельности: МНОГОКАНАЛЬНОЕ КОДИРОВАНИЕ АУДИО

Вид РИД

Изобретение

Юридическая информация Юридическая информация Свернуть Развернуть

Авторы

Правообладатели

ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)

№ охранного документа

0002778832

Дата охранного документа

25.08.2022

Краткое описание РИД Краткое описание РИД Свернуть Развернуть

Аннотация: Изобретение относится к параметрическому многоканальному кодированию аудио. При многоканальном кодировании аудио достигается повышенная эффективность вычислений посредством вычисления параметров для сравнения для компенсации ITD между любыми двумя каналами в частотной области для параметрического аудиокодера. Это позволяет смягчать отрицательные последствия для оценок параметров кодера. 4 н. и 11 з.п. ф-лы, 3 ил., 2 табл.

Реферат Реферат Свернуть Развернуть

Настоящая заявка относится к параметрическому многоканальному кодированию аудио.

Способ из уровня техники для параметрического кодирования стереосигналов с потерями на низких скоростях передачи битов основан на параметрическом стерео согласно стандартизации в MPEG-4, часть 3 [1]. Общая идея состоит в уменьшении числа каналов многоканальной системы посредством вычисления сигнала понижающего микширования из двух входных каналов после извлечения стерео-/пространственных параметров, которые отправляются в декодер в качестве вспомогательной информации. Эти стерео-/пространственные параметры могут обычно содержать межканальную разность ILD уровней, межканальную разность IPD фаз и межканальную когерентность ICC, которые могут вычисляться в подполосах частот и которые в определенной степени захватывают пространственное изображение.

Однако этот способ не допускает компенсацию или синтезирование межканальных разностей времен (ITD), что является, например, желательным для понижающего микширования или воспроизведения речи, записанной с настройкой микрофонов AB, либо для синтезирования сцен, подготовленных посредством бинаурального рендеринга. Cинтез ITD рассматривается в бинауральном кодировании по сигнальным меткам (BCC) [2], которое, как правило, использует параметры ILD и ICC, в то время как оцениваются ITD и выполняется канальное совмещение в частотной области.

Хотя существуют модули оценки ITD во временной области, для оценки ITD обычно предпочтительно применять частотно-временное преобразование, которое обеспечивает спектральную фильтрацию взаимной корреляционной функции и также является вычислительно эффективным. По причинам сложности, желательно использовать одинаковые преобразования, которые также используются для извлечения стерео-/пространственных параметров и возможно для понижающего микширования каналов, что также достигается в подходе с BCC.

Тем не менее, это сопровождается недостатком: точная оценка стереопараметров в идеальном случае выполняется для совмещенных каналов. Но если каналы совмещаются в частотной области, например, посредством кругового сдвига в частотной области, это может вызывать смещение в окнах анализа, что может отрицательно влиять на оценки параметров. В случае BCC, это главным образом влияет на измерение ICC, причем увеличение смещений окна в конечном счете направляет значение ICC к нулю, даже если входные сигналы фактически являются полностью когерентными.

Таким образом, задача состоит в создании концепции для вычисления параметров в многоканальном кодировании аудио, которое допускает компенсацию межканальных разностей времен при недопущении отрицательных эффектов на оценки пространственных параметров.

Данная задача решается посредством объекта изобретения по независимым пунктам прилагаемой формулы изобретения.

Настоящая заявка основана на заключении о том, что в многоканальном кодировании аудио повышенная эффективность вычислений может достигаться посредством вычисления по меньшей мере одного параметра для сравнения для компенсации ITD между любыми двумя каналами в частотной области, которые должны использоваться посредством параметрического аудиокодера. Упомянутый по меньшей мере один параметр для сравнения может использоваться параметрическим кодером для смягчения вышеупомянутых отрицательных последствий для оценок пространственных параметров.

Вариант осуществления может содержать параметрический аудиокодер, который направлен на представление стерео- или в общем пространственного контента посредством по меньшей мере одного сигнала понижающего микширования и дополнительных стереопараметров или пространственных параметров. В числе этих стерео-/пространственных параметров могут быть предусмотрены ITD, которые могут оцениваться и компенсироваться в частотной области, до вычисления оставшихся стерео-/пространственных параметров. Эта процедура может смещать другие стерео-/пространственные параметры, что представляет собой проблему, которая в ином случае должна была бы решаться затратным способом путём повторного вычисления частотно-временного преобразования. В упомянутом варианте осуществления эта проблема может в достаточной степени смягчаться посредством применения вычислительно незатратной схемы коррекции, которая может использовать значение ITD и определенные данные базового преобразования.

Вариант осуществления относится к параметрическому аудиокодеру с потерями, который может быть основан на подходе на основе взвешенного среднего/бокового преобразования, может использовать стерео-/пространственные параметры IPD, ITD, а также два коэффициента усиления и может работать в частотной области. Другие варианты осуществления могут использовать другое преобразование и могут использовать другие пространственные параметры надлежащим образом.

В варианте осуществления, параметрический аудиокодер может быть способен как компенсировать, так и синтезировать ITD в частотной области. Он может содержать вычислительно эффективную схему коррекции усиления, которая смягчает отрицательные последствия вышеуказанного смещения окна. Также предлагается схема коррекции для кодера BCC.

Предпочтительные варианты реализации настоящей заявки являются предметом зависимых пунктов формулы изобретения. Предпочтительные варианты осуществления настоящей заявки описаны ниже с обращением к чертежам, на которых:

Фиг. 1 показывает блок-схему устройства сравнения для параметрического кодера согласно варианту осуществления настоящей заявки;

Фиг. 2 показывает блок-схему параметрического кодера согласно варианту осуществления настоящей заявки;

Фиг. 3 показывает блок-схему параметрического декодера согласно варианту осуществления настоящей заявки;

Фиг. 1 показывает устройство 100 сравнения для многоканального аудиосигнала. Как показано, оно может содержать ввод для аудиосигналов для пары стереоканалов, а именно, для сигнала l(τ) левого аудиоканала и сигнала r(τ) правого аудиоканала. Другие варианты осуществления, конечно, могут содержать множество каналов, чтобы захватывать пространственные свойства источников звука.

До преобразования аудиосигналов временной области l(τ), r(τ) в частотную область, одинаковые перекрывающиеся оконные функции 11, 21 w(τ) могут применяться к сигналам l(τ), r(τ) левого и правого входных каналов, соответственно. Кроме того, в вариантах осуществления, определенное значение дополнения нулями может добавляться, что обеспечивает сдвиги в частотной области. Затем прошедшие оконное преобразование аудиосигналы могут передаваться в соответствующие блоки 12, 22 дискретного преобразования Фурье (DFT), чтобы выполнять соответствующие частотно-временные преобразования. Они могут давать в результате частотно-временные элементы L_t,k и R_t,k разрешения, , в качестве преобразований частоты аудиосигналов для пары каналов.

Упомянутые преобразования L_t,k и R_t,k частоты могут передаваться в блок 20 обнаружения и компенсации ITD. Он может быть выполнен с возможностью извлечения параметра ITD для представления ITD между аудиосигналами для пары каналов, здесь ITD_t, с использованием преобразований L_t,k и R_t,k частоты аудиосигналов пары каналов в упомянутых окнах анализа w(τ). Другие варианты осуществления могут использовать другие подходы для извлечения параметра ITD, который также может определяться перед блоками DFT во временной области.

Извлечение параметра ITD для вычисления ITD может заключать в себе вычисление (возможно взвешенной) авто- или взаимной корреляционной функции. Традиционно, она может вычисляться из частотно-временных элементов L_t,k и R_t,k разрешения посредством применения обратного дискретного преобразования Фурье (IDFT) к члену .

Надлежащий способ компенсации измеренной ITD состоит в выполнении совмещения каналов во временной области и затем в применении вновь того же самого частотно-временного преобразования к сдвинутому каналу(ам) для получения частотно-временных элементов разрешения с компенсацией ITD. Однако для снижения сложности эта процедура может аппроксимироваться посредством выполнения кругового сдвига в частотной области. Соответственно, компенсация ITD может выполняться посредством блока 20 обнаружения и компенсации ITD в частотной области, например, посредством выполнения круговых сдвигов посредством блоков 13 и 23 кругового сдвига, соответственно, что дает в результате:

(1)

и:

(2),

где ITD_t может обозначать ITD для кадра t в выборках.

В варианте осуществления, это позволяет продвигать вперед отстающий канал и позволяет задерживать отстающий канал на ITD_t/2 выборок. Тем не менее, в другом варианте осуществления (если задержка является критичной), может быть преимущественным только продвигать вперед отстающий канал на ITD_t выборок, что не увеличивает задержку системы.

Как результат, блок 20 обнаружения и компенсации ITD может компенсировать ITD для пары каналов в частотной области посредством кругового сдвига(ов) с использованием параметра ITD ITD_t для формирования пары преобразований L_t,k,comp, R_t,k,comp частоты с компенсацией ITD на выходе. Кроме того, блок 20 обнаружения и компенсации ITD может выводить извлеченный параметр ITD, а именно, ITD_t, например, для передачи посредством параметрического кодера.

Как показано на фиг. 1, блок 30 вычисления параметров для сравнения и пространственных параметров может принимать параметр ITD ITD_t и пару преобразований L_t,k,comp, R_t,k,comp частоты с компенсацией ITD в качестве своих входных сигналов. Блок 30 вычисления параметров для сравнения и пространственных параметров может использовать часть или все свои входные сигналы для того, чтобы извлекать стерео-/пространственные параметры многоканального аудиосигнала, такие как межфазная разность IPD.

Кроме того, блок 30 вычисления параметров для сравнения и пространственных параметров может формировать (на основании параметра ITD ITD_t и пары преобразований L_t,k,comp, R_t,k,comp частоты с компенсацией ITD) по меньшей мере один параметр для сравнения, здесь два коэффициента g_t,b и r_t,b,corr усиления, для параметрического кодера. Другие варианты осуществления дополнительно или альтернативно могут использовать преобразования L_t,k, R_t,k частоты и/или пространственные/стереопараметры, извлеченные в блоке 30 вычисления параметров для сравнения и пространственных параметров, для того, чтобы формировать по меньшей мере один параметр для сравнения.

По меньшей мере, один параметр для сравнения может выступать в качестве части вычислительно эффективной схемы коррекции, чтобы смягчать отрицательные последствия вышеуказанного смещения в окнах анализа w(τ) для оценок пространственных/стереопараметров для параметрического кодера, причем упомянутое смещение вызывается посредством совмещения каналов посредством круговых сдвигов в области DFT в блоке 20 обнаружения и компенсации ITD. В варианте осуществления по меньшей мере один параметр для сравнения может вычисляться для восстановления аудиосигналов пары каналов в декодере, например, из сигнала понижающего микширования.

Фиг. 2 показывает вариант осуществления такого параметрического кодера 200 для стереоаудиосигналов, в котором устройство 100 сравнения по фиг. 1 может использоваться для получения параметра ITD ITD_t, пары преобразований L_t,k,comp, R_t,k,comp частоты с компенсацией ITD и параметров и g_t,b для сравнения.

Параметрический кодер 200 может формировать сигнал DMX_t,k понижающего микширования в блоке 40 понижающего микширования для сигналов l(τ), r(τ) левого и правого входных каналов с использованием преобразований L_t,k,comp, R_t,k,comp частоты с компенсацией ITD в качестве ввода. Другие варианты осуществления дополнительно или альтернативно могут использовать преобразования L_t,k, R_t,k частоты для того, чтобы формировать сигнал DMX_t,k понижающего микширования.

Параметрический кодер 200 может вычислять стереопараметры (такие как, например, IPD) на основе кадров в блоке 30 вычисления параметров для сравнения и пространственных параметров. Другие варианты осуществления могут определять другие или дополнительные стерео-/пространственные параметры. Процедура кодирования варианта осуществления параметрического кодера 200 на фиг. 2 может примерно выполнять следующие этапы, которые подробно описываются ниже.

1. Частотно-временное преобразование входных сигналов с использованием прошедших оконное преобразование DFT

в блоках 11, 12, 21, 22 оконного преобразования и обработки DFT

2. Оценка и компенсация ITD в частотной области

в блоке 20 обнаружения и компенсации ITD

3. Извлечение стереопараметров и вычисление параметров для сравнения

в блоке 30 вычисления параметров для сравнения и пространственных параметров

4. Понижающее микширование

в блоке 40 понижающего микширования

5. Частотно-временное преобразование с последующим оконным преобразованием и суммированием с перекрытием

в блоке 50 IDFT

Вариант осуществления параметрического аудиокодера 200 на фиг. 2 может быть основан на взвешенном среднем/боковом преобразовании входных каналов в частотной области с использованием преобразований L_t,k,comp, R_t,k,comp частоты с компенсацией ITD, а также ITD в качестве ввода. Оно позволяет дополнительно вычислять стерео-/пространственные параметры, такие как IPD, а также два коэффициента усиления, захватывающие стереоизображение. Оно позволяет смягчать отрицательные последствия вышеуказанного смещения окна.

Для извлечения пространственных параметров в блоке 30 вычисления параметров для сравнения и пространственных параметров, частотно-временные элементы L_t,k,comp и R_t,k,comp разрешения с компенсацией ITD могут группироваться на подполосы частот, и для каждой подполосы частот могут вычисляться межфазная разность IPD и два коэффициента усиления. Пусть I_b обозначает индексы частотных элементов разрешения в подполосе b частот. В таком случае, IPD может вычисляться следующим образом:

(3).

Два вышеуказанных коэффициента усиления могут быть связаны с компенсированными по фазе средними/боковыми преобразованиями для каждой полосы частот пары преобразований L_t,k,comp и R_t,k,comp частоты с компенсацией ITD, заданных посредством уравнений (4) и (5) следующим образом:

(4)

и:

(5)

для .

Первый коэффициент g_t,b усиления из упомянутых коэффициентов усиления может рассматриваться в качестве оптимального усиления для прогнозирования для прогнозирования для каждой полосы частот преобразования St боковых сигналов из преобразования Mt средних сигналов в уравнении (6):

(6)

таким образом, что энергия остатка прогнозирования в уравнении (6), задаваемая посредством уравнения (7) следующим образом:

, (7)

является минимальной. Этот первый коэффициент g_t,b усиления может упоминаться как боковое усиление.

Второй коэффициент r_t,b усиления описывает отношение энергии остатка прогнозирования к энергии преобразования M_t,k средних сигналов, заданной посредством уравнения (8) следующим образом:

, (8)

и может упоминаться как остаточное усиление. Остаточное усиление r_t,b может использоваться в декодере, например, в варианте осуществления декодера на фиг. 3, для формирования подходящей замены для остатка прогнозирования.

В варианте осуществления кодера, показанном на фиг. 2, оба коэффициента g_t,b и r_t,b усиления могут вычисляться в качестве параметров для сравнения в блоке 30 вычисления параметров для сравнения и пространственных параметров с использованием энергий и преобразований L_t,k,comp и R_t,k,comp частоты с компенсацией ITD, заданных в уравнениях (9) следующим образом:

(9)

и абсолютного значения их внутреннего произведения:

, (10)

заданного в уравнении (10).

На основе упомянутых энергий и вместе с внутренним произведением , коэффициент g_t,b бокового усиления может вычисляться с использованием уравнения (11) следующим образом:

(11).

Кроме того, коэффициент r_t,b остаточного усиления может вычисляться на основе упомянутых энергий и вместе с внутренним произведением и коэффициента g_t,b бокового усиления с использованием уравнения (12) следующим образом:

(12).

В других вариантах осуществления, другие подходы и/или уравнения могут использоваться для того, чтобы вычислять коэффициент g_t,b бокового усиления и коэффициент r_t,b остаточного усиления и/или другие параметры для сравнения надлежащим образом.

Как упомянуто выше, компенсация ITD в частотной области, как правило, снижает сложность, но без дополнительных мер это сопровождается недостатком. В идеальном случае, для чистой безэховой речи, записанной с помощью AB-компоновки микрофонов, сигнал l(τ) левого канала фактически представляет собой задержанную (посредством задержки d) и масштабированную (посредством усиления c) версию сигнала r(τ) правого канала. Эта ситуация может выражаться посредством следующего уравнения (13), в котором:

(13).

После надлежащей компенсации ITD не прошедших оконное преобразование входных канальных аудиосигналов l(τ) и r(τ), оценка для коэффициента g_t,b бокового усиления должна задаваться в уравнении (14) следующим образом:

(14)

с исчезающим коэффициентом r_t,b остаточного усиления, заданным следующим образом:

(15).

Тем не менее, если канальное совмещение выполняется в частотной области, аналогично варианту осуществления на фиг. 2, посредством блока 20 обнаружения и компенсации ITD с использованием блоков 13 и 23 кругового сдвига, соответственно, надлежащие окна анализа w(τ) DFT также сдвигаются по кругу. Таким образом, после компенсации ITD в частотной области, преобразование частоты R_t,k,comp с компенсацией ITD для правого канала может определяться в форме частотно-временных элементов разрешения посредством DFT:

(16),

тогда как преобразование L_t,k,comp частоты с компенсацией ITD для левого канала может определяться в форме частотно-временных элементов разрешения в качестве DFT:

(17),

где w является окном анализа DFT.

Обнаружено, что такое канальное совмещение в частотной области главным образом влияет на коэффициент r_t,b остаточного усиления прогнозирования, который растет с увеличением ITD_t. Без дополнительных мер, канальное совмещение в частотной области в силу этого должно добавлять дополнительное объемное окружение в выходной аудиосигнал в декодере, как показано на фиг. 3. Это дополнительное объемное окружение является нежелательным, в частности, когда аудиосигнал, который должен кодироваться, содержит чистую речь, поскольку искусственное объемное окружение ухудшает понятность речи.

Следовательно, вышеописанное последствие может смягчаться посредством коррекции коэффициента r_t,b остаточного усиления (прогнозирования) при наличии ненулевых ITD с использованием дополнительного параметра для сравнения.

В варианте осуществления, это может осуществляться посредством вычисления смещения усиления для остаточного усиления r_t,b, которое направлено на согласование с ожидаемым остаточным сигналом e(τ), когда сигнал является когерентным и временно плоским. В этом случае, предполагается глобальное усиление для прогнозирования, заданное посредством уравнения (18) следующим образом:

(18)

и исчезающая глобальная , заданная посредством . Следовательно, ожидаемый остаточный сигнал e(τ) может определяться с использованием уравнения (19) следующим образом:

(19).

В варианте осуществления, дополнительный параметр для сравнения, помимо коэффициента g_t,b бокового усиления и коэффициента r_t,b остаточного усиления, может вычисляться на основе ожидаемого остаточного сигнала e(τ) в блоке 30 вычисления параметров для сравнения и пространственных параметров с использованием параметра ITD ITD_t и функции, равной или аппроксимирующей автокорреляционную функцию для окна анализа w, заданной в уравнении (20) следующим образом:

(20).

Если M_r обозначает кратковременное среднее значение , энергия ожидаемого остаточного сигнала e(τ) может приблизительно вычисляться посредством уравнения (21) следующим образом:

(21).

С прошедшим оконное преобразование средним сигналом, заданным посредством уравнения (22) следующим образом:

(22),

энергия этого прошедшего оконное преобразование среднего сигнала может аппроксимироваться посредством уравнения (23) следующим образом:

(23).

В варианте осуществления, вышеуказанная функция, используемая при вычислении параметра для сравнения в блоке 30 вычисления параметров для сравнения и пространственных параметров, равна или аппроксимирует нормализованную версию автокорреляционной функции для окна анализа, заданную в уравнении (23a) следующим образом:

(23a).

На основе этой нормализованной автокорреляционной функции , упомянутый дополнительный параметр для сравнения может вычисляться с использованием уравнения (24) следующим образом:

(24)

для получения оцененного параметра коррекции для остаточного усиления r_t,b. В варианте осуществления, параметр для сравнения может использоваться в качестве оценки для локальных остаточных усилений r_t,b в подполосах b частот. В другом варианте осуществления, коррекция остаточных усилений r_t,b может затрагиваться посредством использования параметра для сравнения в качестве смещения. Иными словами, значения остаточного усиления r_t,b могут заменяться посредством скорректированного остаточного усиления r_t,b,corr, заданного в уравнении (25) следующим образом:

(25).

Таким образом, в варианте осуществления, дополнительный параметр для сравнения, вычисленный в блоке 30 вычисления параметров для сравнения и пространственных параметров, может содержать скорректированное остаточное усиление r_t,b,corr, которое соответствует остаточному усилению r_t,b, скорректированному посредством параметра коррекции остаточного усиления, заданного в уравнении (24) в форме смещения, заданного в уравнении (25).

Следовательно, дополнительный вариант осуществления относится к параметрическому кодированию аудио с использованием прошедшего оконное преобразование DFT и [поднабора] параметров IPD согласно уравнению (3), бокового усиления g_t,b согласно уравнению (11), остаточного усиления r_t,b согласно уравнению (12) и ITD, при этом остаточное усиление r_t,b регулируется согласно уравнению (25).

При эмпирической оценке, оценки остаточного усиления могут тестироваться с различными вариантами выбора для правого канального аудиосигнала r(τ) в уравнении (13). Для входных сигналов r(τ) белого шума, которые удовлетворяют предположению по временной равномерности, оценки остаточного усиления являются достаточно близкими к среднему остаточных усилений r_t,b, измеренных в подполосах частот, как показано на нижеприведенной таблице 1.

ITD\c	1	2	4	8	16	32
мс	0,0893	0,0793	0,0569	0,0351	0,0196	0,0104
	(0,0885)	(0,0785)	(0,0565)	(0,0349)	(0,0195)	(0,0104)
мс	0,1650	0,1460	0,1045	0,0640	0,0357	0,0189
	(0,1631)	(0,1458)	(0,1039)	(0,0640)	(0,0357)	(0,0189)
мс	0,2348	0,2073	0,1472	0,0896	0,0498	0,0263
	(0,2327)	(0,2062)	(0,1473)	(0,0904)	(0,0504)	(0,0267)
мс	0,3005	0,2644	0,1862	0,1125	0,0621	0,0327
	(0,2992)	(0,2627)	(0,1885)	(0,1151)	(0,0641)	(0,0339)

Таблица 1. Среднее измеренных остаточных усилений r_t,b для панорамированного белого шума с ITD и оценками остаточного усиления (указаны в скобках).

Для речевых сигналов r(τ), часто нарушается предположение временной равномерности, что типично увеличивает среднее остаточных усилений r_t,b (см. нижеприведенную таблицу 2 в сравнении с вышеприведенной таблицей 1). Способ регулирования остаточного усиления или коррекции согласно уравнению (25) в силу этого может считаться достаточно консервативным. Тем не менее, он по-прежнему позволяет удалять большую часть нежелательного объемного окружения для записей чистой речи.

ITD\c	1	2	4
мс	0,1055	0,1022	0,0874
	(0,0885)	(0,0785)	(0,0565)
мс	0,1782	0,1634	0,1283
	(0,1631)	(0,1458)	(0,1039)
мс	0,2435	0,2191	0,1657
	(0,2327)	(0,2062)	(0,1473)
мс	0,3050	0,2720	0,2014
	(0,2992)	(0,2627)	(0,1885)

Таблица 2. Среднее измеренных остаточных усилений r_t,b для панорамированной моноречи с ITD и оценками остаточного усиления (указаны в скобках).

Нормализованная автокорреляционная функция , заданная в уравнении (23a), может считаться независимой от индекса t кадра в случае, если используется одно окно анализа w. Кроме того, нормализованная автокорреляционная функция может считаться варьирующейся очень медленно для типичных окон анализа w. Следовательно, может интерполироваться точно из небольшой таблицы значений, что обеспечивает высокую эффективность этой схемы коррекции с точки зрения сложности.

Таким образом, в вариантах осуществления, функция для определения оценок остаточного усиления или смещения коррекции остаточного усиления в качестве параметра для сравнения в блоке 30, может получаться посредством интерполяции нормализованной версии автокорреляционной функции для окна анализа, сохраненного в таблице поиска. В другом варианте осуществления, другие подходы для интерполяции нормализованной автокорреляционной функции могут использоваться надлежащим образом.

Для BCC, как описано в [2], аналогичная проблема может возникать при оценке межканальной когерентности ICC в подполосах частот. В варианте осуществления, соответствующая может оцениваться посредством уравнения (26) с использованием энергий и уравнения (9) и внутреннего произведения уравнения (10) следующим образом:

(26).

По определению, ICC измеряется после компенсации ITD. Тем не менее, несовпадающие оконные функции w могут смещать ICC-измерение. В вышеуказанной настройке чистой безэховой речи, описанной посредством уравнения (13), ICC должна быть равна 1 при вычислении для надлежащим образом совмещенных входных каналов.

Тем не менее, смещение, вызываемое посредством вращения окон анализа w(τ) в частотной области при компенсации ITD ITD_t в частотной области посредством кругового сдвига(ов), может смещать измерение ICC к , заданной в уравнении (27) следующим образом:

(27).

В варианте осуществления, смещение ICC может корректироваться аналогично по сравнению с коррекцией остаточного усиления r_t,b в уравнении (25), а именно, посредством проведения замены, заданной в уравнении (28) следующим образом:

(28).

Таким образом, дополнительный вариант осуществления относится к параметрическому кодированию аудио с использованием прошедшего оконное преобразование DFT и [поднабора] параметров IPD согласно уравнению (3), ILD, ICC согласно уравнению (26) и ITD, при этом ICC регулируется согласно уравнению (28).

В варианте осуществления параметрического кодера 200, показанного на фиг. 2, блок 40 понижающего микширования может уменьшать число каналов многоканальной, здесь стерео-, системы посредством вычисления сигнала DMX_t,k понижающего микширования, заданного посредством уравнения (29) в частотной области. В варианте осуществления, сигнал DMX_t,k понижающего микширования может вычисляться с использованием преобразований L_t,k,comp и R_t,k,comp частоты с компенсацией ITD согласно следующему:

(29).

В уравнении (29), β может представлять собой параметр регулирования реальной абсолютной фазы, вычисленный из стерео-/пространственных параметров. В других вариантах осуществления, схема кодирования, как показано на фиг. 2, также может работать с любым другим способом понижающего микширования. Другие варианты осуществления могут использовать преобразования L_t,k и R_t,k частоты и необязательно дополнительные параметры для того, чтобы определять сигнал DMX_t,k понижающего микширования.

В варианте осуществления кодера по фиг. 2, блок 50 обратного дискретного преобразования Фурье (IDFT) может принимать сигнал DMX_t,k понижающего микширования в частотной области из блока 40 понижающего микширования. блок 50 IDFT может преобразовывать частотно-временные элементы DMX_t,k разрешения для понижающего микширования, , из частотной области во временную область, что дает в результате сигнал dmx(τ) понижающего микширования во временной области. В вариантах осуществления, синтезирующая оконная функция ws(τ) может применяться и суммироваться с сигналом dmx(τ) понижающего микширования во временной области.

Кроме того, аналогично варианту осуществления на фиг. 2, базовый кодер 60 может принимать сигнал dmx(τ) понижающего микширования в области, чтобы кодировать одноканальный аудиосигнал согласно MPEG-4, часть 3 [1] или любому другому подходящему алгоритму кодирования аудио надлежащим образом. В варианте осуществления по фиг. 2, подвергнутый базовому кодированию сигнал dmx(τ) понижающего микширования во временной области может комбинироваться с параметром ITD ITD_t, боковым усилением g_t,b и скорректированным остаточным усилением r_t,b,corr, надлежащим образом обработанными и/или дополнительно кодированными для передачи в декодер.

Фиг. 3. показывает вариант осуществления многоканального декодера. Декодер может принимать комбинированный сигнал, содержащий входной сигнал dmx(τ) моно/понижающего микширования во временной области и параметры для сравнения и/или пространственные параметры в качестве вспомогательной информации на основе кадров. Декодер, как показано на фиг. 3, может выполнять следующие этапы, которые подробно описываются ниже.

1. Частотно-временное преобразование ввода с использованием прошедших оконное преобразование DFT

в блоке 80 DFT

2. Прогнозирование отсутствующего остатка в частотной области

в блоке 90 повышающего микширования и пространственного восстановления

3. Повышающее микширование в частотной области

в блоке 90 повышающего микширования и пространственного восстановления

4. Синтез ITD в частотной области

в блоке 100 синтеза ITD

5. Преобразование из частотной во временную область, оконное преобразование и суммирование с перекрытием

в блоках 112, 122 IDFT и блоках 111, 121 оконного преобразования

Частотно-временное преобразование входного сигнала dmx(τ) моно/понижающего микширования может выполняться аналогично входным аудиосигналам кодера на фиг. 2. В конкретных вариантах осуществления, подходящее значение дополнения нулями может добавляться для восстановления ITD в частотной области. Эта процедура может давать в результате преобразование частоты сигнала понижающего микширования в форме частотно-временных элементов DMX_t,k разрешения, .

Чтобы восстанавливать пространственные свойства сигнала DMX_t,k понижающего микширования, может требоваться второй сигнал, независимый от передаваемого сигнала DMX_t,k понижающего микширования. Этот сигнал, например, может (ре)конструироваться в блоке 90 повышающего микширования и пространственного восстановления с использованием скорректированного остаточного усиления r_t,b,corr в качестве параметра для сравнения (передаваемого посредством кодера, такого как кодер на фиг. 2) и частотно-временных элементов разрешения с временной задержкой сигнала DMX_t,k понижающего микширования, заданных в уравнении (30):

(30)

для .

В других вариантах осуществления, другие подходы и уравнения могут использоваться для того, чтобы восстанавливать пространственные свойства сигнала DMX_t,k понижающего микширования на основе передаваемого по меньшей мере одного параметра для сравнения.

Кроме того, блок 90 повышающего микширования и пространственного восстановления может выполнять повышающее микширование посредством применения инверсии к среднему/боковому преобразованию в кодере с использованием сигнала DMX_t,k понижающего микширования и бокового усиления g_t,b, передаваемых посредством кодера, а также восстановленного остаточного сигнала . Это может давать в результате декодированные преобразования и частоты с компенсацией ITD, заданные посредством уравнений (31) и (32) следующим образом:

(31)

и:

(32)

для , где β является параметром абсолютного вращения фаз, равным параметру в процедуре понижающего микширования в уравнении (29)

Кроме того, как показано на фиг. 3, декодированные преобразования и частоты с компенсацией ITD могут приниматься посредством блока 100 синтеза/декомпенсации ITD. Он может применять параметр ITD ITD_t в частотной области посредством вращения и , как задано в уравнениях (33) и (34), что дает в результате декодированные преобразования и частоты с декомпенсацией ITD:

(33)

и:

(34).

На фиг. 3, преобразование из частотной во временную область декодированных преобразований частоты с декомпенсацией ITD в форме частотно-временных элементов и разрешения, , может выполняться посредством блоков 112 и 122 IDFT, соответственно. Результирующие сигналы временной области затем могут подвергаться оконному преобразованию посредством блоков 111 и 121 оконного преобразования, соответственно, и суммироваться с восстановленными выходными аудиосигналами и временной области левого и правого аудиоканала.

Вышеописанные варианты осуществления являются просто иллюстративными в отношении принципов настоящего изобретения. Следует понимать, что модификации и изменения компоновок и подробностей, описанных в данном документе, должны быть очевидными для специалистов в данной области техники. Следовательно, они подразумеваются как ограниченные только посредством объема нижеприведенной формулы изобретения, а не посредством конкретных подробностей, представленных посредством описания и пояснения вариантов осуществления в данном документе.

Библиографический список

[1] MPEG-4 High Efficiency Advanced Audio Coding (HE-AAC) v2.

[2] Jürgen Herre "FROM JOINT STEREO TO SPATIAL AUDIO CODING – RECENT PROGRESS AND STANDARDIZATION", Proc. of the 7th Int. Conference on digital Audio Effects (DAFX-04), Неаполь, Италия, 5-8 октября 2004 года.

[3] Christoph Tourney и Christof Faller "Improved Time Delay Analysis/Synthesis for Parametric Stereo Audio Coding", AES Convention Paper 6753, 2006 год.

[4] Christof Faller и Frank Baumgarte "Binaural Cue Coding Part II: Schemes and Applications", IEEE Transactions on Speech and Audio Processing, издание 11, номер 6, ноябрь 2003 года.

Источник поступления информации: Роспатент

‹ › ×

Авторы
Правообладатели

Показаны записи 81-90 из 331.

26.08.2017

№217.015.e0e0

Принцип для компенсации переключения режима кодирования

Изобретение относится к средствам для компенсации переключения режима кодирования. Технический результат заключается в повышении качества аудио при переключении между разными режимами кодирования с разными полосами пропускания, за счет сглаживания и/или смешивания звука при соответствующем...

Тип: Изобретение

Номер охранного документа: 0002625561

Дата охранного документа: 14.07.2017

Показать авторов и правообладателей

26.08.2017

№217.015.e100

Устройство и способ кодирования или декодирования аудиосигнала с использованием перекрытия, зависящего от местоположения перехода

Изобретение относится к обработке аудиосигналов и предназначено для кодирования или декодирования аудиосигналов при наличии переходов. Технический результат - предоставление усовершенствованного аудиокодирования/декодирования, обеспечивающего повышение производительности устройства. Устройство...

Тип: Изобретение

Номер охранного документа: 0002625560

Дата охранного документа: 14.07.2017

Показать авторов и правообладателей

26.08.2017

№217.015.e286

Посегментная настройка пространственного аудиосигнала к другой установке громкоговорителя для воспроизведения

Изобретение относится к средствам посегментной настройки пространственного аудиосигнала к другой установке громкоговорителей для воспроизведения. Технический результат заключается в сохранении пространственного образа аудиосцены при перенастройке аудиосигнала к другой установке...

Тип: Изобретение

Номер охранного документа: 0002625953

Дата охранного документа: 19.07.2017

Показать авторов и правообладателей

26.08.2017

№217.015.e2ab

Кодер, декодер и способы для зависимого от сигнала преобразования масштаба при пространственном кодировании аудиообъектов

Изобретение относится к средствам для пространственного кодирования аудиообъектов. Технический результат заключается в повышении качества кодированного аудиосигнала. Декодер для формирования выходного аудиосигнала, содержащего один или более каналов вывода аудио, из сигнала понижающего...

Тип: Изобретение

Номер охранного документа: 0002625939

Дата охранного документа: 19.07.2017

Показать авторов и правообладателей

26.08.2017

№217.015.e2ad

Устройство и способ для генерирования сигнала с улучшенным спектром, используя операцию ограничения энергии

Изобретение относится к средствам для генерирования сигнала с использованием операции ограничения энергии. Технический результат заключается в повышении качества фрикативных звуков в аудиосигнале. Устройство для генерирования сигнала с улучшенным спектром содержит: генератор сигнала для...

Тип: Изобретение

Номер охранного документа: 0002625945

Дата охранного документа: 19.07.2017

Показать авторов и правообладателей

26.08.2017

№217.015.e33a

Устройство для обеспечения аудиосигнала для воспроизведения преобразователем звука, система, способ (варианты) и компьютерная программа

Изобретение относится к акустике. Устройство для обработки аудиосигнала для воспроизведения преобразователем звука содержит блок определения параметров эквализации для определения набора параметров эквализации и эквалайзер, выполненный с возможностью эквализации входного аудиосигнала, для...

Тип: Изобретение

Номер охранного документа: 0002626037

Дата охранного документа: 21.07.2017

Показать авторов и правообладателей

26.08.2017

№217.015.e5bc

Устройство и способ формирования кодированного сигнала или декодирования кодированного аудиосигнала с использованием участка с множественным перекрытием

Изобретение относится к обработке аудиосигналов или сигналов изображения, в частности к кодированию или декодированию аудиосигналов или сигналов изображения при наличии переходов. Технический результат – предоставление усовершенствованной концепции аудиокодирования/декодирования, которая...

Тип: Изобретение

Номер охранного документа: 0002626666

Дата охранного документа: 31.07.2017

Показать авторов и правообладателей

26.08.2017

№217.015.e6d0

Устройство и способ для улучшения воспринимаемого качества воспроизведения звука путем объединения активного шумоподавления и компенсации воспринимаемого шума

Изобретение относится к обработке аудиосигнала и, в частности, к устройству и способу для улучшения воспринимаемого качества воспроизведения звука путем объединения активного шумоподавления и компенсации воспринимаемого шума, например, путем улучшения воспринимаемого качества воспроизведения...

Тип: Изобретение

Номер охранного документа: 0002626987

Дата охранного документа: 02.08.2017

Показать авторов и правообладателей

26.08.2017

№217.015.e7a3

Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в создании усовершенствованной концепции кодирования/декодирования аудиоданных, позволяющей уменьшить скорость передачи дополнительной информации для схемы направленного...

Тип: Изобретение

Номер охранного документа: 0002627102

Дата охранного документа: 03.08.2017

Показать авторов и правообладателей

26.08.2017

№217.015.ea16

Декодер и способ параметрической концепции обобщенного пространственного кодирования аудиообъектов для случаев многоканального понижающего микширования/повышающего микширования

Изобретение относится к средствам для пространственного кодирования аудиообъектов. Технический результат заключается в повышении качества кодирования аудиообъектов. Декодер для генерирования выходного аудиосигнала содержит один или более выходных аудиоканалов, из микшированного с понижением...

Тип: Изобретение

Номер охранного документа: 0002628195

Дата охранного документа: 15.08.2017

Показать авторов и правообладателей

Показаны записи 11-14 из 14.

12.04.2023

№223.018.44f7

Устройство, способ или компьютерная программа для оценки разности во времени между каналами

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в повышении точности оценки разности во времени между каналами между двумя сигналами каналов. Технический результат достигается за счет выполнения оценки характеристики сигнала...

Тип: Изобретение

Номер охранного документа: 0002762302

Дата охранного документа: 17.12.2021

Показать авторов и правообладателей

20.04.2023

№223.018.4dc2

Многорежимное канальное кодирование

Изобретение относится к канальному кодированию. Технический результат заключается в повышении скорости передачи данных и повышении надежности передачи режима кодирования. Технический результат достигается за счет того, что канальный декодер определяет режим декодирования без отдельного приема...

Тип: Изобретение

Номер охранного документа: 0002793198

Дата охранного документа: 29.03.2023

Показать авторов и правообладателей

12.05.2023

№223.018.546b

Декодер и способ декодирования для маскировки lc3, включающий в себя маскировку полных потерь кадров и маскировку частичных потерь кадров

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в повышении точности маскировки ошибок при обработке аудиоданных. Технический результат достигается за счет декодирования текущего кадра для восстановления аудиосигнала, при этом...

Тип: Изобретение

Номер охранного документа: 0002795500

Дата охранного документа: 04.05.2023

Показать авторов и правообладателей

17.06.2023

№223.018.8089

Кодер, многосигнальный декодер и соответствующие способы с использованием отбеливания сигналов или постобработки сигналов

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в повышении точности многосигнального кодирования или декодирования. Технический результат достигается за счет вычисления информации о средней энергии предварительно обработанных...

Тип: Изобретение

Номер охранного документа: 0002769788

Дата охранного документа: 06.04.2022

Показать авторов и правообладателей