26.08.2017

№217.015.d64c

Результат интеллектуальной деятельности: УСТРОЙСТВО И СПОСОБ ДЛЯ ОБРАБОТКИ КОДИРОВАННОГО СИГНАЛА И КОДЕР И СПОСОБ ДЛЯ ГЕНЕРИРОВАНИЯ КОДИРОВАННОГО СИГНАЛА

Вид РИД

Изобретение

Юридическая информация Юридическая информация Свернуть Развернуть

Авторы

Правообладатели

ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)

№ охранного документа

0002622860

Дата охранного документа

20.06.2017

Краткое описание РИД Краткое описание РИД Свернуть Развернуть

Аннотация: Изобретение относится к средствам кодирования и декодирования аудиосигнала. Технический результат заключается в повышении качества кодированного аудиосигнала. Кодированный сигнал содержит кодированный сигнал аудио, имеющий информацию относительно задержки тона или усиления тона, и параметр управления постфильтром низких звуковых частот, содержащий: декодер сигнала аудио для декодирования кодированного сигнала аудио, используя информацию относительно задержки тона или усиления тона, чтобы получить декодированный сигнал аудио; управляемый постфильтр низких звуковых частот для фильтрации декодированного сигнала аудио, чтобы получить обработанный сигнал, при этом управляемый постфильтр низких звуковых частот имеет переменную характеристику постфильтра низких звуковых частот, управляемую параметром управления постфильтром низких звуковых частот; и контроллер для установки переменной характеристики постфильтра низких звуковых частот в соответствии с параметром управления постфильтром низких звуковых частот, включенным в кодированный сигнал. 6 н. и 12 з.п. ф-лы, 13 ил.

Реферат Реферат Свернуть Развернуть

Настоящее изобретение относится к обработке сигнала аудио и, в частности, к обработке сигнала аудио в контексте кодирования речи, используя адаптивные постфильтры низких звуковых частот.

Постфильтр низких звуковых частот является постобработкой декодированного сигнала, используемого в некоторых речевых кодерах. Постобработка иллюстрируется на фиг. 11 и является эквивалентной вычитанию из декодированного сигнала (n) долгосрочной ошибки предсказания, которая масштабируется и затем подвергается низкочастотной фильтрации. Функция передачи фильтра долгосрочного предсказания задается посредством:

где T является задержкой, которая обычно соответствует элементу речи или основному периоду псевдостационарного декодированного сигнала. Задержка T обычно выводится из декодированного сигнала или из информации, содержащейся непосредственно в потоке битов. Она обычно является параметром задержки долгосрочного предсказания, уже используемым для декодирования сигнала. Она может также быть вычислена в отношении декодированного сигнала посредством выполнения анализа с долгосрочным предсказанием. Постфильтрованный декодированный сигнал затем равен:

где α является мультипликативным коэффициентом усиления, соответствующим коэффициенту ослабления анти-гармонических компонентов, и h_LP(n) является импульсным откликом низкочастотного фильтра. Что касается задержки T, коэффициент усиления может поступить непосредственно из потока битов или вычислен из декодированного сигнала.

Постфильтр низких звуковых частот был разработан для того, чтобы повысить качество чистой речи, но может создать неожиданные артефакты, которые могут испортить опыт прослушивания, особенно когда антигармонические компоненты являются полезными компонентами в первоначальном сигнале, как это может иметь место для музыки или зашумленной речи. Одно решение этой проблемы может быть найдено в [3], где постфильтр может быть обойден благодаря решению, определенному или на стороне декодера или на стороне кодера. В последнем случае решение должно быть передано в потоке битов, как это изображено на фиг. 12.

В частности, фиг. 11 и 12 иллюстрируют декодер 1100 для декодирования сигнала аудио, кодированного в потоке битов, чтобы получить декодированный сигнал. Декодированный сигнал подвергают задержке в каскаде 1102 задержки и отправляют в вычитатель 1112. Кроме того, декодированный аудио сигнал вводят в фильтр долгосрочного предсказания, обозначенный посредством P_LT(z). Выходной сигнал фильтра 1104 вводят в каскад 1108 усиления, и выходной сигнал каскада 1108 усиления вводят в низкочастотный фильтр 1106. Фильтром 1104 долгосрочного предсказания управляют посредством задержки T и каскад 1108 усиления управляется коэффициентом усиления α. Задержка T является задержкой тона и усиление α является усилением тона. Оба значения декодируются/извлекаются блоком 1110. Как правило, усиление тона и задержка тона дополнительно используются декодером 1100, чтобы генерировать декодированный сигнал, такой как декодированный речевой сигнал.

Фиг. 12 дополнительно имеет блок 1200 принятия решения в декодере и коммутатор 1202, чтобы или использовать постфильтр низких звуковых частот или нет. Постфильтр низких звуковых частот в целом обозначен позицией 1114 на фиг. 11 и фиг. 12.

Было найдено, что управление постфильтром низких звуковых частот посредством информации тона, такой как усиление тона и задержка тона или полная деактивация постфильтра низких звуковых частот не являются оптимальными решениями. Вместо этого постфильтр низких звуковых частот может повысить качество аудио, особенно если постфильтр низких звуковых частот корректно установлен. С другой стороны, постфильтр низких звуковых частот может серьезно ухудшить качество аудио, когда постфильтром низких звуковых частот не управляют, чтобы иметь оптимальную характеристику постфильтра низких звуковых частот.

Поэтому задачей настоящего изобретения является обеспечить концепцию кодирования, имеющую улучшенное качество аудио.

Эта задача решается устройством для обработки кодированного сигнала аудио по п. 1, кодером для генерирования кодированного сигнала по п. 11, способом обработки кодированного сигнала аудио по п. 18, способа генерирования кодированного сигнала по п. 19, компьютерной программой по п. 20 или кодированного сигнала аудио по п. 21.

Оптимальное управление постфильтром низких звуковых частот обеспечивает существенное повышение качества аудио по сравнению с простым возбуждаемым информацией тона управлением постфильтром низких звуковых частот или по сравнению с только активированием/деактивированием постфильтра низких звуковых частот. Для этого параметр управления постфильтром низких звуковых частот генерируется на стороне кодера, обычно используя закодированный и снова декодированный сигнал и первоначальный сигнал в кодере, и этот параметр управления постфильтром низких звуковых частот передается к стороне декодера. В устройстве на стороне декодера для обработки кодированного сигнала декодер сигнала аудио конфигурируется для декодирования кодированного сигнала аудио, используя задержку тона или усиления тона, чтобы получить декодированный сигнал аудио. Кроме того, предоставлен управляемый постфильтр низких звуковых частот для фильтрации декодированного сигнала аудио, чтобы получить обработанный сигнал, где этот управляемый постфильтр низких звуковых частот имеет управляемую характеристику постфильтра низких звуковых частот, управляемую посредством параметра управления постфильтром низких звуковых частот. Кроме того, предоставлен контроллер для установки переменной характеристики постфильтра низких звуковых частот в соответствии с параметром управления постфильтром низких звуковых частот, включенным в кодированный сигнал в дополнение к задержке тона или усилению тона, включенным в кодированный сигнал аудио.

Таким образом, постфильтр низких звуковых частот является фильтром, применяемым на выходе некоторых речевых декодеров, и стремится ослабить антигармонический шум, введенный кодированием речи с потерями. В варианте осуществления оптимальный коэффициент ослабления антигармонических компонентов вычисляют посредством модуля оценки минимальной среднеквадратической ошибки (MMSE). Предпочтительно, квадратичная ошибка между первоначальным сигналом и постфильтрованным декодированным сигналом является функцией стоимости, которая должна быть минимизирована. Этот полученный таким образом оптимальный коэффициент вычисляют на стороне кодера до квантования и передачи к декодеру. Кроме того или альтернативно, также возможно оптимизировать на стороне кодера другие параметры постфильтрации низких звуковых частот, то есть задержку T тона и характеристику фильтра. Предпочтительно, характеристика фильтра является характеристикой низкочастотного фильтра, но настоящее изобретение не ограничено только фильтрам, имеющим низкочастотную характеристику. Вместо этого другие характеристики фильтра могут быть характеристикой универсального фильтра, характеристикой полосового фильтра или характеристикой фильтра верхних частот. Индекс лучшего фильтра затем передается к декодеру.

В других вариантах осуществления многомерная оптимизация выполняется посредством оптимизации одновременно комбинации из двух или трех параметров из параметров усиления/ослабления, параметра задержки или параметра характеристики фильтра.

Предпочтительные варианты осуществления ниже описаны в контексте приложенных чертежей и дополнительно описаны в зависимых пунктах формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг. 1 иллюстрирует вариант осуществления устройства для обработки кодированного сигнала аудио;

Фиг. 2 иллюстрирует другой вариант осуществления устройства для обработки кодированного сигнала;

Фиг. 3 иллюстрирует другое устройство для обработки кодированного сигнала аудио, работающее в спектральной области;

Фиг. 4 иллюстрирует схематическое представление управляемого постфильтра низких звуковых частот согласно Фиг. 1;

Фиг. 5 иллюстрирует операции, выполняемые контроллером согласно Фиг. 1;

Фиг. 6 иллюстрирует кодер для генерирования кодированного сигнала в варианте осуществления;

Фиг. 7A иллюстрирует другой вариант осуществления кодера;

Фиг. 7B иллюстрирует уравнения/этапы, выполняемые устройством/способом для генерирования кодированного сигнала;

Фиг. 8 иллюстрирует процедуры, выполняемые процессором согласно Фиг.6;

Фиг. 9 иллюстрирует этапы или процедуры, выполняемые процессором согласно Фиг. 6 в другом варианте осуществления;

Фиг. 10 иллюстрирует другую реализацию кодера/процессора согласно Фиг. 6;

Фиг. 11 иллюстрирует устройство обработки сигнала согласно уровню техники; и

Фиг. 12 иллюстрирует другое устройство обработки сигнала согласно уровню техники.

Фиг. 1 иллюстрирует устройство для обработки кодированного сигнала. Кодированный сигнал вводят в интерфейс 100 ввода. На выходе интерфейса 100 ввода обеспечен декодер сигнала аудио для декодирования кодированного сигнала аудио. Кодированный сигнала, введенный в интерфейс 100 ввода, содержит кодированный сигнал аудио, имеющий информацию относительно задержки тона или усиления тона. Кроме того, кодированный сигнал содержит параметр управления постфильтром низких звуковых частот. Этот параметр управления постфильтром низких звуковых частот передается от интерфейса 100 ввода к контроллеру 114 для установки переменной характеристики постфильтра низких звуковых частот управляемого постфильтра 112 низких звуковых частот в соответствии с параметром управления постфильтром низких звуковых частот, включенным в кодированный сигнал. Этот параметр 101 управления поэтому предоставлен в кодированном сигнале аудио в дополнение к информации относительно задержки тона или усиления тона и поэтому может быть использован для установки управляемой характеристики постфильтра низких звуковых частот в дополнение к параметрам управления постфильтром низких звуковых частот, специально включенным в кодированный сигнал 102.

Как иллюстрировано на фиг. 2, управляемый постфильтр 112 низких звуковых частот может содержать фильтр P_LT(z) долгосрочного предсказания, обозначенный позицией 204, последовательно подсоединенный каскад 206 усиления и последовательно соединенный низкочастотный фильтр 208. В этом контексте, однако, подчеркивается, что элементы 204, 206, 208 могут быть скомпонованы в любом другом порядке, то есть каскад 206 усиления может быть скомпонован перед фильтром 204 долгосрочного предсказания или после низкочастотного 208 фильтра и, равным образом, порядок между низкочастотным фильтром 208, фильтром 204 долгосрочного предсказания может быть изменен так, чтобы низкочастотный фильтр 208 был первым в цепи обработки. Кроме того, характеристики фильтра 204 предсказания, каскада 206 усиления и низкочастотного 208 фильтра могут быть слиты в единственный фильтр (или в два каскадированных фильтра), имеющий произведение передаточных функций этих трех элементов.

На фиг. 2 параметр 101 управления постфильтром низких звуковых частот является значением усиления для управления каскадом 206 усиления, и это значение 101 усиления декодируется декодером 114 усиления, который включен в контроллер 114 из Фиг. 1. Таким образом, декодер 114 усиления обеспечивает декодированное усиление α (индекс), и это значение подается на каскад 206 с переменным усилением. Результатом процедур на фиг. 1 и Фиг. 2 и других процедур настоящего изобретения является обработанный или постфильтрованный декодированный сигнал, имеющий превосходное качество по сравнению с процедурами, иллюстрированными на фиг. 11 и Фиг. 12. В частности, контроллер 114 на фиг. 1 дополнительно содержит блок 210 для декодирования/восстановления информации тона, то есть информации относительно задержки тона T и/или информации относительно усиления g_ltp тона. Такое выведение этих данных может быть выполнено или просто считывая соответствующую информацию из кодированного сигнала, иллюстрированного посредством линии 211, или фактически анализируя декодированный сигнал аудио, иллюстрированный посредством линии 212. Однако, когда декодером сигнала аудио является речевой декодер, то кодированный сигнал аудио будет содержать явную информацию относительно усиления тона или задержки тона. Однако, когда эта информация не присутствует, она может быть выведена из декодированного сигнала 103 блоком 210. Этот анализ может, например, быть анализом тона или анализом отслеживания тона или любым другим известным способом выведения тона аудио сигнала. Дополнительно, блок 210 не может только вывести задержку тона или частоту тона, но может также вывести усиление тона.

Фиг. 2 иллюстрирует предпочтительную реализацию настоящего изобретения, работающего во временной области. Будучи обратной к ней, фиг. 3 иллюстрирует реализацию настоящего изобретения, работающего в спектральной области. В качестве примера, область поддиапазона QMF иллюстрирована на фиг. 3. В отличие от фиг. 2, анализатор 300 QMF предоставлен для того, чтобы преобразовать декодированный сигнал в спектральную область, предпочтительно область QMF. Кроме того, предоставлен второй преобразователь 302 время - спектр, который предпочтительно реализован как блок анализа QMF. Низкочастотный фильтр 208 на фиг. 2 заменен блоком 304 взвешивания поддиапазона, и вычитатель 202 на Фиг. 2 заменен на вычитатель 202 для каждого частотного диапазона. Дополнительно, предоставлен блок 306 синтеза QMF. В частности, анализ QMF 302 обеспечивает множество индивидуальных поддиапазонов или спектральных значений для индивидуальных диапазонов частот. Эти индивидуальные частотные диапазоны затем подвергаются взвешиванию 304 поддиапазона, где взвешивающий коэффициент различается для каждого индивидуального частотного диапазона так, чтобы все взвешивающие коэффициенты вместе представляли, например, характеристику низкочастотного фильтра. Таким образом, когда рассматривают, например, пять частотных диапазонов, и когда характеристика низкочастотного фильтра должна быть реализована блоком 304 взвешивания поддиапазона для индивидуальных частотных диапазонов, то взвешивающие коэффициенты, примененные блоком 304 взвешивания поддиапазона, будут уменьшаться от высокого значения для самого низкого частотного диапазона к более низкому значению для более высокого частотного диапазона. Это иллюстрируется в соответствии с эскизом справа на фиг. 3, в качестве примера иллюстрирующим пять частотных диапазонов с номерами 1, 2, 3, 4, 5 частотных диапазонов, где каждый частотный диапазон имеет индивидуальный взвешивающий коэффициент. Частотный диапазон 1 имеет взвешивающий коэффициент 310, примененный блоком 304, частотный диапазон 2 имеет взвешивающий коэффициент 312, частотный диапазон 3 имеет взвешивающий коэффициент 314, частотный диапазон 4 имеет взвешивающий коэффициент 316, и частотный диапазон 5 имеет взвешивающий коэффициент 318. Можно заметить, что взвешивающий коэффициент для более высокого частотного диапазона, такого как частотный диапазон 5, ниже чем взвешивающий коэффициент для более низкого частотного диапазона, такого как частотный диапазон 1. Таким образом, характеристика низкочастотного фильтра реализуется. С другой стороны, взвешивающие коэффициенты могут быть скомпонованы в другом порядке, чтобы применить другую характеристику фильтра в зависимости от некоторого случая использования.

Таким образом, по сравнению с фиг. 2 низкочастотная фильтрация временной области в блоке 208 заменена двумя преобразователями 300, 302 время-спектр и преобразователем 306 спектр-время.

Фиг. 4 иллюстрирует предпочтительную реализацию управляемого постфильтра 112 низких звуковых частот из фиг. 1. Предпочтительно, постфильтр 112 низких звуковых частот содержит устройство 209 фильтра и вычитатель 202. Устройство фильтра принимает, в качестве своего входа, декодированный сигнал 103. Предпочтительно, устройство 208 фильтра содержит функциональные возможности фильтра 204 долгосрочного предсказания, функциональные возможности каскада 206 усиления и функциональные возможности манипулятора сигнала, причем этот манипулятор сигнала может, например, быть фактическим фильтром 208, как может иметь место в реализации согласно фиг. 2. Альтернативно, манипулятор сигнала может быть блоком взвешивания для индивидуального поддиапазона или частотного диапазона спектра, как в реализации согласно фиг. 3, элемент 304.

Элементы 204, 206, 208 могут быть скомпонованы в любом порядке или любой комбинации и могут даже быть реализованы в пределах единственного элемента, как описано в контексте фиг. 2. Выходной сигнал вычитателя 202 является обработанным или постфильтрованным сигналом 113.

В зависимости от реализации управляемыми параметрами устройства фильтра являются задержка T для фильтра 204 долгосрочного предсказания, значение α усиления для каскада 206 усиления и характеристика фильтра для манипулятора/фильтра 208 сигнала. На все эти параметры индивидуально или все вместе может влиять параметр управления постфильтром низких звуковых частот, дополнительно включенный в поток битов, как описано в контексте элемента 101 из фиг. 1.

Фиг. 5 иллюстрирует процедуру для выведения фактически декодированного усиления α (индекс), иллюстрированного на фиг. 3. Для этого квантованное значение усиления извлекают из потока битов посредством синтаксического разбора кодированного сигнала, чтобы получить параметр управления постфильтром низких звуковых частот, представляющий извлеченное значение этапа 500. Кроме того, на этапе 502 усиление тона выводится, используя информацию относительно усиления тона, включенную в кодированный сигнал аудио, или анализируя декодированный аудио сигнал, как описано в контексте блока 210 на фиг. 2 и фиг. 3. Затем последовательно выведенное усиление 502 тона измеряется, используя коэффициент масштабирования, являющийся большим чем ноль и меньшим чем 1,0, как иллюстрировано на этапе 504. Затем вычисляют параметр каскада усиления или значение α (индекс) усиления, используя квантованное значение усиления, полученное на этапе 500, и масштабированное усиление тона, полученное на этапе 504. В частности, ссылка делается на уравнение (7) на фиг. 7B. Параметр α (индекс) каскада усиления, вычисленный на этапе 506 из фиг. 5, полагается на масштабированное усиление тона, полученное этапом 504. Усилением тона является g_ltp и коэффициент масштабирования в этом варианте осуществления равен 0,5. Другие коэффициенты масштабирования между 0,3 и 0,7 также являются предпочтительными. Усиление g_ltp тона, используемое в уравнении (7) на фиг. 7B, вычисляется/извлекается блоком 210 из фиг. 3 или фиг. 2, как описано выше, и соответствует информации относительно усиления тона, включенного в кодированный сигнал аудио.

Фиг. 6 иллюстрирует кодер для генерирования кодированного сигнала в соответствии с вариантом осуществления настоящего изобретения. В частности, кодер содержит кодер 600 сигнала аудио для генерирования закодированного сигнала 601 аудио, содержащего информацию относительно усиления тона или задержки тона, и этот кодированный сигнал аудио генерируется из первоначального сигнала 603 аудио. Кроме того, предоставлен декодер 602 для декодирования кодированного сигнала аудио, чтобы получить декодированный сигнал 605 аудио. Кроме того, процессор 604 предоставлен для того, чтобы вычислить параметр 607 управления постфильтром низких звуковых частот, удовлетворяющий критерию оптимизации, в котором декодированный сигнал 605 и первоначальный сигнал 603 аудио используются для того, чтобы вычислить параметр 607 управления постфильтром низких звуковых частот. Кроме того, кодер содержит интерфейс 606 вывода для того, чтобы вывести кодированный сигнал 608, имеющий закодированный сигнал 601 аудио, информацию относительно усиления тона и информацию относительно значения тона и дополнительно имеющий параметр 607 управления постфильтром низких звуковых частот.

Нужно подчеркнуть, что, хотя явно не указано, аналогичные ссылочные позиции на чертежах иллюстрируют аналогичные элементы и изменения будут очевидны из описания отдельных элементов в контексте отдельных чертежей.

В варианте осуществления процессор 604 конфигурируется, чтобы вычислить параметр управления постфильтром низких звуковых частот так, чтобы отношение сигнала к шуму между первоначальным сигналом, введенным в кодер 600 сигнала аудио, и декодированным и постфильтрованным сигналом аудио низких звуковых частот было минимизировано.

В другом варианте осуществления, как иллюстрировано на фиг. 7A, процессор 604 содержит фильтр 204 долгосрочного предсказания, управляемый задержкой T тона, низкочастотный фильтр 208 или каскад 206 усиления, и в котором процессор 604 конфигурируется, чтобы генерировать, в качестве параметра управления постфильтром низких звуковых частот, параметр задержки тона, характеристику низкочастотного фильтра или параметр каскада усиления.

В другом варианте осуществления процессор 604 далее содержит квантователь для того, чтобы квантовать параметр управления постфильтром низких звуковых частот. В варианте осуществления на фиг. 7A, этот квантователь является квантователем 708 усиления. В частности, квантователь конфигурируется, чтобы осуществлять квантование в заранее определенное количество индексов квантования, которые имеют значительно меньшее разрешение по сравнению с разрешением, предоставленным компьютером или процессором. Предпочтительно, заранее определенное количество индексов квантования равно 32, обеспечивая 5-битовое квантование, или даже равно 16, обеспечивая 4-битовое квантование, или даже равно 8, обеспечивая 3-битовое квантование, или даже равно 4, обеспечивая 2-битовое квантование.

В предпочтительном варианте осуществления процессор 604 конфигурируется, чтобы вычислить параметры управления постфильтром низких звуковых частот так, чтобы критерий оптимизации был удовлетворен для квантованных параметров управления постфильтром низких звуковых частот. Таким образом, дополнительная погрешность, введенная квантованием, уже включена в процесс оптимизации.

Пост-фильтрация согласно уровню техники основана на сильном предположении относительно природы сигнала и природы артефактов кодирования. Оно основано на блоках оценки, усилении α, задержке T и низкочастотном фильтре, который, возможно, не является оптимальным. Это изобретение предлагает способ для того, чтобы оптимизировать по меньшей мере один из этих параметров на стороне кодера прежде, чем его квантовать и послать его в декодер.

Аспект изобретения относится к определению аналитически (Фиг. 7B, уравнения (1)-(5)) оптимального усиления α для применения в постфильтре низких звуковых частот. Усиление кодирования предпочтительно выражается как отношение сигнала к шуму в дБ:

где s(n) является первоначальным сигналом и (n) - декодированной версией. Это усиление кодирования модифицируется после применения постфильтра и становится:

где - антигармонический компонент, фильтрованный низкочастотным фильтром H_LP(z).

Оптимизация усиления α в терминах усиления кодирования эквивалентна оценке минимальной среднеквадратической ошибки. Это может быть выражено как:

Оптимальное усиление затем задается посредством:

Максимальное SNR затем равно .

Оптимальное усиление должно быть вычислено на стороне кодера, поскольку он нуждается в первоначальном сигнале. Оптимальное усиление должно затем квантоваться. В предпочтительном варианте осуществления это делается посредством кодирования его по отношению к оценке усиления, которое может быть уже декодировано из потока битов и использоваться декодером. Эта оценка является предпочтительно квантованным усилением g_ltp долгосрочного предсказания_,умноженным на 0,5. Если долгосрочное предсказание не доступно в аудио кодере, можно закодировать абсолютное значение оптимального усиления и вычислить оценку задержки T и в кодере и в декодере из декодированного сигнала. Хотя в этом случае и в предпочтительном варианте осуществления оптимальное усиление не посылают и устанавливают на стороне декодера в ноль. Постфильтр не имеет затем какого-либо эффекта на декодированный сигнал, и задержка T не должна быть оценена. В этом случае параметр 607 управления постфильтром низких звуковых частот не должен быть вычислен или передаваться.

В предпочтительном варианте осуществления квантование выполняют, как описано следующим псевдокодом (Фиг.7B, уравнение (6)):

где k - количество битов, в отношении которых квантуется оптимальное усиление, α_min и α_max являются минимальным и максимальный относительными квантованными усилениями, соответственно. В предпочтительном варианте осуществления k=2, то есть квантованное усиление посылают каждый кадр в 2 битах. В предпочтительном варианте осуществления α_max = 1.5 и α_min = 0.

Декодированное оптимальное усиление затем приравнивают к (Фиг. 7B, уравнение (7)):

Может случиться, что вышеупомянутое квантование не является оптимальным в терминах SNR. Этого можно избежать, вычисляя для каждых представляющих значений результирующее SNR_pf(α (индекс)), но если количество битов k высоко, вычислительная сложность может сильно расти. Вместо этого можно квантовать усиление, как это описано выше, и затем проверять, являются ли соседние представительные значения лучшим выбором (Фиг.7B, уравнение (8)):

index_new будет затем передано вместо индекса.

Фиг. 8 иллюстрирует другой вариант осуществления способа на стороне кодера. На этапе 800 вычисляют декодированный сигнал. Это выполняют, например, посредством декодера 602 на фиг. 6. На этапе 810 антигармонический компонент, фильтрованный фильтром, вычисляют процессором 604. Антигармонический компонент, фильтрованный фильтром 208, например на фиг. 7A, является s_e(n), как определено в уравнении (3). Таким образом, антигармонический компонент, фильтрованный, например, низкочастотным фильтром H_LP(z), получают, фильтруя декодированный сигнал на выходе 605 согласно фиг. 6, используя фильтр 204 долгосрочного предсказания, например, согласно фиг. 7A, и низкочастотный фильтр 208, имеющий передаточную функцию в z-области h_LP(z).

Затем оптимальное усиление α вычисляют процессором 604, как иллюстрировано на этапе 820 на фиг. 8. Это может, например, быть сделано, используя уравнение (4) или уравнение (5), чтобы получить неквантованное оптимальное усиление. Наилучшее квантованное усиление может, например, быть получено уравнением (6) или уравнением (8) из фиг. 7B. Однако вычисление оптимального усиления, как определено на этапе 820, не должно обязательно быть выполнено аналитическим способом, но может также быть сделано в соответствии с любой другой процедурой, используя вычисленный антигармонический компонент, фильтрованный фильтром с одной стороны, и используя первоначальный сигнал s, с другой стороны. Для этого ссылка делается на фиг. 9 и фиг. 10. Фиг. 10 иллюстрирует другой вариант осуществления изобретенного кодера. Кодер 600 на фиг. 10 соответствует кодеру 600 сигнала аудио из фиг. 6. Точно так же, декодер 602 из фиг. 10 соответствует декодеру 602 из Фиг. 6. Кроме того, процессор 604 согласно фиг. 6 содержит, с одной стороны, устройство 209 фильтра, и с другой стороны, селектор MMSE 706.

Декодер 602 вычисляет декодированный сигнал . Декодированный сигнал вводят в устройство 209 фильтра, чтобы получить антигармонический компонент, как описано на этапе 810 согласно фиг. 8, умноженный на некоторый коэффициент усиления α. Затем селектор MMSE 706 вычисляет, например, отношение сигнала к шуму для различных (не-)квантованных параметров, как обозначено на этапе 910 на фиг. 9. Вычисление SNR выполняют, оценивая уравнение (2) или (4) или любую другую процедуру, использующую (s(n)- (n) + α s_e(n)). Затем, как указано этапом 920, селектор MMSE 706 выбирает неквантованный или, альтернативно, квантованный параметр с самым высоким значением SNR, чтобы получить на выходе блока 706 квантованный или неквантованный параметр, удовлетворяющий критерию оптимизации.

Таким образом, селектор MMSE 706 может выполнить исчерпывающий поиск, например, для каждого значения. Альтернативно, селектор MMSE может установить некоторое значение α и затем вычислить различные антигармонические компоненты α*s_e, для отдельных значений T задержки тона. Кроме того, некоторое значение α и некоторое значение T могут быть заранее определены и отдельные антигармонические компоненты могут быть вычислены для отдельных характеристик фильтра. Это иллюстрировано линией 1000 управления на фиг. 10. В других вариантах осуществления многомерная оптимизация выполняется так, что все доступные комбинации значений α, T и отдельные характеристики фильтра устанавливают, и соответствующее значение SNR вычисляют для каждой комбинации этих трех параметров и процессора 604, соответствующего комбинации устройства 209 фильтра и селектора MMSE 706 при выборе квантованного или неквантованного параметра с самым высоким значением SNR в предпочтительном варианте осуществления или одной из, например, десяти комбинаций параметров, имеющих самые высокие значения SNR среди всех возможностей.

Затем дополнительная ссылка делается к фиг. 1-5, иллюстрирующих сторону декодера настоящего изобретения.

На стороне декодера адаптивный постфильтр низких звуковых частот иллюстрируется на фиг. 1 или 2. Сначала усиление декодируют и затем используют для постфильтрации декодированного аудио сигнала. Следует уведомить, что в случае, если усиление квантуется в нуль, это будет эквивалентно обходу постфильтрации. В этом последнем случае только память фильтров обновляется.

Наконец, не является ограничением, что низкочастотный фильтр выполнен во временной области. Он может быть применен в частоте посредством умножения частотных элементов дискретизации и поддиапазонов. Можно использовать FFT, MDCT, QMF или любое спектральное разложение. В предпочтительном варианте осуществления низкочастотный фильтр применяется во временной области на стороне кодера и в области QMF в декодере.

Согласно другим вариантам осуществления, также возможно оптимизировать на стороне кодера другие параметры постфильтрации низких звуковых частот, то есть задержку T и фильтр h_LP(n). Аналитическое разрешение их оптимизации является более сложным, но оптимизация может быть достигнута посредством вычисления усиления или кодирования на выходе постфильтра с различными параметрами-кандидатами. Кандидат, имеющий лучшее SNR, затем выбирается и передается. Для задержки хорошие кандидаты могут быть выбраны в окружении первой оценки, и затем только дельта с оцененной задержкой должна быть передана. Для низкочастотного фильтра может быть заранее определен ряд фильтров-кандидатов, и SNR вычислено для каждого из них. Естественно, не является ограничением, что все фильтры показывают низкочастотную характеристику. Один или более кандидатов могут быть универсальным, полосовым или фильтром верхних частот. Индекс лучшего фильтра затем передается к декодеру. В другом варианте осуществления можно выполнять многомерную оптимизацию, чтобы оптимизировать одновременно комбинацию двух или трех параметров.

Хотя настоящее изобретение было описано в контексте блок-схем, где блоки представляют фактические или логические компоненты аппаратного обеспечения, настоящее изобретение может также быть реализовано реализуемым компьютером способом. В последнем случае блоки представляют соответствующие этапы способа, где эти этапы обозначают функциональные возможности, выполняемые соответствующими логическими или физическими блоками аппаратного обеспечения.

Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствуют этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства. Некоторые или все этапы способа могут быть выполнены посредством (или использованы) устройства аппаратного обеспечения, таким как, например, микропроцессор, программируемый компьютер или электронная схема. В некоторых вариантах осуществления один или более самых важных этапов способа может быть казнен таким устройством.

Изобретенный передаваемый или кодированный сигнал может быть сохранен на цифровом запоминающем носителе или может быть передан на носителе передачи, таком как беспроводный носитель передачи или проводной носитель передачи, например, как Интернет.

В зависимости от некоторых требований реализации варианты осуществления изобретения могут быть реализованы в аппаратном обеспечении или в программном обеспечении. Реализация может быть выполнена, используя цифровой запоминающий носитель, например гибкий диск, DVD, Blu-ray, CD, ROM, PROM, EPROM, EEPROM или флэш-память, имеющий электронно считываемые сохраненные на нем управляющие сигналы, которые взаимодействуют (или способны к взаимодействию) с программируемой компьютерной системой таким образом, что соответствующий способ выполняется. Поэтому, цифровой запоминающий носитель может быть считываемым компьютером.

Некоторые варианты осуществления согласно изобретению содержат носитель информации, имеющий электронно считываемые управляющие сигналы, которые способны к взаимодействию с программируемой компьютерной системой, таким образом что один из способов, описанных здесь, выполняется.

В целом, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, причем программный код функционирует для того, чтобы выполнять один из способов, когда компьютерный программный продукт запускается на компьютере. Программный код может, например, быть сохранен на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для того, чтобы выполнить один из способов, описанных здесь, сохраненную на машиночитаемом носителе.

Другими словами, вариант осуществления изобретательного способа является поэтому компьютерной программой, имеющей программный код для того, чтобы выполнить один из способов, описанных здесь, когда компьютерная программа запускается на компьютере.

Другой вариант осуществления изобретательного способа является поэтому, носителем информации (или невременным запоминающим носителем, таким как цифровой запоминающий носитель или считываемый компьютером носитель) содержащий записанную на нем компьютерную программу для того, чтобы выполнить один из способов, описанных в настоящем описании. Носитель информации, цифровой запоминающий носитель или записанный носитель обычно являются материальными и/или невременными.

Другим вариантом осуществления способа изобретения является поэтому, поток данных или последовательность сигналов, представляющих компьютерную программу для того, чтобы выполнить один из способов, описанных в настоящем описании. Поток данных или последовательность сигналов могут, например, быть сконфигурированы, чтобы быть переданными через соединение передачи данных, например, через Интернет.

Другой вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, конфигурируемое или приспособленное для выполнения одного из способов, описанных в настоящем описании.

Другой вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для того, чтобы выполнить один из способов, описанных в настоящем описании.

Другой вариант осуществления согласно изобретению содержит устройство или систему, сконфигурированную, чтобы передавать (например, электронно или оптически) компьютерную программу для выполнения одного из способов, описанных в настоящем описании, на приемник. Приемник может быть, например, компьютером, мобильным устройством, запоминающим устройством или подобным. Устройство или система могут, например, содержать файловый сервер для того, чтобы передать компьютерную программу приемнику.

В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использована для выполнения некоторых или всех функциональных возможностей способов, описанных здесь. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы выполнить один из способов, описанных в настоящем описании. Вообще, способы предпочтительно выполняют любым устройством аппаратного обеспечения.

Вышеупомянутые описанные варианты осуществления являются просто иллюстративными для принципов настоящего изобретения. Подразумевается, что модификации и изменения компоновок и деталей, описанных в настоящем описании, будут очевидны для специалистов в данной области техники. Намерением, поэтому, является ограничиваться только объемом формулы изобретения, а не конкретными деталями, представленными посредством описания и объяснениями вариантов осуществления в настоящем описании.

Ссылки

[1] 3GPP TS 16.290 Audio codec processing functions; Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec; Transcoding functions.

[2] Recommendation ITU-T G.718 : “Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s”.

[3] International patent WO2012/000882 A1, “Selective Bass Post Filter”.

УСТРОЙСТВО И СПОСОБ ДЛЯ ОБРАБОТКИ КОДИРОВАННОГО СИГНАЛА И КОДЕР И СПОСОБ ДЛЯ ГЕНЕРИРОВАНИЯ КОДИРОВАННОГО СИГНАЛА

Источник поступления информации: Роспатент

‹ › ×

Авторы
Правообладатели

Показаны записи 231-240 из 355.

29.12.2018

№218.016.ad1c

Аудиопроцессор и способ для обработки аудиосигнала с использованием вертикальной фазовой коррекции

Изобретение относится к средствам для обработки аудиосигнала с использованием вертикальной фазовой коррекции. Технический результат заключается в повышении эффективности обработки аудиосигнала. Выполняют базовое кодирование аудиосигнала, чтобы получать базовый кодированный аудиосигнал, имеющий...

Тип: Изобретение

Номер охранного документа: 0002676414

Дата охранного документа: 28.12.2018