×
20.11.2015
216.013.8f36

РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
№ охранного документа
0002568278
Дата охранного документа
20.11.2015
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится к средствам расширения верхней полосы звукового сигнала по нижней полосе звукового сигнала. Технический результат заключается в повышении эффективности расширения полосы звукового сигнала. Расширение полосы звукового сигнала включает в себя следующие этапы: извлекают (S1) набор особенностей звукового сигнала нижней полосы; сопоставляют (S2) извлеченные особенности по меньшей мере с одним параметром верхней полосы с помощью обобщенного аддитивного моделирования; сдвигают (S3) по частоте копию звукового сигнала нижней полосы в верхнюю полосу; управляют (S4) огибающей сдвинутой по частоте копии звукового сигнала нижней полосы с помощью упомянутого по меньшей мере одного параметра верхней полосы. 4 н. и 9 з.п. ф-лы, 14 ил.
Реферат Свернуть Развернуть

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение относится к кодированию звука, и в частности, к расширению полосы пропускания звукового сигнала нижней полосы.

УРОВЕНЬ ТЕХНИКИ

Настоящее изобретение относится к расширению полосы пропускания (BWE) звуковых сигналов. Схемы BWE все больше используют в кодировании/декодировании речи и аудиосигналов для улучшения воспринимаемого качества при заданной скорости передачи битов. Главной идеей в основе BWE является то, что часть звукового сигнала не передают, а восстанавливают (оценивают) в декодере из компонентов принятого сигнала.

Таким образом, в схеме BWE часть спектра сигнала восстанавливают в декодере. Восстановление выполняют, используя некоторые особенности спектра сигнала, который был фактически передан, используя традиционные методы кодирования. Обычно верхнюю полосу (HB) сигнала восстанавливают из некоторых особенностей звукового сигнала нижней полосы (LB).

Зависимости между особенностями LB и характеристиками сигнала HB часто моделируют с помощью модели гауссовых смесей (GMM) или скрытых марковских моделей (ХМ), например, [1-2]. Чаще всего предсказанные характеристики HB относятся к спектральным и/или временным огибающим.

Существуют два основных подхода BWE:

• В первом подходе характеристики сигнала HB полностью предсказывают из некоторых особенностей LB. Эти решения BWE вносят артефакты в восстановленный сигнал HB, что в некоторых случаях приводит к ухудшению качества по сравнению с сигналом с ограниченной полосой. Сложные сопоставления (например, основанные на GMM или ХМ) вполне вероятно приводят к ухудшению качества при неизвестных данных. Практика обычно такова, что чем сложнее сопоставление (большое количество обучающих параметров), тем более вероятно возникновение артефактов при данных того типа, который не присутствует в обучающем наборе данных. Не является тривиальной задачей найти сопоставление с такой сложностью, которая обеспечивает оптимальный баланс между общей точностью предсказания и низким количеством выбросов (данных, которые заметно отклоняются от данных в обучающем наборе, т.е. компонентов, которые не могут быть очень хорошо смоделированы).

• Вторым подходом (пример описан в [3]) является восстановление сигнала HB из комбинации особенностей LB и небольшого количества переданной информации HB. Схемы BWE с помощью переданной информации HB приводят к улучшению эффективности (за счет увеличения битового бюджета), но не предлагают обобщенную схему объединения переданных и предсказанных параметров. Обычно один набор параметров HB передают, а другой набор параметров HB предсказывают, что означает, что переданная информация не может компенсировать неудачи в предсказанных параметрах.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Задачей настоящего изобретения является достижение улучшенной схемы BWE.

Эта задача достигается с помощью прилагаемой формулы изобретения.

Согласно первому аспекту настоящее изобретение содержит способ оценки расширения верхней полосы звукового сигнала нижней полосы. Этот способ включает в себя следующие этапы. Извлекают набор особенностей звукового сигнала нижней полосы. Извлеченные особенности сопоставляют по меньшей мере с одним параметром верхней полосы с помощью обобщенного аддитивного моделирования. Копию звукового сигнала нижней полосы сдвигают по частоте в верхнюю полосу. Огибающей сдвинутой по частоте копии звукового сигнала нижней полосы управляют по меньшей мере с помощью одного параметра верхней полосы.

Согласно второму аспекту настоящее изобретение содержит устройство для оценки расширения верхней полосы звукового сигнала нижней полосы. Блок извлечения особенностей конфигурируют для извлечения набора особенностей звукового сигнала нижней полосы. Блок сопоставления включает в себя следующие элементы: модуль сопоставления с помощью обобщенного аддитивного моделирования, сконфигурированный для сопоставления извлеченных особенностей по меньшей мере с одним параметром верхней полосы с помощью обобщенного аддитивного моделирования; модуль сдвига частоты, сконфигурированный для сдвига по частоте копии звукового сигнала нижней полосы в верхнюю полосу; модуль управления огибающей, сконфигурированный для управления огибающей сдвинутой по частоте копии с помощью упомянутого по меньшей мере одного параметра верхней полосы.

Согласно третьему аспекту настоящее изобретение содержит речевой декодер, включающий в себя устройство согласно второму аспекту.

Согласно четвертому аспекту настоящее изобретение содержит сетевой узел, включающий в себя речевой декодер согласно третьему аспекту.

Преимущество предложенной схемы BWE состоит в том, что она предлагает хороший баланс между сложными схемами сопоставления (хорошая средняя эффективность, но сильные выбросы) и более ограниченной схемой сопоставления (ниже средняя эффективность, но более устойчивая).

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Данное изобретение, вместе с дополнительными задачами и преимуществами, можно лучше всего понять, обращаясь к последующему описанию, рассмотренному вместе с сопроводительными чертежами, на которых:

Фиг.1 - структурная схема, иллюстрирующая вариант осуществления структуры кодирования/декодирования, которая включает в себя речевой декодер согласно одному из вариантов осуществления настоящего изобретения;

Фиг.2A-C являются схемами, иллюстрирующими принципы обобщенных аддитивных моделей;

Фиг.3 - структурная схема, иллюстрирующая вариант осуществления устройства согласно настоящему изобретению для генерации расширения HB;

Фиг.4 - схема, иллюстрирующая пример параметра верхней полосы, полученного с помощью обобщенного аддитивного моделирования согласно одному из вариантов осуществления настоящего изобретения;

Фиг.5 - схема, иллюстрирующая определение подходящих для извлечения особенностей в другом варианте осуществления настоящего изобретения;

Фиг.6 - структурная схема, иллюстрирующая вариант осуществления устройства согласно настоящему изобретению, подходящий для генерации расширения HB, основываясь на особенностях, проиллюстрированных на фиг.5;

Фиг.7 - схема, иллюстрирующая пример параметров верхней полосы, полученных с помощью обобщенного аддитивного моделирования согласно одному из вариантов осуществления настоящего изобретения, основываясь на особенностях, проиллюстрированных на фиг.5;

Фиг.8 - структурная схема, иллюстрирующая другой вариант осуществления структуры кодирования/декодирование, которая включает в себя речевой декодер согласно другому варианту осуществления настоящего изобретения;

Фиг.9 - структурная схема, иллюстрирующая дополнительный вариант осуществления структуры кодирования/декодирования, которая включает в себя речевой декодер согласно дополнительному варианту осуществления настоящего изобретения;

Фиг.10 - структурная схема, иллюстрирующая другой вариант осуществления устройства согласно настоящему изобретению для генерации расширения HB;

Фиг.11 - структурная схема, иллюстрирующая дополнительный вариант осуществления устройства согласно настоящему изобретению для генерации расширения HB;

Фиг.12 - структурная схема, иллюстрирующая вариант осуществления сетевого узла, включающего в себя вариант осуществления речевого декодера согласно настоящему изобретению;

Фиг.13 - структурная схема, иллюстрирующая вариант осуществления речевого декодера согласно настоящему изобретению; и

Фиг.14 - последовательность операций, которая иллюстрирует вариант осуществления способа согласно настоящему изобретению.

ПОДРОБНОЕ ОПИСАНИЕ

Элементы, имеющие одинаковые или подобные функции, будут обеспечены теми же самыми условными обозначениями на чертежах.

Далее объясняют набор особенностей LB и их использование для оценки части HB сигнала посредством сопоставления. Дополнительно, также объясняют, как переданная информация HB может использоваться для управления сопоставлением.

Фиг.1 - структурная схема, иллюстрирующая вариант осуществления структуры кодирования/декодирования, которая включает в себя речевой декодер согласно одному из вариантов осуществления настоящего изобретения. Речевой кодер 1 принимает (обычно кадр) исходный звуковой сигнал s, который направляют к блоку 10 фильтров анализа, который разделяет звуковой сигнал на часть SLB нижней полосы и часть SHB верхней полосы. В данном варианте осуществления часть HB не используют (что подразумевает, что блок фильтров анализа может просто содержать низкочастотный фильтр). Часть LB SLB звукового сигнала кодируют в кодере 12 LB (обычно в кодере линейного предсказания с кодовым возбуждением (CELP), например, в кодере с линейным предсказанием с алгебраическим кодовым возбуждением (ACELP)), и код посылают в речевой декодер 2. Пример кодирования/декодирования ACELP можно найти в [4]. Код, принимаемый речевым декодером 2, декодируют в декодере 14 LB (обычно в декодере CELP, например, в декодере ACELP), который выдает звуковой сигнал ŝLB нижней полосы, соответствующий SLB. Этот звуковой сигнал ŝLB нижней полосы направляют к блоку 16 извлечения особенностей, который извлекает набор особенностей FLB (описан ниже) сигнала ŝLB. Извлеченные особенности FLB направляют к блоку 18 сопоставления, который сопоставляет их по меньшей мере с одним параметром верхней полосы (описан ниже) с помощью обобщенного аддитивного моделирования (описано ниже). Параметр(ы) HB используется(ются) для управления огибающей копии звукового сигнала LB ŝLB, которая была сдвинута по частоте в верхнюю полосу, который дает предсказание или оценку ŝHB части HB, которую не используют, SHB. Сигналы SLB и SHB направляют к блоку 20 фильтров синтеза, который восстанавливает оценку ŝ оригинального исходного звукового сигнала. Блок 16 извлечения особенностей и блок 18 сопоставления вместе формируют устройство 30 (дополнительно описано ниже) для генерации расширения HB.

Представленные ниже в качестве примера особенности звукового сигнала LB, называемые локальными особенностями, используют для предсказания некоторых характеристик сигнала HB. Можно использовать все особенности или подмножество представленных в качестве примера особенностей. Все эти локальные особенности вычисляют на покадровой основе, и динамика локальных особенностей также включает в себя информацию из предыдущего кадра. В последующем n является индексом кадра, l является индексом выборки и s(n,l) является речевой выборкой.

Первые две примерные особенности относятся к наклону спектра и к динамике наклона. Они измеряют частотное распределение энергии:

Следующие две примерные особенности измеряют частоту основного тона (основную частоту речи) и динамику частоты основного тона. Поиск оптимальной задержки ограничен имеющим смысл диапазоном частоты основного тона, τMIN и τMAX, например, 50-400 Гц:

Пятая и шестая примерные особенности отражают баланс между тоновым и шумоподобным компонентами в сигнале. В данном случае σ2ACB и σ2FCB являются энергией адаптивной и фиксированной кодовой книги в кодеках CELP, например, в кодеках ACELP, и является энергией сигнала возбуждения:

Последняя локальная особенность в данном примерном наборе фиксирует динамику энергии на покадровой основе. В данном случае σ2S является энергией речевого кадра:

Все эти локальные особенности, которые используются при сопоставлении, масштабируются перед сопоставлением следующим образом:

где ΨΜΙΝ и ΨΜАX являются предварительно определенными константами, которые соответствуют минимальному и максимальному значению для заданной особенности. Это дает набор извлеченных особенностей Ψ= .

Согласно настоящему изобретению оценка расширения HB из локальных особенностей основана на обобщенном аддитивном моделировании. По этой причине данная концепция будет кратко описана в отношении фиг.2A-C. Дополнительные подробности относительно обобщенных аддитивных моделей могут быть найдены, например, в [5].

В статистике регрессионные модели часто используют для оценки поведения параметров. Простой моделью является линейная модель:

,

где Ŷ - оценка переменной Y, которая зависит от (случайных) переменных X1,..., XM. Это показано для М=2 на фиг.2A. В этом случае Ŷ будет плоской поверхностью.

Характерной особенностью линейной модели является то, что каждый элемент суммирования линейно зависит только от одной переменной. Обобщением этой особенности является изменение (по меньшей мере одной из) этих линейных функций на нелинейные функции (каждая из которых все еще зависит только от одной переменной). Это приводит к аддитивной модели:

Эта аддитивная модель проиллюстрирована на фиг.2B для М = 2. В этом случае поверхность, представляющая Ŷ, является изогнутой. Функции fm(Xm) обычно являются сигмоидальными функциями (в общем случае функциями, имеющими форму «S»), как проиллюстрировано на фиг.2B. Примерами сигмоидальных функций являются логистическая функция, кривая Гомперца, S-образная кривая и функция гиперболического тангенса. Изменяя параметры, которые определяют сигмоидальную функцию, сигмоидальная форма может изменяться непрерывно от приблизительно линейной формы между минимумом и максимумом до приблизительно ступенчатой функции между теми же самыми минимумом и максимумом.

Дополнительное обобщение получают с помощью обобщенной аддитивной модели

где g(⋅) называют связывающей функцией. Это проиллюстрировано на фиг.2C, где поверхность Ŷ дополнительно изменяют (Ŷ получают, беря инверсию g-1(⋅), обычно также сигмоидальную, обеих сторон в уравнении (11)). В особом случае, когда связывающая функция g(⋅) является функцией тождественности, уравнение (11) уменьшают до уравнения (10). Так как оба случая представляют интерес, в целях настоящего изобретения «обобщенная аддитивная модель» будет также включать в себя случай связывающей функции тождественности. Однако, как отмечено выше, по меньшей мере одна из функций fm(Xm) нелинейна, что делает модель нелинейной (поверхность Ŷ изогнута).

В одном из вариантов осуществления настоящего изобретения 7 (нормализованных) особенностей Ψ= , полученных согласно уравнениям (1)-(8), используют для оценки соотношения Y(n) между энергией HB и LB в сжатой (обусловленной восприятием) области. Это соотношение может соответствовать некоторым частям временной или спектральной огибающих или полному усилению, как будет дополнительно описано ниже. Например:

где β можно выбирать как, например, β = 0,2. Другой пример:

В уравнениях (12) и (13) параметр β и функцию log10 используют для преобразования соотношения энергии в сжатую «обусловленную восприятием» область. Это преобразование выполняют для учета приблизительно логарифмических характеристик чувствительности человеческого уха.

Так как энергия EHB(n) не доступна в декодере, соотношение Y(n) предсказывают или оценивают. Это делают с помощью моделирования оценки Ŷ(n) соотношения Y(n), основываясь на извлеченных особенностях LB и обобщенной аддитивной модели. Пример задан с помощью:

где М = 7 при заданных извлеченных локальных особенностях (меньшее количество особенностей также допустимо). Если сравнивать с уравнением (11), то очевидно, что соответствуют переменным X1,..., XP и что функции fk соответствуют элементам в сумме, которые являются сигмоидальными функциями, определенными с помощью параметров модели ω={ω1m, ω2m, ω2m}Mm=1 и связывающей функцией тождественности. Параметры ω0 и ω обобщенной аддитивной модели хранятся в декодере, и они были получены с помощью обучения на базе данных речевых кадров. Обучающая процедура находит подходящие параметры ω0 и ω с помощью минимизации ошибки между соотношением Ŷ(n), оцененным с помощью уравнения (14), и фактическим соотношением Y(n), заданным уравнением (12) (или (13)) по речевой базе данных. Подходящим способом (специально для сигмоидальных параметров) является способ Левенберга-Марквардта, описанный, например, в [6].

Фиг.3 - структурная схема, иллюстрирующая вариант осуществления устройства 30 согласно настоящему изобретению для генерации расширения HB. Устройство 30 включает в себя блок 16 извлечения особенностей, сконфигурированный для извлечения набора особенностей звукового сигнала нижней полосы. Блок 18 сопоставления, соединенный с блоком 16 извлечения особенностей, включает в себя модуль 32 сопоставления с помощью обобщенного аддитивного моделирования, сконфигурированный для сопоставления извлеченных особенностей с параметром верхней полосы Ŷ с помощью обобщенного аддитивного моделирования. В проиллюстрированном варианте осуществления блок 18 сопоставления включает в себя модуль 34 сдвига частоты, сконфигурированный для сдвига по частоте копии звукового сигнала нижней полосы ŝLB в верхнюю полосу. В проиллюстрированном варианте осуществления блок 18 сопоставления также включает в себя модуль 36 управления огибающей, сконфигурированный для управления огибающей сдвинутой по частоте копии с помощью параметра верхней полосы Ŷ.

Фиг.4 - схема, иллюстрирующая пример параметра верхней полосы, полученного с помощью обобщенного аддитивного моделирования согласно одному из вариантов осуществления настоящего изобретения. Она иллюстрирует, как предполагаемое соотношение (усиление) Ŷ используется для управления огибающей сдвинутой по частоте копии сигнала LB (в этом случае в частотной области). Пунктирная линия представляет постоянное усиление (1,0) сигнала LB. Таким образом, в данном варианте осуществления расширение HB получают с помощью применения одного предполагаемого усиления Ŷ к сдвинутой по частоте копии сигнала LB.

Фиг.5 - схема, иллюстрирующая определение подходящих для извлечения особенностей в другом варианте осуществления настоящего изобретения. В данном варианте осуществления извлекают только 2 особенности F1, F2 сигнала LB.

В показанном на фиг.5 варианте осуществления особенность F1 определяют с помощью:

где

E10,0-11,6 - оценка энергии звукового сигнала нижней полосы в частотной полосе 10,0-11,6 кГц,

E8,0-11,6 - оценка энергии звукового сигнала нижней полосы в частотной полосе 8,0-11,6 кГц.

Кроме того, в проиллюстрированном на фиг.5 варианте осуществления особенность F2 определяют с помощью:

где

E8,0-11,6 - оценка энергии звукового сигнала нижней полосы в частотной полосе 8,0-11,6 кГц,

E0,0-11,6 - оценка энергии звукового сигнала нижней полосы в частотной полосе 0,0-11,6 кГц.

Особенности F1, F2 представляют наклон спектра и аналогичны описанной выше особенности Ψ1, но их определяют в частотной области вместо временной области. Кроме того, может применяться определение особенностей F1, F2 по другим частотным интервалам сигнала LB. Однако в данном варианте осуществления настоящего изобретения важно, что F1, F2 описывают соотношения энергии между различными частями спектра звукового сигнала нижней полосы.

Используя извлеченные особенности F1, F2, теперь возможно, чтобы модуль 32 сопоставления сопоставлял их с параметрами HB с помощью использования обобщенной аддитивной модели:

где

k=1..., K, являются параметрами верхней полосы, которые определяют усиление, управляющее огибающей K предварительно определенных частотных полос сдвинутой по частоте копии звукового сигнала нижней полосы,

{w0k, w1mk, w2mk, w3mk} являются наборами коэффициентов сопоставления, которые определяют сигмоидальные функции для каждого параметра верхней полосы,

Fm, m=1, 2, являются особенностями звукового сигнала нижней полосы, которые описывают соотношения энергии между различными частями спектра звукового сигнала нижней полосы.

Фиг.6 - структурная схема, иллюстрирующая вариант осуществления устройства согласно настоящему изобретению, подходящий для генерации расширения HB, основываясь на особенностях, проиллюстрированных на фиг.5. Данный вариант осуществления включает в себя аналогичные элементы, как вариант осуществления на фиг.3, но в этом случае они сконфигурированы для сопоставления особенностей F1, F2 с K усилениями вместо одного усиления Ŷ.

Фиг.7 - схема, иллюстрирующая пример параметров верхней полосы, полученных с помощью обобщенного аддитивного моделирования согласно одному из вариантов осуществления настоящего изобретения, основываясь на особенностях, проиллюстрированных на фиг.5. В данном примере существует K=4 усилений , которые управляют огибающей 4 предварительно определенных частотных полос сдвинутой по частоте копии звукового сигнала нижней полосы. Таким образом, в данном примере огибающей HB управляют с помощью 4 параметров вместо одного параметра Ŷ в примере, относящемся к фиг.4. Меньшее и большее количество параметров также допустимо.

Фиг.8 - структурная схема, иллюстрирующая другой вариант осуществления структуры кодирования/декодирования, которая включает в себя декодер согласно другому варианту осуществления настоящего изобретения. Данный вариант осуществления отличается от варианта осуществления на фиг.1 тем, что в нем используют сигнал HB SHB. Вместо этого сигнал HB направляют к блоку 22 информации HB, который классифицирует сигнал HB и посылает N-битовый индекс класса в речевой декодер 2. Если передача информации HB разрешена, как проиллюстрировано на фиг.8, то сопоставление выполняют по частям с совокупностями, которые обеспечивают с помощью данной передачи, причем количество классов зависит от количества доступных битов. Индекс класса используют с помощью блока 18 сопоставления, как будет описано ниже.

Фиг.9 - структурная схема, иллюстрирующая дополнительный вариант осуществления структуры кодирования/декодирования, которая включает в себя декодер согласно дополнительному варианту осуществления настоящего изобретения. Этот вариант осуществления аналогичен варианту осуществления на фиг.8, но формирует индекс класса, используя и сигнал HB sHB, и сигнал LB sLB. В данном примере N=1 бит, но также возможно иметь больше 2 классов, если индекс будет включать в себя большее количество битов.

Фиг.10 - структурная схема, иллюстрирующая другой вариант осуществления устройства согласно настоящему изобретению для генерации расширения HB. Данный вариант осуществления отличается от варианта осуществления на фиг.3 тем, что он включает в себя модуль 38 выбора набора коэффициентов сопоставления, который сконфигурирован для выбора набора коэффициентов сопоставления ωC = , зависящего от принятого индекса C класса сигнала. В данном варианте осуществления параметр верхней полосы Ŷ предсказывают из набора особенностей нижней полосы и предварительно сохраненных коэффициентов сопоставления ωC. Индекс C класса выбирает набор коэффициентов сопоставления, который определяют с помощью обучающей процедуры в автономном режиме, чтобы они соответствовали данным в этой совокупности. Это можно увидеть, как постепенный переход из состояния, когда HB просто предсказывают (нет классификации), в состояние, когда HB просто квантуют (с классификацией). Последнее является результатом того факта, что с увеличением количества совокупностей сопоставление будет иметь тенденцию предсказывать среднее значение совокупности.

Фиг.11 - структурная схема, иллюстрирующая дополнительный вариант осуществления устройства согласно настоящему изобретению для генерации расширения HB. Данный вариант осуществления аналогичен варианту осуществления на фиг.10, но основан на особенностях F1, F2, описанных в отношении фиг.5. Кроме того, в данном варианте осуществления класс C сигнала задают с помощью (также относится к верхней части фиг.5):

где

ES8,0-11,6 - оценка энергии исходного звукового сигнала в частотной полосе 8,0-11,6 кГц, и

ES11,6-16,0 - оценка энергии исходного звукового сигнала в частотной полосе 11,6-16,0 кГц.

В данном примере C классифицирует (грубо говоря, чтобы дать мысленное представление того, что означает данная примерная классификация) звуки на «вокализованные» (класс 1) и «невокализованные» (класс 2).

Основываясь на этой классификации, блок 18 сопоставления можно конфигурировать для выполнения сопоставления согласно (обобщенной аддитивной модели 32):

где

, k = 1,…,K, являются параметрами верхней полосы, которые определяют усиление, связанное с классом C сигнала, который классифицирует исходный звуковой сигнал, представленный звуковым сигналом нижней полосы (ŝLB), и управляют огибающей K предварительно определенных частотных полос сдвинутой по частоте копии звукового сигнала нижней полосы,

являются наборами коэффициентов сопоставления, которые определяют сигмоидальные функции для каждого параметра верхней полосы в классе сигнала,

Fm, m = 1, 2, являются особенностями звукового сигнала нижней полосы, которые описывают соотношения энергии между различными частями спектра звукового сигнала нижней полосы.

В качестве примера K = 4, и F1, F2 можно определять с помощью (15) и (16).

Преимущество вариантов осуществления на фиг.8-11 состоит в том, что они обеспечивают «точную настройку» сопоставления извлеченных особенностей с типом кодируемого звука.

Фиг.12 - структурная схема, иллюстрирующая вариант осуществления сетевого узла, включающего в себя вариант осуществления речевого декодера 2 согласно настоящему изобретению. Этот вариант осуществления иллюстрирует радио-терминал, но другие сетевые узлы можно также применять. Например, если передача голоса по IP (Интернет протоколу) используется в сети, то узлы могут содержать компьютеры.

В сетевом узле на фиг.12 антенна принимает закодированный речевой сигнал. Демодулятор и канальный декодер 50 преобразовывает этот сигнал в речевые параметры нижней полосы (и дополнительно - в класс C сигнала, как обозначено «(класс C)» и штриховой линией сигнала) и направляет их к речевому декодеру 2 для генерации речевого сигнала s, как описано выше в отношении различных вариантов осуществления.

Описанные в данном документе этапы, функции, процедуры и/или блоки можно воплощать в аппаратном обеспечении, используя любую обычную технологию, такую как технология дискретных схем или интегральных схем, которые включают в себя и универсальную электронную схему, и специальную схему.

Альтернативно, по меньшей мере некоторые из описанных этапов, функций, процедур и/или блоков можно воплощать в программном обеспечении для выполнения с помощью подходящего устройства обработки, такого как микропроцессор, цифровой сигнальный процессор (DSP) и/или любое подходящее программируемое логическое устройство, например, устройство на основе программируемой пользователем вентильной матрицы (FPGA).

Нужно также подразумевать, что можно многократно использовать обычные возможности обработки сетевых узлов. Это можно сделать, например, с помощью перепрограммирования существующего программного обеспечения или добавления новых компонентов программного обеспечения.

В качестве примера реализации, фиг.13 является структурной схемой, иллюстрирующей вариант осуществления примера речевого декодера 2 согласно настоящему изобретению. Данный вариант осуществления основан на процессоре 100, например, микропроцессоре, который выполняет компонент 110 программного обеспечения для оценки речевого сигнала нижней полосы ŝLB, компонент 120 программного обеспечения для оценки речевого сигнала верхней полосы ŝHB, и компонент 130 программного обеспечения для генерации речевого сигнала ŝ из ŝLB и ŝHB. Данное программное обеспечение хранится в памяти 150. Процессор 100 осуществляет связь с памятью по системной шине. Параметры речи нижней полосы (и дополнительно класс C сигнала) принимаются с помощью контроллера 160 ввода/вывода (I/O), который управляет шиной I/O, с которой соединены процессор 100 и память 150. В данном варианте осуществления параметры, принимаемые контроллером 150 I/O, сохраняются в памяти 150, где они обрабатываются с помощью компонентов программного обеспечения. Компонент 110 программного обеспечения может воплощать функциональные возможности блока 14 в описанных выше вариантах осуществления. Компонент 120 программного обеспечения может воплощать функциональные возможности блока 30 в описанных выше вариантах осуществления. Компонент 130 программного обеспечения может воплощать функциональные возможности блока 20 в описанных выше вариантах осуществления. Речевой сигнал, полученный из компонента 130 программного обеспечения, выводится из памяти 150 с помощью контроллера 160 I/O по шине I/O.

В варианте осуществления на фиг.13 речевые параметры принимаются с помощью контроллера 160 I/O, а другие задачи, такие как демодуляция и канальное декодирование в радио-терминале, как предполагается, обрабатываются в другом месте в принимающем сетевом узле. Однако, в качестве альтернативы можно предоставлять возможность дополнительным компонентам программного обеспечения в памяти 150 также выполнять всю или часть цифровой обработки сигналов для извлечения речевых параметров из принимаемого сигнала. В таком варианте осуществления речевые параметры можно получать непосредственно из памяти 150.

В случае, если принимающий сетевой узел является компьютером, принимающим пакеты передачи голоса по IP-протоколу, то IP-пакеты обычно направляются к контроллеру 160 I/O, а речевые параметры извлекаются с помощью дополнительных компонентов программного обеспечения в памяти 150.

Некоторые или все описанные выше компоненты программного обеспечения можно переносить на компьютерно-читаемом носителе, например, на CD (компакт-диске), на DVD (цифровом универсальном диске) или на жестком диске, и загружать в память для выполнения с помощью процессора.

Фиг.14 - последовательность операций, которая иллюстрирует один из вариантов осуществления способа согласно настоящему изобретению. На этапе S1 извлекают набор особенностей звукового сигнала нижней полосы. На этапе S2 сопоставляют извлеченные особенности по меньшей мере с одним параметром верхней полосы с помощью обобщенного аддитивного моделирования. На этапе S3 сдвигают по частоте копию звукового сигнала нижней полосы ŝLB в верхнюю полосу. На этапе S4 управляют огибающей сдвинутой по частоте копии звукового сигнала нижней полосы с помощью параметра(ов) верхней полосы.

Специалистам будет понятно, что различные модификации и изменения могут быть сделаны в настоящем изобретении без отступления от его объема, который определен с помощью прилагаемой формулы изобретения.

СОКРАЩЕНИЯ

ACELP - линейное предсказание с алгебраическим кодовым возбуждением

BWE - расширение полосы пропускания

CELP - линейное предсказание с кодовым возбуждением

DSP - цифровой сигнальный процессор

FPGA - программируемая пользователем вентильная матрица

GMM - модель гауссовых смесей

HB - верхняя полоса

HMM - скрытые марковские модели

IP - Интернет-протокол

LB - нижняя полоса

ССЫЛКИ

[1] M. Nilsson and W. B. Kleijn, «Avoiding over-estimation in bandwidth extension of telephony speech», Proc. IEEE Int. Conf. Acoust. Speech Sign. Process., 2001.

[2] P. Jax and P. Vary, «Wideband extension of telephone speech using a hidden Markov model», IEEE Workshop on Speech Coding, 2000.

[3] ITU-T Rec. G.729.1, «G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729», 2006.

[4] 3GPP TS 26. 190, «Adaptive Multi-Rate - Wideband (AMR-WB) speech codec; Transcoding functions», 2008.

[5] «New Approaches to Regression by Generalized Additive Models and Continuous Optimization for Modern Applications in Finance, Science and Technology», Pakize Taylan, Gerhard- Wilhelm Weber, Amir Beck, http://www3.iam.metu.edu.tr/iam/images/1/10/Preprint56.pdf

[6] Numerical Recipes in C++: The Art of Scientific Computing, 2nd edition, reprinted 2003, W. Press, S. Teukolsky, W. Vetterling, B. Flannery.


РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ ЗВУКОВОГО СИГНАЛА НИЖНЕЙ ПОЛОСЫ
Источник поступления информации: Роспатент

Showing 1-10 of 573 items.
10.01.2013
№216.012.1a93

Улучшенная синхронизация линейно-частотно-модулированных последовательностей

Изобретение относится к системе сотовой беспроводной связи и предназначено для повышения точности синхронизации. Изобретение раскрывает способы и устройства для идентификации корректных пиков в выходных сигналах согласованных фильтров в пользовательском оборудовании для систем связи....
Тип: Изобретение
Номер охранного документа: 0002472295
Дата охранного документа: 10.01.2013
10.01.2013
№216.012.1aaa

Способы и устройства для управления мощностью при произвольном доступе в сети связи

Изобретение относится к связи, в частности к реализуемому в первом устройстве связи в сети связи способу задания установочного параметра мощности передачи при произвольном доступе для первого устройства связи, содержащему прием (42) от второго устройства связи по радиоканалу данных, указывающих...
Тип: Изобретение
Номер охранного документа: 0002472318
Дата охранного документа: 10.01.2013
20.01.2013
№216.012.1e00

Способ и устройство в системе связи

Заявленное изобретение предназначено для приема пакетов данных от базовой станции и предоставления обратной связи на базовую станцию. При этом обратная связь относится к состоянию приема принятых пакетов данных и может содержать ACK/NAK. Технический результат состоит в предоставлении механизма...
Тип: Изобретение
Номер охранного документа: 0002473174
Дата охранного документа: 20.01.2013
27.01.2013
№216.012.2163

Способ и устройство, предназначенные для управления многоантенной передачей в беспроводной сети связи

Изобретение относится к беспроводным системам связи. Управление многоантенной передачей, представленное в настоящей заявке, включает в себя генерацию набора виртуальных реализаций канала в передатчике (10), который совместно использует те же самые статистические данные второго порядка, что и...
Тип: Изобретение
Номер охранного документа: 0002474048
Дата охранного документа: 27.01.2013
27.01.2013
№216.012.2168

Произвольный доступ в дуплексных системах связи с временным разделением

Изобретение относится к технике связи и может использоваться в дуплексных системах связи с временным разделением. Технический результат состоит в повышении пропускной способности каналов в системах с произвольным доступом. Для этого мобильный терминал приводится в действие в системе сотовой...
Тип: Изобретение
Номер охранного документа: 0002474053
Дата охранного документа: 27.01.2013
27.01.2013
№216.012.2176

Групповой доступ к услугам мультимедийной подсистемы на базе ip-протокола

Изобретение относится к системам мультимедийных услуг. Технический результат заключается в упрощении доступа к услугам мультимедийной подсистемы на базе IP-протокола группами пользователей, которые требуют альтернативной обработки относительно стандартной обработки пользователей мультимедийной...
Тип: Изобретение
Номер охранного документа: 0002474067
Дата охранного документа: 27.01.2013
27.01.2013
№216.012.2178

Способ сокращения сигнализации управления в ситуациях передачи обслуживания

Изобретение относится к управлению мобильностью в беспроводных сетях передачи данных. Технический результат заключается в сокращении сигнализации управления при передаче обслуживания. Сущность настоящего изобретения заключается в способе, устройстве и программе для использования IP-адресов...
Тип: Изобретение
Номер охранного документа: 0002474069
Дата охранного документа: 27.01.2013
10.02.2013
№216.012.2502

Управление группами в сети связи

Изобретение относится к области управления группами в сети связи. Техническим результатом является повышение эффективности управления группами в сети связи. Сетевой узел принимает с запрашивающего узла запрос для контроля группы, которая содержит в себе множество членов группы. Запрос также...
Тип: Изобретение
Номер охранного документа: 0002474976
Дата охранного документа: 10.02.2013
20.02.2013
№216.012.28cf

Устройство отключения передатчика

Изобретение относится к системе оптической связи и, в частности, к устройству отключения оптического передатчика для интеграции с оконечным узлом пассивной оптической сети. Изобретение раскрывает устройство отключения, содержащее модуль (11) слежения и модуль (12) отключения, при этом модуль...
Тип: Изобретение
Номер охранного документа: 0002475967
Дата охранного документа: 20.02.2013
20.02.2013
№216.012.28fa

Способ и установка в сети связи

Настоящее изобретение относится к способам, абонентскому оборудованию и базовой радиостанции в сети связи, в которой отсутствие покрытия нисходящей линии связи обнаруживается на основании измерений, выполненных по общему каналу или по сочетанию общего и выделенного каналов. Затем отсутствие...
Тип: Изобретение
Номер охранного документа: 0002476010
Дата охранного документа: 20.02.2013
Showing 1-10 of 160 items.
10.01.2013
№216.012.1a93

Улучшенная синхронизация линейно-частотно-модулированных последовательностей

Изобретение относится к системе сотовой беспроводной связи и предназначено для повышения точности синхронизации. Изобретение раскрывает способы и устройства для идентификации корректных пиков в выходных сигналах согласованных фильтров в пользовательском оборудовании для систем связи....
Тип: Изобретение
Номер охранного документа: 0002472295
Дата охранного документа: 10.01.2013
10.01.2013
№216.012.1aaa

Способы и устройства для управления мощностью при произвольном доступе в сети связи

Изобретение относится к связи, в частности к реализуемому в первом устройстве связи в сети связи способу задания установочного параметра мощности передачи при произвольном доступе для первого устройства связи, содержащему прием (42) от второго устройства связи по радиоканалу данных, указывающих...
Тип: Изобретение
Номер охранного документа: 0002472318
Дата охранного документа: 10.01.2013
20.01.2013
№216.012.1e00

Способ и устройство в системе связи

Заявленное изобретение предназначено для приема пакетов данных от базовой станции и предоставления обратной связи на базовую станцию. При этом обратная связь относится к состоянию приема принятых пакетов данных и может содержать ACK/NAK. Технический результат состоит в предоставлении механизма...
Тип: Изобретение
Номер охранного документа: 0002473174
Дата охранного документа: 20.01.2013
27.01.2013
№216.012.2163

Способ и устройство, предназначенные для управления многоантенной передачей в беспроводной сети связи

Изобретение относится к беспроводным системам связи. Управление многоантенной передачей, представленное в настоящей заявке, включает в себя генерацию набора виртуальных реализаций канала в передатчике (10), который совместно использует те же самые статистические данные второго порядка, что и...
Тип: Изобретение
Номер охранного документа: 0002474048
Дата охранного документа: 27.01.2013
27.01.2013
№216.012.2168

Произвольный доступ в дуплексных системах связи с временным разделением

Изобретение относится к технике связи и может использоваться в дуплексных системах связи с временным разделением. Технический результат состоит в повышении пропускной способности каналов в системах с произвольным доступом. Для этого мобильный терминал приводится в действие в системе сотовой...
Тип: Изобретение
Номер охранного документа: 0002474053
Дата охранного документа: 27.01.2013
27.01.2013
№216.012.2176

Групповой доступ к услугам мультимедийной подсистемы на базе ip-протокола

Изобретение относится к системам мультимедийных услуг. Технический результат заключается в упрощении доступа к услугам мультимедийной подсистемы на базе IP-протокола группами пользователей, которые требуют альтернативной обработки относительно стандартной обработки пользователей мультимедийной...
Тип: Изобретение
Номер охранного документа: 0002474067
Дата охранного документа: 27.01.2013
27.01.2013
№216.012.2178

Способ сокращения сигнализации управления в ситуациях передачи обслуживания

Изобретение относится к управлению мобильностью в беспроводных сетях передачи данных. Технический результат заключается в сокращении сигнализации управления при передаче обслуживания. Сущность настоящего изобретения заключается в способе, устройстве и программе для использования IP-адресов...
Тип: Изобретение
Номер охранного документа: 0002474069
Дата охранного документа: 27.01.2013
10.02.2013
№216.012.2502

Управление группами в сети связи

Изобретение относится к области управления группами в сети связи. Техническим результатом является повышение эффективности управления группами в сети связи. Сетевой узел принимает с запрашивающего узла запрос для контроля группы, которая содержит в себе множество членов группы. Запрос также...
Тип: Изобретение
Номер охранного документа: 0002474976
Дата охранного документа: 10.02.2013
20.02.2013
№216.012.28cf

Устройство отключения передатчика

Изобретение относится к системе оптической связи и, в частности, к устройству отключения оптического передатчика для интеграции с оконечным узлом пассивной оптической сети. Изобретение раскрывает устройство отключения, содержащее модуль (11) слежения и модуль (12) отключения, при этом модуль...
Тип: Изобретение
Номер охранного документа: 0002475967
Дата охранного документа: 20.02.2013
20.02.2013
№216.012.28fa

Способ и установка в сети связи

Настоящее изобретение относится к способам, абонентскому оборудованию и базовой радиостанции в сети связи, в которой отсутствие покрытия нисходящей линии связи обнаруживается на основании измерений, выполненных по общему каналу или по сочетанию общего и выделенного каналов. Затем отсутствие...
Тип: Изобретение
Номер охранного документа: 0002476010
Дата охранного документа: 20.02.2013
+ добавить свой РИД