25.10.2018

№218.016.957f

Результат интеллектуальной деятельности: ПРИНЦИП КОДИРОВАНИЯ ИНФОРМАЦИИ

Вид РИД

Изобретение

Юридическая информация Юридическая информация Свернуть Развернуть

Авторы

Правообладатели

ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)

№ охранного документа

0002670384

Дата охранного документа

22.10.2018

Краткое описание РИД Краткое описание РИД Свернуть Развернуть

Аннотация: 301 Изобретение относится к области аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования. Технический результат достигается за счет анализа информационного сигнала (IS) для получения коэффициентов линейного предсказания предсказательного полинома A(z); преобразования коэффициентов линейного предсказания предсказательного полинома A(z) в значения частоты (f …f ) спектрального частотного представления (RES, IES) предсказательного полинома A(z); ограничения числового диапазона спектров (RES, IES) полиномов P(z) и Q(z) путем умножения полиномов P(z) и Q(z) или одного или более полиномов, выведенных из полиномов P(z) и Q(z), на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности; получения квантованных значений частоты (f …f ) из значений частоты (f …f ); и формирования битового потока (BS), содержащего квантованные значения частоты (f …f ). 3 н. и 17 з.п. ф-лы, 8 ил.

Реферат Реферат Свернуть Развернуть

Для кодирования речи чаще всего используется принцип линейного предсказания с возбуждением алгебраическим кодом (ACELP), на котором основаны, например, стандарты семейства AMR, G.718 и MPEG USAC [1-3]. В их основе лежит моделирование речи с использованием исходной модели, состоящей из линейного предсказателя (LP) для моделирования спектральной огибающей, долговременного предсказателя (LTP) для моделирования основной частоты и алгебраической кодовой книги для остатка.

Коэффициенты линейной предсказательной модели очень чувствительны к квантованию, в связи с чем, они обычно сначала преобразуются в линейные спектральные частоты (LSF) или спектральные частоты иммитанса (ISF), а затем квантуются. Области LSF/ISF устойчивы к ошибкам квантования, и в этих областях легко поддерживать устойчивость предсказателя, что обеспечивает подходящую область для квантования [4].

LSF/ISF, в дальнейшем именуемые значениями частоты, можно получать из линейного предсказательного полинома A(z) m-го порядка следующим образом. Полиномы пары линейных спектров задаются в виде

P(z)=A(z)+(z^-m-l)A(z^-1)

Q(z)=A(z)-(z^-m-l)A(z^-1) (1)

где l=1 для представления в виде пары линейных спектров и l=0 для представления в виде пары спектров иммитанса, но, в принципе, пригодно любое l≥0. Таким образом, в дальнейшем, предполагается только, что l≥0.

Заметим, что первоначальный предсказатель всегда можно реконструировать с использованием A(z)=1/2[P(z)+Q(z)]. Таким образом, полиномы P(z) и Q(z) содержат всю информацию A(z).

Основное свойство полиномов LSP/ISP состоит в том, что, если и только если все корни A(z) располагаются внутри единичной окружности, то корни P(z) и Q(z) чередуются на единичной окружности. Поскольку корни P(z) и Q(z) располагаются на единичной окружности, их можно представлять только их углами. Эти углы соответствуют частотам, и поскольку спектры P(z) и Q(z) имеют вертикальные линии в их спектрах логарифмической величины на частотах, соответствующих корням, корни именуются значениями частоты.

Отсюда следует, что значения частоты кодируют всю информацию предсказателя A(z). Кроме того, было установлено, что значения частоты устойчивы к ошибкам квантования, благодаря чему, малая ошибка в одном из значений частоты создает малую ошибку в спектре реконструированного предсказателя, которая располагается, в спектре, вблизи соответствующей частоты. Благодаря этим благоприятным свойствам, квантование в областях LSF или ISF используется во всех распространенных речевых кодеках [1-3].

Однако одной из проблем, связанных с использованием значений частоты, является эффективное отыскание их положений из коэффициентов полиномов P(z) и Q(z). В конце концов, отыскание корней полиномов является классической и трудной задачей. Ранее предложенные способы решения этой задачи включают в себя следующие подходы:

• один из ранних подходов использует тот факт, что нули располагаются на единичной окружности, благодаря чему они выглядят как нули в спектре величины [5]. Таким образом, взяв дискретное преобразование Фурье коэффициентов P(z) и Q(z), можно искать впадины в спектре величины. Каждая впадина указывает положение корня, и если подвергнуть спектр достаточной повышающей дискретизации, можно найти все корни. Однако этот способ дает только приближенную позицию, поскольку из положения впадины трудно определить точную позицию.

• наиболее часто используемый подход базируется на полиномах Чебышева и представлен в [6]. Он исходит из того, что полином P(z) симметричен, и полином Q(z) антисимметричен, благодаря чему, они содержат много избыточной информации. Удаляя тривиальные нули при z=±1 и подставляя x=z+z^-1 (что называется преобразованием Чебышева), полиномы можно преобразовать в альтернативное представление FP(x) и FQ(x). Порядок этих полиномов вдвое меньше, чем у P(z) и Q(z), и они имеют только действительные корни в диапазоне от -2 до +2. Заметим, что полиномы FP(x) и FQ(x) являются действительнозначными при действительном x. Кроме того, поскольку корни являются простыми, FP(x) и FQ(x) будет иметь пересечение нуля на каждом из своих корней.

В речевых кодеках, например, AMR-WB, этот подход применяется таким образом, что полиномы FP(x) и FQ(x) оцениваются на фиксированной сетке на действительной оси для отыскания всех пересечений нуля. Положения корней дополнительно уточняются посредством линейной интерполяции вокруг пересечения нуля. Преимущество этого подхода состоит в сниженной сложности благодаря устранению избыточных коэффициентов.

Хотя вышеописанные способы достаточно хорошо работают в существующих кодеках, они сталкиваются с рядом проблем.

Задача заключается в обеспечении улучшенного принципа кодирования информации.

В первом аспекте для решения задачи предусмотрен информационный кодер для кодирования информационного сигнала. Информационный кодер содержит:

анализатор для анализа информационного сигнала для получения коэффициентов линейного предсказания предсказательного полинома A(z);

преобразователь для преобразования коэффициентов линейного предсказания предсказательного полинома A(z) в значения частоты спектрального частотного представления предсказательного полинома A(z), причем преобразователь выполнен с возможностью определения значений частоты путем анализа пары полиномов P(z) и Q(z), заданных в виде

P(z)=A(z)+(z^-m-l)A(z^-1) и

Q(z)=A(z)-(z^-m-l)A(z^-1),

где m - порядок предсказательного полинома A(z) и l больше или равно нулю, причем преобразователь выполнен с возможностью получения значений частоты путем установления строго действительного спектра, выведенного из P(z) и строго мнимого спектра из Q(z) и путем идентификации нулей строго действительного спектра, выведенного из P(z), и строго мнимого спектра, выведенного из Q(z);

квантователь для получения квантованных значений частоты из значений частоты; и

формирователь битового потока для формирования битового потока, содержащего квантованные значения частоты.

Информационный кодер согласно изобретению использует поиск пересечения нуля, тогда как спектральный подход для отыскания корней согласно уровню техники опирается на отыскание впадин в спектре величины. Однако поиск впадин менее точен, чем поиск пересечений нуля. Рассмотрим, например, последовательность [4, 2, 1, 2, 3]. Очевидно, наименьшее значение имеет третий элемент, в соответствии с чем, нуль находится где-то между вторым и четвертым элементом. Другими словами, невозможно определить, находится ли нуль справа или слева от третьего элемента. Если же рассмотреть последовательность [4, 2, 1, -2, -3], можно сразу же понять, что пересечение нуля находится между третьим и четвертым элементами, благодаря чему, предел погрешности снижается наполовину. Отсюда следует, что, согласно подходу спектра величины, требуется вдвое больше точек анализа для получения той же точности, что и при поиске пересечений нуля.

По сравнению с оцениванием величин |P(z)| и |Q(z)|, подход пересечения нуля имеет значительное преимущество в точности. Рассмотрим, например, последовательность 3, 2, -1, -2. Согласно подходу пересечения нуля, очевидно, что нуль располагается между 2 и -1. Однако, на основании соответствующей последовательности величин 3, 2, 1, 2, можно заключить, что нуль располагается где-то между вторым и последним элементами. Другими словами, подход пересечения нуля дает вдвое большую точность по сравнению с подходом на основе величины.

Кроме того, информационный кодер согласно изобретению может использовать длинные предсказатели, например, m=128. Вместо этого, преобразование Чебышева осуществляется в достаточной степени только при сравнительно малой длине A(z), например, m≤20. Для длинных предсказателей преобразование Чебышева численно нестабильно, из-за чего, практическая реализация алгоритма невозможна.

Основные свойства предложенного информационного кодера, таким образом, дают возможность получать такую же или более высокую точность, чем способ на основе преобразования Чебышева, поскольку поиск пересечений нуля и преобразование из временной области в частотную область осуществляются, таким образом, что нули можно найти очень низкой вычислительной сложностью.

В результате, информационный кодер согласно изобретению определяет нули (корни) не только более точно, но и с низкой вычислительной сложностью.

Информационный кодер согласно изобретению можно использовать в любом приложении обработки сигнала, которому нужно определять линейный спектр последовательности. Данный информационный кодер рассмотрен в порядке иллюстрации в контексте кодирования речи. Изобретение применимо в устройстве или приложении кодирования речевого, аудио и/или видеосигнала, использующем линейный предсказатель для моделирования огибающей спектральной величины, перцептивного порога частотного маскирования, огибающей временной величины, перцептивного порога временного маскирования или других форм огибающей или других представлений, эквивалентных форме огибающей, например, сигнала автокорреляции, использующем линейный спектр для представления информации огибающей, для кодирования, анализа или обработки, которому требуется способ определения линейного спектра из входного сигнала, например, речевого или общего аудиосигнала, и где входной сигнал представляется как цифровой фильтр или другая последовательность чисел.

Информационный сигнал может представлять собой, например, аудиосигнал или видеосигнал. Значениями частоты могут быть линейные спектральные частоты или спектральные частоты иммитанса. Квантованные значения частоты, передаваемые в битовом потоке, позволяют декодеру декодировать битовый поток для воссоздания аудиосигнала или видеосигнала.

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит определяющее устройство для определения полиномов P(z) и Q(z) из предсказательного полинома A(z).

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит идентификатор нулей для идентификации нулей строго действительного спектра, выведенного из P(z), и строго мнимого спектра, выведенного из Q(z).

Согласно предпочтительному варианту осуществления изобретения, идентификатор нулей выполнен с возможностью идентификации нулей посредством

a) начинания с действительного спектра на нулевой частоте;

b) увеличения частоты, пока перемена знака в действительном спектре обнаружена;

c) увеличения частоты, пока не будет обнаружена дополнительная перемена знака в мнимом спектре; и

d) повторения этапов b) и c), пока не будут обнаружены все нули.

Заметим, что Q(z) и, таким образом, мнимая часть спектра всегда имеет нуль на нулевой частоте. Поскольку корни перекрываются, P(z) и, таким образом, действительная часть спектра всегда будет отлична от нуля на нулевой частоте. Поэтому можно начинать с действительной части на нулевой частоте и увеличивать частоту, пока не будет обнаружена первая перемена знака, которая указывает первое пересечение нуля и, таким образом, первое значение частоты.

Поскольку корни чередуются, спектр Q(z) будет иметь следующую перемену знака. Таким образом, можно увеличивать частоту, пока не будет обнаружена перемена знака для спектра Q(z). Этот процесс может повторяться, перемежаясь между спектрами P(z) и Q(z), пока не будут найдены все значения частоты. Подход, используемый для определения положения пересечения нуля в спектрах, таким образом, аналогичен подходу, применяемому в области преобразования Чебышева [6, 7].

Поскольку нули P(z) и Q(z) чередуются, можно попеременно искать нули на действительных и комплексных частях, что позволяет находить все нули за один проход, и наполовину снижать сложность по сравнению с полным поиском.

Согласно предпочтительному варианту осуществления изобретения, идентификатор нулей выполнен с возможностью идентификации нулей посредством интерполяции.

Помимо подхода пересечения нуля можно легко применять интерполяцию, что позволяет оценивать позицию нуля с еще более высокой точностью, например, чем при осуществлении традиционными способами, например [7].

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит устройство заполнения нулями для добавления одного или более коэффициентов, имеющих значение ʺ0ʺ, к полиномам P(z) и Q(z) для формирования пары удлиненных полиномов P_e(z) и Q_e(z). Точность можно дополнительно повысить за счет увеличения длины оцененного спектра. На основании информации о системе, в ряде случаев фактически возможно определить минимальное расстояние между значениями частоты, и, таким образом, определить минимальную длину спектра, которая позволяет найти все значения частоты [8].

Согласно предпочтительному варианту осуществления изобретения, преобразователь выполнен таким образом, что в ходе преобразования коэффициентов линейного предсказания в значения частоты спектрального частотного представления предсказательного полинома A(z) исключается, по меньшей мере, часть операций с коэффициентами, про которые известно, что они имеют значение ʺ0ʺ, удлиненных полиномов P_e(z) и Q_e(z).

Однако увеличение длины спектра не приводит к возрастанию вычислительной сложности. Наибольший вклад в сложность вносит преобразование из временной области в частотную область, например, быстрое преобразование Фурье коэффициентов A(z). Однако, поскольку вектор коэффициентов заполнен нулями до нужной длины, он очень разрежен. Этот факт легко можно использовать для снижения сложности. Это довольно простая задача в том смысле, что точно известно, какие коэффициенты равны нуль, благодаря чему, на каждой итерации быстрого преобразования Фурье можно просто исключить операции, в которых участвуют нули. Применение такого разреженного быстрого преобразования Фурье является прямым, и любой программист может реализовать его. Сложность такой реализации можно представить как O(N log₂(1+m+l)), где N - длина спектра, и m и l определены ранее.

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит формирователь составного полинома, выполненный с возможностью установления составного полинома C_e(P_e(z), Q_e(z)) из удлиненных полиномов P_e(z) и Q_e(z).

Согласно предпочтительному варианту осуществления изобретения, преобразователь выполнен таким образом, что строго действительный спектр, выведенный из P(z), и строго мнимый спектр из Q(z) устанавливаются посредством единого преобразования Фурье путем преобразования составного полинома C_e(P_e(z), Q_e(z)).

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит устройство преобразования Фурье для осуществления преобразования Фурье над парой полиномов P(z) и Q(z) или одним или более полиномов, выведенных из пары полиномов P(z) и Q(z), в частотную область и регулировочное устройство для регулировки фазы спектра, выведенного из P(z), таким образом, чтобы он был строго действительным, и для регулировки фазы спектра, выведенного из Q(z), таким образом, чтобы он был строго мнимым. Устройство преобразования Фурье может действовать на основе быстрого преобразования Фурье или дискретного преобразования Фурье.

Согласно предпочтительному варианту осуществления изобретения, регулировочное устройство выполнено в виде устройства сдвига коэффициентов для осуществления циклического сдвига коэффициентов пары полиномов P(z) и Q(z) или одного или более полиномов, выведенных из пары полиномов P(z) и Q(z).

Согласно предпочтительному варианту осуществления изобретения, устройство сдвига коэффициентов выполнено с возможностью осуществления циклического сдвига коэффициентов таким образом, чтобы первоначальная средняя точка последовательности коэффициентов сдвигалась к первой позиции последовательности.

Теоретически, общеизвестно, что преобразование Фурье симметричной последовательности является действительнозначным, и антисимметричные последовательности имеют чисто мнимые Фурье-спектры. В данном случае, наша входная последовательность представляет собой коэффициенты полинома P(z) или Q(z), который имеет длину m+l, тогда как предпочтительно иметь дискретное преобразование Фурье гораздо большей длины N>>(m+l). Традиционный подход к формированию более длинных Фурье-спектров предусматривает заполнение нулями входного сигнала. Однако заполнение последовательности нулями необходимо реализовать аккуратно, чтобы сохранить свойства симметрии.

Рассмотрим сначала полином P(z) с коэффициентами

[p₀, p₁, p₂, p₁, p₀].

При обычном применении алгоритмов FFT требуется, чтобы первым элементом была точка симметрии, благодаря чему, при применении, например, в MATLAB, можно записать

fft([p₂, p₁, p₀, p₀, p₁])

для получения действительнозначного выходного сигнала. В частности, можно применять циклический сдвиг, в результате чего точка симметрии, соответствующая элементу средней точки, то есть коэффициент p₂, сдвигается влево и оказывается в первой позиции. Затем коэффициенты, находившиеся слева от p₂, присоединяются к концу последовательности.

Для заполненной нулями последовательности

[p₀, p₁, p₂, p₁, p₀, 0, 0... 0]

можно применять тот же процесс. Последовательность

[p₂, p₁, p₀, 0, 0... 0, p₀, p₁]

таким образом, будет иметь действительнозначное дискретное преобразование Фурье. При этом количество нулей во входных последовательностях равно N-m-l, если N - нужная длина спектра.

Соответственно, рассмотрим коэффициенты

[q₀, q₁, 0, -q₁, -q₀],

соответствующие полиному Q(z). Применяя циклический сдвиг, при котором предыдущая средняя точка переходит в первую позицию, получаем последовательность

[0, -q₁, -q₀, q₀, q₁],

которая имеет чисто мнимое дискретное преобразование Фурье. Затем преобразование с заполнением нулями можно использовать для последовательности

[0, -q₁, -q₀, 0, 0... 0, q₀, q₁].

Заметим, что вышеупомянутое применяется только для случаев, когда длина последовательности является нечетной, благодаря чему, m+l является четным. Для случаев, когда m+l нечетно, существует два варианта. Можно реализовать циклический сдвиг в частотной области либо применять DFT с полувыборками (см. ниже).

Согласно предпочтительному варианту осуществления изобретения, регулировочное устройство выполнено в виде фазовращателя для осуществления сдвига фазы выходного сигнала устройства преобразования Фурье.

Согласно предпочтительному варианту осуществления изобретения, фазовращатель выполнен с возможностью осуществления сдвига фазы выходного сигнала устройства преобразования Фурье путем умножения k-го элемента разрешения по частоте на exp(i2πkh/N), где N - длина выборки, и h=(m+l)/2.

Общеизвестно, что циклический сдвиг во временной области эквивалентен чередованию фаз в частотной области. В частности, сдвиг на h=(m+l)/2 шагов во временной области соответствует умножению k-го элемента разрешения по частоте на exp(-i2πkh/N), где N - длина спектра. Вместо циклического сдвига, можно, таким образом, применять умножение в частотной области для получения в точности такого же результата. Этот подход немного увеличивает сложность. Заметим, что h=(m+l)/2 является целым числом только при четном m+l. При нечетном m+l, циклический сдвиг потребует задержки на рациональное число шагов, что трудно реализовать напрямую. Вместо этого, можно применять соответствующий сдвиг в частотной области путем вышеописанного чередования фаз.

Альтернативно можно реализовать DFT с полувыборками. В частности, в то время как традиционное DFT задается в виде

(2)

DFT с полувыборками можно задать в виде

(3)

Для этого представления легко разработать быструю реализацию в виде FFT.

Преимущество этого представления состоит в том, что теперь точка симметрии находится в n=1/2 вместо обычного n=1. Это DFT с полувыборками позволяет, с помощью последовательности

[2, 1, 0, 0, 1, 2],

получать действительнозначный Фурье-спектр.

В случае нечетного m+l, для полинома P(z) с коэффициентами p₀, p₁, p₂, p₂, p₁, p₀ можно, посредством DFT с полувыборками и заполнения нулями, получить действительнозначный спектр, когда входная последовательность представляет собой

[p₂, p₁, p₀, 0, 0... 0, p₀, p₁, p₂].

Соответственно, для полинома Q(z) можно применять DFT с полувыборками к последовательности

[-q₂, -q₁, -q₀, 0, 0... 0, q₀, q₁, q₂]

для получения чисто мнимого спектра.

Согласно этим способам, для любой комбинации m и l, можно получить действительнозначный спектр для полинома P(z) и чисто мнимый спектр для любого Q(z). Фактически, поскольку спектры P(z) и Q(z) являются чисто действительными и мнимыми, соответственно, их можно сохранять в едином комплексном спектре, который в этом случае соответствует спектру P(z)+Q(z)=2A(z). Масштабирование с коэффициентом 2 не изменяет положение корней, поэтому его можно игнорировать. Таким образом, спектры P(z) и Q(z) можно получать, оценивая только спектр A(z) с использованием единого FFT. Необходимо применять только циклический сдвиг, как объяснено выше, к коэффициентам A(z).

Например, при m=4 и l=0, коэффициенты A(z) образуют последовательность

[a₀, a₁, a₂, a₃, a₄]

которую можно заполнять нулями до произвольной длины N в виде

[a₀, a₁, a₂, a₃, a₄, 0, 0... 0].

Если затем применить циклический сдвиг на (m+l)/2=2 шага, получится

[a₂, a₃, a₄, 0, 0... 0, a₀, a₁].

Произведя DFT этой последовательности, можно получить спектр P(z) и Q(z) в действительных и комплексных частях спектра.

Согласно предпочтительному варианту осуществления изобретения, преобразователь выполнен таким образом, что строго действительный спектр, выведенный из P(z), и строго мнимый спектр из Q(z) устанавливаются посредством единого преобразования Фурье, например, быстрого преобразования Фурье (FFT), путем преобразования составного полинома C(P(z), Q(z)).

Полином P(z) симметричен, и полином Q(z) антисимметричен, с осью симметрии в z^-(m+l)/2. Отсюда следует, что спектры z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), соответственно, оцененные на единичной окружности z=exp(iθ), имеют действительные и комплексные значения, соответственно. Поскольку нули располагаются на единичной окружности, их можно найти посредством поиска пересечений нуля. Кроме того, оценивание на единичной окружности можно реализовать просто посредством быстрого преобразования Фурье.

Поскольку спектры, соответствующие z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), являются действительными и комплексными, соответственно, 2z^-(m+l)/2A(z) можно реализовать посредством единого быстрого преобразования Фурье. В частности, если взять сумму z^-(m+l)/2(P(z)+Q(z)), то действительные и комплексные части спектров соответствуют z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), соответственно. Кроме того, поскольку

z^-(m+l)/2(P(z)+Q(z))=2z^-(m+l)/2A(z), (4)

можно напрямую брать FFT от 2z^-(m+l)/2A(z) для получения спектров, соответствующих z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), не определяя в явном виде P(z) и Q(z). Поскольку интерес представляют только положения нулей, можно исключить умножение на скаляр 2 и вместо этого оценивать z^-(m+l)/2A(z) с помощью FFT. Заметим, что, поскольку A(z) имеет только m+1 ненулевых коэффициентов, для снижения сложность можно использовать урезанное FFT [11]. Чтобы гарантировать, что найдены все корни, следует использовать FFT достаточно большой длины N, с которой спектр оценивается на, по меньшей мере, одной частоте между каждыми двумя нулями.

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит ограничительное устройство для ограничения числового диапазона спектров полиномов P(z) и Q(z) путем умножения полиномов P(z) и Q(z) или одного или более полиномов, выведенных из полиномов P(z) и Q(z), на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности.

Речевые кодеки часто реализуются на мобильном устройстве с ограниченными ресурсами, в связи с чем, числовые операции нужно реализовать посредством представлений фиксированной точки. Поэтому важно, чтобы реализуемые алгоритмы действовали с числовыми представлениями ограниченного диапазона. Однако для спектральных огибающих обычной речи, числовой диапазон Фурье-спектра настолько велик, что требуется 32-битовая реализация FFT, чтобы гарантировать, что положение пересечений нуля остаются неизменными.

С другой стороны, 16-битовое FFT часто реализуется с более низкой сложностью, в связи с чем, полезно ограничивать диапазон спектральных значений для согласования с этим 16-битовым диапазоном. Из уравнений |P(e^iθ)|≤2|A(e^iθ)| и |Q(e^iθ)|≤2|A(e^iθ)| следует, что ограничение числового диапазона B(z)A(z) влечет за собой ограничение числового диапазона B(z)P(z) и B(z)Q(z). Если B(z) не имеет нулей на единичной окружности, то B(z)P(z) и B(z)Q(z) будут иметь то же самое пересечение нуля на единичной окружности, что и P(z) и Q(z). Кроме того, B(z) должен быть симметричен, чтобы z^-(m+l+n)/2P(z)B(z) и z^-(m+l+n)/2Q(z)B(z) оставались симметричным и антисимметричным и их спектры были чисто действительным и мнимым, соответственно. Таким образом, вместо того, чтобы оценивать спектр z^(n+l)/2A(z), можно оценивать z^(n+l+n)/2A(z)B(z), где B(z) - симметричный полином n-го порядка, не имеющий корней на единичной окружности. Другими словами, можно применять вышеописанный подход, но сначала умножать A(z) на фильтр B(z) и применять видоизмененный фазовый сдвиг z^-(m+l+n)/2.

B₁(z)=β₀+β₁z^-1+β₂z^-2 (5)

где β_k∈R являются параметрами, и |β₂|>2|β₁|. Регулируя β_k, можно изменять наклон спектра и, таким образом, уменьшать числовой диапазон произведения A(z)B₁(z). Очень вычислительно эффективный подход состоит в выборе β таким образом, чтобы величины на нулевой частоте и частоте Найквиста были равны, |A(1)B₁(1)|=|A(-1)B₁(-1)|, например, можно выбрать

β₀=A(1)-A(-1) и β₁=2(A(1)+A(-1)). (6)

Этот подход обеспечивает приблизительно плоский спектр.

Можно видеть (см. также фиг. 5) что A(z) пропускает высокие частоты, и B₁(z) пропускает низкие частоты, благодаря чему, произведение A(z)B₁(z), предположительно, имеет одинаковую величину на нулевой частоте и частоте Найквиста и имеет более или менее плоскую частотную характеристику. Поскольку B₁(z) имеет только одну степень свободы, очевидно, трудно предположить, что произведение будет иметь совершенно плоскую частотную характеристику. Тем не менее, заметим, что отношение между самым высоким пиком и самой низкой впадиной B₁(z)A(z) может быть много меньше, чем у A(z). Это означает, что получен нужный результат; числовой диапазон B₁(z)A(z) много меньше, чем у A(z).

Второй, немного более сложный, способ предусматривает вычисление автокорреляции r_k импульсной характеристики A(0,5z). В данном случае, умножение на 0,5 перемещает нули A(z) в направлении начала, благодаря чему, спектральная величина снижается приблизительно наполовину. Благодаря применению алгоритма Левинсона-Дарбина к автокорреляции r_k, получается минимально-фазовый фильтр H(z) n-го порядка. В этом случае можно задать B₂(z)=z^-nH(z)H(z^-1) для получения приблизительно постоянного |B₂(z)A(z)|. Заметим, что диапазон |B₂(z)A(z)| меньше, чем у |B₁(z)A(z)|. Дополнительные подходы к конструированию B(z) легко найти в классической литературе по конструированию КИХ-фильтров [18].

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит ограничительное устройство для ограничения числового диапазона спектров удлиненных полиномов P_e(z) и Q_e(z) или одного или более полиномов, выведенных из удлиненных полиномов P_e(z) и Q_e(z) путем умножения удлиненных полиномов P_e(z) и Q_e(z) на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности. B(z) можно найти, как объяснено выше.

В дополнительном аспекте для решения задачи предусмотрен способ работы информационного кодера для кодирования информационного сигнала. Способ содержит этапы:

анализа информационного сигнала для получения коэффициентов линейного предсказания предсказательного полинома A(z);

преобразования коэффициентов линейного предсказания предсказательного полинома A(z) в значения частоты f₁…f_n спектрального частотного представления предсказательного полинома A(z), причем значения частоты f₁…f_n определяются путем анализа пары полиномов P(z) и Q(z), заданных в виде

P(z)=A(z)+(z^-m-l)A(z^-1) и

Q(z)=A(z)-(z^-m-l)A(z^-1),

где m - порядок предсказательного полинома A(z) и l больше или равно нулю, причем значения частоты f₁…f_n получаются путем установления строго действительного спектра, выведенного из P(z) и строго мнимого спектра из Q(z) и путем идентификации нулей строго действительного спектра, выведенного из P(z), и строго мнимого спектра, выведенного из Q(z);

получения квантованных значений частоты f_q1…f_qn из значений частоты f₁…f_n; и

формирования битового потока, содержащего квантованные значения частоты f_q1…f_qn.

Кроме того, предусмотрена программа, именуемая компьютерной программой для, при исполнении на процессоре, выполнения способа согласно изобретению.

Предпочтительные варианты осуществления изобретения рассмотрены со ссылкой на прилагаемые чертежи, в которых:

фиг. 1 демонстрирует вариант осуществления информационного кодера согласно изобретению в схематическом виде;

фиг. 2 демонстрирует иллюстративное соотношение A(z), P(z) и Q(z);

фиг. 3 демонстрирует первый вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде;

фиг. 4 демонстрирует второй вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде;

фиг. 5 демонстрирует иллюстративный спектр величины предсказателя A(z), соответствующих выравнивающих фильтров B₁(z) и B₂(z) и произведений A(z)B₁(z) и A(z)B₂(z);

фиг. 6 демонстрирует третий вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде;

фиг. 7 демонстрирует четвертый вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде; и

фиг. 8 демонстрирует пятый вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде.

Фиг. 1 демонстрирует вариант осуществления информационного кодера 1 согласно изобретению в схематическом виде.

Информационный кодер 1 для кодирования информационного сигнала IS содержит:

анализатор 2 для анализа информационного сигнала IS для получения коэффициентов линейного предсказания предсказательного полинома A(z);

преобразователь 3 для преобразования коэффициентов линейного предсказания предсказательного полинома A(z) в значения частоты f₁…f_n спектрального частотного представления RES, IES предсказательного полинома A(z), причем преобразователь 3 выполнен с возможностью определения значений частоты f₁…f_n путем анализа пары полиномов P(z) и Q(z), заданных в виде

P(z)=A(z)+(z^-m-l)A(z^-1) и

Q(z)=A(z)-(z^-m-l)A(z^-1),

где m - порядок предсказательного полинома A(z) и l больше или равно нулю, причем преобразователь 3 выполнен с возможностью получения значений частоты f₁…f_n путем установления строго действительного спектра RES выведенный из P(z) и строго мнимого спектра IES из Q(z) и путем идентификации нулей строго действительного спектра RES, выведенного из P(z), и строго мнимого спектра IES, выведенного из Q(z);

квантователь 4 для получения квантованных значений частоты fq₁…fq_n из значений частоты f₁…f_n; и

формирователь 5 битового потока для формирования битового потока BS, содержащего квантованные значения частоты f_q1…f_qn.

Информационный кодер 1 согласно изобретению использует поиск пересечения нуля, тогда как спектральный подход для отыскания корней согласно уровню техники опирается на отыскание впадин в спектре величины. Однако поиск впадин менее точен, чем поиск пересечений нуля. Рассмотрим, например, последовательность [4, 2, 1, 2, 3]. Очевидно, наименьшее значение имеет третий элемент, в соответствии с чем, нуль находится где-то между вторым и четвертым элементом. Другими словами, невозможно определить, находится ли нуль справа или слева от третьего элемента. Если же рассмотреть последовательность [4, 2, 1, -2, -3], можно сразу же понять, что пересечение нуля находится между третьим и четвертым элементами, благодаря чему, предел погрешности снижается наполовину. Отсюда следует, что, согласно подходу спектра величины, требуется вдвое больше точек анализа для получения той же точности, что и при поиске пересечений нуля.

Основные свойства предложенного информационного кодера 1, таким образом, дают возможность получать такую же или более высокую точность, чем способ на основе преобразования Чебышева, поскольку поиск пересечений нуля и преобразование из временной области в частотную область осуществляются, таким образом, что нули можно найти очень низкой вычислительной сложностью.

В результате, информационный кодер 1 согласно изобретению определяет нули (корни) не только более точно, но и с низкой вычислительной сложностью.

Информационный кодер 1 согласно изобретению можно использовать в любом приложении обработки сигнала, которому нужно определять линейный спектр последовательности. Данный информационный кодер 1 рассмотрен в порядке иллюстрации в контексте кодирования речи. Изобретение применимо в устройстве или приложении кодирования речевого, аудио и/или видеосигнала, использующем линейный предсказатель для моделирования огибающей спектральной величины, перцептивного порога частотного маскирования, огибающей временной величины, перцептивного порога временного маскирования или других форм огибающей или других представлений, эквивалентных форме огибающей, например, сигнала автокорреляции, использующем линейный спектр для представления информации огибающей, для кодирования, анализа или обработки, которому требуется способ определения линейного спектра из входного сигнала, например, речевого или общего аудиосигнала, и где входной сигнал представляется как цифровой фильтр или другая последовательность чисел.

Информационный сигнал IS может представлять собой, например, аудиосигнал или видеосигнал.

Фиг. 2 демонстрирует иллюстративное соотношение A(z), P(z) и Q(z). Вертикальные штриховые линии изображают значения частоты f₁…f₆. Заметим, что величина выражается на линейной оси, а не на логарифмической шкале, чтобы пересечения нуля оставались видимыми. Можно видеть, что линейные спектральные частоты возникают в пересечениях нуля P(z) и Q(z). Кроме того, величины P(z) и Q(z) везде меньше или равны 2|A(z)|; |P(e^iθ)|≤2|A(e^iθ)| и |Q(e^iθ)|≤2|A(e^iθ)|.

Фиг. 3 демонстрирует первый вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде.

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 содержит определяющее устройство 6 для определения полиномов P(z) и Q(z) из предсказательного полинома A(z).

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит устройство преобразования Фурье 8 для осуществления преобразования Фурье над парой полиномов P(z) и Q(z) или одним или более полиномов, выведенных из пары полиномов P(z) и Q(z), в частотную область и регулировочное устройство 7 для регулировки фазы спектра RES выведенного из P(z), таким образом, чтобы он был строго действительным, и для регулировки фазы спектра IES выведенного из Q(z), таким образом, чтобы он был строго мнимым. Устройство 8 преобразования Фурье может действовать на основе быстрого преобразования Фурье или дискретного преобразования Фурье.

Согласно предпочтительному варианту осуществления изобретения регулировочное устройство 7 выполнено в виде устройства 7 сдвига коэффициентов для осуществления циклического сдвига коэффициентов пары полиномов P(z) и Q(z) или одного или более полиномов, выведенных из пары полиномов P(z) и Q(z).

Согласно предпочтительному варианту осуществления изобретения, устройство 7 сдвига коэффициентов выполнено с возможностью осуществления циклического сдвига коэффициентов таким образом, чтобы первоначальная средняя точка последовательности коэффициентов сдвигалась к первой позиции последовательности.

Рассмотрим сначала полином P(z) с коэффициентами

[p₀, p₁, p₂, p₁, p₀].

При обычном применении алгоритмов быстрого преобразования Фурье требуется, чтобы первым элементом была точка симметрии, благодаря чему, при применении, например, в MATLAB, можно записать

fft([p₂, p₁, p₀, p₀, p₁])

Для заполненной нулями последовательности

[p₀, p₁, p₂, p₁, p₀, 0, 0, …, 0]

можно применять тот же процесс. Последовательность

[p₂, p₁, p₀, 0, 0, …, 0, p₀, p₁]

Соответственно, рассмотрим коэффициенты

[q₀, q₁, 0, -q₁, -q₀],

[0, -q₁, -q₀, q₀, q₁],

[0, -q₁, -q₀, 0, 0... 0, q₀, q₁]

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 содержит идентификатор 9 нулей для идентификации нулей строго действительного спектра RES, выведенного из P(z), и строго мнимого спектра IES, выведенного из Q(z).

Согласно предпочтительному варианту осуществления изобретения, идентификатор 9 нулей выполнен с возможностью идентификации нулей посредством

a) начинания с действительного спектра RES на нулевой частоте;

b) увеличения частоты, пока перемена знака в действительном спектре RES обнаружена;

c) увеличения частоты, пока не будет обнаружена дополнительная перемена знака в мнимом спектре IES; и

d) повторения этапов b) и c), пока не будут обнаружены все нули.

Заметим, что Q(z) и, таким образом, мнимая часть IES спектра всегда имеет нуль на нулевой частоте. Поскольку корни перекрываются, P(z) и, таким образом, действительная часть RES спектра всегда будет отлична от нуля на нулевой частоте. Поэтому можно начинать с действительной части RES на нулевой частоте и увеличивать частоту, пока не будет обнаружена первая перемена знака, которая указывает первое пересечение нуля и, таким образом, первое значение частоты f₁.

Поскольку корни чередуются, спектр IES Q(z) будет иметь следующую перемену знака. Таким образом, можно увеличивать частоту, пока не будет обнаружена перемена знака для спектра IES Q(z). Этот процесс может повторяться, перемежаясь между спектрами P(z) и Q(z), пока не будут найдены все значения частоты f₁…f_n. Таким образом, подход, используемый для определения положения пересечения нуля в спектрах RES и IES, аналогичен подходу, применяемому в области преобразования Чебышева [6, 7].

Поскольку нули P(z) и Q(z) чередуются, можно попеременно искать нули на действительных частях RES и комплексных частях IES, что позволяет находить все нули за один проход, и наполовину снижать сложность по сравнению с полным поиском.

Согласно предпочтительному варианту осуществления изобретения, идентификатор 9 нулей выполнен с возможностью идентификации нулей посредством интерполяции.

Фиг. 4 демонстрирует второй вариант осуществления преобразователя 3 информационного кодера 1 согласно изобретению в схематическом виде.

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 содержит устройство заполнения нулями 10 для добавления одного или более коэффициентов, имеющих значение ʺ0ʺ, к полиномам P(z) и Q(z) для формирования пары удлиненных полиномов P_e(z) и Q_e(z). Точность можно дополнительно повысить за счет увеличения длины оцененного спектра RES, IES. На основании информации о системе, в ряде случаев фактически возможно определить минимальное расстояние между значениями частоты f₁…f_n, и, таким образом, определить минимальную длину спектра RES, IES, с помощью которой можно найти все значения частоты f₁…f_n [8].

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 выполнен таким образом, что в ходе преобразования коэффициентов линейного предсказания в значения частоты f₁…f_n, спектрального частотного представления RES, IES предсказательного полинома A(z) исключается, по меньшей мере, часть операций с коэффициентами, про которые известно, что они имеют значение ʺ0ʺ, удлиненных полиномов P_e(z) и Q_e(z).

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит ограничительное устройство 11 для ограничения числового диапазона спектров удлиненных полиномов P_e(z) и Q_e(z) или одного или более полиномов, выведенных из удлиненных полиномов P_e(z) и Q_e(z) путем умножения удлиненных полиномов P_e(z) и Q_e(z) на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности. B(z) можно найти, как объяснено выше.

Фиг. 5 демонстрирует иллюстративный спектр величины предсказателя A(z), соответствующих выравнивающих фильтров B₁(z) и B₂(z) и произведений A(z)B₁(z) и A(z)B₂(z). Горизонтальная пунктирная линия демонстрирует уровень A(z)B1(z) на нулевой частоте и частоте Найквиста.

Согласно предпочтительному варианту осуществления (не показан) изобретения, преобразователь 3 содержит ограничительное устройство 11 для ограничения числового диапазона спектров RES, IES полиномов P(z) и Q(z) путем умножения полиномов P(z) и Q(z) или одного или более полиномов, выведенных из полиномов P(z) и Q(z), на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности.

Остается задача сконструировать фильтр B(z), ограничивающий числовой диапазон A(z)B(z), с тем условием, что B(z) должен быть симметричным и не иметь корней на единичной окружности. Простейший фильтр, удовлетворяющий требованиям, представляет собой линейно-фазовый фильтр 2-го порядка B₁(z)=β₀+β₁z^-1+β₂z^-2, где β_k∈R являются параметрами, и |β₂|>2|β₁|. Регулируя β_k, можно изменять наклон спектра и, таким образом, уменьшать числовой диапазон произведения A(z)B₁(z). Очень вычислительно эффективный подход состоит в выборе β таким образом, чтобы величины на нулевой частоте и частоте Найквиста были равны, |A(1)B₁(1)|=|A(-1)B₁(-1)|, например, можно выбрать β₀=A(1)-A(-1) и β₁=2(A(1)+A(-1)).

Этот подход обеспечивает приблизительно плоский спектр.

Из фиг. 5 можно видеть что A(z) пропускает высокие частоты, и B₁(z) пропускает низкие частоты, благодаря чему, произведение A(z)B₁(z), предположительно, имеет одинаковую величину на нулевой частоте и частоте Найквиста и имеет более или менее плоскую частотную характеристику. Поскольку B₁(z) имеет только одну степень свободы, очевидно, трудно предположить, что произведение будет иметь совершенно плоскую частотную характеристику. Тем не менее, заметим, что отношение между самым высоким пиком и самой низкой впадиной B₁(z)A(z) может быть много меньше, чем у A(z). Это означает, что получен нужный результат; числовой диапазон B₁(z)A(z) много меньше, чем у A(z).

Фиг. 6 демонстрирует третий вариант осуществления преобразователя 3 информационного кодера 1 согласно изобретению в схематическом виде.

Согласно предпочтительному варианту осуществления изобретения регулировочное устройство 12 выполнено в виде фазовращателя 12 для осуществления сдвига фазы выходного сигнала устройства преобразования Фурье 8.

Согласно предпочтительному варианту осуществления изобретения, фазовращатель 12 выполнен с возможностью осуществления сдвига фазы выходного сигнала устройства преобразования Фурье 8 путем умножения k-го элемента разрешения по частоте на exp(i2πkh/N), где N - длина выборки, и h=(m+l)/2.

Фиг. 7 демонстрирует четвертый вариант осуществления преобразователя 3 информационного кодера 1 согласно изобретению в схематическом виде.

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 содержит формирователь составного полинома 13 выполненный с возможностью установления составного полинома C(P(z), Q(z)) из полиномов P(z) и Q(z).

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 выполнен таким образом, что строго действительный спектр, выведенный из P(z), и строго мнимый спектр из Q(z) устанавливаются посредством единого преобразования Фурье, например, быстрого преобразования Фурье (FFT), путем преобразования составного полинома C(P(z), Q(z)).

Поскольку спектры, соответствующие z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), являются действительными и комплексными, соответственно, их можно реализовать посредством единого быстрого преобразования Фурье. В частности, если взять сумму z^-(m+l)/2(P(z)+Q(z)), то действительные и комплексные части спектров соответствуют z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), соответственно. Кроме того, поскольку z^-(m+l)/2(P(z)+Q(z))=2z^-(m+l)/2A(z), можно напрямую брать FFT от 2z^-(m+l)/2A(z) для получения спектров, соответствующих z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), не определяя в явном виде P(z) и Q(z). Поскольку интерес представляют только положения нулей, можно исключить умножение на скаляр 2 и вместо этого оценивать z^-(m+l)/2A(z) с помощью FFT. Заметим, что, поскольку A(z) имеет только m+1 ненулевых коэффициентов, для снижения сложность можно использовать урезанное FFT [11]. Чтобы гарантировать, что найдены все корни, следует использовать FFT достаточно большой длины N, с которой спектр оценивается на, по меньшей мере, одной частоте между каждыми двумя нулями.

Согласно предпочтительному варианту осуществления (не показан) изобретения, преобразователь 3 содержит формирователь составного полинома, выполненный с возможностью установления составного полинома C_e(P_e(z), Q_e(z)) из удлиненных полиномов P_e(z) и Q_e(z).

Согласно предпочтительному варианту осуществления (не показан) изобретения, преобразователь выполнен таким образом, что строго действительный спектр, выведенный из P(z), и строго мнимый спектр из Q(z) устанавливаются посредством единого преобразования Фурье путем преобразования составного полинома C_e(P_e(z), Q_e(z)).

Фиг. 8 демонстрирует пятый вариант осуществления преобразователя 3 информационного кодера 1 согласно изобретению в схематическом виде.

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 содержит устройство преобразования Фурье 14 для осуществления преобразования Фурье над парой полиномов P(z) и Q(z) или одним или более полиномов, выведенных из пары полиномов P(z) и Q(z), в частотную область с половиной выборок таким образом, чтобы спектр, выведенный из P(z), был строго действительным, и таким образом, чтобы спектр, выведенный из Q(z), был строго мнимым.

DFT с полувыборками можно задать в виде

Для этого представления легко разработать быструю реализацию в виде FFT.

[2, 1, 0, 0, 1, 2]

получать действительнозначный Фурье-спектр RES.

В случае нечетного m+l, для полинома P(z) с коэффициентами p₀, p₁, p₂, p₂, p₁, p₀ можно, посредством DFT с полувыборками и заполнения нулями, получить действительнозначный спектр RES, когда входная последовательность представляет собой

[p₂, p₁, p₀, 0, 0... 0, p₀, p₁, p₂].

Соответственно, для полинома Q(z) можно применять DFT с полувыборками к последовательности

[-q₂, -q₁, -q₀, 0, 0... 0, q₀, q₁, q₂]

для получения чисто мнимого спектра IES.

Например, при m=4 и l=0, коэффициенты A(z) образуют последовательность

[a₀, a₁, a₂, a₃, a₄],

которую можно заполнять нулями до произвольной длины N в виде

[a₀, a₁, a₂, a₃, a₄, 0, 0... 0].

Если затем применить циклический сдвиг на (m+l)/2=2 шага, получится

[a₂, a₃, a₄, 0, 0... 0, a₀, a₁].

Произведя DFT этой последовательности, можно получить спектр P(z) и Q(z) в действительных частях RES и комплексных частях IES спектра.

Общий алгоритм в случае четного m+l можно задать следующим образом. Пусть коэффициенты A(z), обозначенные a_k, располагаются в буфере длиной N.

1. Применить циклический сдвиг к a_k на (m+l)/2 шагов влево.

2. Вычислить быстрое преобразование Фурье последовательности a_k и обозначить его A_k.

3. Пока не будут найдены все значения частоты, начинать с k=0 и попеременно

(a) пока sign(real(A_k))=sign(real(A_k+1)) увеличивать k:=k+1. Найдя пересечение нуля, сохранить k в списке значений частоты.

(b) пока sign(imag(A_k))=sign(imag(A_k+1)) увеличивать k:=k+1. Найдя пересечение нуля, сохранить k в списке значений частоты.

4. Для каждого значения частоты, интерполировать между A_k и A_k+1 для определения точной позиции.

Здесь функции sign(x), real(x) и imag(x) означают знак x, действительную часть x и мнимую часть x, соответственно.

Для случая нечетного m+l, циклический сдвиг уменьшается до только (m+l-1)/2 шагов влево, и стандартное быстрое преобразование Фурье заменяется быстрым преобразованием Фурье с полувыборками.

Альтернативно, всегда можно заменить комбинацию циклического сдвига и 1-го преобразования Фурье быстрым преобразованием Фурье и фазовым сдвигом в частотной области.

Для более точного определения положения корней, можно использовать предложенный выше способ для обеспечения первого предположения и затем применять второй этап для уточнения положения корней. Для уточнения можно применять любой классический метод отыскания корней полинома, например, метод Дюрана-Кернера, Аберта-Эрлиха, Лагерра, Гаусса-Ньютона или другие [11-17].

В одном представлении, представленный способ состоит из следующих этапов:

(a) Для последовательности длиной m+l+1, заполненной нулями до длины N, где m+l четно, применения циклического сдвига на (m+l)/2 шагов влево, таким образом, что длина буфера равна N и соответствует нужной длине выходного спектра, или

для последовательности длиной m+l+1, заполненной нулями до длины N, где m+l нечетно, применения циклического сдвига на (m+l-1)/2 шагов влево, таким образом, что длина буфера равна N и соответствует нужной длине выходного спектра.

(b) При четном m+l, применения к последовательности стандартного DFT. При нечетном m+l, применения к последовательности DFT с полувыборками, как описано в ур. 3 или эквивалентном представлении.

(c) Если входной сигнал симметричен или антисимметричен, поиска пересечений нуля представления в частотной области и сохранения положений в списке.

Если входной сигнал является составной последовательностью B(z)=P(z)+Q(z), поиска пересечений нуля в действительной и мнимой части представления в частотной области и сохранения положений в списке. Если входной сигнал является составной последовательностью B(z)=P(z)+Q(z), и корни P(z) и Q(z) перемежаются или имеют аналогичную структуру, поиска пересечений нуля попеременно в действительной и мнимой части представления в частотной области и сохранения положений в списке.

В другом представлении, представленный способ состоит из следующих этапов

(a) Для входного сигнала, имеющего такую же форму, как в предыдущем пункте, применения DFT к входной последовательности.

(b) Применения чередования фаз к значениям в частотной области, что эквивалентно циклическому сдвигу входного сигнала на (m+l)/2 шагов влево.

В отношении кодера 1 и способов описанных вариантов осуществления отметим следующее:

Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа также представляют описания соответствующего блока или элемента или признака соответствующего устройства.

В зависимости от конкретных требований реализации, варианты осуществления изобретения можно реализовать аппаратными средствами или программными средствами. Реализацию можно осуществлять с использованием цифрового носителя данных, например, флоппи-диска, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, на котором хранятся электронно считываемые сигналы управления, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой для осуществления соответствующего способа.

Некоторые варианты осуществления согласно изобретению содержат среду переноса данных, имеющую электронно считываемые сигналы управления, которые способны взаимодействовать с программируемой компьютерной системой для осуществления одного из описанных здесь способов.

В общем случае, варианты осуществления настоящего изобретения можно реализовать в виде компьютерного программного продукта с программным кодом, причем программный код пригоден для осуществления одного из способов при выполнении компьютерного программного продукта на компьютере. Программный код может, например, храниться на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для осуществления одного из описанных здесь способов, хранящуюся на машиночитаемом носителе или нетранзиторном носителе данных.

Другими словами, вариант осуществления способа, отвечающего изобретению, предусматривает, таким образом, компьютерную программу, имеющую программный код для осуществления одного из описанных здесь способов при выполнении компьютерной программы на компьютере.

Дополнительный вариант осуществления способов, отвечающих изобретению, предусматривает, таким образом, среду переноса данных (или цифровой носитель данных или компьютерно-считываемый носитель), на котором записана компьютерная программа для осуществления одного из описанных здесь способов.

Дополнительный вариант осуществления способа, отвечающего изобретению, предусматривает, таким образом, поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из описанных здесь способов. Поток данных или последовательность сигналов может, например, переноситься через соединение с возможностью передачи данных, например, через интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью или адаптированное для осуществления одного из описанных здесь способов.

Дополнительный вариант осуществления содержит компьютер с установленной на нем компьютерной программой для осуществления одного из описанных здесь способов.

В некоторых вариантах осуществления, программируемое логическое устройство (например, вентильная матрица, программируемая пользователем) может использоваться для осуществления некоторых или всех функциональных возможностей описанных здесь способов. В некоторых вариантах осуществления, вентильная матрица, программируемая пользователем может взаимодействовать с микропроцессором для осуществления одного из описанных здесь способов. В общем случае, способы преимущественно осуществляются любым аппаратным устройством.

Хотя это изобретение описано применительно к некоторым вариантам осуществления, допустимы изменения, перестановки и эквиваленты, не выходящие за рамки объема этого изобретения. Следует также заметить, что существует много альтернативных путей осуществления способов и составов настоящего изобретения. Поэтому нижеследующую формулу изобретения следует рассматривать как включающую в себя все подобные изменения, перестановки и эквиваленты, отвечающие истинной сущности и объему настоящего изобретения.

Ссылочные позиции:

1 информационный кодер

2 анализатор

3 преобразователь

4 квантователь

5 формирователь битового потока

6 определяющее устройство

7 устройство сдвига коэффициентов

8 устройство преобразования Фурье

9 идентификатор нулей

10 устройство заполнения нулями

11 ограничительное устройство

12 фазовращатель

13 формирователь составного полинома

14 устройство преобразования Фурье с половинными выборками

IS информационный сигнал

RES действительный спектр

IES мнимый спектр

f₁…f_n значения частоты

f_q1…f_qn квантованные значения частоты

BS битовый поток

Ссылки:

[1] B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola-Pukkila, J. Vainio, H. Mikkola, and K. Järvinen, ʺThe adaptive multirate wideband speech codec (AMR-WB)ʺ, Speech and Audio Processing, IEEE Transactions on, vol. 10, no. 8, pp. 620-636, 2002.

[2] ITU-T G.718, ʺFrame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/sʺ, 2008.

[3] M. Neuendorf, P. Gournay, M. Multrus, J. Lecomte, B. Bessette, R. Geiger, S. Bayer, G. Fuchs, J. Hilpert, N. Rettelbach, R. Salami, G. Schuller, R. Lefebvre, and B. Grill, ʺUnified speech and audio coding scheme for high quality at low bitratesʺ, in Acoustics, Speech and Signal Processing. ICASSP 2009. IEEE Int Conf, 2009, pp. 1-4.

[4] T. Bäckström and C. Magi, ʺProperties of line spectrum pair polynomials - a reviewʺ, Signal Processing, vol. 86, no. 11, pp. 3286-3298, November 2006.

[5] G. Kang and L. Fransen, ʺApplication of line-spectrum pairs to low-bit-rate speech encodersʺ, in Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP'85., vol. 10. IEEE, 1985, pp. 244-247.

[6] P. Kabal and R. P. Ramachandran, ʺThe computation of line spectral frequencies using Chebyshev polynomialsʺ, Acoustics, Speech and Signal Processing, IEEE Transactions on, vol. 34, no. 6, pp. 1419-1426, 1986.

[7] 3GPP TS 26.190 V7.0.0, ʺAdaptive multi-rate (AMR-WB) speech codecʺ, 2007.

[8] T. Bäckström, C. Magi, and P. Alku, ʺMinimum separation of line spectral frequenciesʺ, IEEE Signal Process. Lett., vol. 14, no. 2, pp. 145-147, February 2007.

[9] T. Bäckström, ʺVandermonde factorization of Toeplitz matrices and applications in filtering and warping,ʺ IEEE Trans. Signal Process., vol. 61, no. 24, pp. 6257-6263, 2013.

[10] V. F. Pisarenko, ʺThe retrieval of harmonics from a covariance functionʺ, Geophysical Journal of the Royal Astronomical Society, vol. 33, no. 3, pp. 347-366, 1973.

[11] E. Durand, Solutions Numériques des Équations Algébriques. Paris: Masson, 1960.

[12] I. Kerner, ʺEin Gesamtschrittverfahren zur Berechnung der Nullstellen von Polynomenʺ, Numerische Mathematik, vol. 8, no. 3, pp. 290-294, May 1966.

[13] O. Aberth, ʺIteration methods for finding all zeros of a polynomial simultaneouslyʺ, Mathematics of Computation, vol. 27, no. 122, pp. 339-344, April 1973.

[14] L. Ehrlich, ʺA modified newton method for polynomialsʺ, Communications of the ACM, vol. 10, no. 2, pp. 107-108, February 1967.

[15] D. Starer and A. Nehorai, ʺPolynomial factorization algorithms for adaptive root estimationʺ, in Int. Conf. on Acoustics, Speech, and Signal Processing, vol. 2. Glasgow, UK: IEEE, May 1989, pp. 1158-1161.

[16] --, ʺAdaptive polynomial factorization by coefficient matchingʺ, IEEE Transactions on Signal Processing, vol. 39, no. 2, pp. 527-530, February 1991.

[17] G. H. Golub and C. F. van Loan, Matrix Computations, 3rd ed. John Hopkins University Press, 1996.

[18] T. Saramäki, ʺFinite impulse response filter designʺ, Handbook for Digital Signal Processing, pp. 155-277, 1993.

Источник поступления информации: Роспатент

‹ › ×

Авторы
Правообладатели

Показаны записи 1-10 из 331.

20.08.2013

№216.012.5f96

Способ сварки и конструктивный элемент

Изобретение может быть использовано при ремонте конструктивных элементов с заполнением сваркой углублений поврежденной области. Углубление (4) имеет контур (16), который ограничивает наружную поверхность (13) конструктивного элемента относительно углубления (4). Углубление (4) заполняют слоями...

Тип: Изобретение

Номер охранного документа: 0002490102

Дата охранного документа: 20.08.2013

Показать авторов и правообладателей

10.09.2013

№216.012.6915

Силовой полупроводниковый модуль с боковыми стенками слоистой конструкции

Изобретение относится к силовому полупроводниковому модулю. Технический результат - предложение силового полупроводникового модуля, обладающего высокой взрывоустойчивостью и изготавливаемого с особенно оптимальными затратами. Достигается тем, что в силовом полупроводниковом модуле (1),...

Тип: Изобретение

Номер охранного документа: 0002492548

Дата охранного документа: 10.09.2013

Показать авторов и правообладателей

20.09.2013

№216.012.6d3e

Устройство, способ и компьютерная программа для обеспечения набора пространственных указателей на основе сигнала микрофона и устройство для обеспечения двухканального аудиосигнала и набора пространственных указателей

Устройство для обеспечения набора пространственных указателей, связанных с аудиосигналом повышающего микширования, имеющим более двух каналов, на основе двухканального сигнала микрофона, содержит анализатор сигнала и генератор дополнительной пространственной информации. Анализатор сигнала...

Тип: Изобретение

Номер охранного документа: 0002493617

Дата охранного документа: 20.09.2013

Показать авторов и правообладателей

20.11.2013

№216.012.827b

Способ получения прозрачного проводящего покрытия из оксида металла путем импульсного высокоионизирующего магнетронного распыления

Прозрачное проводящее покрытие из оксида металла наносят на подложку путем распыления, по меньшей мере, одного компонента покрытия из оксида металла импульсным магнетронным методом и конденсирования его на подложке. Пиковая плотность мощности импульсов магнетрона составляет свыше 1,5 кВт/см,...

Тип: Изобретение

Номер охранного документа: 0002499079

Дата охранного документа: 20.11.2013

Показать авторов и правообладателей

20.08.2014

№216.012.eb94

Транспортное средство с отражателем звуковых волн

Группа изобретений относится к области транспортного машиностроения. Транспортное средство по первому варианту содержит потолок и один динамик. Потолок имеет первую часть, отражающую звуковые волны и имеющую первую характеристику отражения звуковых волн, и вторую часть, имеющую вторую...

Тип: Изобретение

Номер охранного документа: 0002526116

Дата охранного документа: 20.08.2014

Показать авторов и правообладателей

10.09.2014

№216.012.f1d9

Устройство, способ и компьютерная программа для выработки широкополосного сигнала с использованием управляемого расширения ширины полосы и слепого расширения ширины полосы

Изобретение относится к средствам для выработки широкополосного сигнала с использованием входного сигнала низкой полосы. Технический результат заключается в расширении полосы при низкой скорости передачи битов и сохранении высокого качества сигнала. Процессор выполняет операции управляемого...

Тип: Изобретение

Номер охранного документа: 0002527735

Дата охранного документа: 10.09.2014

Показать авторов и правообладателей

20.02.2015

№216.013.28a7

Аудио или видео кодер, аудио или видео и относящиеся к ним способы для обработки многоканальных аудио или видеосигналов с использованием переменного направления предсказания

Изобретение относится к средствам обработки многоканальных аудио или видеосигналов с использованием переменного направления предсказания. Технический результат заключается в повышении качества аудио или видео. Объединяют два аудио или видео канала для получения первого сигнала объединения в...

Тип: Изобретение

Номер охранного документа: 0002541864

Дата охранного документа: 20.02.2015

Показать авторов и правообладателей

10.04.2015

№216.013.3ad7

Поставщик транспортного потока, поставщик сигнала dab, анализатор транспортного потока, приемник dab, способ, компьютерная программа и сигнал транспортного потока

Изобретение относится к поставщикам транспортного потока. Технический результат заключается в повышении безопасности передачи данных. Поставщик транспортного потока конфигурируется для предоставления пакета транспортного потока первого типа пакета, содержащего таблицу взаимосвязи программ и...

Тип: Изобретение

Номер охранного документа: 0002546551

Дата охранного документа: 10.04.2015

Показать авторов и правообладателей

10.04.2015

№216.013.3b0a

Способ и кодер и декодер для воспроизведения без промежутка аудио сигнала

Заявленное изобретение относится к средствам для выдачи информации относительно достоверности закодированных аудиоданных. Технический результат заключается в обеспечении возможности обрезания недостоверных данных. Каждый блок закодированных аудиоданных может содержать информацию относительно...

Тип: Изобретение

Номер охранного документа: 0002546602

Дата охранного документа: 10.04.2015

Показать авторов и правообладателей

10.04.2015

№216.013.3d89

Аудиокодек, поддерживающий режимы кодирования во временной области и в частотной области

Изобретение относится к средствам, поддерживающим режимы кодирования во временной области и в частотной области. Технический результат заключается в уменьшении задержки и повышении эффективности кодирования с точки зрения отношения скорость/искажения. Конфигурируют аудиокодер таким образом, что...

Тип: Изобретение

Номер охранного документа: 0002547241

Дата охранного документа: 10.04.2015

Показать авторов и правообладателей

Показаны записи 1-9 из 9.

10.02.2016

№216.014.c211

Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра

Изобретение относится к средствам кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра. Технический результат заключается в повышении качества кодированного аудиосигнала. Блок применения оконной функции для применения окна анализа кодирования с...

Тип: Изобретение

Номер охранного документа: 0002574849

Дата охранного документа: 10.02.2016

Показать авторов и правообладателей

20.02.2016

№216.014.cedb

Кодирование и декодирование позиций слотов с событиями в кадре аудиосигнала

Изобретение относится к области обработки аудиосигнала и аудиокодирования. Технический результат - повышение точности кодирования и декодирования. Раскрыты устройство для декодирования, устройство для кодирования, способ декодирования и способ кодирования позиций слотов, содержащих события в...

Тип: Изобретение

Номер охранного документа: 0002575393

Дата охранного документа: 20.02.2016

Показать авторов и правообладателей

10.06.2016

№216.015.4914

Кодирование и декодирование позиций импульсов дорожек аудиосигнала

Изобретение относится к средствам кодирования и декодирования закодированного аудиосигнала. Технический результат заключается в обеспечении кодирования и декодирования информации импульсов с использованием меньшего количества битов для представления информации импульсов, что обеспечит...

Тип: Изобретение

Номер охранного документа: 0002586597

Дата охранного документа: 10.06.2016

Показать авторов и правообладателей

19.01.2018

№218.016.05d2

Матрицы оптимального микширования и использование декорреляторов при обработке пространственного звука

Изобретение относится к акустике. Устройство для генерации звукового сигнала, имеющее два или более звуковых каналов. Устройство содержит блок предварительной обработки и процессор сигналов. Блок предварительной обработки выполнен с возможностью рассчета первой ковариантности звукового сигнала....

Тип: Изобретение

Номер охранного документа: 0002631023

Дата охранного документа: 15.09.2017

Показать авторов и правообладателей

20.01.2018

№218.016.1975

Устройство для кодирования речевого сигнала с использованием acelp в автокорреляционной области

Изобретение относится к средствам для кодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования аудио. Устройство кодирования речевого сигнала посредством определения вектора кодовой книги алгоритма кодирования речи содержит модуль определения матрицы для...

Тип: Изобретение

Номер охранного документа: 0002636126

Дата охранного документа: 20.11.2017

Показать авторов и правообладателей

10.05.2018

№218.016.495b

Основанное на линейном предсказании кодирование аудио с использованием улучшенной оценки распределения вероятностей

Изобретение относится к средствам для кодирования аудио. Технический результат заключается в повышении эффективности кодирования. Основанный на линейном предсказании аудиодекодер содержит: модуль оценки распределений вероятностей, сконфигурированный с возможностью определять, для каждой из...

Тип: Изобретение

Номер охранного документа: 0002651187

Дата охранного документа: 18.04.2018

Показать авторов и правообладателей

26.07.2018

№218.016.7580

Кодер, декодер и способ кодирования и декодирования

Изобретение относится к средствам для кодирования и декодирования. Технический результат заключается в повышении эффективности кодирования. Кодер для кодирования аудиосигнала в поток данных содержит модуль предсказания, модуль разложения на множители, преобразователь и каскад квантования и...

Тип: Изобретение

Номер охранного документа: 0002662407

Дата охранного документа: 25.07.2018

Показать авторов и правообладателей

02.08.2018

№218.016.77da

Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения

Изобретение относится к кодированию и декодированию огибающей аудиосигнала. Технический результат – улучшение кодирования и декодирования огибающей аудиосигналов. Устройство содержит интерфейс ввода для приема кодирующих значений и генератор огибающей для генерации огибающей аудиосигнала,...

Тип: Изобретение

Номер охранного документа: 0002662921

Дата охранного документа: 31.07.2018

Показать авторов и правообладателей

27.01.2020

№220.017.fa59

Кодер и способ кодирования аудиосигнала с уменьшенным фоновым шумом с использованием кодирования с линейным предсказанием

Изобретение относится к вычислительной технике для кодирования аудиосигнала. Технический результат заключается в повышении точности обработки аудиосигнала с использованием кодирования с линейным предсказанием. Технический результат достигается за счет оценки представления фонового шума...

Тип: Изобретение

Номер охранного документа: 0002712125

Дата охранного документа: 24.01.2020

Показать авторов и правообладателей