×
10.08.2015
216.013.6df8

Результат интеллектуальной деятельности: СПОСОБ ОБРАБОТКИ ФУНКЦИИ АВТОКОРРЕЛЯЦИИ ДЛЯ ИЗМЕРЕНИЯ ОСНОВНОГО ТОНА РЕЧЕВОГО СИГНАЛА

Вид РИД

Изобретение

Аннотация: Изобретение относится к средствам обработки функции автокорреляции для измерения основного тона речевого сигнала и может быть использовано в области обработки сигналов, в системах распознавания речи. Технический результат заключается в повышении надежности измерения частоты основного тона речевого сигнала. Подчеркивают главный пик в автокорреляционной функции с помощью вычитания из автокорреляционной функции, полученной для сегмента сигнала, меньшей по амплитуде сглаженной функции автокорреляции для модуля сигнала на том же сегменте и обнуления отрицательных разностей. 1 з.п. ф-лы, 3 ил.

Изобретение относится к области обработки сигналов и может быть использовано для измерения основного тона речевых сигналов, а также других квазипериодических сигналов.

Измерение основного тона является базовой процедурой при анализе и распознавании речевого сигнала. Для этих целей часто используется кратковременная автокорреляционная функция коротких вокализованных сегментов сигнала длительностью ΔT=20-50 мс. Пусть имеется сегмент речевого сигнала s(t), заданный на интервале [0, ΔT]. В этом случае частота основного тона f0=1/T0 определяется величиной, обратной координате главного пика на τ=Т0 автокорреляционной функции

или нормированной автокорреляционной функции r0(τ)=r(τ)/r(0). Однако поскольку речевой сигнал является сверткой сигнала голосового источника, роль которого выполняют голосовые связки, с импульсной характеристикой речевого тракта, то за пик основного тона может быть принят пик автокорреляционной функции, связанный с первой формантой речевого сигнала, что приводит к нежелательным грубым ошибкам измерения основного тона.

Для уменьшения амплитуды пика в r(τ), связанного с первой формантой, используется центральное клиппирование речевого сигнала (Sondhi M.M. New methods of pitch extraction // IEEE Trans. Audio and Electroacoust. 1968. V.AU-16. №2. 262-266), выравнивающее амплитуды гармоник речевого сигнала и тем самым ослабляющее его формантные резонансы. Подобная процедура обеспечивает подчеркивание пика корреляционной функции на τ=Т0 для стационарных участков речевого сигнала, однако оказывается неудовлетворительной при изменении амплитуды речевого сигнала на протяжении интервала ΔT или в присутствии импульсных помех.

Наиболее близким техническим решением к предлагаемому способу является способ подчеркивания в автокорреляционной функции пика на τ=Т0 (Колоколов А.С., Любинский И.А., Мещеряков А.Ю. Измерение основного тона речевого сигнала на основе его автокорреляционной функции // Наукоемкие технологии, 2012, т.13, №5, с.26-29). Он основан на клиппировании положительных пиков в автокорреляционной функции r0(τ) с помощью линейно-убывающей функции , где α - параметр, определяющий уровень клиппирования r0(τ), выбираемый в диапазоне 0<α<1, а τ ∈[0, ΔТ]. В результате получается клиппированная автокорреляционная функция

Рассмотренная процедура клиппирования обеспечивает подчеркивание пика автокорреляционной функции на τ=Т0 для стационарных участков речевого сигнала и является малочувствительной к присутствию импульсных помех, однако оказывается неудовлетворительной при изменении амплитуды речевого сигнала на протяжении интервала ΔT, т.к. в этом случае автокорреляционная функция r0(τ) будет затухать быстрее, чем пороговая функция р0(τ).

Техническим результатом изобретения является повышение надежности измерения частоты основного тона ƒ0 речевого сигнала путем применения обработки автокорреляционной функции r0(τ), подчеркивающей ее пик на τ=1/ƒ0.

Технический результат обеспечивается тем, что производится подчеркивание главного пика в автокорреляционной функции с помощью вычитания из автокорреляционной функции, полученной для сегмента сигнала, меньшей по амплитуде функции автокорреляции для модуля сигнала на том же сегменте и обнуления отрицательных разностей.

Кроме того, производят дополнительное сглаживание функции автокорреляции, найденной для модуля сигнала.

На фиг. 1 представлена блок-схема, поясняющая процесс обработки автокорреляционной функции r0(τ) в предлагаемом способе.

На фиг. 2 предложенный способ поясняется на примере двухформантного синтетического гласного с постоянной амплитудой.

На фиг. 3 демонстрируется устойчивость способа при линейном убывании амплитуды на сегменте гласного до уровня 0,5 - (а) и 0,25 - (б).

На фиг.1 представлены блок получения автокорреляционной функции сигнала 1, блок получения автокорреляционной функции модуля сигнала 2, блок сглаживания 3, блок умножения на постоянный коэффициент 4, блок вычитания 5, блок обнуления отрицательных значений 6.

Поставленная цель достигается с помощью нахождения взвешенной разности

где

⊗ - знак операции свертки; h(τ) - симметричная импульсная характеристика сглаживающего фильтра, которая в частном случае отсутствия сглаживания будет представлять собой δ - функцию Дирака; 0<α<1; τ∈[0, Т]; |s(t)| - модуль s(t).

Такого рода обработку можно рассматривать как своего рода клиппирование r0(τ) с пороговой функцией ar0e(τ), затухающей примерно так же, как и r0(τ). В результате этого rc2(τ) в сравнении с rc1(τ) выделение пика на τ=Т0 оказывается в меньшей степени зависимым от изменении амплитуды речевого сигнала на протяжении интервала ΔT.

Приведенные на фиг.2(а), (б) и (с) зависимости, представляющие соответственно автокорреляционные функции r0(τ), r0e(τ) и результат обработки rc2(τ), были получены для дискретного двухформантного синтетического гласного, представленного 256 отсчетами, при частоте дискретизации 10 кГц для α=0,85. Синтезированный гласный имел частоту основного тона f0=100 Гц и частоты формант 500 и 830 Гц.

Сглаживание r0e(τ) выполнялось с помощью фильтра низких частот с симметричной импульсной характеристикой h(n)=0,25u0(n-1)+0,5u0(n)+0,25u0(n+1), где n=…-2, -1, 0, 1, 2, …,

Поэтому вычисление свертки сводилось к суммированию трех взвешенных спектральных отсчетов. В одном случае (фиг.2) амплитуда гласного была неизменной на протяжении сегмента длительностью ΔT=25,6 мс, в других двух случаях (фиг.3(а) и 3(б)) линейно спадала до уровней в два и четыре раза ниже исходного.

Из чертежей можно видеть, что предложенный способ обработки автокорреляционной функции позволяет подчеркнуть ее пик на τ=1/f0 как в случае речевого сигнала с постоянной амплитудой, так и при изменениях амплитуды речевого сигнала на интервале анализа ΔT. При этом во всех случаях пик у rc2(τ) на τ=1/f0 является существенно более выраженным в сравнении с другими пиками, нежели у автокорреляционной функции r0(τ).

Таким образом, приведенные выше данные позволяют заключить, что предложенный способ обработки функции автокорреляции может быть использован для реализации более устойчивого измерения основного тона речевого сигнала в присутствии амплитудных вариаций сигнала на интервале анализа ΔT.


СПОСОБ ОБРАБОТКИ ФУНКЦИИ АВТОКОРРЕЛЯЦИИ ДЛЯ ИЗМЕРЕНИЯ ОСНОВНОГО ТОНА РЕЧЕВОГО СИГНАЛА
СПОСОБ ОБРАБОТКИ ФУНКЦИИ АВТОКОРРЕЛЯЦИИ ДЛЯ ИЗМЕРЕНИЯ ОСНОВНОГО ТОНА РЕЧЕВОГО СИГНАЛА
СПОСОБ ОБРАБОТКИ ФУНКЦИИ АВТОКОРРЕЛЯЦИИ ДЛЯ ИЗМЕРЕНИЯ ОСНОВНОГО ТОНА РЕЧЕВОГО СИГНАЛА
Источник поступления информации: Роспатент

Showing 271-276 of 276 items.
27.05.2023
№223.018.70ec

Устройство установки датчиков для контроля параметров в помещении для содержания сельскохозяйственных животных

Изобретение относится к сельскому хозяйству, а именно к технологиям содержания животных, и может быть применено в конструкции устройств контроля за параметрами микроклимата на фермах. Устройство содержит размещенную в помещении пространственную ферменную конструкцию, образованную...
Тип: Изобретение
Номер охранного документа: 0002776203
Дата охранного документа: 14.07.2022
29.05.2023
№223.018.7271

Способ определения длины металлической трубы

Изобретение относится к измерительной технике и может быть использовано для бесконтактного определения длины металлических труб как готовых изделий, так и при их производстве на металлургических, машиностроительных предприятиях. Технический результат – повышение точности определения длины...
Тип: Изобретение
Номер охранного документа: 0002796388
Дата охранного документа: 22.05.2023
03.06.2023
№223.018.76af

Способ измерения массового расхода газообразного вещества, протекающего по трубопроводу

Изобретение относится к области приборостроения, в частности к способам измерения расхода потоков веществ. Способ измерения массового расхода газообразного вещества, протекающего по трубопроводу, заключается в том, что поток контролируемой среды нагревают микроволновым излучением. Сначала...
Тип: Изобретение
Номер охранного документа: 0002748325
Дата охранного документа: 24.05.2021
05.06.2023
№223.018.76c3

Способ измерения физической величины

Изобретение относится к области электротехники, а именно к волноводному резонатору для измерения диэлектрической проницаемости жидкости. Повышение точности измерений является техническим результатом, который достигается за счет того, что предварительно определяют номинальное значение...
Тип: Изобретение
Номер охранного документа: 0002786526
Дата охранного документа: 21.12.2022
05.06.2023
№223.018.7730

Устройство для молниеотвода от привязного коптера

Изобретение относится к средствам защиты объектов различного назначения при прямом или близком воздействии молниевых разрядов, электромагнитных импульсов (ЭМИ), коротких замыканий и коммутаций энергооборудования, в частности к средствам молниезащиты, беспилотных летательных аппаратов....
Тип: Изобретение
Номер охранного документа: 0002767515
Дата охранного документа: 17.03.2022
05.06.2023
№223.018.77c5

Способ и система управления связями компьютеров в многоуровневом составном компьютерном кластере

Изобретение относится к вычислительной технике. Технический результат заключается в расширении арсенала средств того же назначения. Способ управления связями компьютеров в многоуровневом составном компьютерном кластере, содержащем контроллеры компьютеров - объекты O и модули связи MS,...
Тип: Изобретение
Номер охранного документа: 0002744591
Дата охранного документа: 11.03.2021
Showing 171-171 of 171 items.
09.06.2019
№219.017.7ca2

Способ определения остаточного ресурса детали акустической диагностикой

Использование: для определения остаточного ресурса детали. Сущность заключается в том, что в детали кратковременным ударным воздействием возбуждают собственные упругие акустические колебания, регистрируют и анализируют их параметры, при этом в качестве информативного параметра выявляют и...
Тип: Изобретение
Номер охранного документа: 0002320987
Дата охранного документа: 27.03.2008
+ добавить свой РИД