×
19.04.2019
219.017.31cc

СПОСОБ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА В ЧАСТОТНОЙ ОБЛАСТИ

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
№ охранного документа
0002454735
Дата охранного документа
27.06.2012
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится к области обработки сигналов и может быть использовано при выполнении предварительной обработки речевого сигнала в системах распознавания речи. Предложен способ обработки речевого сигнала, основанный на полосовой фильтрации логарифмического амплитудного спектра фильтром с нечетной импульсной характеристикой и выявлении дополнительных информативных признаков в спектре речевого сигнала. Такими признаками являются локальные положительные и отрицательные наклоны в спектре речевого сигнала, формируемые частотной характеристикой речевого тракта. Технический результат - получение устойчивого и более полного описания речевого сигнала в частотной области путем выявления в логарифмическом амплитудном спектре дополнительных локальных информативных признаков в спектре речевого сигала. 1 з.п. ф-лы, 5 ил.
Реферат Свернуть Развернуть

Изобретение относится к области обработки сигналов и может быть использовано для целей анализа и формирования первичного описания речевого сигнала в системах распознавания речи.

Частотный анализ речевого сигнала широко применяется в современных системах распознавания речи для получения первичного описания сигнала, на основе которого далее производится формирование эталонов речевых звуков, используемых при распознавании. Однако спектр речевого сигнала является зависимым от частотных искажений в канале связи, реверберации или изменения психофизиологического состояния диктора, сопровождающегося вариациями формы импульсов голосового источника. Кроме того, на спектр сигнала также может оказывать влияние присутствие фонового шума. В связи с этим для получения более устойчивого описания речевого сигнала полезной является дополнительная обработка спектра, выявляющая его локальные признаки, которые более устойчивы к перечисленным выше факторам.

Известен способ подобной обработки, основанный на полосовой фильтрации амплитудного спектра речевого сигнала, реализуемой с помощью взвешенного суммирования с разными знаками соседних спектральных отсчетов (Позин Н.В., Любинский И.А., Левашов О.В. и др. Элементы теории биологических анализаторов. М.: Наука, 1978, с.96; Колоколов А.С. Об одном методе анализа периодических сигналов, искаженных аддитивным шумом. Институт проблем управления АН СССР. Москва, 1983. 11 с. Рукопись деп. в ВИНИТИ №6252-83 Деп.). Благодаря такой обработке в амплитудном спектре подчеркиваются спектральные пики, представляющие гармонические компоненты сигнала, увеличивается частотное разрешение спектрального анализатора и повышается отношение сигнал/шум. Однако рассмотренный способ не обеспечивает устойчивости обработанного спектра к частотным искажениям речевого сигнала. Причина этого заключается в том, что факторы, влияющие на изменчивость спектра речевого сигнала, являются его мультипликативными составляющими и их действие не может быть ослаблено с помощью линейной фильтрации.

Наиболее близким техническим решением к предлагаемому является способ получения более устойчивого описания речевого сигнала в частотной области с помощью полосовой фильтрации логарифмического амплитудного спектра с использованием фильтра с четной импульсной характеристикой и последующего нелинейного преобразования,

обеспечивающих выделение в логарифмическом амплитудном спектре пиков, связанных с резонансами речевого тракта (Колоколов А.С. Обработка сигнала в частотной области при распознавании речи // Проблемы управления. 2006. №3. С.14). В результате получается преобразованный спектр

где: F(f,t)=lgS(f,t) - кратковременный логарифмический спектр речевого сигнала, φ(f) - импульсная характеристика полосового фильтра, являющаяся четной функцией, т.е. φ(f)=φ(-f), ⊗ - операция свертки, Q(x)=x при x≥0, Q(x)=0 при x<0.

В результате логарифмирования спектра

S(f,t)=H(f,t)E(f,t)W(f,t)

его мультипликативные компоненты становятся аддитивными

F(f,t)=lgH(f,t)+lgE(f,t)+lgW(f,t),

где H(f,t) - частотная характеристика речевого тракта, E(f,t) - спектр шумового или голосового источника, W(f,t) - характеристика фильтра, описывающего частотные искажения речевого сигнала. В случае голосового источника E(f,t)=I(f,t)G(f,t), где I(f,t) - спектр почти периодической последовательности δ - функций, G(f,t) - спектр импульса голосового источника. Поэтому с помощью полосовой фильтрации F(f,t) в Fl(f,t) оказывается возможным уменьшить нежелательные вариации, свойственные спектру S(f,t), обусловленные изменениями его мультипликативных компонент W(f,t) и G(f,t), обычно весьма медленно изменяющихся с частотой в сравнении с H(f,t), профиль которой обычно имеет несколько выраженных пиков, представляющих форманты речевого сигнала. Одновременно с помощью полосовой фильтрации производится сглаживание быстро изменяющейся с частотой составляющей I(f,t), описывающей гармоническую структуру речевого сигнала. Таким образом благодаря выполнению обработки (1) выявляются мало чувствительные к вариациям S(f,t) локальные признаки спектра, характеризующие формантный состав звука.

Однако рассмотренный способ не обеспечивает сохранения значительной части важной информации, содержащейся в логарифмическом спектре F(f,t), т.к. выявляет только локальные признаки в спектральной огибающей, представляющие максимумы в lgH(f,t).

Техническим результатом изобретения является выявление в логарифмическом амплитудном спектре дополнительных локальных информативных признаков, представляющих локальные наклоны lgH(f,t). Использование таких признаков в дополнение к признакам, получаемым с помощью обработки (1), позволяет получить устойчивое и более полное описание речевого сигнала в частотной области.

Технический результат достигается тем, что для фильтрации используют фильтр с нечетной импульсной характеристикой, параметры которого выбирают таким образом, чтобы в отфильтрованной спектральной огибающей в виде хорошо выраженных пиков проявлялись локальные наклоны спектра, связанные с частотной характеристикой речевого тракта, и одновременно подавлялась гармоническая структура речевого сигнала. Кроме того, производят отдельное выделение положительных и отрицательных пиков в отфильтрованной огибающей спектра.

На фиг.1 представлена блок-схема, поясняющая предлагаемый способ.

На фиг.2 - вид импульсной характеристики φ1(f) для фильтрации логарифмического спектра и ее преобразование Фурье Ф1 (t).

На фиг.3 - исходный F(i) и обработанный спектры для фрагмента гласного «э» в слове «семь», а - исходный сигнал, б - продифференцированный сигнал.

На фиг.4 - исходный F(i) и обработанный спектры для фрагмента гласного «э» в слове «семь», а - исходный сигнал, б - продифференцированный сигнал.

На фиг.5 - исходный F(i) и обработанный спектры для фрагмента звонкой смычки в слоге «да», а - исходный сигнал, б - продифференцированный сигнал.

На фиг.1 представлены спектральный анализатор 1, полосовой фильтр 2, нелинейные преобразователи 3 и 4.

Поставленная цель достигается с помощью полосовой фильтрации логарифмического амплитудного спектра

фильтром с нечетной импульсной характеристикой φ1(f)=-φ1(-f). В результате преобразования (2) локальные наклоны в спектре F(f,t) представляются в зависимости от знака наклона положительными или отрицательными пиками в F2(f,t), положения которых определяют места локальных наклонов в F(f,t). Далее в отфильтрованном спектре F2(f,t) разделяют положительные и отрицательные составляющие

представляющие соответственно положительные и отрицательные локальные наклоны в логарифмическом спектре F(f,t). Таким образом, выполнение преобразований (2) и (3) можно трактовать как результат работы двух специфических детекторов неоднородностей в F(f,t), реагирующих на крутизну положительных и отрицательных наклонов логарифмической спектральной огибающей.

Ширину и форму импульсной характеристики φ1(f) полосового фильтра следует выбирать так, чтобы в отфильтрованном логарифмическом спектре F2(f,t) в виде выраженных пиков были представлены резкие локальные наклоны частотной характеристики речевого тракта H(f,t), но при этом подавлялась быстро изменяющаяся с частотой составляющая I(f,t), описывающая гармоническую структуру голосового источника. Последнее условие может быть необязательным в случае использования спектрального анализатора с низким частотным разрешением, не обеспечивающим выделения гармонической структуры речевого сигнала.

Важной особенностью преобразования (2) является его нечувствительность к амплитуде речевого сигнала. Это следует из того, что умножение сигнала на константу проявляется в виде постоянной аддитивной составляющей в F(f,t), которая исключается в результате полосовой фильтрации. Поэтому отпадает необходимость в нормализации обработанных спектров F2(f,t), и по амплитуде.

Кроме того, благодаря полосовой фильтрации F(f,t) при преобразованиях (2) и (3), как и в случае преобразования (1), следует ожидать эффекта малой изменчивости обработанного спектра F2(f,t) при наличии частотных искажений, создаваемых фильтром с частотной характеристикой W(f,t), медленно изменяющейся с частотой, и фоновых широкополосных шумов со спектральной плотностью, медленно изменяющейся с частотой.

Приведенные на фигурах логарифмические спектры речевых образцов были получены с помощью частотного анализатора, в общих чертах моделирующего особенности частотного анализа звука в слуховой системе. Для этих целей использовалась гребенка из N=35 цифровых полосовых фильтров, центральные частоты которых располагались равномерно по шкале Барков с шагом 0,57 Барк, начиная с 1,95 Барк (200 Гц). Частотные характеристики фильтров слухового частотного анализатора аппроксимировались полосовыми фильтрами Баттерворта четвертого порядка с наклонами частотной характеристики 12 дБ/окт и шириной полосы пропускания 1,5 Барка. Для фильтрации полученных логарифмических спектров F(i), i - номер фильтра, использовалась симметричная нечетная весовая функция φ(n)=-δk(n-2)+δk(n+2), где δk(n) - функция Кронекера, n=…-2,-1,0,1,2,…. Поэтому вычисление свертки сводилось к суммированию взвешенных спектральных отсчетов. Полученные отфильтрованные спектры и сглаживались низкочастотным фильтром с импульсной характеристикой φ0(n)=0,25δk(n-1)+0,5δk(n)+0,25δk(n+1). Частотные искажения вводились дифференцированием сигнала с помощью нахождения первой разности дискретной речевой волны.

Из чертежей легко видеть, что частотные искажения, обусловленные дифференцированием речевого сигнала, приводят к существенным различиям спектров F(i), достигающих 20 дБ, для гласного и звонкой смычки. Однако эти различия существенно меньше у обработанных спектров и , полученных в результате предложенной обработки спектра, и не превышают величины 4-5 дБ. Из чертежей также видно, что выраженные пики в обработанных спектрах представляют положения резких локальных наклонов спектра.

Таким образом, основываясь на приведенных выше данных, можно заключить, что предложенный способ обработки спектра может быть использован совместно с известным способом (1) для получения устойчивого описания речевого сигнала в частотной области в присутствии частотных искажений.

Источник поступления информации: Роспатент

Показаны записи 1-10 из 101.
20.01.2013
№216.012.1d86

Устройство для измерения уровня диэлектрической жидкости в емкости

Изобретение относится к измерительной технике и может быть использовано для высокоточного определения уровня диэлектрической жидкости, находящейся в какой-либо емкости. В частности, оно может быть применено для измерения уровня нефтепродуктов, сжиженных газов и др. Сущность: устройство содержит...
Тип: Изобретение
Номер охранного документа: 0002473052
Дата охранного документа: 20.01.2013
20.01.2013
№216.012.1d88

Способ измерения уровня вещества в открытой металлической емкости

Изобретение относится к измерительной технике и может быть использовано для измерения уровня вещества (жидкости, сыпучего вещества) в различных открытых металлических емкостях. Сущность: в способе измерения уровня вещества в открытой металлической емкости предварительно в верхней незаполняемой...
Тип: Изобретение
Номер охранного документа: 0002473054
Дата охранного документа: 20.01.2013
20.01.2013
№216.012.1d89

Способ измерения уровня жидкости в емкости

Изобретение относится к измерительной технике и предназначено для измерения уровня жидкости в различных открытых и замкнутых металлических емкостях. В частности, оно может быть применено для определения уровня жидкого металла в технологических емкостях металлургического производства. Способ...
Тип: Изобретение
Номер охранного документа: 0002473055
Дата охранного документа: 20.01.2013
20.01.2013
№216.012.1d8a

Способ определения уровня жидкости в емкости

Изобретение относится к измерительной технике и может быть использовано для высокоточного определения уровня жидкости, находящейся в каком-либо резервуаре. В частности, оно может быть применено для измерения уровня нефтепродуктов, сжиженных газов и др. Предлагается способ определения уровня...
Тип: Изобретение
Номер охранного документа: 0002473056
Дата охранного документа: 20.01.2013
20.01.2013
№216.012.1d95

Способ диагностирования двигателя внутреннего сгорания

Изобретение относится к испытаниям и диагностике двигателей внутреннего сгорания (ДВС). Способ диагностирования ДВС заключается в возбуждении в камере сгорания электромагнитных колебании фиксированной длины волны и определении амплитуды принимаемого сигнала. При проведении диагностирования...
Тип: Изобретение
Номер охранного документа: 0002473067
Дата охранного документа: 20.01.2013
27.01.2013
№216.012.205c

Способ комплексного использования попутного нефтяного газа

Предлагаемое изобретение относится к нефтяной и газовой промышленности и может быть применено для утилизации попутного нефтяного газа. Способ осуществляют следующим образом. После запуска газовой турбины в турбину сжатия подают воздух и попутный нефтяной газ. Сжатые газ и воздух направляют в...
Тип: Изобретение
Номер охранного документа: 0002473785
Дата охранного документа: 27.01.2013
27.01.2013
№216.012.20c3

Способ определения состояния поверхности дороги

Изобретение относится к измерительной технике и может быть применено для определения состояния поверхности дорожного полотна, на котором возможно образование слоя воды, снега или льда. Сущность: в поверхностный слой контролируемого участка дороги встраивают резонатор с изменяющейся в...
Тип: Изобретение
Номер охранного документа: 0002473888
Дата охранного документа: 27.01.2013
27.01.2013
№216.012.20c4

Способ измерения физической величины

Изобретение относится к измерительной технике и может быть использовано для высокоточного определения различных физических величин. К их числу относятся механические величины, геометрические параметры объектов, физические свойства веществ и др. К ним же относятся также электрофизические,...
Тип: Изобретение
Номер охранного документа: 0002473889
Дата охранного документа: 27.01.2013
27.01.2013
№216.012.210b

Способ нахождения максимальных повторяющихся участков последовательности символов конечного алфавита и способ вычисления вспомогательного массива

Изобретение относится к компьютерной обработке цифровых данных, точнее к способам сжатия массивов цифровой информации путем нахождения совпадающих фрагментов последовательности данных. Техническим результатом является уменьшение количества памяти, требующейся для представления всех максимальных...
Тип: Изобретение
Номер охранного документа: 0002473960
Дата охранного документа: 27.01.2013
27.01.2013
№216.012.215d

Способ получения электрической энергии от маломощных источников электропитания

Изобретение относится к электротехнике, а именно к способам получения электрической энергии от маломощных источников электропитания, например пьезоэлементов, вмонтированных в поверхность, по которой перемещаются подвижные объекты. Технический результат изобретения состоит в обеспечении...
Тип: Изобретение
Номер охранного документа: 0002474042
Дата охранного документа: 27.01.2013
Показаны записи 1-5 из 5.
10.08.2015
№216.013.6df8

Способ обработки функции автокорреляции для измерения основного тона речевого сигнала

Изобретение относится к средствам обработки функции автокорреляции для измерения основного тона речевого сигнала и может быть использовано в области обработки сигналов, в системах распознавания речи. Технический результат заключается в повышении надежности измерения частоты основного тона...
Тип: Изобретение
Номер охранного документа: 0002559710
Дата охранного документа: 10.08.2015
26.08.2017
№217.015.e42a

Способ диагностики механизмов, агрегатов и машин на основе оценки микровариаций вращения вала

Изобретение относится к области неразрушающего контроля и может быть использовано для диагностики состояния механизмов, агрегатов и машин, составной частью которых являются элементы, совершающие вращательное движение. Способ заключается в том, что на валу контролируемого изделия устанавливают...
Тип: Изобретение
Номер охранного документа: 0002626388
Дата охранного документа: 26.07.2017
26.10.2018
№218.016.965f

Способ кратковременного спектрального анализа квазистационарных сигналов

Изобретение относится к измерительной технике и предназначено для определения частот и амплитуд многокомпонентных нестационарных сигналов. Заявлен способ кратковременного спектрального анализа, в котором ошибки, возникающие из-за перекрытия характеристик полосовых фильтров (ПФ) при...
Тип: Изобретение
Номер охранного документа: 0002670702
Дата охранного документа: 24.10.2018
29.04.2019
№219.017.4309

Способ повышения степени усвоения учебной информации путем активизации внимания

Изобретение относится к области образования. Видеопродукцию предъявляют в виде ряда кадров, содержащих учебную информацию. По крайней мере, одна совокупность кадров представляет собой управляющий вниманием блок, который включает три последовательно расположенные группы кадров. Вторая группа...
Тип: Изобретение
Номер охранного документа: 0002360294
Дата охранного документа: 27.06.2009
09.06.2019
№219.017.7ca2

Способ определения остаточного ресурса детали акустической диагностикой

Использование: для определения остаточного ресурса детали. Сущность заключается в том, что в детали кратковременным ударным воздействием возбуждают собственные упругие акустические колебания, регистрируют и анализируют их параметры, при этом в качестве информативного параметра выявляют и...
Тип: Изобретение
Номер охранного документа: 0002320987
Дата охранного документа: 27.03.2008
+ добавить свой РИД