×
19.04.2019
219.017.31cc

Результат интеллектуальной деятельности: СПОСОБ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА В ЧАСТОТНОЙ ОБЛАСТИ

Вид РИД

Изобретение

№ охранного документа
0002454735
Дата охранного документа
27.06.2012
Аннотация: Изобретение относится к области обработки сигналов и может быть использовано при выполнении предварительной обработки речевого сигнала в системах распознавания речи. Предложен способ обработки речевого сигнала, основанный на полосовой фильтрации логарифмического амплитудного спектра фильтром с нечетной импульсной характеристикой и выявлении дополнительных информативных признаков в спектре речевого сигнала. Такими признаками являются локальные положительные и отрицательные наклоны в спектре речевого сигнала, формируемые частотной характеристикой речевого тракта. Технический результат - получение устойчивого и более полного описания речевого сигнала в частотной области путем выявления в логарифмическом амплитудном спектре дополнительных локальных информативных признаков в спектре речевого сигала. 1 з.п. ф-лы, 5 ил.

Изобретение относится к области обработки сигналов и может быть использовано для целей анализа и формирования первичного описания речевого сигнала в системах распознавания речи.

Частотный анализ речевого сигнала широко применяется в современных системах распознавания речи для получения первичного описания сигнала, на основе которого далее производится формирование эталонов речевых звуков, используемых при распознавании. Однако спектр речевого сигнала является зависимым от частотных искажений в канале связи, реверберации или изменения психофизиологического состояния диктора, сопровождающегося вариациями формы импульсов голосового источника. Кроме того, на спектр сигнала также может оказывать влияние присутствие фонового шума. В связи с этим для получения более устойчивого описания речевого сигнала полезной является дополнительная обработка спектра, выявляющая его локальные признаки, которые более устойчивы к перечисленным выше факторам.

Известен способ подобной обработки, основанный на полосовой фильтрации амплитудного спектра речевого сигнала, реализуемой с помощью взвешенного суммирования с разными знаками соседних спектральных отсчетов (Позин Н.В., Любинский И.А., Левашов О.В. и др. Элементы теории биологических анализаторов. М.: Наука, 1978, с.96; Колоколов А.С. Об одном методе анализа периодических сигналов, искаженных аддитивным шумом. Институт проблем управления АН СССР. Москва, 1983. 11 с. Рукопись деп. в ВИНИТИ №6252-83 Деп.). Благодаря такой обработке в амплитудном спектре подчеркиваются спектральные пики, представляющие гармонические компоненты сигнала, увеличивается частотное разрешение спектрального анализатора и повышается отношение сигнал/шум. Однако рассмотренный способ не обеспечивает устойчивости обработанного спектра к частотным искажениям речевого сигнала. Причина этого заключается в том, что факторы, влияющие на изменчивость спектра речевого сигнала, являются его мультипликативными составляющими и их действие не может быть ослаблено с помощью линейной фильтрации.

Наиболее близким техническим решением к предлагаемому является способ получения более устойчивого описания речевого сигнала в частотной области с помощью полосовой фильтрации логарифмического амплитудного спектра с использованием фильтра с четной импульсной характеристикой и последующего нелинейного преобразования,

обеспечивающих выделение в логарифмическом амплитудном спектре пиков, связанных с резонансами речевого тракта (Колоколов А.С. Обработка сигнала в частотной области при распознавании речи // Проблемы управления. 2006. №3. С.14). В результате получается преобразованный спектр

где: F(f,t)=lgS(f,t) - кратковременный логарифмический спектр речевого сигнала, φ(f) - импульсная характеристика полосового фильтра, являющаяся четной функцией, т.е. φ(f)=φ(-f), ⊗ - операция свертки, Q(x)=x при x≥0, Q(x)=0 при x<0.

В результате логарифмирования спектра

S(f,t)=H(f,t)E(f,t)W(f,t)

его мультипликативные компоненты становятся аддитивными

F(f,t)=lgH(f,t)+lgE(f,t)+lgW(f,t),

где H(f,t) - частотная характеристика речевого тракта, E(f,t) - спектр шумового или голосового источника, W(f,t) - характеристика фильтра, описывающего частотные искажения речевого сигнала. В случае голосового источника E(f,t)=I(f,t)G(f,t), где I(f,t) - спектр почти периодической последовательности δ - функций, G(f,t) - спектр импульса голосового источника. Поэтому с помощью полосовой фильтрации F(f,t) в Fl(f,t) оказывается возможным уменьшить нежелательные вариации, свойственные спектру S(f,t), обусловленные изменениями его мультипликативных компонент W(f,t) и G(f,t), обычно весьма медленно изменяющихся с частотой в сравнении с H(f,t), профиль которой обычно имеет несколько выраженных пиков, представляющих форманты речевого сигнала. Одновременно с помощью полосовой фильтрации производится сглаживание быстро изменяющейся с частотой составляющей I(f,t), описывающей гармоническую структуру речевого сигнала. Таким образом благодаря выполнению обработки (1) выявляются мало чувствительные к вариациям S(f,t) локальные признаки спектра, характеризующие формантный состав звука.

Однако рассмотренный способ не обеспечивает сохранения значительной части важной информации, содержащейся в логарифмическом спектре F(f,t), т.к. выявляет только локальные признаки в спектральной огибающей, представляющие максимумы в lgH(f,t).

Техническим результатом изобретения является выявление в логарифмическом амплитудном спектре дополнительных локальных информативных признаков, представляющих локальные наклоны lgH(f,t). Использование таких признаков в дополнение к признакам, получаемым с помощью обработки (1), позволяет получить устойчивое и более полное описание речевого сигнала в частотной области.

Технический результат достигается тем, что для фильтрации используют фильтр с нечетной импульсной характеристикой, параметры которого выбирают таким образом, чтобы в отфильтрованной спектральной огибающей в виде хорошо выраженных пиков проявлялись локальные наклоны спектра, связанные с частотной характеристикой речевого тракта, и одновременно подавлялась гармоническая структура речевого сигнала. Кроме того, производят отдельное выделение положительных и отрицательных пиков в отфильтрованной огибающей спектра.

На фиг.1 представлена блок-схема, поясняющая предлагаемый способ.

На фиг.2 - вид импульсной характеристики φ1(f) для фильтрации логарифмического спектра и ее преобразование Фурье Ф1 (t).

На фиг.3 - исходный F(i) и обработанный спектры для фрагмента гласного «э» в слове «семь», а - исходный сигнал, б - продифференцированный сигнал.

На фиг.4 - исходный F(i) и обработанный спектры для фрагмента гласного «э» в слове «семь», а - исходный сигнал, б - продифференцированный сигнал.

На фиг.5 - исходный F(i) и обработанный спектры для фрагмента звонкой смычки в слоге «да», а - исходный сигнал, б - продифференцированный сигнал.

На фиг.1 представлены спектральный анализатор 1, полосовой фильтр 2, нелинейные преобразователи 3 и 4.

Поставленная цель достигается с помощью полосовой фильтрации логарифмического амплитудного спектра

фильтром с нечетной импульсной характеристикой φ1(f)=-φ1(-f). В результате преобразования (2) локальные наклоны в спектре F(f,t) представляются в зависимости от знака наклона положительными или отрицательными пиками в F2(f,t), положения которых определяют места локальных наклонов в F(f,t). Далее в отфильтрованном спектре F2(f,t) разделяют положительные и отрицательные составляющие

представляющие соответственно положительные и отрицательные локальные наклоны в логарифмическом спектре F(f,t). Таким образом, выполнение преобразований (2) и (3) можно трактовать как результат работы двух специфических детекторов неоднородностей в F(f,t), реагирующих на крутизну положительных и отрицательных наклонов логарифмической спектральной огибающей.

Ширину и форму импульсной характеристики φ1(f) полосового фильтра следует выбирать так, чтобы в отфильтрованном логарифмическом спектре F2(f,t) в виде выраженных пиков были представлены резкие локальные наклоны частотной характеристики речевого тракта H(f,t), но при этом подавлялась быстро изменяющаяся с частотой составляющая I(f,t), описывающая гармоническую структуру голосового источника. Последнее условие может быть необязательным в случае использования спектрального анализатора с низким частотным разрешением, не обеспечивающим выделения гармонической структуры речевого сигнала.

Важной особенностью преобразования (2) является его нечувствительность к амплитуде речевого сигнала. Это следует из того, что умножение сигнала на константу проявляется в виде постоянной аддитивной составляющей в F(f,t), которая исключается в результате полосовой фильтрации. Поэтому отпадает необходимость в нормализации обработанных спектров F2(f,t), и по амплитуде.

Кроме того, благодаря полосовой фильтрации F(f,t) при преобразованиях (2) и (3), как и в случае преобразования (1), следует ожидать эффекта малой изменчивости обработанного спектра F2(f,t) при наличии частотных искажений, создаваемых фильтром с частотной характеристикой W(f,t), медленно изменяющейся с частотой, и фоновых широкополосных шумов со спектральной плотностью, медленно изменяющейся с частотой.

Приведенные на фигурах логарифмические спектры речевых образцов были получены с помощью частотного анализатора, в общих чертах моделирующего особенности частотного анализа звука в слуховой системе. Для этих целей использовалась гребенка из N=35 цифровых полосовых фильтров, центральные частоты которых располагались равномерно по шкале Барков с шагом 0,57 Барк, начиная с 1,95 Барк (200 Гц). Частотные характеристики фильтров слухового частотного анализатора аппроксимировались полосовыми фильтрами Баттерворта четвертого порядка с наклонами частотной характеристики 12 дБ/окт и шириной полосы пропускания 1,5 Барка. Для фильтрации полученных логарифмических спектров F(i), i - номер фильтра, использовалась симметричная нечетная весовая функция φ(n)=-δk(n-2)+δk(n+2), где δk(n) - функция Кронекера, n=…-2,-1,0,1,2,…. Поэтому вычисление свертки сводилось к суммированию взвешенных спектральных отсчетов. Полученные отфильтрованные спектры и сглаживались низкочастотным фильтром с импульсной характеристикой φ0(n)=0,25δk(n-1)+0,5δk(n)+0,25δk(n+1). Частотные искажения вводились дифференцированием сигнала с помощью нахождения первой разности дискретной речевой волны.

Из чертежей легко видеть, что частотные искажения, обусловленные дифференцированием речевого сигнала, приводят к существенным различиям спектров F(i), достигающих 20 дБ, для гласного и звонкой смычки. Однако эти различия существенно меньше у обработанных спектров и , полученных в результате предложенной обработки спектра, и не превышают величины 4-5 дБ. Из чертежей также видно, что выраженные пики в обработанных спектрах представляют положения резких локальных наклонов спектра.

Таким образом, основываясь на приведенных выше данных, можно заключить, что предложенный способ обработки спектра может быть использован совместно с известным способом (1) для получения устойчивого описания речевого сигнала в частотной области в присутствии частотных искажений.

Источник поступления информации: Роспатент

Показаны записи 61-70 из 101.
10.04.2019
№219.017.07ab

Устройство для получения электрической энергии при колебании рельсов

Изобретение относится к области железнодорожного транспорта и направлено на создание устройства для получения электрической энергии при колебании рельсов во время движения железнодорожных составов. Устройство содержит разветвленную магнитную цепь, состоящую из трех участков. Два первых участка...
Тип: Изобретение
Номер охранного документа: 0002451616
Дата охранного документа: 27.05.2012
10.04.2019
№219.017.07bf

Устройство для измерения давления

Изобретение относится к измерительной технике и может быть использовано для высокоточного измерения статического и динамического давления. Техническим результатом изобретения является расширение границ области применения датчика давления и повышение его чувствительности. Устройство для...
Тип: Изобретение
Номер охранного документа: 0002408856
Дата охранного документа: 10.01.2011
10.04.2019
№219.017.0860

Электромагнитный аппарат с поступательным движением якоря

Изобретение относится к электротехнике, к электромагнитным приводам, которые могут быть в составе коммутационных аппаратов и в других электромагнитных системах, в которых требуется получить большой ход движения якоря. Технический результат состоит в увеличении диапазона движения якоря,...
Тип: Изобретение
Номер охранного документа: 0002435287
Дата охранного документа: 27.11.2011
10.04.2019
№219.017.08b3

Устройство управления соединением источника и приемника данных при сетевом обмене данных

Изобретение относится к области вычислительной техники, а именно к устройствам управления соединением источников и приемников данных. Техническим результатом изобретения является устранение конфликтов доступа источников данных и уменьшение мощности, потребляемой источником данных. Устройство...
Тип: Изобретение
Номер охранного документа: 0002434271
Дата охранного документа: 20.11.2011
10.04.2019
№219.017.0942

Способ получения электрической энергии при колебании рельсов

Изобретение относится к способам получения электрической энергии при колебании рельсов во время движения железнодорожных составов. Для получения электрической энергии формируют замкнутую магнитную цепь, состоящую из двух участков, первым из которых является часть рельса, совершающего...
Тип: Изобретение
Номер охранного документа: 0002444458
Дата охранного документа: 10.03.2012
17.04.2019
№219.017.15ba

Способ индикации наличия жидкости в резервуаре и устройство для его осуществления

Изобретения относятся к электрическим методам и средствам контроля и могут быть использованы для индикации наличия жидкости в резервуарах и трубопроводах в условиях изменяющихся температуры, давления и свойств жидкости, а также для условий невесомости, при которых могут иметь место налипания на...
Тип: Изобретение
Номер охранного документа: 0002393435
Дата охранного документа: 27.06.2010
17.04.2019
№219.017.15c6

Способ измерения сопротивления, индуктивности и емкости (варианты)

Изобретение относится к области измерительной техники. Последовательно осуществляют четыре такта измерения частоты колебаний, причем в первом такте формируют измеряемую величину . Во втором такте, выполняемом через фиксированный промежуток времени после начала первого такта, формируют...
Тип: Изобретение
Номер охранного документа: 0002395100
Дата охранного документа: 20.07.2010
19.04.2019
№219.017.2e14

Двухпортовая ячейка оперативной памяти

Изобретение относится к области вычислительной техники и может быть использовано для реализации оперативной памяти в микропроцессорных системах. Техническим результатом является повышение быстродействия устройства. Устройство содержит два КМДП инвертора, два транзистора записи n-типа, два...
Тип: Изобретение
Номер охранного документа: 0002391721
Дата охранного документа: 10.06.2010
19.04.2019
№219.017.2fad

Способ преобразования тепловой энергии в электрическую энергию

Изобретение может быть использовано в электрических машинах для прямого преобразования тепловых эффектов в электричество. Замкнутый магнитопровод содержит обмотку возбуждения, получающую питание от источника постоянного тока, и вставку, выполненную из ферромагнитного материала, обладающего...
Тип: Изобретение
Номер охранного документа: 0002379820
Дата охранного документа: 20.01.2010
19.04.2019
№219.017.30e3

Частотная адаптивная система управления

Изобретение относится к области систем автоматического управления объектами широкого класса с неизвестными, медленно изменяющимися параметрами и неизвестными ограниченными внешними возмущениями. Техническим результатом является обеспечение устойчивости адаптивной системы при дрейфе параметров...
Тип: Изобретение
Номер охранного документа: 0002413270
Дата охранного документа: 27.02.2011
Показаны записи 1-5 из 5.
10.08.2015
№216.013.6df8

Способ обработки функции автокорреляции для измерения основного тона речевого сигнала

Изобретение относится к средствам обработки функции автокорреляции для измерения основного тона речевого сигнала и может быть использовано в области обработки сигналов, в системах распознавания речи. Технический результат заключается в повышении надежности измерения частоты основного тона...
Тип: Изобретение
Номер охранного документа: 0002559710
Дата охранного документа: 10.08.2015
26.08.2017
№217.015.e42a

Способ диагностики механизмов, агрегатов и машин на основе оценки микровариаций вращения вала

Изобретение относится к области неразрушающего контроля и может быть использовано для диагностики состояния механизмов, агрегатов и машин, составной частью которых являются элементы, совершающие вращательное движение. Способ заключается в том, что на валу контролируемого изделия устанавливают...
Тип: Изобретение
Номер охранного документа: 0002626388
Дата охранного документа: 26.07.2017
26.10.2018
№218.016.965f

Способ кратковременного спектрального анализа квазистационарных сигналов

Изобретение относится к измерительной технике и предназначено для определения частот и амплитуд многокомпонентных нестационарных сигналов. Заявлен способ кратковременного спектрального анализа, в котором ошибки, возникающие из-за перекрытия характеристик полосовых фильтров (ПФ) при...
Тип: Изобретение
Номер охранного документа: 0002670702
Дата охранного документа: 24.10.2018
29.04.2019
№219.017.4309

Способ повышения степени усвоения учебной информации путем активизации внимания

Изобретение относится к области образования. Видеопродукцию предъявляют в виде ряда кадров, содержащих учебную информацию. По крайней мере, одна совокупность кадров представляет собой управляющий вниманием блок, который включает три последовательно расположенные группы кадров. Вторая группа...
Тип: Изобретение
Номер охранного документа: 0002360294
Дата охранного документа: 27.06.2009
09.06.2019
№219.017.7ca2

Способ определения остаточного ресурса детали акустической диагностикой

Использование: для определения остаточного ресурса детали. Сущность заключается в том, что в детали кратковременным ударным воздействием возбуждают собственные упругие акустические колебания, регистрируют и анализируют их параметры, при этом в качестве информативного параметра выявляют и...
Тип: Изобретение
Номер охранного документа: 0002320987
Дата охранного документа: 27.03.2008
+ добавить свой РИД