Результат интеллектуальной деятельности: СПОСОБ РАСПОЗНАВАНИЯ УСТНЫХ КОМАНД

Вид РИД

Изобретение

Юридическая информация Юридическая информация Свернуть Развернуть

Авторы

Правообладатели

№ охранного документа

0000215620

Дата охранного документа

04.07.1968

Реферат Реферат Свернуть Развернуть

Известны способы распознавания устных команд, основанные на преобразовании звукового сигнала в электрический, выделении амплитудных огибающих в различных полосах частот и спектральном анализе этих огибающих.

Предложенный способ отличается тем, что в различных полосах частот распознаваемого сигнала выделяют и используют для спектрального анализа инфразвуковые части спектров амплитудных огибающих и (или) огибающих частоты переходов через нуль с последующей компенсацией постоянных составляющих и нормализацией полученных спектров по длительности произнесения команд.

Это позволяет повысить достоверность результатов распознавания.

В соответствий с данным способом инфразвуковой спектральный анализ огибающих осуществляют непосредственно в процессе звучания слова. При появлении очередного отсчета огибающих для всех частот Ω_i анализируемого спектра параллельно добавляют соответствующее слагаемое в суммах

где Δt - шаг квантования огибающих во времени (постоянный для всех реализаций до нормализации);

N - общее число отсчетов огибающих;

F₁(t_к), F₂(t_к) - огибающие амплитуд и частоты переходов через нуль, соответственно.

Одновременно с этим измеряют длительность Т анализируемого слова и ведут интегрирование огибающих F₁(t_к) и F₂(t_к) в пределах от 0 до Т.

Интегрирование ведут по формулам

По окончании звучания слова вычисляют постоянные составляющие огибающих и по каждой из огибающих маскирующие спектры

Последние используют для устранения маскирующего влияния постоянных составляющих путем их вычитания из значений S₁(Ω_i) и S₂(Ω_i). Полученные после вычитания центрированные спектры огибающих S₁°(Ω_i) и S₂°(Ω_i) используют для нахождения их модулей Ф₁°(Ω_i) и Ф₂°(Ω_i) соответственно. Модули Ф₁°(Ω_i) и Ф₂°(Ω_i) нормируют по темпу речи, для чего предварительно определяют относительную длительность α анализируемого слова где T₀ стандартная длительность, выбираемая произвольно в диапазоне длительностей опознаваемых слов) и нормированные значения частот Ω_i инфразвуковых составляющих , где - функция, определяемая инвариантностью тех или иных инфразвуковых частотных составляющих к темпу речи). Нормированные модули спектров находят из выражений огибающих

Идентификацию распознаваемых команд производят путем сравнения полученных значений с соответствующими эталонными значениями.

Способ распознавания устных команд, основанный на преобразовании звукового сигнала в электрический, выделении амплитудных огибающих в различных полосах частот и спектральном анализе этих огибающих, отличающийся тем, что, с целью повышения достоверности результатов распознавания, в различных полосах частот выделяют инфразвуковые части спектров амплитудных огибающих и (или) огибающих частоты переходов через нуль с последующей компенсацией постоянных составляющих и нормализацией полученных спектров по длительности произнесения команд.

Источник поступления информации: Роспатент

‹ › ×