×
29.03.2019
219.016.f535

Результат интеллектуальной деятельности: СПОСОБ АУТЕНТИФИКАЦИИ ДИКТОРА ПО ПАРОЛЬНОЙ ФРАЗЕ

Вид РИД

Изобретение

№ охранного документа
0002422920
Дата охранного документа
27.06.2011
Аннотация: Изобретение относится к области техники анализа речи, в частности к системам ограничения несанкционированного доступа в помещения или информационным ресурсам. Техническим результатом является повышение достоверности распознавания диктора при использовании парольной фразы ограниченной длины. Указанный технический результат достигается тем, что осуществляют посегментное сравнение входного речевого сигнала диктора с заранее сохраненными эталонами параметров эталонных фраз, произносимых заранее известными дикторами, для чего осуществляют сравнение параметрических описаний последовательных сегментов входного речевого сигнала с параметрическими описаниями последовательных сегментов из выбранных для сравнения с упомянутым эталоном с последующей аутентификацией диктора. В качестве параметрических описаний берут матрицу переходов, для этого строят последовательность особых точек, выделенных сравнением отсчета в сегменте с окружением отсчёта, определенным посредством обобщенных коэффициентов линейного предсказания и порога Т, далее агрегируют последовательности особых точек в блоки длины L, строят матрицу переходов, аналогичную матрице переходов в цепи Маркова, по числу особых точек в блоке, и сравнивают полученную матрицу с образцом эталонной матрицы с заданной точностью ε и принимают решение о правильности аутентификации диктора. 1 ил.

Изобретение относится к области техники анализа речи, в частности к системам ограничения несанкционированного доступа в помещения или информационным ресурсам. Техническим результатом является повышение достоверности распознавания диктора при использовании парольной фразы ограниченной длины. Технический результат достигается тем, что в звуковом сегменте находятся интервалы, содержащие особые точки, выделяемые обобщенной процедурой линейного предсказания, в качестве параметрического описания звукового сегмента используется статистическая матрица переходов в последовательности интервалов, содержащих особые точки, и стандартная метрика в пространстве матриц.

Заявляемый способ относится к области техники анализа речи, в частности к системам ограничения несанкционированного доступа в помещения или к информационным ресурсам.

Известны способы и устройства для распознавания дикторов по речевому сегменту, независимому от текста, на основе оценки статистических параметров в сегменте [1].

Данный способ предполагает наличие звукового сегмента для настройки и анализа продолжительностью порядка минуты, что не может быть применимо для аутентификации по парольной фразе, продолжительность которой составляет около 2-3 секунд.

Наибольшую популярность получили методы оценки параметров в модели на основе смеси Гауссовских распределений, например, [2].

Этот метод позволяет распознавать диктора по произвольной фразе, но и в этом способе необходимы звуковые сегменты продолжительностью порядка половины минуты

Известен метод идентификации диктора на основе коэффициентов линейного предсказания, теория которого представлена в [3]. Эти коэффициенты подсчитываются согласно формуле

Недостатком этого метода является слабая устойчивость коэффициентов предсказания, когда размер звукового сегмента имеет малу длину.

Известен способ идентификации диктора, совпадающее с заявленным решением по наибольшему количеству существенных признаков и достигаемому техническому результату, принятому за прототип, по особенностям произнесения парольной фразы на основе разбиения звукового сегмента на отдельные зоны и анализу различных параметров вычисленных по этим зонам [4]. Полученная информация обрабатывается статистическими методами. Решение принимается путем оценки вероятности появления вычисленного вектора параметров в принятой статистической модели с учетом длин доверительных интервалов.

Недостатком известного метода является привязка способа разбиения на зоны к процедуре вычисления основного тона, который по короткой фраз определяется с высокой вариабельностью (изменчивостью). Таким образом недостатком всех известных методов является отсутствие учета особенносте произнесения последовательностей фонем в заданном контексте, который представлен парольной фразой. Известные методы основаны на применении гармонического анализа, предполагающего стационарность исследуемого участка звукового сегмента, что приводит к ошибкам при исследовании сегментов малой длины.

Задачей данного изобретения является создание способа, учитывающего особенности произнесения последовательности отдельных фонем в контексте одной и той же парольной фразы, основанного на оценках параметров, не зависящих от коэффициента усиления микрофона и устойчивых к колебаниям длины звукового сегмента, отвечающего парольной фразе.

Поставленная задача решается путем выделения особых точек в звуковом сегменте и методом обработки распределения особых точек. Под особой точкой звукового сегмента заявителем понимается отсчет в звуковом сегменте, который сильно отличается от своего окружения. В отличие от метода линейного предсказания отклонение в каждой точке от окружения оценивается по разности между этим отсчетом и линейной аппроксимацией отсчетов как предшествующих этому отсчету, так и следующих за ним.

Заявленное техническое решение реализуется посредством применения ЭВМ с устройством звукового ввода и программы, обеспечивающей реализацию заявленного способа выделения особых точек и способа описания распределения этих особых точек.

Сущность заявленного технического решения заключается в том, что способ аутентификации диктора по парольной фразе включает посегментное сравнение входного речевого сигнала диктора с заранее сохраненными эталонами параметров эталонных фраз, произносимых заранее известными дикторами, для чего осуществляют сравнение параметрических описаний последовательных сегментов входного речевого сигнала с параметрическими описаниями последовательных сегментов из выбранных для сравнения с упомянутым эталоном с последующей аутентификацией диктора, при этом в качестве упомянутых параметрических описаний берут матрицу переходов, построенную в соответствии с правилом, заключающимся в том, что строят последовательность особых точек, выделенных сравнением отсчета в сегменте с окружением отсчета, определенным посредством обобщенных коэффициентов линейного предсказания и порога Т, далее агрегируют последовательности особых точек в блоки длины L, строят матрицу переходов, аналогичную матрице переходов в цепи Маркова, по числу особых точек в блоке и сравнивают полученную матрицу с образцом эталонной матрицы с заданной точностью ε и принимают решение о правильности аутентификации диктора.

Блок схема алгоритма заявленного способа приведена на чертеже. Блок схема состоит из четырех последовательно включенных блоков с номерами 1, 2. 3, 4, реализующих заявленный способ.

На вход блока 1 поступает звуковой сегмент. Этот блок подсчитывает обобщенные коэффициенты линейного предсказания согласно формуле

по формулам, приведенным ниже, и среднеквадратическое отклонение σ по стандартной формуле. В формуле (1) отсчет xn аппроксимируется линейной комбинацией р отсчетов до отсчета xn и р отсчетов после отсчета xn. Для отыскания коэффициенты a k, bk введем следующие обозначения:

,

В этих обозначениях отыскание коэффициентов в (1) сводится к решению системы уравнений

Обоснование указанных формул приведено в [5].

Блок 2 определяет, является ли центр интервала длины 2р+1 особой точкой. На вход блока поступают звуковой сегмент, среднеквадратическое отклонение σ, обобщенные коэффициенты линейного предсказания a k, bk, k=1,…,p и порог T (выбирается из существующей экспериментальной базы КГУ) Для центра каждого интервала проверяется выполнение неравенства

При выполнении неравенства (2) центр интервала объявляется особой точкой. В силу однородности формулы выполнение неравенства (2) не зависит от коэффициента усиления микрофона. На выходе блока получается последовательность zn, состоящая из 1 и 0 в зависимости от того, является ли xn особой точкой соответствующего интервала длины 2р+1 или не является особой точкой.

На вход блока 3 поступает последовательность {zn}, сгенерированная блоком 2, и параметр L (выбирается из существующей экспериментальной базы КГУ)/

(сигналов?). Блок 3 производит агрегирование значений {zn} путем выбора натурального числа L и перехода к последовательностям Согласно определению элементы последовательности sN могут принимать значения из интервала [0, L]. Эта последовательность поступает на вход блока 4.

Блок 4 осуществляет статистическую обработку последовательности {sN} посредством параметра ε (выбирается из существующей экспериментальной базы КГУ) и сравнение с эталоном, (′эталон диктора) с этой целью строится матрица Q размером (L+1)×(L+1), аналогичная матрице переходов Марковской (цепь Маркова) цепи. Обозначим через qi, i=0,1,…,L количество элементов в последовательности {sN}, равных i. Элемент Q[i/j] матрицы Q, стоящий в строке с номером i и столбце с номером j, вычисляется по формуле

Q[i/j]=tij/qi

Здесь tij - число пар в последовательности {sN}, где sN=i,sN+l=j. Согласно построению матрица Q будет стохастической. Ее элементы являются оценками вероятностей перехода от одной группы особых точек к другой, что обеспечивает описание особенностей распределения особых точек, характерных для данного диктора при произнесении парольной фразы Далее осуществляется сравнение вычисленной матрицы Q с эталонной матрицей Q. Сравнение производится на основе вычисления обычного расстояния между матрицами, подсчитанного с помощью формулы , где . Если d<ε, принимается решение о правильной аутентификации, в противном случае принимается решение об отказе в доступе к ресурсу (выбирается из существующей экспериментальной базы КГУ).

Заявленное техническое решение соответствует критерию «новизна», предъявляемому к изобретениям, так как в результате исследований заявителем не выявлены технические решения, обладающие совокупностью заявленных признаков, приводящих к реализации поставленных целей - созданию способа аутентификации диктора по парольной фразе, учитывающего особенности произнесения последовательности отдельных фонем в контексте одной и той же парольной фразы, основанного на оценках параметров, не зависящих от коэффициента усиления микрофона и устойчивых к колебаниям длины звукового сегмента, отвечающего парольной фразе.

Заявленное техническое решение соответствует критерию «изобретательский уровень», предъявляемому к изобретениям, так как для специалиста в заявленной области техники не являются очевидным полученные технические результаты, выражающиеся в том, что заявителем решена актуальная, не разрешенная до даты подачи настоящей заявки проблема, заключающаяся в необходимости создании надежного способа аутентификации диктора по парольной фразе существовавшая в течение длительного периода времени, которая разрешена авторами посредством создания принципиально нового способа, заключающегося в выделения особых точек в звуковом сегменте и методом обработки распределения особых точек, при этом под особой точкой звукового сегмента заявителем понимается отсчет в звуковом сегменте, который сильно отличается от своего окружения. В отличие от метода линейного предсказания, отклонение в каждой точке от окружения оценивается по разности между этим отсчетом и линейной аппроксимацией отсчетов как предшествующих этому отсчету, так и следующих за ним. Таким образом заявленное решение не вытекает явным образом из известного уровня техники, что также является дополнительным доказательством соответствия заявленного технического решения критерию «изобретательский уровень».

Заявленное техническое решение реализовано в лабораторных условиях Казанского государственного университета и может быть реализовано на любом специализированном предприятии с использованием стандартного оборудования, что является доказательством соответствия заявленного технического решения критерию «промышленная применимость», предъявляемого к изобретениям.

Источники информации, принятые во внимание

1. Патент РФ 2107950.

2.Патент США 6411930.

3. A.Oppenheim, R.Schafer. Discrete-time signal processing. Prentice Hall, 1989

4. Патент РФ 2230375.

5. Е.Л.Столов. Алгоритм обработки голосового пароля // Исследования по информатике, № 11, "Отечество", Казань, 2007. с.103-108

Способ аутентификации диктора по парольной фразе, включающий посегментное сравнение входного речевого сигнала диктора с заранее сохраненными эталонами параметров эталонных фраз, произносимых заранее известными дикторами, для чего осуществляют сравнение параметрических описаний последовательных сегментов входного речевого сигнала с параметрическими описаниями последовательных сегментов из выбранных для сравнения с упомянутым эталоном с последующей аутентификацией диктора, отличающийся тем, что в качестве упомянутых параметрических описаний берут матрицу переходов, построенную в соответствии с правилом, заключающимся в том, что строят последовательность особых точек, выделенных сравнением отсчета в сегменте с окружением отсчета, определенным посредством обобщенных коэффициентов линейного предсказания и порога Т, далее агрегируют последовательности особых точек в блоки длины L, строят матрицу переходов, аналогичную матрице переходов в цепи Маркова, по числу особых точек в блоке и сравнивают полученную матрицу с образцом эталонной матрицы с заданной точностью ε и принимают решение о правильности аутентификации диктора.
Источник поступления информации: Роспатент

Показаны записи 1-9 из 9.
29.03.2019
№219.016.f476

Антигельминтная композиция на основе соли четвертичного фосфония и замещенного динитробензофуроксана

Изобретение относится к ветеринарии и представляет собой антигельминтную композицию, содержащую н-гексадецилтрифенилфосфоний бромид и 5,7-бис-(м-нитроанилино)-4,6-нитробензофуроксан в качестве активных компонентов при их весовом соотношении 1:10 и глюкозу как вспомогательное вещество....
Тип: Изобретение
Номер охранного документа: 0002413513
Дата охранного документа: 10.03.2011
19.04.2019
№219.017.2e01

Способ определения бензола

Изобретение направлено на разработку способа определения бензола, позволяющего проводить качественное и количественное определение бензола в смесях с другими органическими соединениями. Способ определения основан на детектировании бензола сенсором, поверхность которого модифицирована...
Тип: Изобретение
Номер охранного документа: 0002390765
Дата охранного документа: 27.05.2010
19.04.2019
№219.017.2f7c

Способ модификации живой клетки

Изобретение относится к биотехнологии. Живую клетку модифицируют, используя послойное чередующееся нанесение полиэлектролитов и наночастиц на поверхность клетки. Изобретение может быть использовано для визуализации и/или характеризации клетки, при этом повышается качество модификации...
Тип: Изобретение
Номер охранного документа: 0002377310
Дата охранного документа: 27.12.2009
19.04.2019
№219.017.3157

Антивирусный препарат контактного действия на основе "бетадина" и эндонуклеазы

Изобретение относится к ветеринарии, сельскому хозяйству, медицине, биотехнологии и микробиологической промышленности и может быть использовано для защиты от инфекций, вызываемых ДНК- и РНК-содержащими вирусами. Антивирусный комбинированный препарат контактного действия на основе средства...
Тип: Изобретение
Номер охранного документа: 0002423136
Дата охранного документа: 10.07.2011
09.05.2019
№219.017.4d67

1-дибутоксифосфорил-2-(бета-аминоэтил)аминоэтан, обладающий фунгицидной активностью и антибактериальными свойствами

Настоящее изобретение относится к соединению формулы: (BuO)P(O)CHCHNHCHCHNH, обладающему фунгицидным действием в сочетании с антибактериальными свойствами в отношении кишечной палочки, золотистого стафилококка, протея, синегнойной палочки, и может быть использовано в медицине. Технический...
Тип: Изобретение
Номер охранного документа: 0002374259
Дата охранного документа: 27.11.2009
09.05.2019
№219.017.4f80

Способ определения фильтрационных параметров призабойной зоны пласта методом высокочастотных фильтрационных волн давления

Изобретение относится к нефтедобывающей промышленности, в частности к гидродинамическим экспресс-методам определения фильтрационных параметров призабойной зоны пласта, и может быть использовано для контроля за экологическим состоянием пластов надпродуктивной толщи. Способ определения...
Тип: Изобретение
Номер охранного документа: 0002400622
Дата охранного документа: 27.09.2010
18.05.2019
№219.017.59a4

Способ усиления барьерных функций почвы против углеводородного загрязнения

Изобретение относится к способам защиты почв, грунтов и грунтовых вод от углеводородного загрязнения, в частности, к способам создания противофильтрационных экранов при строительстве нефтехранилищ, нефтепроводов и др. Способ создания противофильтрационного барьера, предотвращающего нисходящую...
Тип: Изобретение
Номер охранного документа: 0002422591
Дата охранного документа: 27.06.2011
29.06.2019
№219.017.a0e6

Способ получения лекарственного препарата генетически модифицированных клеток

Изобретение относится к биотехнологии. Получают двухкассетную генетическую плазмидную конструкцию pBud-VEGF-GDNF, содержащую фрагменты ДНК, кодирующие VEGF и GDNF. Из крови человека выделяют мононуклеарные клетки. Выделенные клетки генетически модифицируют pBud-VEGF-GDNF. Генетически...
Тип: Изобретение
Номер охранного документа: 0002431669
Дата охранного документа: 20.10.2011
06.07.2019
№219.017.a81b

Способ элементного анализа веществ

Изобретение относится к области анализа материалов. Предложен способ прямого инструментального определения концентрации примесей элементов в твердых и жидких веществах с градуировкой по методу стандартных добавок. Для регистрации аналитического сигнала используют образованный на подвижном зонде...
Тип: Изобретение
Номер охранного документа: 0002380688
Дата охранного документа: 27.01.2010
Показаны записи 1-2 из 2.
10.10.2013
№216.012.747e

Генератор случайных чисел на основе трехзначной логики

Изобретение относится к вычислительной технике и может быть использовано при вычислениях методом Монте-Карло и для генерации случайных ключей в схемах шифрования. Техническим результатом является увеличение скорости работы генератора. Устройство состоит из одинаковых комбинационных схем,...
Тип: Изобретение
Номер охранного документа: 0002495479
Дата охранного документа: 10.10.2013
25.08.2017
№217.015.d2f2

Способ оценки мгновенной частоты речевого сигнала в точках локального максимума

Изобретение относится к области техники анализа речи, в частности к способу оценки мгновенной частоты в точках локального максимума речевых сигналов. Техническим результатом является уменьшение количества вычислений для оценки мгновенной частоты в точках локального экстремума. Вводят в память...
Тип: Изобретение
Номер охранного документа: 0002621647
Дата охранного документа: 06.06.2017
+ добавить свой РИД