13.01.2017

№217.015.7232

Результат интеллектуальной деятельности: СПОСОБ ОЦЕНКИ ВАРИАТИВНОСТИ ПАРОЛЬНОЙ ФРАЗЫ (ВАРИАНТЫ)

Вид РИД

Изобретение

Юридическая информация Юридическая информация Свернуть Развернуть

Авторы

Правообладатели

№ охранного документа

0002598314

Дата охранного документа

20.09.2016

Краткое описание РИД Краткое описание РИД Свернуть Развернуть

Аннотация: Изобретение относится к области распознавания речи. Технический результат - обеспечение надежной оценки вариативности парольных фраз. Способ оценки вариативности парольной фразы, включающий получение парольной фразы от пользователя и оценку ее вариативности, отличающийся тем, что получают от пользователя парольную фразу в виде акустической фразы, преобразуют акустическую парольную фразу в последовательность акустических признаков, рассчитывают последовательность предопределенных речевых признаков по этой акустической фразе и определяют вариативность парольной фразы по этим признакам, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом. 2 н. и 4 з.п. ф-лы, 7 ил.

Реферат Реферат Свернуть Развернуть

Изобретение относится главным образом к технологиям распознавания речи, в частности к системам, сравнивающим голос пользователя с записанным голосом другого пользователя и выдающим оценку схожести голосов, и может быть использовано в системах ограничения несанкционированного доступа в помещения или информационным ресурсам.

Распознавание речи - это процесс автоматического распознавания говорящего на основании индивидуальной информации, содержащейся в звуковых сигналах. Этот процесс может быть разделен на идентификацию и верификацию. Идентификация определяет, кто именно говорит из имеющегося числа дикторов. Верификация определяет соответствие или несоответствие личности говорящего. Верификация может быть использована для контроля доступа к ограниченным сервисам, к примеру телефонный доступ к банковским операциям, совершение покупок или доступ к секретному оборудованию.

Способ использования технологии обычно представляет собой процесс, когда пользователь произносит короткую фразу в микрофон. Затем измеряются и определяются различные акустические параметры (звуки, частота, высота тона и другие физические характеристики голосовых каналов, которые обычно называют звуковыми характеристиками). Затем эти элементы используются для установления набора уникальных звуковых параметров пользователя (которые обычно называются «отпечаток голоса» или «голосовая модель»). Данный процесс обычно называют регистрацией. Регистрация в этом случае представляет собой получение образца голоса. Затем полученный образец голоса обрабатывается (трансформируется в соответствующий отпечаток голоса), и отпечаток голоса хранится совместно с идентификаторами личности для использования в протоколах безопасности. Во время процесса верификации диктору предлагается повторить фразу, которая использовалась при регистрации. Алгоритм верификации голоса сравнивает голос диктора с записью голоса, сделанной во время регистрации. Технология верификации затем принимает или отклоняет попытку диктора установить соответствие голосовому образцу. Если голосовой образец соответствует, то пользователю предоставляется защищенный доступ. Если нет - то пользователю будет отказано в предоставлении доступа. Системы верификации диктора могут быть текстозависимыми или текстонезависимыми, либо являться их комбинацией. В текстозависимых системах человек произносит заранее заданное слово или фразу. Данная информация (обычно называемая «голосовой пароль» «кодовая фраза», «голосовой отпечаток») может представлять собой такую информацию, как имя, место рождения, любимый цвет или последовательность чисел. В текстозависимых системах распознавание диктора происходит без требования заранее установленной кодовой фразы.

Для оценки новизны и технического уровня заявленного решения рассмотрим ряд известных заявителю технических средств аналогичного назначения, характеризуемых совокупностью сходных с заявленным изобретением признаков, известных из сведений, ставших общедоступными до даты приоритета изобретения.

Известен способ аутентификации диктора по входному речевому сигналу диктора в виде парольной фразы, включающий сравнение параметров этого сигнала с заданной точностью с заранее сохраненными эталонами параметров входных речевых сигналов в виде той же парольной фразы, произносимой заранее известными дикторами, с последующей аутентификацией, отличающийся тем, что в качестве упомянутых параметров берется низкочастотная часть вейвлет преобразования от нормированной функции распределения особых точек вдоль звукового файла, отвечающего входному речевому сигналу диктора в виде парольной фразы, выделенных сравнением отсчета в этой точке в звуковом файле с предшествующими и последующими отсчетами посредством обобщенных коэффициентов линейного предсказания и порога Т, при этом нормирование функции распределения сводится к приведению ее к стандартной длине Len, принятой при подсчете эталонных параметров входных речевых сигналов в виде парольной фразы, произносимой заранее известным дикторами, см. патент РФ №2422921.

Известен способ аутентификации диктора по парольной фразе, включающий посегментное сравнение входного речевого сигнала диктора с заранее сохраненными эталонами параметров эталонных фраз, произносимых заранее известными дикторами, для чего осуществляют сравнение параметрических описаний последовательных сегментов входного речевого сигнала с параметрическими описаниями последовательных сегментов из выбранных для сравнения с упомянутым эталоном с последующей аутентификацией диктора, отличающийся тем, что в качестве упомянутых параметрических описаний берут матрицу переходов, построенную в соответствии с правилом, заключающимся в том, что строят последовательность особых точек, выделенных сравнением отсчета в сегменте с окружением отсчета, определенным посредством обобщенных коэффициентов линейного предсказания и порога Т, далее агрегируют последовательности особых точек в блоки длины L, строят матрицу переходов, аналогичную матрице переходов в цепи Маркова, по числу особых точек в блоке и сравнивают полученную матрицу с образцом эталонной матрицы с заданной точностью и принимают решение о правильности аутентификации диктора, см. патент РФ №2422920.

Существуют определенное число различных технологий, используемых для создания голосовых отпечатков: скрытые модели Маркова (HMMs), Gaussian Mixture Models (GMMs), искусственные нейронные сети или совокупности вышеуказанных техник. Одной из проблем с вышеописанной технологией распознавания является вариативность голосового пароля (кодовой фразы, голосового отпечатка). Кодовая фраза может быть фонетически богата или фонетически скудна. «Фонетически скудная кодовая фраза» означает, что эта кодовая фраза содержит только ограниченное количество уникальных звуков (фонем) и, соответственно, вариативность этой кодовой фразы мала. Если вариативность кодовой фразы мала (в крайних случаях кодовая фраза содержит только набор идентичных звуков, например, «а-а-а-а»), невозможно оценить соответствующие физические характеристики голосовых каналов диктора. В результате создается неэффективный голосовой отпечаток и эффективность системы распознавания диктора резко снижается.

Необходимо отметить, что эта проблема отличается от проблемы криптографической защищенности текстового пароля. В самом деле, если голосовой пароль содержит ограниченное число уникальных текстовых знаков (в крайних случаях кодовая фраза содержит только набор идентичных знаков, например, «qqqqq»), его криптографическая защищенность существенно низка. Однако это означает только, что пароль может быть легко угадан и является недостаточно сложным, чтобы отразить криптографические атаки.

В противоположность этому система распознавания диктора не может создать эффективные голосовые отпечатки в связи с недостатком звуков в кодовой фразе. Результатом слабого голосового отпечатка в процессе верификации или идентификации является низкое качество распознавания диктора. К примеру, одним из обычно используемых коэффициентов вероятности для оценки работы системы распознавания является Уровень равновероятной ошибки (Equal Error Rate - EER). Чем ниже EER, тем лучше система распознавания. Было установлено, что EER увеличивается с 6% для фонетически богатых парольных фраз до 18% для фонетически скудных парольных фраз.

Задача изобретения заключается в создании способа для оценки вариативности парольной фразы, которая могла бы быть затем использована для генерирования фонетически богатых паролей в текстозависимых системах распознавания, для оценки вариативности входных данных парольной фразы в текстозависимой системе при регистрации и для генерирования предупреждения диктора в случае низкой вариативности парольной фразы. Определение вариативности парольной фразы затем может быть использовано для генерации фонетически представительных паролей в текстозависимых системах идентификации диктора по голосу, для оценки вариативности входной фразы в текстонезависимых системах в процессе регистрации и для генерации предупредительного сообщения клиенту в случае низкой вариативности парольной фразы.

Сущность первого независимого объекта заявляемого изобретения как технического решения выражается в следующей совокупности существенных признаков, достаточной для достижения указанного выше обеспечиваемого изобретением технического результата.

Согласно первому независимому объекту изобретения способ оценки вариативности парольной фразы, включающий получение парольной фразы от пользователя и оценку ее вариативности, характеризующийся тем, что получают от пользователя парольную фразу в виде акустической фразы, преобразуют акустическую парольную фразу в последовательность акустических признаков, рассчитывают последовательность предопределенных речевых признаков по этой акустической фразе и определяют вариативность парольной фразы по этим признакам, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом.

В этом заключается совокупность существенных признаков первого независимого варианта изобретения, обеспечивающая получение технического результата во всех случаях, на которые распространяется испрашиваемый объем правовой охраны.

Кроме того, первой независимый варианта изобретения характеризуется наличием ряда факультативных признаков, описывающих частные случаи его реализации, а именно:

- преобразование акустической парольной фразы в последовательность акустических признаков осуществляют путем преобразования парольной фразы в последовательность спектров, после чего преобразуют спектры в первую последовательность формантов;

- вариативность парольной фразы определяют по оценке гистограмм N-Dim для каждой траектории формант, затем оценивают минимальные и максимальные значения для каждой форманты, выводят по меньшей мере одну совокупности бинов гиперкуба, определяют место каждой форманты как единицы в соответствующей совокупности бинов гиперкуба и используют гистограммы N-Dim для оценки энтропии и максимального значения данной энтропии;

- оценивают абсолютную псевдоэнтропию;

- оценивают относительную псевдоэнтропию.

Согласно второму независимому объекту изобретения способ оценки вариативности парольной фразы, включающий получение парольной фразы от пользователя и оценку ее вариативности, характеризующийся тем, что получают от пользователя текстовую парольную фразу, преобразуют текстовую парольную фразу в последовательность фонетических символов и определяют вариативность текста парольной фразы по последовательности фонетических символов, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом.

За счет реализации отличительных признаков изобретения достигается технический результат, заключающийся в том, что, заявленный способ в обоих вариантах его реализации обеспечивает надежную оценку вариативности парольных фраз, полученных как в акустическим, так и в текстовом виде.

Сущность изобретения поясняется чертежами, где на фиг. 1 представлена блок-схема реализации заявленного способа в обоих вариантах, на фиг. 2 - схема реализации первого варианта заявленного способа, при получении парольной фразы в фонетическом виде, на фиг. 3 - схема реализации второго варианта заявленного способа, при получении парольной фразы в текстовом виде, на фиг. 4 - график зависимости Equal Error Rate (EER) от информационной вариативности, на фиг. 5 - график зависимости Equal Error Rate (EER) от относительной вариативности на фиг. 6 - график зависимости Equal Error Rate (EER) от абсолютной вариативности, 1-й взвешенной (оцененной) суммы и 2-й взвешенной (оцененной) вариативности, на фиг.7 - таблицы, иллюстрирующие числовые данные Equal Error Rate (EER) как функцию различных вариативностей.

Заявленный способ реализуют следующим образом.

В первом варианте получают от пользователя парольную фразу в виде акустической фразы, преобразуют акустическую парольную фразу в последовательность акустических признаков, рассчитывают последовательность предопределенных речевых признаков по этой акустической фразе и определяют вариативность парольной фразы по этим признакам, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом.

Преобразуют акустическую парольную фразу в последовательность акустических признаков, осуществляют путем преобразования парольной фразы в последовательность спектров, после чего преобразуют спектры в первую последовательность формантов. Вариативность парольной фразы определяют по оценке гистограмм N-Dim для каждой траектории формант, затем оценивают минимальные и максимальные значения для каждой форманты, выводят по меньшей мере одну совокупности бинов гиперкуба, определяют место каждой форманты как единицы в соответствующей совокупности бинов гиперкуба и используют гистограммы N-Dim для оценки энтропии и максимального значения данной энтропии. Оценивают абсолютную и относительную псевдоэнтропию.

Во втором варианте получают от пользователя текстовую парольную фразу, преобразуют текстовую парольную фразу в последовательность фонетических символов и определяют вариативность текста парольной фразы по последовательности фонетических символов, после чего сравнивают определенную вариативность парольной фразы с предустановленным лимитом.

Устройство, реализующее оба варианта заявленного способа, представляет собой взаимосвязанные носитель информации, центральный процессор и графический интерфейс, где на носителе информации имеются машинные команды, включающие команды на получение парольной фразы от пользователя, расчета последовательности предопределенных акустических признаков или фонетических символов, оценки вариативности парольной фразы на основе этих признаков, сравнение рассчитанной вариативности парольной фразы с предопределенным порогом и сообщение пользователю результата сравнения значения вариативности парольной фразы с предопределенным порогом.

Данное устройство может быть реализовано с использованием известных компьютерных или мультипроцессорных систем.

СПОСОБ ОЦЕНКИ ВАРИАТИВНОСТИ ПАРОЛЬНОЙ ФРАЗЫ (ВАРИАНТЫ)

Источник поступления информации: Роспатент

‹ › ×

Авторы
Правообладатели

Показаны записи 1-3 из 3.

10.10.2014

№216.012.fbd4

Способ гибридной генеративно-дискриминативной сегментации дикторов в аудио-потоке

Изобретение относится к области информационных технологий, реализующих интерфейс между человеком и компьютером, а именно к сегментации (диаризации) или разделению дикторов в аудио-потоке. Технический результат заключается в повышении точности распознавания диктора для диалога в телефонном...

Тип: Изобретение

Номер охранного документа: 0002530314

Дата охранного документа: 10.10.2014

Показать авторов и правообладателей

29.12.2017

№217.015.fe35

Система контроля и управления доступом на базе биометрических технологий аутентификации личности по голосу и по лицу

Изобретение относится к области идентификации и аутентификации личности. Техническим результатом является регистрация и идентификация людей в самых различных ситуациях, когда необходимо производить обязательную регистрацию и предоставление данных о людях, а также их идентификацию,...

Тип: Изобретение

Номер охранного документа: 0002638775

Дата охранного документа: 15.12.2017

Показать авторов и правообладателей

24.04.2020

№220.018.1875

Устройство для регистрации и управления вводом речевой информации

Изобретение относится к области аналого-вычислительной техники, в частности к аналого-цифровым преобразователям, устройствам ввода речевой информации и может быть использовано, преимущественно, для медицинских работников при вводе ими речевой информации о состоянии здоровья, анамнезе и диагнозе...

Тип: Изобретение

Номер охранного документа: 0002719659

Дата охранного документа: 21.04.2020

Показать авторов и правообладателей

Показаны записи 1-3 из 3.

10.10.2014

№216.012.fbd4

Способ гибридной генеративно-дискриминативной сегментации дикторов в аудио-потоке

Тип: Изобретение

Номер охранного документа: 0002530314

Дата охранного документа: 10.10.2014

Показать авторов и правообладателей

29.12.2017

№217.015.fe35

Система контроля и управления доступом на базе биометрических технологий аутентификации личности по голосу и по лицу

Тип: Изобретение

Номер охранного документа: 0002638775

Дата охранного документа: 15.12.2017

Показать авторов и правообладателей

10.07.2019

№219.017.af43

Способ синтеза речи

Изобретение в целом относится к способам синтеза речи, а в частности к компилятивным способам синтеза речи на основе текста. Техническим результатом является улучшение качества синтезируемой речи за счет точной передачи интонации. Указанный технический результат достигается тем, что выделяют в...

Тип: Изобретение

Номер охранного документа: 0002421827

Дата охранного документа: 20.06.2011

Показать авторов и правообладателей