×
19.06.2019
219.017.8a6d

Результат интеллектуальной деятельности: СПОСОБ И УСТРОЙСТВО ДЛЯ ЕСТЕСТВЕННО-РЕЧЕВОГО РАСПОЗНАВАНИЯ РЕЧЕВОГО ВЫСКАЗЫВАНИЯ

Вид РИД

Изобретение

№ охранного документа
0002432623
Дата охранного документа
27.10.2011
Аннотация: Изобретение относится к способу и устройству для естественно-речевого распознавания речевого высказывания. Техническим результатом является создание способа и системы распознавания речи с большим объемом распознавания при небольшом грамматическом объеме. Указанный технический результат достигается тем, что способ для естественно-речевого распознавания речевого высказывания включает анализ речевого сигнала (10) параллельно или последовательно в нескольких ветвях устройства распознавания речи независимо друг от друга с использованием нескольких грамматик (12, 14, 26). Способ включает одновременную подачу речевого сигнала (10) к первой и второй ветвям распознавания речи, включающим в себя соответственно первую грамматику (12) и вторую грамматику (14) для анализа речевого сигнала. В случае распознавания или нераспознавания речевого высказывания посредством первой грамматики (12) или второй грамматики (14) получают первый или второй положительные результаты распознавания или первый или второй отрицательные результаты распознавания. Решение об успешном распознавании речевого высказывания принимают на основании оценки первого и второго результатов распознавания. Посредством первой грамматики (12) анализируют часто встречающиеся речевые высказывания, посредством второй грамматики (14) - реже встречающиеся речевые высказывания, а посредством каждой дополнительной грамматики (26) - еще реже встречающиеся речевые высказывания. Используют либо выданный первой грамматикой (12) результат распознавания, либо результат распознавания с наибольшей надежностью распознавания. 2 н. и 1 з.п. ф-лы, 2 ил., 1 табл.

Изобретение относится к способу и устройству для естественно-речевого распознавания речевого высказывания, в частности, на основе системы распознавания речи, который осуществляется, например, в электронной системе обработки данных.

Системы распознавания речи используются в различных областях. Например, они используются в сочетании с офисными приложениями для регистрации текстов или в сочетании с техническими устройствами для управления ими и для ввода команд. Системы распознавания речи используются также для управления информационными и коммуникационными приборами, например радио, мобильными телефонами и навигационными системами. Кроме того, многие фирмы используют системы речевых диалогов для консультирования и информирования клиентов, также основанные на системах распознавания речи. На это и направлена заявка.

При автоматическом распознавании речи для оценки последовательностей слов используются так называемые речевые модели, основанные на грамматическом правиле, называемом также грамматика или граммар. Грамматики определяют однозначные правила предложений. Основанные на грамматиках системы распознавания речи имеют высокую надежность распознавания.

В частности, при консультировании клиентов в технической области, например, что касается мобильных телефонов и тарифов, всегда требуются более мощные системы распознавания речи. Чтобы понимать многочисленные высказывания клиентов, требуются очень большие грамматики, объем которых снижает надежность распознавания.

Любой автоматизированный процесс распознавания речи основан на сравнении конкретного высказывания позвонившего с записанными словами или выражениями. Только в случае совпадения высказывание считается распознанным и может инициировать установленное действие. Однако из этого следует «Grammar Dilemma»: небольшие грамматики имеют небольшой объем распознавания, зато лучшую надежность распознавания. Большие грамматики, наоборот, покрывают широкий спектр выражений, тогда как надежность распознавания снижается.

В US 2002/013346 А1 раскрыт способ распознавания речи, при котором речевое высказывание лица регистрируется и преобразуется в обрабатываемый в устройстве распознавания речи речевой сигнал. Затем параллельно в нескольких ветвях устройства распознавания речи с использованием нескольких грамматик проводится анализ речевого сигнала, и процесс распознавания считается успешно завершенным, если анализ речевого сигнала, по меньшей мере, в одной ветви распознавания речи даст положительный результат распознавания.

Аналогичный способ с параллельной обработкой речевого сигнала с помощью нескольких грамматик раскрыт в US 2002/005845 A1.

В WO 00/14727 A1 раскрыта система распознавания речи, в которой с помощью нескольких грамматик проводится последовательная обработка речевого сигнала. Результаты отдельных этапов обработки взвешиваются и выдается общий результат.

Задачей изобретения является реализация способа и системы распознавания речи с большим объемом распознавания при небольшом грамматическом объеме. Следовательно, необходимо создать грамматическую модель, которая использовала бы позитивные аспекты больших и малых грамматик без имплицирования их негативных аспектов.

Эта задача решается согласно изобретению посредством способа и устройства, охарактеризованными признаками независимых пунктов формулы.

Предпочтительные варианты осуществления и другие предпочтительные признаки изобретения приведены в зависимых пунктах формулы.

Предложенный способ основан на регистрации речевого высказывания лица и его преобразовании в обрабатываемый в устройстве распознавания речи речевой сигнал, анализе речевого сигнала параллельно или последовательно в нескольких ветвях устройства распознавания речи с использованием нескольких грамматик и успешном завершении процесса распознавания, если анализ речевого сигнала, по меньшей мере, в одной ветви распознавания речи даст положительный результат.

В первом варианте происходит одновременный анализ речевого высказывания двумя или более независимыми грамматиками. В этом случае речевое высказывание лица инициирует два или более одновременных процесса распознавания, которые анализируют и оценивают речевое высказывание независимо друг от друга. Например, здесь сравнительно небольшая основная грамматика с небольшим объемом распознавания уступает место вспомогательной грамматике большего охвата с расширенным объемом распознавания. Обе грамматики не пересекаются.

Второй вариант касается грамматического каскада. В этой модели друг за другом, т.е. последовательно, используются различные грамматики. В тот момент, когда одна грамматика выдает результат распознавания, каскад покидается, и процесс распознавания заканчивается. В этом способе 100% всех распознаваемых высказываний сравниваются с первой грамматикой. В зависимости от производительности и выполнения этой грамматики часть нераспознанных высказываний, например 20%, передается на вторую ступень распознавания. В случае наличия третьей ступени распознавания можно исходить из того, что часть всех входящих высказываний, например 5%, достигает этой третьей ступени распознавания.

Оба способа распознавания покрывают широкий спектр выражений с несколькими «меньшими» грамматиками, которые в комбинации тем не менее гарантируют высокую надежность распознавания. Это может происходить, как сказано выше, в виде одновременного или последовательного процесса распознавания.

Оба предпочтительных варианта осуществления изобретения описаны ниже с помощью чертежей, на которых изображают:

фиг.1 - схематично первый вариант системы распознавания речи с параллельно работающими ветвями распознавания речи;

фиг.2 - схематично второй вариант системы распознавания речи с последовательно работающими, каскадными ветвями распознавания речи.

На фиг.1 речевое высказывание лица в виде речевого сигнала 10 подается одновременно к двум ветвям распознавания речи и анализируется двумя грамматиками 12, 14 (грамматики А, В). Обе грамматики 12, 14 не пересекаются, т.е. они основаны на разных правилах. За счет параллельной обработки речевого сигнала повышаются затраты на анализ и тем самым необходимая вычислительная нагрузка при применении способа в компьютере. Это обстоятельство компенсируется более быстрым распознаванием и существенно более высокой его надежностью.

Сравнение 16 речевого сигнала с грамматикой (А) 12 приводит либо к положительному (да), либо к отрицательному (нет) результату распознавания. Точно так же сравнение 18 речевого сигнала с грамматикой (В) 14 приводит либо к положительному (да), либо к отрицательному (нет) результату распознавания. В процессе распознавания с одновременно работающими грамматиками 12, 14 возникают четыре возможных случая распознавания, которые могут оцениваться разными методами посредством логики 20 (см. таблицу).

Случай распознавания Грамматика 1 (основная грамматика) Грамматика 2 (вспомогательная грамматика) Общий результат
1 Отсутствие результата (нет) Отсутствие результата (нет) Не распознан
2 Результат (да) Отсутствие результата (нет) Распознан
3 Отсутствие результата (нет) Результат (да) Распознан
4 Результат (да) Результат (да) Распознан

Случаи 1-3 распознавания не связаны с проблемами, поскольку они дают однозначные результаты. В случае 1 речевой сигнал не распознается и тем самым отклоняется (поз.24). Случаи 2, 3 дают только положительный результат и показывают тем самым однозначно распознавание речевого сигнала (поз.22).

В случае 4, когда обе грамматики 12, 14 распознают речевой сигнал 10, необходимо, напротив, реализовать логику, поскольку результат неоднозначен. Она может принять решение в пользу грамматики 12, может быть ориентирована на надежность распознавания (Confidence Level) или может представлять собой смешанную форму из обоих (например, результат от грамматики 14 используется только тогда, когда надежность распознавания на заданное значение выше, чем от грамматики 12).

Вместо двух параллельных ветвей распознавания речи могут быть предусмотрены согласно изобретению также три или более таких параллельно работающих ветвей.

На фиг.2 изображен другой предпочтительный вариант. Здесь несколько грамматик 12, 14, 26 (грамматики А, В, С) последовательно соединены между собой каскадом. Это значит, что в случае грамматического каскада обращение к различным грамматикам 12, 14, 26 происходит не одновременно, а последовательно. Схематично процесс распознавания можно представить следующим образом: в момент, когда одна грамматика дает положительный результат распознавания, каскад покидается и процесс распознавания завершается (поз.22).

Речевой сигнал 10 подается сначала к первой грамматике (А) 12 и подвергается там анализу. Сравнение 16 речевого сигнала с грамматикой (А) 12 приводит либо к положительному результату распознавания (да), при котором процесс распознавания успешно завершен, либо к отрицательному результату распознавания (нет), при котором речевой сигнал подается для дальнейшего анализа ко второй грамматике (В) 14. Сравнение 18 речевого сигнала 10 с грамматикой (В) 14 приводит либо к положительному результату распознавания (да), при котором процесс распознавания успешно завершен, либо к отрицательному результату распознавания (нет), при котором речевой сигнал подается для дальнейшего анализа к третьей грамматике (С) 26. Сравнение речевого сигнала с грамматикой (С) 26 приводит либо к положительному результату распознавания (да), при котором процесс распознавания успешно завершен, либо к отрицательному результату распознавания (нет), при котором речевой сигнал отклоняется как нераспознанный (поз.24).

В этом способе сначала все 100% входящих речевых сигналов 10 сравниваются с первой грамматикой 12. В зависимости от производительности и выполнения этой грамматики часть речевых высказываний не распознается. Эти нераспознанные речевые сигналы передаются на вторую ступень распознавания. В зависимости от производительности и выполнения второй ступени распознавания речевые сигналы передаются на третью ступень распознавания.

Преимущество грамматического каскада по сравнению со способом одновременного распознавания посредством нескольких грамматик состоит в том, что не возникает дополнительной вычислительной нагрузки, поскольку речевой сигнал 10 в любой момент сравнивается только с одной грамматикой. Однако последовательное распознавание неизбежно приведет к увеличению латентного времени в системе.

Вместо трех ветвей распознавания речи каскадом могут быть предусмотрены согласно изобретению также четыре или более последовательно работающих ветвей распознавания речи.

Перечень ссылочных позиций

10 - речевой сигнал

12 - грамматика А

14 - грамматика В

18 - ответвление А

20 - ответвление В

22 - распознавание завершено

22 - распознавание не завершено

26 - грамматика С

28 - ответвление С

Источник поступления информации: Роспатент

Показаны записи 1-10 из 10.
20.01.2013
№216.012.1e0b

Способ беспроводной персонализации чип-карт в телекоммуникации

Изобретение относится к телекоммуникациям, а именно к способу запуска в действие и персонализации модуля идентификации абонента SIM. Техническим результатом является повышение гибкости использования и упрощение интерфейса для передачи данных изготовителю карты. Технический результат достигается...
Тип: Изобретение
Номер охранного документа: 0002473185
Дата охранного документа: 20.01.2013
20.05.2013
№216.012.429d

Персонализация sim посредством однозначно определенного персонализированного задающего sim

Изобретение относится к области управления сетевыми данными, а именно к запуску в действие и персонализации последующего второго, не персонализированного, модуля идентификации (VSIM), в особенности, для работы оконечного устройства мобильной радиосвязи, причем имеется первый модуль...
Тип: Изобретение
Номер охранного документа: 0002482623
Дата охранного документа: 20.05.2013
20.08.2013
№216.012.626b

Способ управления сотой закрытой группой абонентов (csg) для свободного доступа к сети

Изобретение относится к способу управления одной или более сотами наземной сети мобильной связи. Технический результат заключается в обеспечении возможности доступа к сети для участников других закрытых групп абонентов и/или открытого доступа к сети. Для этого каждая сота идентифицируется...
Тип: Изобретение
Номер охранного документа: 0002490827
Дата охранного документа: 20.08.2013
27.11.2013
№216.012.8656

Кодирование банковского перевода

Изобретение относится к процессу кодирования и/или декодирования содержимого полей данных формы, при этом содержимое разных полей данных объединяется в первую последовательность стандартизированных символов, причем эта первая последовательность стандартизированных символов кодируется...
Тип: Изобретение
Номер охранного документа: 0002500068
Дата охранного документа: 27.11.2013
10.06.2014
№216.012.cccf

Способ выбора ресурсов, которые должны быть освобождены в случае перегрузки сотовой наземной мобильной системы

Изобретение относится к области беспроводной связи и, в частности, к способу распределения ресурсов в сотовой наземной мобильной сети. Техническим результатом является создание эффективного алгоритма выбора ресурсов, которые должны быть освобождены, который принимает во внимание совместно...
Тип: Изобретение
Номер охранного документа: 0002518202
Дата охранного документа: 10.06.2014
10.04.2015
№216.013.3c7f

Способ, система и базовая станция для разделения или совместного использования сети мобильного радиодоступа geran (сети радиодоступа gsm edge)

Изобретение относится к технике связи и может использоваться в беспроводных системах многостанционного доступа. Технический результат состоит в повышении пропускной способности каналов передачи. Для этого описаны способ, система и базовая станция для разделения или совместного использования...
Тип: Изобретение
Номер охранного документа: 0002546975
Дата охранного документа: 10.04.2015
12.01.2017
№217.015.6363

Способ, наземная сеть мобильной связи общего пользования, абонентская аппаратура и программное обеспечение

Изобретение относится к предоставлению сетевого доступа к абонентскому оборудованию. Технический результат изобретения заключается в повышенной гибкости обеспечения сетевого доступа к абонентской аппаратуре. Сетевой доступ содержит доступ абонентского оборудования к наземной сети, причем...
Тип: Изобретение
Номер охранного документа: 0002589316
Дата охранного документа: 10.07.2016
25.08.2017
№217.015.b03c

Способ и устройство для пространственно-временного управления потреблением электроэнергии телекоммуникационной сети в зависимости от состояний системы энергоснабжения

Изобретение относится к системам управления потреблением электроэнергии телекоммуникационной сети. Технический результат заключается в оптимизации пространственно-временного управления потреблением электроэнергии в зависимости от состояний нагрузки в электросети. Электросеть имеет центральный...
Тип: Изобретение
Номер охранного документа: 0002613350
Дата охранного документа: 16.03.2017
17.02.2018
№218.016.2d5e

Способ и система для изготовления продукта с помощью цифрового блока изготовления

Изобретение относится к средствам изготовления продукта с помощью цифрового блока изготовления. Технический результат состоит в расширении арсенала средств автоматического серийного изготовления продукта. Способ содержит этапы: через сеть связи от подключенного к сети устройства связи запускают...
Тип: Изобретение
Номер охранного документа: 0002643625
Дата охранного документа: 02.02.2018
29.06.2019
№219.017.9f69

Способ предоставления привилегий низкопривилегированной инстанции высокопривилегированной инстанцией

Изобретение относится к компьютерному администрированию, а именно к способу предоставления привилегий. Техническим результатом является расширение функциональных возможностей за счет упрощения предоставления привилегий. Для достижения технического результата реализован способ предоставления...
Тип: Изобретение
Номер охранного документа: 0002422894
Дата охранного документа: 27.06.2011
+ добавить свой РИД