×
20.02.2019
219.016.c4a1

СПОСОБ ИДЕНТИФИКАЦИИ ФАКТА РЕЧЕВОЙ АКТИВНОСТИ ОПЕРАТОРА

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
№ охранного документа
02148505
Дата охранного документа
10.05.2000
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится к диагностике психофизиологического состояния человека по речевому сигналу в процессе его профессиональной деятельности и может быть использовано при реализации контроля состояния водителя транспортного средства. Согласно данному способу регистрируют звуковое давление посредством двух разнесенных микрофонов, среднюю скорость воздушного потока - непосредственно перед ртом говорящего. Параметры движения видимой части рта определяют как мгновенное значение эффективной площади его раскрытия, а факт речевой активности устанавливают по критерию, использующему комбинацию упомянутых параметров, при этом пороговые значения для критерия подбирают экспериментально. Данный способ обеспечивает повышение надежности идентификации факта речевой активности оператора в условиях сильного зашумления и снижение требований к точности позиционирования датчиков дополнительной физиологической информации, а также микрофонов. 2 з.п. ф-лы, 2 ил.
Реферат Свернуть Развернуть

Изобретение относится к способам диагностики психофизиологического состояния человека по речевому сигналу в процессе профессиональной деятельности и может быть использовано, в частности, в системах автоматического контроля состояния операторов различных профессий, преимущественно водителей транспортных средств.

Известно, что контроль функционального состояния оператора по речевому сигналу может быть эффективно использован для поддержания работоспособности, например, в условиях монотонии, когда оператор теряет бдительность (см. патент, RU 2111134 С1, НЕЙРОКОМ, В 60 К 28/06, 1998). Способ предусматривает ведение речевого диалога с последующим анализом адекватности реакции водителя (например, ответа в речевой форме) на смысловое содержание вопроса, для чего используется система распознавания речи, которая может быть реализована различными известными методами.

Известно также, что качество распознавания предъявляемого речевого сигнала определяется методами и средствами его приема и фиксации, приобретающими особое значение в реальных условиях работы оператора, особенно водителей транспортных средств, причем в этом случае стараются снизить общий уровень фона. Для этой цели известно использование нескольких микрофонов с совместной обработкой зарегистрированных каждым из них сигналов (патент, US 5539859, Robbe et al., G 10 L 9/00, 395/2.42,1996).

При этом для эффективного распознавания и очистки от шума необходимо выявить только тот акустический сигнал, который и представляет собой речь данного оператора. Для такой цели известно использование дополнительных каналов физиологической информации, например, фиксирующих одновременно с речевым сигналом движение опорных точек на лице оператора с определением набора нормализованных векторов расстояний, описывающих мимику говорящего, с последующим их учетом (патент, US 5586215, Stork et al., G 10 L 5/06, 395/2.41, 1996) или других физиологических параметров, характеризующих эмоциональное состояние данного оператора (патент, ЕР 0660303 Al, AT&T Corp. , G 10 L 9/16, 1995). Вместе с тем, в указанных источниках не содержится информации о возможности распознавания речи в условиях особо высокой защумленности, например в кабине локомотива.

Наиболее близким аналогом патентуемого способа является способ идентификации факта речевой активности оператора, включающий одновременную регистрацию звукового давления посредством установленного у рта говорящего первого микрофона, и параметров движения видимой части рта, сопоставление зарегистрированных параметров с пороговыми значениями и последующее выделение начала и конца речевого фрагмента, подлежащего распознаванию (патент, US 5473726, Marshall, G 10 L 5/06, 395/2.4, 1995). Способ может быть реализован посредством устройства, включающего микрофон и фотодатчик, подключенные к ЭВМ.

Однако вышеупомянутое изобретение не позволяет достаточно надежно идентифицировать факт речевой активности оператора в условиях сильного зашумления и вибрации, свойственным условиям работы ответственных профессий, например экипажей локомотивных бригад на железнодорожном транспорте.

Технический результат изобретения состоит в повышении надежности идентификации факта речевой активности оператора в условиях сильного зашумления и снижении требований к точности позиционирования датчиков дополнительной физиологической информации, а также микрофонов.

Поставленная цель достигается тем, что способ идентификации факта речевой активности оператора включает одновременную регистрацию звукового давления P1(t) посредством установленного у рта говорящего первого микрофона, и параметров перемещения элементов видимой части рта, сопоставление зарегистрированных параметров с пороговыми значениями и последующее выделение начала и конца речевого фрагмента, подлежащего распознаванию. Дополнительно регистрируют среднюю скорость V(t) воздушного потока непосредственно перед ртом говорящего, а также среднее значение звукового давления P2(t) посредством второго микрофона, удаленного от первого. При этом в качестве параметров движения видимой части рта определяют мгновенное значение эффективной площади Sэфф(t) его раскрытия, а факт речевой активности устанавливают при одновременном выполнении следующих условий:
|P1(t)-P2(t)| > E

пор
1
;
|P1(t)|-|P2(t)| > E
пор
2
;
|Sэфф(t)| > E
пор
3
;

|V(t)| > E
пор
5
(t),
где: P1(t), P2(t) - средние значения звукового давления, a E1пор, E2пор, E3пор, E4пор, E5пор - пороговые значения, установленные экспериментально.

Кроме того, способ может характеризоваться тем, что средние значения звукового давления P1(t), P2(t) определяют путем усреднения соответствующих величин мгновенного звукового давления во временном интервале длительностью 10 - 100 миллисекунд.

Кроме того, способ может характеризоваться также тем, что среднюю скорость V(t) воздушного потока непосредственно перед ртом говорящего определяют путем усреднения величины мгновенной скорости воздушного потока во временном интервале длительностью 10-100 миллисекунд.

В основе изобретения лежат следующие предпосылки, соображения и экспериментальные факты.

При наличии искомой речевой активности оператора среднее значение звукового давления P1(t) от ближнего микрофона должно превышать среднее значение звукового давления P2(t) от удаленного микрофона. Тем самым знак разности модулей этих сигналов E2(t): = |P1(t)|-|P2(t)| указывает направление распространения сигнала по оси, соединяющей ближний и дальний микрофоны, а абсолютная величина этой разности показывает относительную громкость источника сигнала в шуме. Кроме того, при отсутствии речевой активности оператора в предположении, что длина волны много больше расстояния между микрофонами, фазы шумовой составляющей сигнала незначительно изменяются при переходе от удаленного микрофона к ближнему, поэтому энергия E1(t): = |P1(t)-P2(t)| должна быть мала.

При анализе оптическим методом параметров движения видимой части рта сигналы, поступившие от фотоприемников, нормируют таким образом, что плотно закрытый рот соответствует нулевому уровню сигнала. Далее вычисляют модуль E3(t) сигнала с максимальным модулем производной и модуль производной этого сигнала E4(t). При речевом ответе сигнал E3(t) должен быть отличен от константы в течение времени всего ответа; кроме того, модуль его производной определяет скорость движения губ. Использование этих параметров позволяет устройству не реагировать на "паразитные" движения губ оператора, например, при дыхании через рот. Регистрируемая информация о скорости V(t) воздушного потока непосредственно перед ртом говорящего позволяет ввести дополнительные критерии для дифференциации входных данных, поскольку профили функции V(t) во время дыхания и речи различны.

Полученные на выходе значения сравнивают с пороговыми величинами, установленными экспериментально. Изобретение позволяет зафиксировать факт речевой активности, если в один и тот же момент времени все пять анализируемых величин превысили свои пороговые значения.

Сущность патентуемого способа поясняется чертежами, где:
на фиг. 1 изображена блок-схема устройства для реализации способа,
на фиг. 2 - алгоритм обработки сигналов для выделения факта речевой активности оператора.

Устройство содержит микрофон 1, располагаемый в непосредственной близости от рта оператора, микрофон 2, расположенный на некотором удалении (0,5-15 см) от первого микрофона, фотодатчик 3, предназначенный для регистрации параметров Sэфф(t) движения видимой части рта и располагаемый перед губами оператора, а также датчик 4 средней скорости V(t) воздушного потока непосредственно перед ртом говорящего, расположенный рядом с фотодатчиком 3.

Фотодатчик 3 включает инфракрасный излучатель 5 и приемное устройство 6, содержащее линейку фотоприемников. Оба микрофона и датчики монтируют на гарнитуре, одеваемой на голову оператора (на фигуре не показана). Введение нескольких фотоприемников позволяет снизить требования к точности позиционирования фотодатчика и увеличить свободу перемещения гарнитуры с датчиками без перенастройки устройства, что в свою очередь обеспечивает удобство при работе с устройством. Микрофоны 1,2, фотодатчик 3 и датчик 4 через индивидуальные аналого-цифровые преобразователи (АЦП) 7 - 10 подключены к блоку 11 анализа, который может быть реализован на базе компьютера.

Алгоритм обработки сигналов для выделения факта речевой активности оператора приведен на фиг. 2.

По команде "старт" (поз. 100) фиксируются сигналы P1(t) (поз. 102) и P2(t) (поз. 104) с первого и второго микрофонов, несущие информацию о звуковом давлении, а также сигнал о параметрах Sэфф(t) движения видимой части рта (поз. 106) и средней скорости V(t) воздушного потока непосредственно перед ртом говорящего (поз. 108). Далее вычисляется модуль разности сигналов звукового давления E1(t) = |P1(t)-P2(t)| (nоз. 110). Далее, на следующем этапе (поз. 112) проводится проверка превышения величиной Е1(t) порогового значения E1пор, установленного на этапе обучения системы. Если получен результат E1(t) < E1пор, то фиксируется отрицательный результат. В противном случае на следующем шаге (поз. 114) вычисляется величина У2(t), равная разности модулей указанных звуковых давлений. Далее проводится сравнение величин E2(t) и E2пор (поз. 116), если E2(t) < E2пор, то алгоритм дает отрицательный ответ, свидетельствующий о том, что идентифицируемая речь отсутствует. Если условие E2(t) > E2пор удовлетворяется, то алгоритм переходит к следующему шагу.

На следующем шаге (поз. 118) вычисляется величина E3(t) = |Sэфф(t)| , а далее (поз. 120) проводится сопоставление этой величины с пороговым значением, установленным на этапе обучения системы. Если E3(t) > E3пор, то производится вычисление величины E4(t), равной модулю производной величины Sэфф(t) (поз. 122). На следующем этапе (поз. 124) производится проверка соответствия полученного значения E4(t) пороговой величине E4пор. Если удовлетворяется условие, то E4(t) > E4пор, то проводится проверка выполнения условий для последнего анализируемого сигнала E5(t): модуля средней скорости V(t) воздушного потока непосредственно перед ртом говорящего (поз. 126). В том случае, если не удовлетворяется условие E5(t) > E5пор(t) (поз. 128), делается общий вывод о том, что факт речевой активности отсутствует (поз. 130). Алгоритм при этом переходит к началу (поз. 100). Если же E5(t) > E5пор(t), то делается общий вывод о том, что анализируемый звуковой фрагмент представляет собой речь данного оператора. При этом началом звукового фрагмента является момент превышения всеми анализируемыми величинами соответствующих пороговых значений. Далее цикл анализа повторяется с дискретностью, определяемой частотой дискретизации блока анализа 11. Временной интервал при вычислении средних значений звукового давления P1(t), P2(t) и V(t) воздушного потока непосредственно перед ртом говорящего составляет 10 - 100 миллисекунд.

Предлагаемое устройство позволяет повысить надежность идентификации факта речевой активности оператора в условиях сильного зашумления, а использование разнородных по физической природе датчиков - снизить требования к точности позиционирования гарнитуры на голове оператора.

1.Способидентификациифактаречевойактивностиоператора,включающийодновременнуюрегистрациюзвуковогодавленияP(t)посредствомустановленногоуртаговорящегопервогомикрофонаипараметровперемещенияэлементоввидимойчастирта,сопоставлениезарегистрированныхпараметровспороговымизначениямиипоследующеевыделениеначалаиконцаречевогофрагмента,подлежащегораспознаванию,отличающийсятем,чтодополнительнорегистрируютсреднююскоростьV(t)воздушногопотоканепосредственнопередртомговорящего,атакжесреднеезначениезвуковогодавленияP(t)посредствомвторогомикрофона,удаленногоотпервого,приэтомвкачествепараметровдвижениявидимойчастиртаопределяютмгновенноезначениеэффективнойплощадиS(t)егораскрытия,афактречевойактивностиустанавливаютприодновременномвыполненииследующихусловий:гдеP(t),P(t)-средниезначениязвуковогодавления;E ,E ,E ,E ,E -пороговыезначения,установленныеэкспериментально.12.Способпоп.1,отличающийсятем,чтосредниезначениязвуковогодавленияP(t),P(t)определяютпутемусреднениясоответствующихвеличинмгновенногозвуковогодавлениявовременноминтерваледлительностью10-100мс.23.Способпоп.1или2,отличающийсятем,чтосреднююскоростьV(t)воздушногопотоканепосредственнопередртомговорящегоопределяютпутемусреднениявеличинымгновеннойскоростивоздушногопотокавовременноминтерваледлительностью10-100мс.3
Источник поступления информации: Роспатент

Показаны записи 1-5 из 5.
20.02.2019
№219.016.bcc6

Телеметрическая система контроля бодрствования водителя транспортного средства

Изобретение относится к технике диагностики психофизиологического состояния человека в процессе профессиональной деятельности. Система содержит связанные по радиоканалу приемник и два телеметрических датчика, а также блок обработки сигналов и управления, связанный с блоком индикации. Каждый...
Тип: Изобретение
Номер охранного документа: 0002282543
Дата охранного документа: 27.08.2006
10.04.2019
№219.016.ff5d

Способ оценки сенсорной чувствительности в условиях анестезии и устройство для его осуществления

Изобретение относится к медицине, а именно к анестезиологии, и может быть использовано при различных хирургических манипуляциях, требующих проведения общей анестезии. Способ оценки сенсорной чувствительности в условиях анестезии состоит в воздействии стимула в виде импульсов электрического...
Тип: Изобретение
Номер охранного документа: 0002269291
Дата охранного документа: 10.02.2006
10.04.2019
№219.016.ff76

Устройство контроля психофизиологической совместимости операторов по гомеостатической методике

Изобретение относится к медицинской технике и может быть использовано при проведении психологических исследований и диагностики, в частности при оценке конфликтности или слаженности действий операторов. Устройство содержит по меньшей мере два пульта испытуемых. Каждый пульт включает переменный...
Тип: Изобретение
Номер охранного документа: 0002266049
Дата охранного документа: 20.12.2005
18.05.2019
№219.017.5458

Способ оценки склонности к риску

Изобретение относится к способам оценки психофизиологических качеств человека-оператора сложных систем управления и может быть использовано при профессиональном отборе. Способ заключается в формировании на экране монитора компьютера, по меньшей мере, трех кадров с изображением трех...
Тип: Изобретение
Номер охранного документа: 0002289165
Дата охранного документа: 10.12.2006
09.06.2019
№219.017.782d

Телеметрическая система контроля работоспособности оператора по уровню бодрствования и предвестникам гипогликемии

Изобретение относится к средствам диагностики психофизиологического состояния человека в процессе профессиональной деятельности и может быть использовано в системах автоматического контроля состояния операторов, в частности водителей транспортных средств. Технический результат - контроль...
Тип: Изобретение
Номер охранного документа: 0002251156
Дата охранного документа: 27.04.2005
+ добавить свой РИД