×
25.08.2017
217.015.9f3e

Результат интеллектуальной деятельности: УСТРОЙСТВО СИНТЕЗА РЕЧИ

Вид РИД

Изобретение

Аннотация: Изобретение направлено на формирование речевого сигнала с заданными характеристиками. Технический результат заключается в повышении естественности, разборчивости речи и ее эмоциональной окраски при генерации речевого сигнала при уменьшении вычислительной сложности за счет усовершенствования структуры элементов системы синтеза речи и разделения используемых баз данных. Устройство синтеза речи на основе текста, содержит блок, принимающий текстовую строку и формирующий из нее последовательность идентификаторов звуковых единиц, подаваемую в блок формирования звукового сигнала, а затем в блок воспроизведения. В блок формирования звукового сигнала параллельно подаются дополнительные команды управления, вырабатываемые из сформированной последовательности идентификаторов звуковых единиц блоком формирования управляющих команд, зависящих от языка, блоком формирования управляющих команд, зависящих от моделируемых параметров диктора, а именно параметров голоса и/или его физических и физиологических параметров, и блоком формирования управляющих параметров окраса голоса, настроенных на определенное психофизиологическое состояние, предназначенных для формирования управляющих параметров для коррекции интенсивности речевого сигнала. 1 з.п. ф-лы, 1 ил.

Изобретение относится к речевой информатике и приборостроению для синтеза речи по печатному тексту для вывода из ЭВМ.

Известным способом синтезирования речи по печатному тексту является компиляционный синтез речи. Синтез речи по этому способу обеспечивается путем компиляции фрагментов заранее записанных речевых сигналов, их обработки и последовательного воспроизведения [1, 2, 3].

Недостатками этого способа является необходимость хранения участков речевых сегментов в виде базы данных, сложность «стыкования» различных речевых участков при коартикуляции звуков речи, а также значительная трудоемкость при изменении параметров голоса. Как правило, для этого требуется новая база данных речевых сегментов.

Известен способ синтеза речи [4], ориентированный на повышение естественности, разборчивости речи при генерации речевого сигнала при уменьшении вычислительной сложности за счет усовершенствования структуры элементов системы синтеза речи и разделения используемых баз данных, являющийся аналогом данного патента. Недостатком данного способа является необходимость хранения в базе данных диктора нескольких вариантов его психофизиологического состояния, которые существенно влияют на окрас речевого сигнала.

Известен способ синтеза речи [5] с улучшением качества синтезируемой речи за счет точной передачи интонации. Технический результат в данном способе достигается тем, что выделяют в тексте, по меньшей мере, одну часть, определяют интонацию каждой части, ставят в соответствие каждой части целевые речевые звуки, определяют физические параметры целевых речевых звуков, находят в речевой базе речевые звуки, наиболее близкие по физическим параметрам к целевым речевым звукам, синтезируют речь в виде последовательности из найденных речевых звуков, причем физические параметры указанных целевых речевых звуков определяют в соответствии с определенной интонацией. Недостатком данного способа является необходимость хранения значительных объемов информации по каждому аллофону и необходимость поиска по данной базе данных, а также сложность психофизиологической окраски голоса.

Известен способ автоматизированной обработки текста и компьютерное устройство для реализации этого способа [6]. Техническим результатом данного способа является повышение качества, увеличение скорости обработки и уменьшение количества информационных ресурсов. Указанный результат достигается тем, что способ включает в себя объединение слов в синтагмы с простановкой символов пауз в конце синтагм с последующим транскрибированием синтагм для получения идеальных транскрипций синтагм в терминах фонем и аллофонов. Затем дополнительно формируют базу данных эталонных аллофонов, сравнивают совпадение аллофонов идеальных транскрипций синтагм с эталонными аллофонами и исключают аллофоны идеальных транскрипций синтагм, не совпадающие с эталонными аллофонами. По аллофонам идеальных транскрипций синтагм, совпадающим с эталонными аллофонами, формируют сбалансированные синтагмы текста - имеющие наибольшее число совпадений аллофонов идеальных транскрипций синтагм с эталонными аллофонами. Недостатком данного способа является сложность модификации идеальных аллофонов для формирования психофизиологической окраски голоса, а также необходимость хранения излишней информации об аллофонах.

Известно устройство [7], которое осуществляет ввод теста в текстовый процессор, соединенный с устройствами выбора «мультиволн», которые вместе формируют речевой сигнал. Достоинством данного способа является относительно небольшое количество речевых сегментов («мультиволн», звуковых волн), т.е. база данных значительно меньше по сравнению с базой данной, используемой при компилятивном синтезе. Недостатком мультиволнового синтеза является значительная вычислительная сложность при получении итогового речевого сигнала, возникающая при обработке получающегося речевого сигнала.

Русская речь имеет широкий диапазон изменений по просодической и артикуляционной составляющей, что не позволяет использовать в полной мере способы и устройства синтеза иноязычной речи. Получающая речь при использовании этих способов и устройств, как правило, является неестественной, либо существенно ограничена в вариативности произносимого голоса. Кроме того, как правило, разработчики систем не учитывают вариативность психофизиологической окраски голоса. Необходимо разработать такое устройство, которое при функционировании учитывало бы орфоэпические особенности русского языка, с одной стороны, и, с другой стороны, позволяло моделировать произношение конкретного диктора, и имело бы возможность психофизиологической окраски речи, генерируемой ЭВМ.

Известно [7, 8, 9], что качество синтезирования речи по печатному тексту может быть улучшено за счет изменения структуры системы синтеза речи.

Цель изобретения - повышение естественности и разборчивости речи, обусловленной увеличением вариативности темпа, тембра, психофизиологической окраски и других особенностей синтезируемого речевого сигнала, при уменьшении вычислительной сложности за счет усовершенствования структуры элементов устройства синтеза речи по печатному тексту и разделения используемых баз данных и параметров процесса генерации речи.

Это достигается тем, что в предлагаемом устройстве производят раздельное формирование управляющих сигналов для блока формирования звукового сигнала. При этом один из блоков учитывает особенности языка и, по сути, является формирователем основы речевого сигнала, а два остальных используются для формирования коррекционных команд над результатом работы первого блока и основываются на принятой модели диктора.

Сущность предлагаемого устройства представлена на Фиг. Устройство состоит из следующих блоков: 1 - текстовый процессор; 2 - блок формирования последовательности акустических единиц, зависящих от языка; 3 - блок формирования управляющих команд, зависящих от моделируемого диктора; 4 - блок формирования управляемых параметров окраса голоса, зависящих от необходимого психофизиологического окраса речевого сигнала; 5 - блок формирования звукового сигнала; 6 - блок воспроизведения.

Текстовый процессор (1) осуществляет функции нормализации текста, фонетического транскрибирования, разметки длительностей и фразовых ударений. Блок (2) формирования последовательности акустических единиц, зависящих от языка, выбирает базовые акустические сегменты, которые являются базовыми для речевого сигнала. Блок (3) формирования управляющих команд, зависящих от моделируемого диктора, формирует команды управления, которые будут корректировать звуковые единицы в соответствии с моделью диктора. Блок (4) формирования управляемых параметров окраса голоса, настроенных на определенное психофизиологическое состояние (гнев, радость, счастье, удивление, спокойствие и др.), формирует управляемые параметры для коррекции генерируемого речевого сигнала. Блок формирования звукового сигнала (5) выполняет операции формирования элементов управления параметрами воспроизведения в зависимости от способа синтеза (компилятивный, артикуляционный, фонемный), действия проводятся на последовательности акустических сегментов по командам, зависящим от диктора и последовательности идентификаторов звуковых единиц в соответствии с параметрами окраса голоса. Блок воспроизведения (6) воспроизводит синтезированную речь.

Предлагаемое устройство работает следующим образом. Информация после текстового процессора (1), освобожденная от цифр и знаков пунктуации, представляет собой последовательность идентификаторов звуковых единиц. Эта последовательность поступает на вход блока (2) формирования управляющих команд, зависящих от языка. Этот блок выбирает звуковые единицы акустических сегментов (или их аналогов - мультиволн, аллофонов, фонем, дифонов и пр.) из базы данных (2.А), соответствующие заданном языку и его особенностям: коэффициенты длительностей, мощностей звуков, а также интонационным параметрам. Одновременно с этим последовательность идентификаторов звуковых единиц поступает на вход блока (3) формирования управляющих команд, зависящих от моделируемого диктора. Этот блок выбирает параметры управления из базы данных (3.Р), соответствующие заданным параметрам голоса: полу диктора, высоте, темпу, ритму, мощности, индивидуальной ритмомелодической картине (в том числе при артикуляционном синтезе - физические и физиологические параметры диктора). В это же время в блоке (4) по поступающей последовательности идентификаторов звуковых единиц формируются параметры генерации (коррекции) речевого сигнала для его психофизиологического окраса путем выбора корректирующих параметров из базы данных (4.А). Последовательность идентификаторов звуковых единиц с блока (1) вместе со звуковыми единицами акустических сегментов с блока (2), управляющей информацией, полученной с блока (3), и параметрами окраса речевого сигнала (4) подаются на блок формирования звукового сигнала (5), где формируется итоговая сборка звукового сигнала по результатам работы блока (2) и коррекцией по результатам работы блоков (3) и (4), который поступает на блок воспроизведения (6).

Таким образом, при разделении баз данных и блоков управления по языку и диктору позволяет расширить диапазон изменения параметров синтезируемого речевого сигнала при одновременном сокращении количества вычислительных операций.

Использованные источники информации

1. Способ компиляционного фонемного синтеза русской речи и устройство для его реализации. Алперин Е.Д., Кнох В.Я. Патент RU 2298234, G10L 13/08, заявл. 21.07.2005, опубл. 27.04.2007.

2. Преобразование буквы в звук для синтезированного произношения сегмента текста. Чэнь Гуй-Линь, Хуан Цзянь-Чэн. Заявка на изобретение RU 2006114705, G10L 13/08, заявл. 17.09.2004, опубл. 10.11.2007.

3. Способ компиляционного фонемного синтеза русской речи и устройство для его реализации. Алперин Е.Д., Кнох В.Я. Заявка на изобретение RU 2005123222, G10L 15/00, заявл. 21.07.2005, опубл. 27.01.2007.

4. Способ синтеза речи и устройство для его реализации. Мещеряков Р.В. Заявка на изобретение RU 2009111740, G10L 13/08, заявл. 30.03.2009, опубл. 30.03.2009.

5. Способ синтеза речи. Хитров М.В. Патент на изобретение RU 2421827, G10L 13/08, заявл. 07.08.2009, опубл. 20.06.2011.

6. Способ автоматизированной обработки текста и компьютерное устройство для реализации этого способа. Бредихин А.Ю., Сергейчев Н.Е. Патент на изобретение RU 2460154, G10L 13/08, G06F 17/21, заявл. 15.06.2011, опубл. 27.08.2012.

7. Лобанов Б.М. Компьютерный синтез и клонирование речи / Б.М. Лобанов, Л.И. Цирюльник. - Минск: Белорус. наука, 2008. - 343 с.

8. Златоустова Л.В. Общая и прикладная фонетика / Л.В. Златоустова, Р.К. Потапова, В.Н. Трунин-Донской. - М.: Издательство МГУ, 1986. - 304 с.

9. Потапова Р.К. Речь: коммуникация, информация, кибернетика. - М.: Радио и связь. - 1997. - 528 с.


УСТРОЙСТВО СИНТЕЗА РЕЧИ
УСТРОЙСТВО СИНТЕЗА РЕЧИ
Источник поступления информации: Роспатент

Показаны записи 31-40 из 57.
13.01.2017
№217.015.7b44

Меандровая линия задержки из двух витков, защищающая от сверхкоротких импульсов

Изобретение относится к радиотехнике и может быть использовано для защиты радиоэлектронной аппаратуры от сверхкоротких импульсов. Достигаемый технический результат - ослабление амплитуды сверхкоротких импульсов(СКИ). Линия задержки включает виток, состоящий из одного опорного проводника, двух...
Тип: Изобретение
Номер охранного документа: 0002600098
Дата охранного документа: 20.10.2016
13.01.2017
№217.015.81bb

Способ напыления тонкопленочных покрытий на поверхность полупроводниковых гетероэпитаксиальных структур методом магнетронного распыления

Способ включает формирование в известной магнетронной распылительной системе планарного типа магнитного поля, зажигание разряда в скрещенных электрическом и магнитном полях, распыление материала катода и его осаждение на поверхность полупроводниковой гетероэпитаксиальной структуры. Между...
Тип: Изобретение
Номер охранного документа: 0002601903
Дата охранного документа: 10.11.2016
13.01.2017
№217.015.8b7e

Способ определения электрооптического коэффициента оптических кристаллов с высокой электропроводностью

Изобретение относится к области оптоэлектроники и может быть использовано при изготовлении оптических приборов на основе оптических кристаллов, обладающих высокой электропроводностью. Способ осуществляется следующим образом: кристалл с высокой электропроводностью помещают в одно из плеч...
Тип: Изобретение
Номер охранного документа: 0002604117
Дата охранного документа: 10.12.2016
13.01.2017
№217.015.9069

Способ трассировки печатных проводников с дополнительным диэлектриком для цепей с резервированием

Изобретение относится к конструированию печатных плат, конкретно - к способам их трассировки. Технический результат состоит в уменьшении восприимчивости резервируемой цепи к внешним кондуктивным эмиссиям и уменьшение уровня кондуктивных эмиссий от резервируемой цепи. Для этого способ...
Тип: Изобретение
Номер охранного документа: 0002603851
Дата охранного документа: 10.12.2016
13.01.2017
№217.015.906a

Способ трассировки печатных проводников цепей с резервированием

Изобретение относится к конструированию печатных плат, конкретно к способам их трассировки. Технический результат состоит в уменьшении восприимчивости резервируемой цепи к внешним кондуктивным эмиссиям и уменьшении уровня кондуктивных эмиссий от резервируемой цепи. Для этого способ трассировки...
Тип: Изобретение
Номер охранного документа: 0002603850
Дата охранного документа: 10.12.2016
13.01.2017
№217.015.90d0

Способ резервирования плоских кабелей

Изобретение относится к электротехнике, конкретно к способам резервирования кабелей. Технический результат состоит в уменьшение восприимчивости резервируемой цепи к внешним кондуктивным эмиссиям и уменьшение уровня кондуктивных эмиссий от резервируемой цепи. Для этого в способе резервирования...
Тип: Изобретение
Номер охранного документа: 0002603848
Дата охранного документа: 10.12.2016
13.01.2017
№217.015.90eb

Способ резервирования для печатных плат

Изобретение относится к конструированию печатных плат, конкретно - к способам их резервирования. Технический результат состоит в уменьшении восприимчивости резервируемой цепи к внешним кондуктивным эмиссиям и уменьшение уровня кондуктивных эмиссий от резервируемой цепи. Для этого предлагается...
Тип: Изобретение
Номер охранного документа: 0002603843
Дата охранного документа: 10.12.2016
25.08.2017
№217.015.a0b1

Меандровая линия задержки с лицевой связью, защищающая от сверхкоротких импульсов

Изобретение относится к радиотехнике и может быть использовано для защиты радиоэлектронной аппаратуры от сверхкоротких импульсов. Линия задержки состоит из одного опорного проводника, двух параллельных ему и друг другу сигнальных проводников, соединенных между собой на одном конце, и...
Тип: Изобретение
Номер охранного документа: 0002606709
Дата охранного документа: 10.01.2017
25.08.2017
№217.015.a13a

Пигмент для поглощающих термостабилизирующих покрытий

Изобретение относится к области создания пигментов и покрытий для пассивных методов термостабилизации объектов. Описан способ получения пигмента для поглощающих термостабилизирующих покрытий на основе манганитов редкоземельных элементов, обладающих фазовым переходом в зависимости излучательной...
Тип: Изобретение
Номер охранного документа: 0002606446
Дата охранного документа: 10.01.2017
25.08.2017
№217.015.a1c3

Меандровая линия задержки из двух витков с разными разносами, защищающая от сверхкоротких импульсов

Изобретение относится к радиотехнике и может быть использовано для защиты радиоэлектронной аппаратуры от сверхкоротких импульсов. Линия задержки содержит виток, состоящий из одного опорного проводника, двух параллельных ему и друг другу сигнальных проводников, соединенных между собой на одном...
Тип: Изобретение
Номер охранного документа: 0002606776
Дата охранного документа: 10.01.2017
Показаны записи 31-40 из 56.
13.01.2017
№217.015.7b44

Меандровая линия задержки из двух витков, защищающая от сверхкоротких импульсов

Изобретение относится к радиотехнике и может быть использовано для защиты радиоэлектронной аппаратуры от сверхкоротких импульсов. Достигаемый технический результат - ослабление амплитуды сверхкоротких импульсов(СКИ). Линия задержки включает виток, состоящий из одного опорного проводника, двух...
Тип: Изобретение
Номер охранного документа: 0002600098
Дата охранного документа: 20.10.2016
13.01.2017
№217.015.81bb

Способ напыления тонкопленочных покрытий на поверхность полупроводниковых гетероэпитаксиальных структур методом магнетронного распыления

Способ включает формирование в известной магнетронной распылительной системе планарного типа магнитного поля, зажигание разряда в скрещенных электрическом и магнитном полях, распыление материала катода и его осаждение на поверхность полупроводниковой гетероэпитаксиальной структуры. Между...
Тип: Изобретение
Номер охранного документа: 0002601903
Дата охранного документа: 10.11.2016
13.01.2017
№217.015.8b7e

Способ определения электрооптического коэффициента оптических кристаллов с высокой электропроводностью

Изобретение относится к области оптоэлектроники и может быть использовано при изготовлении оптических приборов на основе оптических кристаллов, обладающих высокой электропроводностью. Способ осуществляется следующим образом: кристалл с высокой электропроводностью помещают в одно из плеч...
Тип: Изобретение
Номер охранного документа: 0002604117
Дата охранного документа: 10.12.2016
13.01.2017
№217.015.9069

Способ трассировки печатных проводников с дополнительным диэлектриком для цепей с резервированием

Изобретение относится к конструированию печатных плат, конкретно - к способам их трассировки. Технический результат состоит в уменьшении восприимчивости резервируемой цепи к внешним кондуктивным эмиссиям и уменьшение уровня кондуктивных эмиссий от резервируемой цепи. Для этого способ...
Тип: Изобретение
Номер охранного документа: 0002603851
Дата охранного документа: 10.12.2016
13.01.2017
№217.015.906a

Способ трассировки печатных проводников цепей с резервированием

Изобретение относится к конструированию печатных плат, конкретно к способам их трассировки. Технический результат состоит в уменьшении восприимчивости резервируемой цепи к внешним кондуктивным эмиссиям и уменьшении уровня кондуктивных эмиссий от резервируемой цепи. Для этого способ трассировки...
Тип: Изобретение
Номер охранного документа: 0002603850
Дата охранного документа: 10.12.2016
13.01.2017
№217.015.90d0

Способ резервирования плоских кабелей

Изобретение относится к электротехнике, конкретно к способам резервирования кабелей. Технический результат состоит в уменьшение восприимчивости резервируемой цепи к внешним кондуктивным эмиссиям и уменьшение уровня кондуктивных эмиссий от резервируемой цепи. Для этого в способе резервирования...
Тип: Изобретение
Номер охранного документа: 0002603848
Дата охранного документа: 10.12.2016
13.01.2017
№217.015.90eb

Способ резервирования для печатных плат

Изобретение относится к конструированию печатных плат, конкретно - к способам их резервирования. Технический результат состоит в уменьшении восприимчивости резервируемой цепи к внешним кондуктивным эмиссиям и уменьшение уровня кондуктивных эмиссий от резервируемой цепи. Для этого предлагается...
Тип: Изобретение
Номер охранного документа: 0002603843
Дата охранного документа: 10.12.2016
25.08.2017
№217.015.a0b1

Меандровая линия задержки с лицевой связью, защищающая от сверхкоротких импульсов

Изобретение относится к радиотехнике и может быть использовано для защиты радиоэлектронной аппаратуры от сверхкоротких импульсов. Линия задержки состоит из одного опорного проводника, двух параллельных ему и друг другу сигнальных проводников, соединенных между собой на одном конце, и...
Тип: Изобретение
Номер охранного документа: 0002606709
Дата охранного документа: 10.01.2017
25.08.2017
№217.015.a13a

Пигмент для поглощающих термостабилизирующих покрытий

Изобретение относится к области создания пигментов и покрытий для пассивных методов термостабилизации объектов. Описан способ получения пигмента для поглощающих термостабилизирующих покрытий на основе манганитов редкоземельных элементов, обладающих фазовым переходом в зависимости излучательной...
Тип: Изобретение
Номер охранного документа: 0002606446
Дата охранного документа: 10.01.2017
25.08.2017
№217.015.a1c3

Меандровая линия задержки из двух витков с разными разносами, защищающая от сверхкоротких импульсов

Изобретение относится к радиотехнике и может быть использовано для защиты радиоэлектронной аппаратуры от сверхкоротких импульсов. Линия задержки содержит виток, состоящий из одного опорного проводника, двух параллельных ему и друг другу сигнальных проводников, соединенных между собой на одном...
Тип: Изобретение
Номер охранного документа: 0002606776
Дата охранного документа: 10.01.2017
+ добавить свой РИД