×
11.02.2020
220.018.016b

Алгоритм удаления шума в аудиопотоке, содержащем человеческую речь

Вид РИД

Произведениe науки

Код транзакции депонирования в блокчейн Ethereum: 0x5fdc91819744f0c26df848e5598cc68db26ddff79887ac734fdb3f22cd09e2a4
Юридическая информация Свернуть Развернуть
Наименование РИД на английском: Algorithm for removing noise in an audio stream containing human speech
Краткое описание РИД Свернуть Развернуть
Описание произведения: Алгоритм предназначен для удаления шума в аудиопотоке, содержащем человеческую речь. Может быть применим в любых устройствах записывающих, обрабатывающих человеческую речь в шумной обстановке. В частности применим в мобильных приложениях и компьютерных программах для ПК. Алгоритм способен понизить уровень шума для более удобного прослушивания человечекой речи.
Ключевые слова: шумоподавление, удаление шума, аудиопоток, запись речи, обработка звука, звукообработка
Развернутое описание Свернуть Развернуть
Основные результаты научного произведения:
1) Получен алгоритм удаления шума в аудиопотоке, который содержит человеческую речь;
2) Получена компьютерная программа, реализующая алгоритм; 
3) Проведены испытания и внедрение алгоритма в мобильное приложение "Умный диктофон - Лилия" для мобильных устройств на базе iOS и Android
4) Проведены испытания и внедрение алгоритма в серию мобильных приложений "Школа Сов" для мобильных устройств на базе iOS
Перспективные направления применения для дальнейших исследований и разработок: Алгоритм может быть применен для дальнейшего исследования способов обработки и фильтрации аудиосигналов.
Приоритетные направления развития науки, технологий и техники в РФ: Информационно-телекоммуникационные системы
Реферат Свернуть Развернуть
Алгоритм шумоподавления состоит из четырех структурных частей: • Первая часть алгоритма – «Разбиение». Входной поток данных разбивается на интервалы одинаковой длины с 50% наложением. Длина интервала рассчитывается исходя из частоты дискретизации сигнала и составляет 0,040 с. Так для сигнала с частотой дискретизации равной 44100 Гц размер интервала составляет 1764 отсчета. Каждый из полученных интервалов поточечно умножается на оконную функцию Хэмминга соответствующего размера. В таком виде интервал передается на следующие части алгоритма. • Вторая часть алгоритма – «Модель шума». После «разбиения» сигнал поинтервально передается для оценки модели шума. Для полученного сигнала рассчитывается энергия. С результатом производятся манипуляции, включающие в себя сглаживание, расчет вариации, расчет максимума, расчет минимума и другие преобразования. В результате выполненных манипуляций получаются метрики, которые сохраняются для обработки следующего интервала (накопительные метрики), часть из которых представляет собой спектральную картину шумовой составляющей сигнала. Модель шума обновляется с каждым новым обработанным интервалом, таким образом, с течением времени алгоритм качественнее оценивает шумовую составляющую сигнала. Более того, при смене шумовой обстановки алгоритм перестраивает модель шума. Время реакции составляет порядка 1 секунды (это касается и запуска алгоритма, когда модель шума не сформирована). • Третья часть – «Подавление». Полученные после разбиения интервалы сигнала очищаются от шума с использованием модели шума, полученной на предыдущем шаге. Для этого используется адаптивный подбор уровня подавления, который определяет соотношение сигнал/шум в данном интервале сигнала. Полученный уровень используется для спектрального вычитания шума из сигнала в данном интервале. Для уменьшения «музыкальных» шумов некоторые параметры алгоритма рассчитываются не только на основе текущего интервала, но и на основе предыдущего. • Четвертая часть – «Объединение». После подавления шумов, интервалы сигнала объединяются в итоговый результат. Для этого интервалы, которые были получены 50% наложением, поточечно складываются с таким же наложением.
Хеш-код депонирования: c621a1ef7bf702a4333619997d250b51995ef130d1f998ff66f14eaca3011718
Источник поступления информации: Портал edrid.ru

Showing 1-10 of 18 items.
26.10.2016
№216.015.5712

По беспроводной вибродиагностики\микрошокового анализа машин "резонанс"

55.03.05. Надежность и долговечность машин Программное обеспечение системы вибродиагностического неразрушающего контроля, позволяющая быстро и эффективно получить как качественную, так и детальную информацию о состоянии разнородных машин \ станков \ агрегатов и промышленных установок различной...
26.10.2016
№216.015.5713

По классификации виброакустических воздействий

29. ФИЗИКА Программное обеспечение, позволяющее производить классификацию виброакустических воздействий, в том числе в режиме реального времени
27.10.2016
№216.015.5714

Система моделирования воздушных потоков для объектов индустриальных площадок

29. ФИЗИКА. Разработано для испытания самоконфигурируемых вибрационных систем охраны индустриальных площадок. Программное обеспечение, позволяющее проводить испытания различных технических платформ и технических устройств на виртуальном полигоне, учитывающее быстродвижущиеся направленные...
11.11.2016
№216.015.5731

По трехмерного моделирования результатов решения прямой задачи гравиразведки

Гравиразведка. Геофизика. Программное обеспечение 3D моделирования результатов решения прямой задачи гравиразведки, представляющее из себя плагин для Petrel. Решается прямая задача и результат отображается на 3D-сетке местности.
14.11.2016
№216.015.573a

Программная модель кинематического накопителя супермаховичного типа

Расчет разработка и изготовление кинетических накопителей энергии супермаховичного типа Математическая модель взаимодействие маховика и его кожуха, позволяющая переоценить энергоемкость системы маховик-кожух
06.02.2017
№217.015.93b1

Алгоритм определения расстояния до объектов по данным стереопары

Алгоритм определения расстояния до объектов по данным трех видеокамер аппаратно-программного комплекса Easy2See.
31.05.2017
№217.015.9457

Методика создания эффективного дизайна мобильных приложений типа диктофон

Предлагаемая методика эффективного дизайна приложений типа диктофон с функционалом обработки звука позволяет быстрее и качественнее создать новый удобный интерфейс. В предлагаемой методике обозначены: 1. Необходимый функциональные кнопки; 2. Соответствие стилю каждого элемента функционала 3....
Тип: Произведениe науки
09.06.2017
№217.015.945d

Программный комплекс программиста для работы с техническими системами в gazebo

Программный комплекс программиста позволяет создавать модели технических средств в формате Gazebo автоматически генерируя sdf-файл. А так же предоставляет оболочку верхнего уровня для последующего управления техническими средствами.
10.06.2017
№217.015.945f

По двухфакторной идентификации личности с использованием распознавания образов

Cозданы классификаторы, способные детектировать лицо человека на изображении, реализован алгоритм для идентификации личности человека по характерным точкам лица. Данный алгоритм является точным, но реа-лизация классификатора на основе метода k-ближайших соседей является не актуальным на...
27.03.2018
№218.016.2e95

Алгоритмы автоматической оценки проводимых испытаний

Оценка проводимых испытаний производится путём анализа координат объектов (игроки и мяч), полученных при помощи системы машинного зрения. Каждый игрок снабжается цветовым маркером, по которым в дальнейшем происходит их детектирование, получение координат и определения направления движения. Мяч...
Showing 1-2 of 2 items.
11.02.2020
№220.018.016c

Алгоритм удаления пауз между словами человеческой речи в аудиопотоке

Алгоритм предназначен для удаления пауз между словами человеческой речи в аудиопотоке и сокращения общей длины записи.
Тип: Произведениe науки
11.02.2020
№220.018.016d

Алгоритмы обучения и классификации звуковых последовательностей для распознавания человеческой речи в аудиопотоке

Алгоритмы предназначены для осуществления процессов обучения и классификации звуковых последовательностей для распознавания человеческой речи в аудиопотоке
Тип: Произведениe науки
+ добавить свой РИД