×
11.02.2020
220.018.016b

Результат интеллектуальной деятельности: Алгоритм удаления шума в аудиопотоке, содержащем человеческую речь

Вид РИД

Произведениe науки

Код транзакции депонирования в блокчейн Ethereum: 0x5fdc91819744f0c26df848e5598cc68db26ddff79887ac734fdb3f22cd09e2a4
Наименование РИД на английском: Algorithm for removing noise in an audio stream containing human speech
Описание произведения: Алгоритм предназначен для удаления шума в аудиопотоке, содержащем человеческую речь. Может быть применим в любых устройствах записывающих, обрабатывающих человеческую речь в шумной обстановке. В частности применим в мобильных приложениях и компьютерных программах для ПК. Алгоритм способен понизить уровень шума для более удобного прослушивания человечекой речи.
Ключевые слова: шумоподавление, удаление шума, аудиопоток, запись речи, обработка звука, звукообработка
Основные результаты научного произведения:
1) Получен алгоритм удаления шума в аудиопотоке, который содержит человеческую речь;
2) Получена компьютерная программа, реализующая алгоритм; 
3) Проведены испытания и внедрение алгоритма в мобильное приложение "Умный диктофон - Лилия" для мобильных устройств на базе iOS и Android
4) Проведены испытания и внедрение алгоритма в серию мобильных приложений "Школа Сов" для мобильных устройств на базе iOS
Перспективные направления применения для дальнейших исследований и разработок: Алгоритм может быть применен для дальнейшего исследования способов обработки и фильтрации аудиосигналов.
Приоритетные направления развития науки, технологий и техники в РФ: Информационно-телекоммуникационные системы
Алгоритм шумоподавления состоит из четырех структурных частей: • Первая часть алгоритма – «Разбиение». Входной поток данных разбивается на интервалы одинаковой длины с 50% наложением. Длина интервала рассчитывается исходя из частоты дискретизации сигнала и составляет 0,040 с. Так для сигнала с частотой дискретизации равной 44100 Гц размер интервала составляет 1764 отсчета. Каждый из полученных интервалов поточечно умножается на оконную функцию Хэмминга соответствующего размера. В таком виде интервал передается на следующие части алгоритма. • Вторая часть алгоритма – «Модель шума». После «разбиения» сигнал поинтервально передается для оценки модели шума. Для полученного сигнала рассчитывается энергия. С результатом производятся манипуляции, включающие в себя сглаживание, расчет вариации, расчет максимума, расчет минимума и другие преобразования. В результате выполненных манипуляций получаются метрики, которые сохраняются для обработки следующего интервала (накопительные метрики), часть из которых представляет собой спектральную картину шумовой составляющей сигнала. Модель шума обновляется с каждым новым обработанным интервалом, таким образом, с течением времени алгоритм качественнее оценивает шумовую составляющую сигнала. Более того, при смене шумовой обстановки алгоритм перестраивает модель шума. Время реакции составляет порядка 1 секунды (это касается и запуска алгоритма, когда модель шума не сформирована). • Третья часть – «Подавление». Полученные после разбиения интервалы сигнала очищаются от шума с использованием модели шума, полученной на предыдущем шаге. Для этого используется адаптивный подбор уровня подавления, который определяет соотношение сигнал/шум в данном интервале сигнала. Полученный уровень используется для спектрального вычитания шума из сигнала в данном интервале. Для уменьшения «музыкальных» шумов некоторые параметры алгоритма рассчитываются не только на основе текущего интервала, но и на основе предыдущего. • Четвертая часть – «Объединение». После подавления шумов, интервалы сигнала объединяются в итоговый результат. Для этого интервалы, которые были получены 50% наложением, поточечно складываются с таким же наложением.
Хеш-код депонирования: c621a1ef7bf702a4333619997d250b51995ef130d1f998ff66f14eaca3011718
Источник поступления информации: Портал edrid.ru

Показаны записи 11-18 из 18.
27.03.2018
№218.016.2e96

Методы информационно-управляющих воздействий на системы машинного зрения

Ключевая особенность – методы обеспечения комплексных кинематических и визуальных воздействий на исследуемые платформы по заданному сценарию
Тип: Произведениe науки
11.04.2019
№219.017.0b6c

Программа для ios "умный диктофон - лилия"

Лилия - умный диктофон, позволяющий записывать звук даже в самых шумных помещениях! Нужен диктофон для учебы или работы? Устанавливай Лилию и:- записывай лекции и интервью в 2 клика без гула аудитории и уличных шумов- увеличивай громкость записи до 300%, если собеседника едва слышно- устанавливай...
Тип: Секрет производства («ноу-хау»)
11.02.2020
№220.018.016c

Алгоритм удаления пауз между словами человеческой речи в аудиопотоке

Алгоритм предназначен для удаления пауз между словами человеческой речи в аудиопотоке и сокращения общей длины записи.
Тип: Произведениe науки
11.02.2020
№220.018.016d

Алгоритмы обучения и классификации звуковых последовательностей для распознавания человеческой речи в аудиопотоке

Алгоритмы предназначены для осуществления процессов обучения и классификации звуковых последовательностей для распознавания человеческой речи в аудиопотоке
Тип: Произведениe науки
15.05.2020
№220.018.1d38

Комплекс программ цифровой обработки сигналов акустического типа для решения задач оптимальной фильтрации и машинного обучения в задачах распознавания речи

Разработанный программный комплекс предназначен для цифровой обработки аудиосигналов, для эффективного выделения голосовых частот и улучшение акустических характеристик голоса. для решения задач оптимальной фильтрации и машинного обучения в задачах распознавания речи. Предназначен для...
15.05.2020
№220.018.1d39

Комплекс программ цифровой обработки сигналов акустического типа для решения задач оптимальной фильтрации и машинного обучения в задачах классификации дефектов произношения

Разработанный программный комплекс предназначен для цифровой обработки аудиосигналов, выделения голосовых частот, улучшение акустических характеристик голоса и классификации дефектов произношения при помощи алгоритмов машинного обучения. Предназначен для использования в системах передачи, записи...
17.06.2021
№221.018.3f7c

Программное обеспечение мониторинга здоровья человека по камере смартфона на базе ос android

Разработана система для измерения жизненных показателей человека, обладающее следующим функционалом: -измерение частоты сердечных сокращений -измерение артериального давления -измерение насыщенности крови кислородом -измерение частоты дыхания
18.07.2023
№223.018.82b3

Программа пользовательского интерфейса оператора для маммографических исследований

Программа устанавливается на ПК на базе ОС Windows, и соединяется с удаленным PACS сервером для получения информации о проведенных исследованиях и улучшения качества медицинских снимков. Программа обладает собственным графическим интерфейсом. Представлен следующий функционал: - получение...
Показаны записи 1-2 из 2.
11.02.2020
№220.018.016c

Алгоритм удаления пауз между словами человеческой речи в аудиопотоке

Алгоритм предназначен для удаления пауз между словами человеческой речи в аудиопотоке и сокращения общей длины записи.
Тип: Произведениe науки
11.02.2020
№220.018.016d

Алгоритмы обучения и классификации звуковых последовательностей для распознавания человеческой речи в аудиопотоке

Алгоритмы предназначены для осуществления процессов обучения и классификации звуковых последовательностей для распознавания человеческой речи в аудиопотоке
Тип: Произведениe науки
+ добавить свой РИД