Программа для выделения текстовых данных из изображений подвижных подводных видео камер, использует библиотеку Tesseract для решения задачи распознавания текста на изображении. Для автоматического разбиения видео ряда на кадры используется библиотека FFmpeg. По заданным координатам (4 точки -высота и ширина) на кадре выделяется пространство откуда необходимо извлечь текстовую информацию о широте и долготе местонахождения подводной камеры. Агрегируются данные для каждого кадра.
Для уточнения и сокращения количества ошибок считывания применяется алгоритм постобработки полученных данных, который заключается в исключении незначимых символов, преобразование строки в число, а также проведение дополнительных проверок. Такого рода обработка существенно снижает процент ошибок считывания, но не устраняет их полностью.
Программное обеспечение универсально и подходит для извлечения различной текстовой информации. Наборы примеров целевой направленности могут быть предоставлены заказчиком.
Базовый функционал:
1) Извлечение текстовой информации из указанной части изображения;
2) Сбор данных об местоположении кадра;
3) Разбиение видеопоследовательности на кадры.
Вышеуказанный функционал предусматривает возможность доработки в соответствии с техзаданием конкретных заказчиков.
Составные части, модули РИД:
1) Взаимодействие между нейросетью и приложением. API для получения текстовых данных из изображения.
2) Обработка полученных от пользователя данных на сервере. Разбиение видеоряда на кадры. Формирование ответа на запрос пользователя.
Аналоги/конкурентные РИД:
Полный аналог разрабатываемой системы отсутствует. Конкурентные решения: Cloud Video Intelligence API, Microsoft OneNote, SimpleOCR и подобные им.
Отличия от аналогов/ конкурентные преимущества РИД:
На текущем этапе разработки: целенаправленное извлечение и агрегирование координат из всего видеоряда
Код (коды) продукции в соответствии с Общероссийским классификатором продукции по видам экономической деятельности:
58.29.21.000
Класс (классы) программного обеспечения, которому (которым) соответствует программное обеспечение: 02.11; 04.13; 04.16