×
21.08.2019
219.017.c1fd

СПОСОБ ОБНАРУЖЕНИЯ И ЛОКАЛИЗАЦИИ ТЕКСТОВЫХ ФОРМ НА ИЗОБРАЖЕНИЯХ

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится к способам обнаружения текста на полутоновых цифровых изображениях и связанным с ними способам сегментации изображений по признаку наличия текста. Техническим результатом является повышение точности обнаружения текстовых форм на изображениях, содержащих сложный фон. Способ включает в себя выделение соседних кадров полутоновых изображений последовательности изображений, удаление постоянной составляющей яркости изображения выделенных кадров, двойное пространственное горизонтальное дифференцирование, корреляционную обработку изображения с эталоном, расчет значения порога, сравнение результатов корреляционной обработки с порогом и при условии обнаружения текстовых форм определение их параметров. 3 ил.
Реферат Свернуть Развернуть

Область изобретения

Изобретение относится к способам обнаружения текста на полутоновых цифровых изображениях и связанных с ними способами сегментации изображений по признаку наличия текста (площади занимаемой текстом в кадре) и выявления спама содержащегося в цифровом изображении.

Уровень техники

Известен способ обнаружения текста на изображениях [Y. Kunishige, F. Yaokai, S. Uchida, Scenery Character Detection with Environmental Context // The 11th International Conference on Document Analysis and Recognition (ICDAR), 2011, Pages: 1049-1053.] который заключается в использовании «контекста окружения» (environmental context). Основная мысль заключается в использовании информации о том, что окружает область-«кандидата». Иными словами, предлагается анализировать тот фон, на котором находится регион изображения, возможно, являющийся текстовым. Идея базируется на эмпирическом предположении, что вероятность наличия текста, например, на травяном покрове или на небе - низка.

Основной недостаток данного способа заключается в том, что он исключает наличие в кадре сложного фона и ориентирован только на работу с ограниченным набором фоновых рисунков.

Также известен способ [S. Uchida, Y. Shigeyoshi, Y. Kunishige, F. Yaokai, A Keypoint-Based Approach Toward Scenery Character Detection // The 11th International Conference on Document Analysis and Recognition (ICDAR), 2011, Pages: 819-823.] который заключается в детектировании на изображении так называемых SURF-точек. Предполагается, что если на исследуемом изображении присутствуют буквы, то они будут плотно такими точками покрыты. Дополнительно к этому вычисляется визуальная заметность (visual saliency). Вместе SURF и saliency будут представлять собой (128+1)-мерный вектор признаков. На этом векторе предполагается провести обучение классификатора.

Основной недостаток данного способа заключается в том, что метод детектирования точек дает плохие результаты по обнаружению текста при работе на сложных фонах (рекламные щиты, вывески магазинов, автомобильные номера).

Также известен способ [Y. Du, Н. Ai, S. Lao, Dot Text Detection Based on FAST Points // The 11th International Conference on Document Analysis and Recognition (ICDAR), 2011, Pages: 435-439.] который заключается в поиске точечного текста, но для обнаружения точек, составляющих буквы, применяется хорошо известный алгоритм FAST. Затем производится эвристическая фильтрация ложных кандидатов, объединение точек в буквы, букв - в слова, после чего применяется классификатор SVM для детектирования текстовых областей.

Основной недостаток данного способа заключается в том, что метод детектирования точек, как и в рассмотренном выше способе, дает плохие результаты при работе на сложных фонах (рекламные щиты, вывески магазинов, автомобильные номера).

В качестве прототипа выбран способ обнаружения текста в растровом изображении и способ выявления спама, содержащего растровые изображения (по патенту РФ №2363047, МПК G06K 9/36 (2007/10) опубликован 27.07.2009).

Он заключается в том, что на изображении распознается фоновый цвет, далее приводят изображение к двухцветному виду, находят границы замкнутого контура, описанного вокруг каждого из отдельных рисунков слитых пикселов цвета, отличных от упомянутого фонового цвета, и запоминают его координаты, сравнивают размеры каждого из упомянутых контуров с первыми заранее заданными пределами, интерпретируют каждый из оставшихся замкнутых контуров как контур текстового символа, находят предполагаемые строки текстовых символов, по замкнутым контурам, интерпритированым как контуры текстовых символов, разбивают найденные предполагаемые строки текстовых символов на наборы, интерпритируемые как найденные слова, сравнивают количество упомянутых контуров, интерпритированных как контуры текстовых символов, в каждом из упомянутых вероятных слов со вторыми заранее заданными пределами, исключают из дальнейшего рассмотрения те вероятностные слова, в которых количество упомянутых слов контуров, не попадает в упомянутые вторые заранее заданные пределы, сравнивают количество оставшихся вероятных слов в каждой упомянутой предполагаемой строке с третьими заранее заданными пределами, исключают из дальнейшего рассмотрения те из упомянутых предполагаемых строк, в которых количество вероятных слов не попадает в упомянутые третьи заранее заданные пределы, считают факт наличия оставшихся предполагаемых строк с вероятными словами обнаружением текста в упомянутом изображении.

Недостатком известного способа является низкая скорость работы, обусловленная многоэтапной обработкой, низкая вероятность правильного обнаружения, обусловленная тем, что выбор порога не учитывает статистические характеристики именно текста (буквы), а выбирается на основе гистограммы всего кадра.

Техническим результатом заявленного изобретения является повышение скорости обнаружение текстовых форм на изображении и увеличении вероятности правильного обнаружения за счет учета статистических характеристик текста.

Указанный технический результат достигается тем, что в известном способе производят формирование последовательности изображений, преобразования их к полутоновому представлению и обнаружение текстовых форм.

Сущность изобретения заключается в том, что согласно изобретению выделяют соседние кадры полутоновых изображений последовательности изображений, удаляют постоянную составляющую яркости изображения выделенных кадров, выполняют двойное пространственное горизонтальное дифференцирование, производят корреляционную обработку изображения с эталоном, рассчитывают порог, сравнивают результаты корреляционной обработки с порогом и при условии обнаружения текстовых форм определяют их параметры.

Удаление постоянной составляющей позволит сузить динамический диапазон яркости изображения, что позволит более качественно выделять перепады яркости, данную операцию можно осуществить, например, при помощи программных средств, программно-аппаратных средств, либо их комбинации.

Двойное пространственное горизонтальное дифференцирование, данная операция позволяет определить области, содержащие большое число резких перепадов яркости на ограниченном участке, в большинстве случаев области, содержащие текстовую форму, имеют ярко выраженный горизонтальный перепад яркости между буквами и фоновым рисунком.

Данная операция реализуется за счет вычитания двух соседних изображений сдвинутых относительно друг друга на один столбец и затем повторного вычитания двух преобразованных таким способом кадров.

Данную операцию можно осуществить, например, при помощи программных средств, программно-аппаратных средств.

Переходят к абсолютным значениям яркости, это обусловлено тем, что физически значения яркости могут принимать только положительные значения, а после проведения операции вычитания соседних изображений граница текстовой формы будет описываться, как положительными, так и отрицательными скачками яркости. Переход к абсолютным значениям яркости позволяет при дальнейшей обработке избежать потери части сигнала за счет суммирования с противоположным знаком составляющих, описывающих границы текстовой формы при помощи положительных и отрицательных скачков.

Переход к абсолютным значениям возможно осуществить например, при помощи инвертирующего усилителя для отрицательных значений сигнала, либо программно.

Формируют достаточную статистику, для чего осуществляют корреляционную обработку с эталоном. Если эталон будет точно соответствовать изображению строки текста, то достаточная статистика будет обеспечивать максимум отношения текст/фон [А.В. Коренной, Юдаков Д.С. Обнаружение и локализация текстовых форм на изображениях // Радиотехника №12, 2015 г. стр. 162-168].

Реализовать коррелятор возможно например, при помощи устройства умножения, линий задержки и интегратора, либо программно.

Рассчитывают порог обнаружения, на основе критерия Неймана-Пирсона при учете статистических характеристик достаточной статистики. В качестве фона рассматривается весь кадр изображения, принимая во внимание, что текст занимает относительно малую площадь и на статистические характеристики распределения яркости во всем кадре значения не оказывает А.В. Коренной, Юдаков Д.С. Обнаружение и локализация текстовых форм на изображениях // Радиотехника №12, 2015 г. стр. 162-168]. Порог определяется по табличным значениям плотности распределения вероятности с учетом заданной вероятности ложной тревоги.

На фигуре 1 приведена гистограмма достаточной статистики всего изображения и участка изображения, соответствующего автомобильному номеру (сплошная линия).

Производят процедуру обнаружения путем сравнения результатов корреляционной обработки с порогом, результатом обнаружения текстовой формы будет являться бинарное изображение.

Производят операцию определения параметров обнаруженных текстовых форм. К полученному бинарному изображению, применяется морфологическая операция наращивания для удаления разрывов обнаруженных областей (Гонсалес Р., Вудс Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. - М.: Техносфера, 2005. - 1072 с.). После проведения данной операции производится определение параметров обнаруженных текстовых форм (координаты, длина, ширина и т.д.) на основе алгоритма поиска связных контуров. Каждый обнаруженный блок текста нумеруется и подсчитывается количество пикселей, входящих в данный блок (площадь), а также вычисляются его координаты (координаты верхней левой точки) и геометрические размеры (длина и ширина).

На фигуре 2 представлены результаты работы предложенного способа. Результат обнаружения текстовой формы, определения ее местоположения и размеров отображаются на исходном изображении в виде рамки соответствующего размера с номером в верхнем левом углу.

Способ может быть реализован, например, с помощью устройства, структурная схема которого приведена на фигуре 3, где обозначено: 1 - оптический датчик; 2 - аналого-цифровой преобразователь; 3 - блок удаления постоянной составляющей, предназначен для удаления постоянной составляющей яркости кадра; 4 - блок пространственного дифференцирования, предназначен для вычисления второй пространственной производной яркости кадра изображения; 5 - коррелятор предназначен для вычисления достаточной статистики изображения; 6 - блок эталонов, предназначен для хранения эталонов, может быть реализован на запоминающем устройстве; 7 - пороговое устройство, предназначено для обнаружения областей изображения содержащих текст; 8 - блок формирования порога, предназначен для формирования порога обнаружения; 9 - блок вторичной обработки, предназначен для вычисления параметров обнаруженных текстовых форм, может быть реализован программно на программируемом спецпроцессоре.

Устройство работает следующим образом: сигнал изображения, поступает в приемник оптического сигнала. С выхода приемника оптического сигнала изображение поступает на вход АЦП, на выходе АЦП получается оцифрованное изображение, далее с выхода АПЦ изображение поступает в блок удаления постоянной составляющей, где происходит вычисление постоянной составляющей яркости поступившего на вход изображения и вычитание из значений яркости каждого пикселя, с выхода БУП сигнал поступает на вход блока пространственного дифференцирования в котором производится вычисление вторых горизонтальных дискретных разностей для каждого кадра, с выхода БПД сигнал поступает на вход блока коррелятора, на второй вход коррелятора подается сигнал соответствующий эталону, с выхода коррелятора сигнал поступает в пороговое устройство, на второй вход которого подается сигнал соответствующий выбранному порогу, порог формируется в блоке формирования порога, на выходе порогового устройства получаем бинарное изображение, где значения пикселей превысивших порог задаются белым цветом, а не превысившие порог черным, с выхода порогового устройства сигнал поступает в блок вторичной обработки, где вычисляются параметры текстовых форм.

Таким образом, техническим результатом заявленного изобретения является повышение скорости обнаружение текстовых форм на изображении и увеличении вероятности правильного обнаружения за счет учета статистических характеристик текста.

Этот способ полезен при решения задач поиска текстовой информации на изображениях содержащих пестрый фоновый рисунок.

Способ обнаружения и локализации текстовых форм на изображениях, включающий формирование последовательности изображений, преобразование их к полутоновому представлению и обнаружение текстовых форм, отличающийся тем, что согласно изобретению выделяют соседние кадры полутоновых изображений, считывая значения яркости пикселей с оптического датчика путем фиксации времени накопления между соседними кадрами для оптического датчика, при помощи аналого-цифрового преобразователя значения яркости каждого пикселя каждого из цветовых каналов изображения преобразуются в цифровую форму, преобразуют значения яркостных каналов в полутона программно при помощи вычислительного устройства путем сложения оцифрованных значений яркости каждого канала цвета для каждого пикселя умноженных на соответствующий коэффициент, удаляют постоянную составляющую яркости изображения выделенных кадров путем вычисления среднего значения яркости оцифрованных пикселей в кадре, складывая значения яркости всех пикселей кадра и деля на их количество на основе программы, выполняемой в вычислительном устройстве, вычитают среднее значение яркости из значений яркости каждого пикселя на основе программы, выполняемой в вычислительном устройстве, выполняют двойное пространственное горизонтальное дифференцирование путем двукратного последовательного вычитания в вычислительном устройстве друг из друга значений яркости пикселей соседних строк, производят построчную корреляционную обработку изображения с эталоном, рассчитывают порог по табличным значениям, в пороговом блоке формируют постоянное значение, соответствующее уровню рассчитанного порога, сравнивают значения для пикселей изображения, полученные на выходе коррелятора со значением порога, при условии превышения порога считается, что пиксель принадлежит текстовой форме, при условии обнаружения текстовых форм определяют их параметры.
СПОСОБ ОБНАРУЖЕНИЯ И ЛОКАЛИЗАЦИИ ТЕКСТОВЫХ ФОРМ НА ИЗОБРАЖЕНИЯХ
СПОСОБ ОБНАРУЖЕНИЯ И ЛОКАЛИЗАЦИИ ТЕКСТОВЫХ ФОРМ НА ИЗОБРАЖЕНИЯХ
СПОСОБ ОБНАРУЖЕНИЯ И ЛОКАЛИЗАЦИИ ТЕКСТОВЫХ ФОРМ НА ИЗОБРАЖЕНИЯХ
Источник поступления информации: Роспатент

Показаны записи 1-10 из 244.
25.08.2017
№217.015.9bc8

Способ определения координат наземного источника радиоизлучения при радиопеленговании с борта летательного аппарата

Изобретение относится к радиотехнике и может быть использовано для определения координат наземных источников радиоизлучения (ИРИ) при радиопеленговании с борта летательного аппарата (ЛА). Достигаемый технический результат - повышение точности определения координат наземных ИРИ и снижение...
Тип: Изобретение
Номер охранного документа: 0002610150
Дата охранного документа: 08.02.2017
25.08.2017
№217.015.bb52

Способ управления приемниками воздушного давления

Изобретение относится к способу управления приемниками воздушных давлений (ПВД). Для управления ПВД выявляют неисправный ПВД путем измерения полного и статического давлений основного и резервного ПВД, определяют модули разности полного и статического давлений соответственно для основного и...
Тип: Изобретение
Номер охранного документа: 0002615813
Дата охранного документа: 11.04.2017
25.08.2017
№217.015.bf3b

Способ определения расстояния до неподвижного источника излучения движущимся пеленгатором

Изобретение относится к методам определения расстояния с использованием пеленгатора, размещенного на носителе, выполняющего движение в направлении источника радиоизлучения, в интересах снижения погрешности определения координат. Достигаемый технический результат – снижение погрешности...
Тип: Изобретение
Номер охранного документа: 0002617210
Дата охранного документа: 24.04.2017
25.08.2017
№217.015.bf46

Способ формирования маршрута носителя пеленгатора

Изобретение относится к авиационной технике и может быть использовано в бортовой пассивной РЛС и автоматической системе управления самолета. Достигаемый технический результат - формирование маршрута носителя пеленгатора, определяющего местоположение излучателя, при котором достигается...
Тип: Изобретение
Номер охранного документа: 0002617127
Дата охранного документа: 21.04.2017
25.08.2017
№217.015.bfc3

Устройство адаптивной маскировки объектов

Изобретение предназначено для маскировки стационарных или движущихся объектов с помощью адаптивных маскировочных устройств, работающих в оптическом диапазоне длин волн. Устройство адаптивной маскировки объектов содержит последовательно соединенные цифровую камеру с выносным объективом, ЭВМ,...
Тип: Изобретение
Номер охранного документа: 0002617157
Дата охранного документа: 21.04.2017
25.08.2017
№217.015.c160

Способ определения дальности до неподвижного источника излучения движущимся пеленгатором

Изобретение относится к методам определения дальности с использованием пеленгатора, размещенного на носителе, выполняющего движение в направлении источника радиоизлучения, в интересах снижения погрешности определения координат. Достигаемый технический результат – снижение погрешности...
Тип: Изобретение
Номер охранного документа: 0002617447
Дата охранного документа: 25.04.2017
25.08.2017
№217.015.c5b9

Фазовый пеленгатор

Изобретение относится к области радиотехники и может использоваться в радиомониторинге при поиске источников радиоизлучения на ограниченной территории и в помещениях, например, специальных электронных устройств перехвата информации. Достигаемый технический результат изобретения - обеспечение...
Тип: Изобретение
Номер охранного документа: 0002618522
Дата охранного документа: 04.05.2017
25.08.2017
№217.015.c61d

Способ буксировки самолетов с использованием малогабаритного буксировщика с дистанционным управлением

Изобретение относится к наземному обеспечению воздушных судов, в частности к их буксированию. Способ буксировки реализуется использованием малогабаритного буксировщика с дистанционным управлением, включающего рампу (8) механизма подъема и фиксации колес передней стойки воздушного судна и...
Тип: Изобретение
Номер охранного документа: 0002618611
Дата охранного документа: 04.05.2017
25.08.2017
№217.015.cb3f

Способ измерения задержки радиосигналов

Изобретение относится к измерительной технике и может быть использовано в системах радиолокации, навигации, связи для определения местоположения излучателей и синхронизации. Достигаемый технический результат - расширение области применения способа на класс непрерывных радиосигналов. Указанный...
Тип: Изобретение
Номер охранного документа: 0002620131
Дата охранного документа: 23.05.2017
25.08.2017
№217.015.cb48

Способ амплитудного двухмерного пеленгования

Изобретение относится к радиотехнике и может быть использовано в наземных и авиационных радиотехнических системах для всеракурсного определения направления на источники радиоизлучений. Достигаемый технический результат – обеспечение двухмерного всеракурсного пеленгования одновременно в двух...
Тип: Изобретение
Номер охранного документа: 0002620130
Дата охранного документа: 23.05.2017
Показаны записи 1-10 из 11.
20.05.2014
№216.012.c441

Способ распознавания и определения параметров образа объекта на радиолокационном изображении

Изобретение относится к способам обработки радиолокационных изображений (РЛИ). Достигаемый технический результат - повышение быстродействия обработки РЛИ. Сущность изобретения состоит в следующем. При зондировании участка земной поверхности с помощью радиолокатора с синтезированной апертурой...
Тип: Изобретение
Номер охранного документа: 0002516000
Дата охранного документа: 20.05.2014
13.01.2017
№217.015.79bd

Устройство оценки эффективности информационного обмена системы связи

Изобретение относится к электросвязи, в частности к устройствам оценки информационного обмена в системах связи. Техническим результатом предлагаемого устройства является повышение точности оценки КПД передачи информации за счет учета при ее определении воздействия на систему связи помех путем...
Тип: Изобретение
Номер охранного документа: 0002599532
Дата охранного документа: 10.10.2016
25.08.2017
№217.015.c31b

Способ оптимального восстановления изображений в радиолокационных системах дистанционного зондирования земли в телескопическом режиме

Изобретение относится к области радиотехники и может быть использовано в радиолокационных системах дистанционного зондирования Земли. Достигаемый технический результат изобретения – повышение качества изображения путем повышения разрешающей способности формируемого радиолокационного...
Тип: Изобретение
Номер охранного документа: 0002618088
Дата охранного документа: 02.05.2017
26.08.2017
№217.015.dd8a

Способ оптимального восстановления изображений в радиолокационных системах дистанционного зондирования земли

Изобретение относится к области радиотехники и может быть использовано в радиолокационных системах дистанционного зондирования Земли. Техническим результатом изобретения является повышение разрешающей способности восстанавливаемого радиолокационного изображения наблюдаемого участка земной...
Тип: Изобретение
Номер охранного документа: 0002624460
Дата охранного документа: 04.07.2017
20.01.2018
№218.016.0fb9

Устройство для проведения ремонтных работ на гидротехническом сооружении

Изобретение относится к области выполнения ремонта и прочих работ на гидротехнических сооружениях. Устройство для проведения ремонтных работ на гидротехническом сооружении содержит корпус 1 не менее чем с тремя закрытыми гранями и не менее чем с двумя смежными открытыми гранями, одна из которых...
Тип: Изобретение
Номер охранного документа: 0002633548
Дата охранного документа: 13.10.2017
10.05.2018
№218.016.3a27

Способ моделирования изображений в радиолокационных системах дистанционного зондирования протяженных объектов

Изобретение относится к области радиотехники. Технический результат – обеспечение восстановления изображений в радиолокационных системах дистанционного зондирования протяженных объектов за счет моделирования изображений в виде случайных полей на основе стохастических дифференциальных уравнений...
Тип: Изобретение
Номер охранного документа: 0002647702
Дата охранного документа: 16.03.2018
03.07.2018
№218.016.6a12

Способ дистанционного определения пространственного распределения теплофизических параметров поверхности земли

Изобретение относится к дистанционным методам активного теплового неразрушающего контроля и может быть использовано для определения пространственного распределения теплофизических параметров поверхности земли. Сущность: измеряют радиационную температуру исследуемой поверхности земли (2) с...
Тип: Изобретение
Номер охранного документа: 0002659461
Дата охранного документа: 02.07.2018
30.03.2019
№219.016.f9f5

Устройство для проведения ремонтных работ на различных участках гидротехнических сооружений

Изобретение относится к области производства работ в зоне переменного уровня воды на гидротехнических сооружениях, таких как морские нефтегазовые буровые, пирсы, эстакады, стенки отводящих каналов, плотины, быки, опоры мостов, с целью их ремонта, очистки и защиты от коррозии и обрастания....
Тип: Изобретение
Номер охранного документа: 0002683479
Дата охранного документа: 28.03.2019
29.04.2019
№219.017.40e8

Ракета

Изобретение относится к области ракетной техники и может быть использовано в многоступенчатых малогабаритных ракетах с отделяемым стартовым двигателем. Ракета содержит маршевую ступень, отделяемую стартовую ступень с двигателем, механизм разделения с газогенератором, капсюлем, приводом и...
Тип: Изобретение
Номер охранного документа: 0002399865
Дата охранного документа: 20.09.2010
02.07.2019
№219.017.a394

Способ отделения маршевой ступени снаряда от стартового двигателя и устройство для его реализации

Изобретение относится к области ракетной техники, в частности к средствам разъединения ступеней ракеты. Сущность изобретения заключается в том, что для отделения маршевой ступени снаряда от стартового двигателя воспламеняют пороховой заряд капсюлем ударного действия, накаливание которого...
Тип: Изобретение
Номер охранного документа: 0002313762
Дата охранного документа: 27.12.2007
+ добавить свой РИД