×
10.07.2015
216.013.6157

Результат интеллектуальной деятельности: СПОСОБ АВТОМАТИЗИРОВАННОГО ПОИСКА ЭТАЛОННЫХ ПЕЧАТЕЙ

Вид РИД

Изобретение

№ охранного документа
0002556461
Дата охранного документа
10.07.2015
Аннотация: Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов. Техническим результатом является повышение быстродействия при выявлении в любом документе заранее заданной эталонной круглой печати. Предложен способ автоматизированного поиска заранее заданных эталонных круглых печатей. Способ включает в себя этап, на котором осуществляют сбор коллекции различных заранее заданных изображений как содержащих круглые печати, так и не содержащих круглые печати. Далее согласно способу осуществляют обучение каскадных классификаторов на собранных коллекциях изображений и преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем. А также выявляют области в электронном файле анализируемого документа, где предположительно может располагаться печать, и осуществляют сравнение найденных областей с заранее заданными эталонами.
Основные результаты: Способ автоматизированного поиска заранее заданных эталонных круглых печатей, включающий в себя использование каскадных классификаторов, отличающийся тем, что предусматривает выполнение следующих операций:сбор коллекции различных заранее заданных изображений как содержащих круглые печати, так и не содержащих круглые печати;обучение каскадных классификаторов на собранных коллекциях изображений;преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем;сохранение преобразованных изображений печатей на запоминающем устройстве;выявление областей в электронном файле анализируемого документа, где предположительно может располагаться печать;сравнение найденных областей с заранее заданными эталонами;формирование результата, состоящего из эталонов, найденных в анализируемом документе.

Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов.

Из уровня техники известны способы распознавания и поиска данных, в том числе изображений. Например, заявка на изобретение РФ №2012110605, система добавления метаданных, способ и устройство поиска изображения и способ добавления жеста для этого, 27.09.2013, которая включает в том числе и способ поиска изображения, содержащего извлечение по меньшей мере одних метаданных относительно изображения посредством анализа изображения; добавление метаданных к изображению и сохранение изображения с добавленными метаданными во внешнем устройстве и поиск по меньшей мере одного изображения из изображений, сохраненных во внешнем устройстве, на основе метаданных.

Недостатком известного способа является то, что для поиска изображения используются метаданные и не используется информация непосредственно из изображения, в данном случае при отсутствии таких метаданных изображение будет невозможно найти.

Наиболее близким техническим решением к предлагаемому изобретению является способ обнаружения лиц на изображении с применением каскада классификаторов (патент на изобретение РФ №2427911, опубликовано 27.08.2011).

Недостатком указанного способа является ограниченная возможность по поиску изображений только в виде лиц.

Технический результат, на решение которого направлено заявленное изобретение, заключается в создании быстрого, качественного и универсального способа, который позволил бы выявлять в любом документе заданную эталонную круглую печать.

Особенность способа по настоящему изобретению состоит в том, что если достаточно определить только наличие круглой печати, эталонные печати задавать не требуется.

Данный технический результат достигается посредством того, что в способе, включающем в себя использование каскадных класификаторов, предусматривается выполнение следующих операций:

- сбор коллекции различных изображений как содержащих круглые печати, так и не содержащих круглые печати;

- обучение каскадных классификаторов на собранных коллекциях изображений;

- преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем;

- сохранение преобразованных изображений печатей на запоминающем устройстве;

- выявление областей в электронном файле анализируемого документа, где предположительно может располагаться печать;

- сравнение найденных областей с заранее заданными эталонами;

- формирование результата, состоящего из эталонов, найденных в анализируемом документе.

Способ автоматизированного поиска эталонных печатей осуществляют следующим образом.

Используемый алгоритм состоит из двух ступеней:

1. На изображении ищутся области (заданные окнами - ограничивающими квадратами), похожие на круглую печать.

2. Найденные «подозрительные» области сравниваются с загруженными пользователем эталонами печатей.

Такая схема позволила достигнуть приемлемого качества и скорости работы.

Первая ступень настроена так, чтобы баланс ошибок был смещен в сторону ложноположительных срабатываний: практически все изображения печатей пропускаются до второй ступени, но вместе с ними могут попадаться и объекты, не являющиеся печатями.

На вторую ступень попадает небольшое количество подозрительных окон, что значительно сокращает пространство поиска и соответственно время работы детектора.

Для нахождения областей, похожих на круглую печать, был применен каскадный классификатор Виолы-Джонса. Указанный детектор представляет собой каскад очень простых классификаторов (принцип бустинга), основанных на признаках Хаара. Это позволяет отсекать большую часть окон на ранних стадиях, не прогоняя их через весь каскад. За счет этого достигается высокая скорость работы - детектор Виолы-Джонса широко используется для детектирования лиц (например, WO 2008064395 (PCT/AU 2007/001169)), в том числе в портативных устройствах в режиме real-time.

Общий принцип многих детекторов: изображение обрабатывается скользящим окном; для каждого окна решается независимо задача бинарной классификации: есть ли объект на изображении или нет. Если ответ положительный, то в данной позиции найден искомый объект. Размер скользящего окна варьируется от минимального до максимального с заданным множителем.

В способе используется реализация каскадного классификатора из OpenCV. Для обучения использовалась компьютерная программа «Traincascade».

Примеры реализации.

В компании ЗАО «ИнфоВотч» прошли испытания предложенного способа, а именно была создана большая коллекция круглых печатей, а также не-печатей (отрицательных примеров), состоящая примерно из 10.000 изображений. За основу были взяты различные изображения печатей и не-печатей (в частности, выкачанные автоматически из сети Интернет по разным запросам к Google Images), а также внутренняя коллекция документов с печатями компании.

Со всех изображений печати вырезались с помощью детектора окружностей Хафа, а затем с помощью отдельной компьютерной программы из каждого такого изображения создавалось еще несколько путем применения различных операций: поворота на случайный угол и изменения яркости на случайную величину (в пределах некоторого диапазона).

Отобранные каскадным классификатором окна сравниваются с эталонами, загруженными пользователем.

Однако сравнивать их напрямую нельзя, поскольку печать может быть повернута, а также слегка смещена и отмасштабирована относительно эталона. Поэтому используется преобразование Фурье-Меллина:

- К исходным изображениям применяется преобразование Фурье.

- Затем они переводятся в log-полярные координаты.

- Вычисляется фазовая корреляция, которая характеризует близость изображений.

После первых двух преобразований поворот и масштабирование представляются в виде линейных смещений.

Во время вычисления фазовой корреляции снова применяется преобразование Фурье, затем результаты перемножаются и выполняется обратное преобразование Фурье. Значения в ячейках полученной матрицы соответствуют близости изображений, полученных смещением исходных на величину, соответствующую данной ячейке.

Таким образом, благодаря выполненным преобразованиям достигается инвариантность относительно поворота, а также (в определенных пределах) смещения и масштабирования.

Мерой сходства изображения считается максимальное значение в сглаженной матрице фазовой корреляции. Если она превышает заданный порог, то детектор срабатывает.

Способ может работать только с круглыми печатями, поскольку именно на этом классе объектов был обучен каскадный классификатор.

Благодаря описанным взаимосвязанным действиям при использовании указанного способа значительно увеличивается скорость работы и повышается ее качество.

Анализ заявленного технического решения на соответствие условиям патентоспособности показал, что указанные в независимом пункте формулы признаки являются существенными и взаимосвязаны между собой с образованием устойчивой совокупности неизвестной на дату приоритета из уровня техники необходимых признаков, достаточной для получения требуемого синергетического (сверхсуммарного) технического результата.

Свойства, регламентированные в заявленном способе отдельными признаками, общеизвестны из уровня техники и не требуют дополнительных пояснений.

Таким образом, вышеизложенные сведения свидетельствуют о выполнении при использовании заявленного технического решения следующей совокупности условий:

- объект, воплощающий заявленное техническое решение, при его осуществлении предназначен для использования в области, касающейся обнаружения изображений, и может быть использован при обнаружении круглых печатей;

- для заявленного объекта в том виде, как он охарактеризован в независимом пункте формулы изобретения, подтверждена возможность его осуществления с помощью вышеописанных в материалах заявки известных из уровня техники на дату приоритета средств и методов;

- объект, воплощающий заявленное техническое решение, при его осуществлении способен обеспечить достижение усматриваемого заявителем технического результата.

Источник поступления информации: Роспатент

Показаны записи 1-10 из 10.
10.02.2013
№216.012.2498

Способ автоматизированного анализа текстовых документов

Изобретение относится к автоматизированному анализу текстовых документов. Техническим результатом является расширение арсенала технических средств за счет создания сравнительно быстрого и универсального способа, который позволяет выявлять в документе выражения, фразы или даже текстовые отрывки...
Тип: Изобретение
Номер охранного документа: 0002474870
Дата охранного документа: 10.02.2013
27.08.2013
№216.012.6581

Способ классификации документов по категориям

Изобретение относится к способу классификации документов по категориям. Техническим результатом является повышение скорости классификации и сокращение потребного объема памяти. Для достижения этого результата в способе классификации документов по категориям строят онтологию в виде совокупности...
Тип: Изобретение
Номер охранного документа: 0002491622
Дата охранного документа: 27.08.2013
27.09.2013
№216.012.70a9

Способ создания токопроводящих дорожек

Изобретение относится к электронной технике и может быть использовано при формировании токопроводящих дорожек для коммутации электронных схем и полупроводниковых приборов. Сущность изобретения: способ создания токопроводящих дорожек включает нанесение сплошных слоев металлизации на непроводящую...
Тип: Изобретение
Номер охранного документа: 0002494492
Дата охранного документа: 27.09.2013
10.11.2013
№216.012.7fd8

Способ обнаружения текстовых объектов

Изобретение относится к способу обнаружения текстовых объектов. Техническим результатом является расширение арсенала технических средств за счет создания сравнительно быстрого способа обнаружения текстовых объектов. Способ обнаружения текстовых объектов заключается в том, что формируют для...
Тип: Изобретение
Номер охранного документа: 0002498401
Дата охранного документа: 10.11.2013
27.11.2013
№216.012.862a

Способ автоматизированного определения языка и (или) кодировки текстового документа

Изобретение относится к автоматизированному определению языка и (или) кодировки текстового документа. Техническим результатом является расширение арсенала технических средств, позволяющее автоматически определять язык и (или) кодировку текста по заранее набранной статистике в любых текстовых...
Тип: Изобретение
Номер охранного документа: 0002500024
Дата охранного документа: 27.11.2013
10.04.2015
№216.013.3af7

Способ автоматизированного анализа выгрузок из баз данных

Изобретение относится к вычислительной технике. Технический результат заключается в защите информации, хранящейся в защищаемой базе данных, от утечек за счет автоматизированного анализа выгрузок из баз данных. Способ автоматизированного анализа выгрузок из баз данных, в котором преобразуют в...
Тип: Изобретение
Номер охранного документа: 0002546583
Дата охранного документа: 10.04.2015
20.04.2016
№216.015.3689

Способ автоматизированного анализа эталонных форм

Изобретение относится к средствам автоматизированного анализа текстовых документов. Технический результат заключается в повышении точности определения наличия в документах конфиденциальной информации. Преобразуют в заранее заданный формат все информационно-значимые поля эталонных форм документа...
Тип: Изобретение
Номер охранного документа: 0002581766
Дата охранного документа: 20.04.2016
20.08.2016
№216.015.4e9d

Скважинная насосная установка для добычи битуминозной нефти

Изобретение относится к нефтяной промышленности и может быть использовано при термическом способе добычи тяжелых высоковязких и битуминозных нефтей. Скважинная насосная установка содержит колонны насосно-компрессорных труб (НКТ) с пакером в нижней части и штанги, спущенные в наклонный участок...
Тип: Изобретение
Номер охранного документа: 0002595032
Дата охранного документа: 20.08.2016
29.12.2017
№217.015.fed0

Способ автоматизированного анализа векторных изображений

Изобретение относится к автоматизированному анализу векторных изображений. Технический результат – расширение арсенала технических средств посредством выявления схожих с эталоном векторных изображений. Способ автоматизированного анализа векторных изображений заключается в том, что: каждому...
Тип: Изобретение
Номер охранного документа: 0002633156
Дата охранного документа: 11.10.2017
29.12.2017
№217.015.fed1

Способ автоматизированного анализа растровых изображений

Изобретение относится к автоматизированному анализу растровых изображений. Техническим результатом является расширение арсенала технических средств по выявлению в растровых изображениях схожих с эталоном пикселей растровых изображений. Предложен способ автоматизированного анализа растровых...
Тип: Изобретение
Номер охранного документа: 0002633159
Дата охранного документа: 11.10.2017
Показаны записи 1-10 из 10.
10.02.2013
№216.012.2498

Способ автоматизированного анализа текстовых документов

Изобретение относится к автоматизированному анализу текстовых документов. Техническим результатом является расширение арсенала технических средств за счет создания сравнительно быстрого и универсального способа, который позволяет выявлять в документе выражения, фразы или даже текстовые отрывки...
Тип: Изобретение
Номер охранного документа: 0002474870
Дата охранного документа: 10.02.2013
27.08.2013
№216.012.6581

Способ классификации документов по категориям

Изобретение относится к способу классификации документов по категориям. Техническим результатом является повышение скорости классификации и сокращение потребного объема памяти. Для достижения этого результата в способе классификации документов по категориям строят онтологию в виде совокупности...
Тип: Изобретение
Номер охранного документа: 0002491622
Дата охранного документа: 27.08.2013
27.09.2013
№216.012.70a9

Способ создания токопроводящих дорожек

Изобретение относится к электронной технике и может быть использовано при формировании токопроводящих дорожек для коммутации электронных схем и полупроводниковых приборов. Сущность изобретения: способ создания токопроводящих дорожек включает нанесение сплошных слоев металлизации на непроводящую...
Тип: Изобретение
Номер охранного документа: 0002494492
Дата охранного документа: 27.09.2013
10.11.2013
№216.012.7fd8

Способ обнаружения текстовых объектов

Изобретение относится к способу обнаружения текстовых объектов. Техническим результатом является расширение арсенала технических средств за счет создания сравнительно быстрого способа обнаружения текстовых объектов. Способ обнаружения текстовых объектов заключается в том, что формируют для...
Тип: Изобретение
Номер охранного документа: 0002498401
Дата охранного документа: 10.11.2013
27.11.2013
№216.012.862a

Способ автоматизированного определения языка и (или) кодировки текстового документа

Изобретение относится к автоматизированному определению языка и (или) кодировки текстового документа. Техническим результатом является расширение арсенала технических средств, позволяющее автоматически определять язык и (или) кодировку текста по заранее набранной статистике в любых текстовых...
Тип: Изобретение
Номер охранного документа: 0002500024
Дата охранного документа: 27.11.2013
10.04.2015
№216.013.3af7

Способ автоматизированного анализа выгрузок из баз данных

Изобретение относится к вычислительной технике. Технический результат заключается в защите информации, хранящейся в защищаемой базе данных, от утечек за счет автоматизированного анализа выгрузок из баз данных. Способ автоматизированного анализа выгрузок из баз данных, в котором преобразуют в...
Тип: Изобретение
Номер охранного документа: 0002546583
Дата охранного документа: 10.04.2015
20.04.2016
№216.015.3689

Способ автоматизированного анализа эталонных форм

Изобретение относится к средствам автоматизированного анализа текстовых документов. Технический результат заключается в повышении точности определения наличия в документах конфиденциальной информации. Преобразуют в заранее заданный формат все информационно-значимые поля эталонных форм документа...
Тип: Изобретение
Номер охранного документа: 0002581766
Дата охранного документа: 20.04.2016
20.08.2016
№216.015.4e9d

Скважинная насосная установка для добычи битуминозной нефти

Изобретение относится к нефтяной промышленности и может быть использовано при термическом способе добычи тяжелых высоковязких и битуминозных нефтей. Скважинная насосная установка содержит колонны насосно-компрессорных труб (НКТ) с пакером в нижней части и штанги, спущенные в наклонный участок...
Тип: Изобретение
Номер охранного документа: 0002595032
Дата охранного документа: 20.08.2016
29.12.2017
№217.015.fed0

Способ автоматизированного анализа векторных изображений

Изобретение относится к автоматизированному анализу векторных изображений. Технический результат – расширение арсенала технических средств посредством выявления схожих с эталоном векторных изображений. Способ автоматизированного анализа векторных изображений заключается в том, что: каждому...
Тип: Изобретение
Номер охранного документа: 0002633156
Дата охранного документа: 11.10.2017
29.12.2017
№217.015.fed1

Способ автоматизированного анализа растровых изображений

Изобретение относится к автоматизированному анализу растровых изображений. Техническим результатом является расширение арсенала технических средств по выявлению в растровых изображениях схожих с эталоном пикселей растровых изображений. Предложен способ автоматизированного анализа растровых...
Тип: Изобретение
Номер охранного документа: 0002633159
Дата охранного документа: 11.10.2017
+ добавить свой РИД