×
29.12.2017
217.015.fed1

Результат интеллектуальной деятельности: Способ автоматизированного анализа растровых изображений

Вид РИД

Изобретение

№ охранного документа
0002633159
Дата охранного документа
11.10.2017
Аннотация: Изобретение относится к автоматизированному анализу растровых изображений. Техническим результатом является расширение арсенала технических средств по выявлению в растровых изображениях схожих с эталоном пикселей растровых изображений. Предложен способ автоматизированного анализа растровых изображений. Согласно способу преобразуют в заранее заданный формат все электронные файлы эталонных растровых изображений, переводя цвета в градации серого и сжимая до квадрата малой площади порядка 20×20 пикселей. Далее, согласно способу сохраняют преобразованные электронные файлы эталонных растровых изображений в специализированной базе данных. Преобразуют каждый электронный файл анализируемого растрового изображения в заранее заданный формат, идентичный эталонному. Осуществляют поиск каждого пикселя изображения в специализированной базе данных и извлекают из нее информацию о том, в каких эталонных изображениях на данном месте встречается схожий пиксель. При этом специализированная база данных содержит эталонные изображения, при этом каждому эталонному изображению присваивают идентификатор.

Область техники, к которой относится изобретение

Настоящее изобретение относится к автоматизированному анализу растровых изображений и может быть использовано при разработке новых и совершенствовании существующих систем проверки растровых изображений на совпадение с эталонными изображениями.

Уровень техники

В настоящее время весьма остро стоит проблема так называемого перехвата данных. Такая проблема может встретиться в случае отслеживания различных документов, в т.ч. содержащих изображения, проходящих по сети компании, на предмет наличия в них конфиденциальной информации.

В настоящее время известно несколько систем или способов, позволяющих решить эту проблему.

Например, в патенте России №2420800 (приоритет от 30.06.2009, опубликовано 10.06.2011) раскрыт способ поиска похожих по смысловому содержимому электронных документов, в котором задают правила формирования уникальных слов, взвешиваются уникальные слова и связи между ними, строят на основе этого семантическую сеть и сравнивают семантические сети документов. Этот способ достаточно трудоемок и пригоден лишь в ограниченной области.

Известен способ индексации и поиска цифровых изображений (патент на изобретение РФ №2510935, приоритет от 23.09.2011, опубликовано 10.04.2014). Способ, описанный в данном патенте, подходит для поиска изображений определенной категории, в том числе цветовой, но при этом не подходит для задачи поиска конкретного изображения в обширной базе данных, где может присутствовать много изображений с одинаковыми преобладающими цветами. Так как автор патента ставил задачу поиска изображений, подходящих под некоторое описание, он сам указал в качестве недостатка некоторых других методов тот факт, что они могут классифицировать изображения с похожими преобладающими цветами как совершенно различные. В то же время заявленное изобретение решает задачу поиска конкретного изображения с поправкой на искажения, возникающие при его сохранении в разных форматах и разных масштабах. При такой постановке задачи недостатком становится именно невозможность различить изображения с похожими характеристиками.

Раскрытие изобретения

Таким образом, существует потребность в расширении арсенала технических средств за счет создания сравнительно быстрого и универсального способа, который позволил бы выявлять в потоке данных растровые изображения, схожие с эталонными и который бы преодолевал недостатки известных решений.

Для решения этой задачи и получения указанного технического результата в настоящем изобретении предложен способ автоматизированного анализа растровых изображений, заключающийся в следующем.

1. Создают специализированную базу данных эталонных изображений, специализация которой заключается в том, что данные из эталонных изображений хранятся специальным образом. Каждое эталонное изображение описывается тремя параметрами: растр (набор пикселей), порог срабатывания (R, задается в процентах от 1 до 100), размер диапазона допустимых интенсивностей пикселя (L). Первый параметр используется как эталонные данные, второй и третий влияют на качество поиска. Для создания такой базы данных выполняют следующие шаги:

1) каждому эталонному изображению присваивают уникальный идентификатор;

2) все электронные файлы эталонных растровых изображений преобразуют в заранее заданный формат (bmp);

3) каждое эталонное изображение переводят в градации серого, где 1 пиксель кодируется 1 байтом, диапазон интенсивностей от 0 до 255;

4) каждое эталонное изображение ужимают до размера 20 на 20 пикселей;

5) для каждого пикселя строится допустимый диапазон интенсивностей, для этого строится массив допустимых интенсивностей размера L, каждый элемент которого представляет собой значение интенсивности, высчитываемое по формуле

,

где k[i] - элемент массива допустимых интенсивностей,

l - интенсивность в текущем пикселе,

L/2 - половина размера диапазона допустимых интенсивностей,

i - номер текущего элемента массива допустимых интенсивностей, принимает

значения от 0 до L. В граничных ситуациях, когда, например, разность интенсивности и L/2 меньше 0, отрицательные значения интенсивности отбрасывают. Также поступают с верхней границей - значения интенсивности больше 255 также отбрасывают. В этих случаях размер массива допустимых интенсивностей может быть меньше L.

6) создают трехмерный массив, первое измерение которого отражает все возможные значения интенсивности цвета (256 элементов), второе измерение отражает все пиксели изображения (400 элементов, при целевом размере изображения 20 на 20 пикселей), третье измерение будет содержать идентификаторы эталонов (размер заранее неизвестен, зависит от количества эталонных изображений).

7) каждое подготовленное изображение раскладывают по массиву из п. 6 следующим образом:

a) обходят все пиксели текущего эталона, позиция пикселя в изображении - это индекс второго измерения в массиве из п. 1.6;

b) для текущего пикселя обходят все допустимые значения интенсивности, интенсивность - индекс первого измерения в массиве из п. 1.6;

c) в массив из п. 6 по индексу соответствующей интенсивности (п. 1.7.b) и по позиции пикселя на изображении (п. 1.7.а) добавляется идентификатор эталонного документа.

8) создают вспомогательный массив, в котором ключом является уникальный идентификатор эталонного изображения, а значениями - счетчик найденных пикселей (инициализируется 0) и порог срабатывания эталона R.

2. Когда на анализ поступает файл, содержащий растровое изображение, то производят следующие действия:

1) изображение преобразуют в заранее заданный формат (bmp);

2) изображение переводят в градации серого, где 1 пиксель кодируется 1 байтом, диапазон интенсивностей от 0 до 255;

3) изображение ужимают до размера 20 на 20 пикселей;

4) для каждого пикселя анализируемого изображения:

a) по интенсивности, которая является индексом первого измерения массива из п. 1.6 получают массив позиций, в которые входит пиксель с такой интенсивностью;

b) по позиции пикселя в анализируемом изображении, которая является индексом в массиве, полученном в п. 2.4.а, получают список идентификаторов эталонов.

с) в вспомогательном массиве из п. 1.8 увеличивают счетчики найденных пикселей для эталонов, полученных в п. 2.4.b.

5) обходят вспомогательный массив:

a) счетчики найденных пикселей делят на размеры изображения (400) и умножают на 100, таким образом получают процент соответствия анализируемого изображения данному эталону;

b) сравнивают процент соответствия с соответствующими порогами;

c) если порог превышен, помещают идентификатор эталонного документа в список найденных эталонов;

d) обнуляют счетчики найденных пикселей;

6) возвращают массив найденных идентификаторов эталонных документов.

Настоящее изобретение может быть реализовано в любой вычислительной системе, например в персональном компьютере, на сервере и т.п.

Способ автоматизированного анализа растровых изображений по настоящему изобретению предназначен для осуществления так называемого копирайтного анализа (английский аналог - fingerprint detection), задачей которого является установление схожести растровых изображений с изображениями, переданным ранее в базу данных (библиотеку) в качестве эталонных.

Особенностью данного алгоритма является то, что параметрами R и L можно влиять на показатели полноты и качества алгоритма. Например, увеличивая значение L, можно повышать устойчивость к шуму и артефактам ценой повышенного риска ложноположительных срабатываний. Параметр R отвечает за степень похожести изображений в рамках алгоритма.

Источник поступления информации: Роспатент

Показаны записи 1-7 из 7.
27.09.2013
№216.012.70a9

Способ создания токопроводящих дорожек

Изобретение относится к электронной технике и может быть использовано при формировании токопроводящих дорожек для коммутации электронных схем и полупроводниковых приборов. Сущность изобретения: способ создания токопроводящих дорожек включает нанесение сплошных слоев металлизации на непроводящую...
Тип: Изобретение
Номер охранного документа: 0002494492
Дата охранного документа: 27.09.2013
10.04.2015
№216.013.3af7

Способ автоматизированного анализа выгрузок из баз данных

Изобретение относится к вычислительной технике. Технический результат заключается в защите информации, хранящейся в защищаемой базе данных, от утечек за счет автоматизированного анализа выгрузок из баз данных. Способ автоматизированного анализа выгрузок из баз данных, в котором преобразуют в...
Тип: Изобретение
Номер охранного документа: 0002546583
Дата охранного документа: 10.04.2015
10.07.2015
№216.013.6157

Способ автоматизированного поиска эталонных печатей

Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов. Техническим результатом является повышение быстродействия при выявлении в любом документе заранее заданной эталонной круглой печати. Предложен...
Тип: Изобретение
Номер охранного документа: 0002556461
Дата охранного документа: 10.07.2015
20.04.2016
№216.015.3689

Способ автоматизированного анализа эталонных форм

Изобретение относится к средствам автоматизированного анализа текстовых документов. Технический результат заключается в повышении точности определения наличия в документах конфиденциальной информации. Преобразуют в заранее заданный формат все информационно-значимые поля эталонных форм документа...
Тип: Изобретение
Номер охранного документа: 0002581766
Дата охранного документа: 20.04.2016
20.08.2016
№216.015.4e9d

Скважинная насосная установка для добычи битуминозной нефти

Изобретение относится к нефтяной промышленности и может быть использовано при термическом способе добычи тяжелых высоковязких и битуминозных нефтей. Скважинная насосная установка содержит колонны насосно-компрессорных труб (НКТ) с пакером в нижней части и штанги, спущенные в наклонный участок...
Тип: Изобретение
Номер охранного документа: 0002595032
Дата охранного документа: 20.08.2016
29.12.2017
№217.015.fed0

Способ автоматизированного анализа векторных изображений

Изобретение относится к автоматизированному анализу векторных изображений. Технический результат – расширение арсенала технических средств посредством выявления схожих с эталоном векторных изображений. Способ автоматизированного анализа векторных изображений заключается в том, что: каждому...
Тип: Изобретение
Номер охранного документа: 0002633156
Дата охранного документа: 11.10.2017
12.04.2019
№219.017.0b83

Языконезависимая технология исправления опечаток, с возможностью верификации результата

Изобретение относится к области обработки данных, а именно к классификации текстовых данных. Технический результат - более точная классификация текстовых данных путем исправления случайных опечаток и преднамеренных искажений слов (например, замена кириллических букв аналогичными латинскими)....
Тип: Изобретение
Номер охранного документа: 0002684578
Дата охранного документа: 09.04.2019
Показаны записи 1-6 из 6.
27.09.2013
№216.012.70a9

Способ создания токопроводящих дорожек

Изобретение относится к электронной технике и может быть использовано при формировании токопроводящих дорожек для коммутации электронных схем и полупроводниковых приборов. Сущность изобретения: способ создания токопроводящих дорожек включает нанесение сплошных слоев металлизации на непроводящую...
Тип: Изобретение
Номер охранного документа: 0002494492
Дата охранного документа: 27.09.2013
10.04.2015
№216.013.3af7

Способ автоматизированного анализа выгрузок из баз данных

Изобретение относится к вычислительной технике. Технический результат заключается в защите информации, хранящейся в защищаемой базе данных, от утечек за счет автоматизированного анализа выгрузок из баз данных. Способ автоматизированного анализа выгрузок из баз данных, в котором преобразуют в...
Тип: Изобретение
Номер охранного документа: 0002546583
Дата охранного документа: 10.04.2015
10.07.2015
№216.013.6157

Способ автоматизированного поиска эталонных печатей

Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов. Техническим результатом является повышение быстродействия при выявлении в любом документе заранее заданной эталонной круглой печати. Предложен...
Тип: Изобретение
Номер охранного документа: 0002556461
Дата охранного документа: 10.07.2015
20.04.2016
№216.015.3689

Способ автоматизированного анализа эталонных форм

Изобретение относится к средствам автоматизированного анализа текстовых документов. Технический результат заключается в повышении точности определения наличия в документах конфиденциальной информации. Преобразуют в заранее заданный формат все информационно-значимые поля эталонных форм документа...
Тип: Изобретение
Номер охранного документа: 0002581766
Дата охранного документа: 20.04.2016
20.08.2016
№216.015.4e9d

Скважинная насосная установка для добычи битуминозной нефти

Изобретение относится к нефтяной промышленности и может быть использовано при термическом способе добычи тяжелых высоковязких и битуминозных нефтей. Скважинная насосная установка содержит колонны насосно-компрессорных труб (НКТ) с пакером в нижней части и штанги, спущенные в наклонный участок...
Тип: Изобретение
Номер охранного документа: 0002595032
Дата охранного документа: 20.08.2016
29.12.2017
№217.015.fed0

Способ автоматизированного анализа векторных изображений

Изобретение относится к автоматизированному анализу векторных изображений. Технический результат – расширение арсенала технических средств посредством выявления схожих с эталоном векторных изображений. Способ автоматизированного анализа векторных изображений заключается в том, что: каждому...
Тип: Изобретение
Номер охранного документа: 0002633156
Дата охранного документа: 11.10.2017
+ добавить свой РИД