×
09.08.2018
218.016.7925

СПОСОБ ПОИСКА ПОДОБНЫХ ФАЙЛОВ, РАЗМЕЩЁННЫХ НА УСТРОЙСТВАХ ХРАНЕНИЯ ДАННЫХ

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится к вычислительной технике для поиска информации. Технический результат заключается в повышении эффективности поиска подобных файлов. Технический результат достигается за счет сравнения, которое происходит с подгруппой ранее обработанных файлов, при этом для этого представляют загруженный файл в виде случайного марковского процесса, рассчитывают вероятности появления последовательностей бит размером, меньшим или равным заданной связности, путем деления количества появлений последовательностей бит на размер файла в битах, и производят сравнение только с теми файлами, у которых модуль разницы их размеров и размера проверяемого файла меньше рассчитанной границы максимально возможного изменения размера файла, и если вероятностное расстояние между загруженным файлом и каким-либо ранее обработанным файлом из полученной подгруппы меньше максимально возможного изменения вероятностного расстояния, то данные файлы признают подобными. 3 ил.
Реферат Свернуть Развернуть

Изобретение относится к способам поиска информации, размещенной на локальных и удаленных устройствах хранения данных. В частности, изобретение относится к способам поиска на локальных и удаленных устройствах хранения данных файлов, похожих структурно на выбранный файл.

Известен способ поиска похожих электронных документов, размещенных на устройствах хранения данных, при помощи сравнения семантических сетей по патенту RU 2571539, кл. G06F 017/30. Известный способ включает следующую последовательность действий. Осуществляют загрузку двух электронных документов с устройств хранения данных, определяют параметры поиска путем задания правил формирования множества уникальных слов, формируют множество взвешенных уникальных слов и взвешенных связей между ними, строят семантическую сеть и производят поиск похожих по смыслу документов путем сравнения семантических сетей. При этом дополнительно задают правила формирования стилистических образов документов путем определения размера матриц частот переходов и выбора элементов матриц частот переходов. И, наконец, сравнивают матрицы частот переходов документов на схожесть путем вычисления коэффициента сходства.

Наиболее близким по технической сущности и выполняемым функциям аналогом (прототипом) к заявляемому изобретению является способ поиска похожих файлов с использованием гибкой свертки (патент RU №2580036, МПК G06 F 21/14). Он включает следующую последовательность действий. Выделяют множество признаков из файлов. Разделяют множество выделенных признаков файла, по меньшей мере, на два подмножества, в одном из которых есть как минимум один изменяемый признак, а в другом есть как минимум один неизменяемый признак. Получают свертку каждого из вышеописанных подмножеств признаков файла. Создают свертку файла как комбинацию сверток каждого из вышеописанных подмножеств признаков файла. Сравнивают свертку, по меньшей мере, одного файла с набором заранее созданных сверток файлов. Признают файл похожим на файлы из множества похожих файлов, имеющих одинаковую свертку, если при сравнении свертка указанного файла совпадает со сверткой файла из указанного множества.

В данной области техники существует техническая проблема, заключающаяся в том, что поиск похожих файлов осуществляют сравнением со всеми ранее обработанными файлами, что приводит к значительному снижению скорости поиска.

Техническая проблема решается разработкой способа поиска подобных файлов, размещенных на устройствах хранения данных, обеспечивающего при его реализации возможность повысить скорость поиска подобных файлов различных форматов путем сравнения загруженного файла не со всеми ранее обработанными файлами, а с подгруппой ранее обработанных файлов. Для этого представляют загруженный файл в виде случайного марковского процесса, для чего задают значение максимально возможного изменения вероятностного расстояния, а также задают связность используемой марковской цепи, которая показывает максимальный размер битовой последовательности, для которой учитывают корреляционные свойства. Далее рассчитывают вероятности появления последовательностей бит размером, меньшим и равным заданной связности, путем деления количества появлений последовательностей бит на размер файла в битах и определяют максимально возможное изменение размера файла, используя полученный ряд вероятностей и исходный размер файла. Производят сравнение только с теми файлами, у которых модуль разницы их размеров и размера проверяемого файла меньше рассчитанной границы максимально возможного изменения размера файла. И если вероятностное расстояние между загруженным файлом и каким-либо ранее обработанным файлом из полученной подгруппы меньше максимально возможного изменения вероятностного расстояния, то данные файлы признают подобными.

Перечисленная новая совокупность существенных признаков обеспечивает возможность повышения скорости поиска подобных файлов.

Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного технического решения, отсутствуют, что указывает на соответствие заявленного способа условию патентоспособности «новизна».

Результаты поиска известных решений в данной и смежных областях техники с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленного объекта, показали, что они не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность отличительных существенных признаков, обусловливающих тот же технический результат, который достигнут в заявляемом способе. Следовательно, заявленное изобретение соответствует условию патентоспособности «изобретательский уровень».

Заявленный способ поясняется чертежами, на которых показаны:

фиг. 1 - древовидная структура взаимосвязей вероятностей двоичных векторов различной длины;

фиг. 2 - блок-схема реализации способа поиска подобных файлов, размещенных на устройствах хранения данных;

фиг. 3 - сравнение результатов имитационного моделирования для способа-прототипа и заявленного способа.

Реализация заявленного способа поиска подобных файлов, размещенных на устройствах хранения данных, поясняется на фиг. 2:

Блок №1 - осуществляют загрузку файла с устройства хранения данных.

Блок №2 - задают связность используемой марковской цепи, которая показывает максимальный размер битовой последовательности, для которой учитываются корреляционные свойства. Иными словами, задают количество уровней в древовидной структуре взаимосвязей вероятностей, представленной на фиг. 1. Чем больше количество используемых уровней, тем больше точность оценки статистических свойств, но и тем выше требования к ресурсоемкости. Также задают параметр Мкр - максимально возможное изменение вероятностного расстояния.

Блоки №3, 4, 5, 6 - определяют значения вероятностей для каждого уровня в древовидной структуре взаимосвязей вероятностей, представленной на фиг. 3, меньше или равного заданной связности используемой марковской цепи. Например, для связности марковской цепи, равной двум, определяют вероятности на первом уровне: р(0), и вероятности на втором уровне: р(00), р(01), р(10), р(11). Определение каждой вероятности происходит следующим образом: количество появлений каждой комбинации последовательности бит в файле делится на длину файла в битах.

Блок №7 - определяют максимально возможное изменение размера файла, используя полученный ряд вероятностей и исходный размер файла L:

Блок №8 - выделяют подгруппу ранее обработанных файлов, у которых размер L' удовлетворяет условию:

Блоки №9, 10, 11, 12, 13, 14, 15 - осуществляют расчет вероятностного расстояния между загруженным файлом и каждым файлом их выделенной подгруппы. Расчет производится с использованием модифицированной нормированной метрики Евклида:

где K - связность используемой марковской цепи.

Сравнивают вероятностное расстояние между загруженным файлом и каждым файлом их выделенной подгруппы с максимально возможным изменением вероятностного расстояния Мкр, и если оно меньше максимально возможного, то принимают решение о подобности сравниваемых файлов.

Промышленная применимость изобретения обусловлена тем, что устройство, реализующее предложенный способ, может быть осуществлено с помощью современной элементной базы с достижением указанного в изобретении назначения.

Правомерность теоретических предпосылок проверялась с помощью машинного моделирования способа-прототипа и заявленного способа поиска подобных файлов, размещенных на устройствах хранения данных.

Показателем эффективности способа поиска подобных файлов, размещенных на устройствах хранения данных, является скорость поиска.

Для оценки качества функционирования разработанного способа были проведены эксперименты по поиску подобных файлов различных типов. С этой целью исследованы файлы с расширениями txt, pcm и dat, по которым затем осуществлялся поиск. Тестовый массив файлов составлял более 1000000 файлов. Результаты, представленные на фиг. 3, подтверждают существенное повышение скорости поиска при использовании разработанного способа.

Способ поиска подобных файлов, размещенных на устройствах хранения данных, заключающийся в том, что осуществляют загрузку файла с устройства хранения данных, создают его свертку и сравнивают полученную свертку со свертками ранее обработанных файлов для определения подобия файлов, отличающийся тем, что сравнение происходит не со всеми ранее обработанными файлами, а с подгруппой ранее обработанных файлов, для этого представляют загруженный файл в виде случайного марковского процесса, для чего задают значение максимально возможного изменения вероятностного расстояния, а также задают связность используемой марковской цепи, которая показывает максимальный размер битовой последовательности, для которой учитывают корреляционные свойства, после чего рассчитывают вероятности появления последовательностей бит размером, меньшим или равным заданной связности, путем деления количества появлений последовательностей бит на размер файла в битах, определяют максимально возможное изменение размера файла, используя полученный ряд вероятностей и исходный размер файла, и производят сравнение только с теми файлами, у которых модуль разницы их размеров и размера проверяемого файла меньше рассчитанной границы максимально возможного изменения размера файла, и если вероятностное расстояние между загруженным файлом и каким-либо ранее обработанным файлом из полученной подгруппы меньше максимально возможного изменения вероятностного расстояния, то данные файлы признают подобными.
СПОСОБ ПОИСКА ПОДОБНЫХ ФАЙЛОВ, РАЗМЕЩЁННЫХ НА УСТРОЙСТВАХ ХРАНЕНИЯ ДАННЫХ
СПОСОБ ПОИСКА ПОДОБНЫХ ФАЙЛОВ, РАЗМЕЩЁННЫХ НА УСТРОЙСТВАХ ХРАНЕНИЯ ДАННЫХ
СПОСОБ ПОИСКА ПОДОБНЫХ ФАЙЛОВ, РАЗМЕЩЁННЫХ НА УСТРОЙСТВАХ ХРАНЕНИЯ ДАННЫХ
СПОСОБ ПОИСКА ПОДОБНЫХ ФАЙЛОВ, РАЗМЕЩЁННЫХ НА УСТРОЙСТВАХ ХРАНЕНИЯ ДАННЫХ
Источник поступления информации: Роспатент

Showing 1-10 of 69 items.
12.01.2017
№217.015.5b83

Способ измерения времени задержки на двустороннее распространение для трафика данных с переменной скоростью передачи битов и устройство для его осуществления

Изобретения относятся к области телекоммуникационных сетей связи, в частности к сетям связи с коммутацией пакетов. Способ и устройство измерения времени задержки на двустороннее распространение для трафика данных с переменной скоростью обеспечивают достижение технического результата,...
Тип: Изобретение
Номер охранного документа: 0002589887
Дата охранного документа: 10.07.2016
13.01.2017
№217.015.6f75

Способ динамического управления параметрами сети связи в признаковом пространстве

Предлагаемое техническое решение относится к области телекоммуникаций и может быть использовано для анализа состояния защищенности, мониторинга и управления безопасностью автоматизированных систем, являющихся элементами сети связи и автоматизации, в условиях информационно-технических...
Тип: Изобретение
Номер охранного документа: 0002597457
Дата охранного документа: 10.09.2016
13.01.2017
№217.015.7da5

Способ обеспечения живучести распределенной абонентской сети связи

Изобретение относится к области сетей связи и может быть использовано при проектировании распределенных сетей связи. Техническим результатом является повышение живучести формируемой сети за счет снижения вероятности обнаружения абонентских радиоизлучающих средств связи злоумышленниками....
Тип: Изобретение
Номер охранного документа: 0002600941
Дата охранного документа: 27.10.2016
13.01.2017
№217.015.7e43

Способ идентификации массивов бинарных данных

Изобретение относится к обработке данных. Технический результат заключается в повышении точности оценки сходства массивов бинарных данных. В способе идентификации массивов бинарных данных осуществляют автоматизированное сравнение массивов бинарных данных путем получения наборов...
Тип: Изобретение
Номер охранного документа: 0002601191
Дата охранного документа: 27.10.2016
13.01.2017
№217.015.83f0

Способ сглаживания приоритетного трафика данных и устройство для его осуществления

Изобретение относится к области телекоммуникационных сетей связи, а именно к сетям связи с коммутацией пакетов. Техническим результатом является обеспечение сглаживания приоритетного трафика данных, что позволяет повысить эффективность использования канального ресурса сети связи с коммутацией...
Тип: Изобретение
Номер охранного документа: 0002601604
Дата охранного документа: 10.11.2016
13.01.2017
№217.015.88fd

Способ мультимедийного вывода

Изобретение относится к мультимедийным инфокоммуникационным системам. Техническим результатом является повышение целостности выводимой информации. В способе принимают через сеть и декодируют множество мультимедийных потоков для события мультимедийной конференции, вычисляют общее количество...
Тип: Изобретение
Номер охранного документа: 0002602667
Дата охранного документа: 20.11.2016
13.01.2017
№217.015.89d4

Способ измерения расхода жидкости

Изобретение относится к приборостроению и может быть использовано в счетчиках расхода воды с автономным питанием. Особенность способа измерения расхода жидкости заключается в том, что для его реализации используют крыльчатки счетчика с закрепленным на ней диском, наполовину покрытым металлом, и...
Тип: Изобретение
Номер охранного документа: 0002602401
Дата охранного документа: 20.11.2016
13.01.2017
№217.015.89e4

Способ встраивания информации в графический файл, сжатый фрактальным методом

Изобретение относится к области стеганографии, а именно к способам встраивания сообщения в цифровое изображение. Техническим результатом является обеспечение возможности скрытой передачи конфиденциальных данных, используя контейнер, представленный в виде фрактально сжатого изображения....
Тип: Изобретение
Номер охранного документа: 0002602670
Дата охранного документа: 20.11.2016
25.08.2017
№217.015.a043

Способ и устройство классификации сегментов зашумленной речи с использованием полиспектрального анализа

Изобретение относится к области цифровой связи и технологиям обработки речи в условиях зашумления. Технический результат - повышение достоверности классификации сегментов зашумленной речи по типовым классификационным группам. В способе классификации сегментов зашумленной речи осуществляют...
Тип: Изобретение
Номер охранного документа: 0002606566
Дата охранного документа: 10.01.2017
25.08.2017
№217.015.a256

Способ определения местоположения станции сети связи vsat

Изобретение относится к радиотехнике, а именно к способам определения местоположения источников радиоизлучения, и может быть использовано при построении систем определения местоположения станции сетей связи VSAT. Достигаемым техническим результатом способа определения местоположения станции...
Тип: Изобретение
Номер охранного документа: 0002606958
Дата охранного документа: 10.01.2017
Showing 1-10 of 18 items.
27.04.2014
№216.012.bd15

Способ моделирования поиска подвижных абонентов на сетях связи

Изобретение относится к области моделирования сетей связи. Техническим результатом является повышение достоверности оценки моделируемых процессов функционирования и состояний динамически перемещающихся абонентов сетей связи относительно реально функционирующих (существующих) в реальном масштабе...
Тип: Изобретение
Номер охранного документа: 0002514144
Дата охранного документа: 27.04.2014
27.09.2014
№216.012.f7af

Способ умерения бортовой качки судна посредством пассивного успокоителя бортовой качки и пассивный успокоитель бортовой качки судна

Изобретение относится к области судостроения и может быть использовано для умерения бортовой качки судов, обладающих относительно высокой остойчивостью (например, катамаранов) на короткопериодном волнении. Способ умерения бортовой качки судна осуществляется посредством пассивного успокоителя...
Тип: Изобретение
Номер охранного документа: 0002529244
Дата охранного документа: 27.09.2014
10.10.2014
№216.012.fbed

Способ встраивания информации в изображение, сжатое фрактальным методом, на основе сформированной библиотеки доменов

Изобретение относится к области стеганографии. Технический результат заключается в обеспечении возможности скрытой передачи конфиденциальных данных. Способ встраивания информации в изображение, сжатое фрактальным методом, на основе сформированной библиотеки доменов, включающий этапы...
Тип: Изобретение
Номер охранного документа: 0002530339
Дата охранного документа: 10.10.2014
10.02.2015
№216.013.2616

Способ сжатия графического файла фрактальным методом с использованием кольцевой классификации сегментов

Изобретение относится к вычислительной технике. Технический результат заключается в сокращении времени сжатия графического файла фрактальным методом. Способ сжатия графического файла фрактальным методом с использованием кольцевой классификации сегментов, в котором графический файл разбивают на...
Тип: Изобретение
Номер охранного документа: 0002541203
Дата охранного документа: 10.02.2015
10.02.2015
№216.013.262c

Устройство защиты средств электронно-вычислительной техники от электромагнитных излучений

Изобретение относится к области защиты от электромагнитных излучений (ЭМИ) и может быть использовано для защиты средств электронно-вычислительной техники (СЭВТ) объектов инфокоммуникационных систем от воздействий внешних и побочных электромагнитных излучений (ПЭМИ) СЭВТ. Техническим результатом...
Тип: Изобретение
Номер охранного документа: 0002541225
Дата охранного документа: 10.02.2015
10.04.2015
№216.013.3ade

Способ встраивания информации в изображение, сжатое фрактальным методом, с учетом мощности пикселей домена

Изобретение относится к стеганографии. Техническим результатом является обеспечение возможности скрытой передачи конфиденциальных данных, используя контейнер, представленный в виде фрактально сжатого изображения. Способ включает этапы формирования вектора параметров сжатия изображения, ввода...
Тип: Изобретение
Номер охранного документа: 0002546558
Дата охранного документа: 10.04.2015
10.08.2015
№216.013.6e37

Способ поиска цифрового изображения, содержащего цифровой водяной знак

Изобретение относится к способу поиска цифровых изображений, содержащих цифровой водяной знак. Техническим результатом является обеспечение работы способа в условиях отсутствия априорных сведений о законе встраивания цифрового водяного знака, а также низкий уровень вероятности ложной тревоги....
Тип: Изобретение
Номер охранного документа: 0002559773
Дата охранного документа: 10.08.2015
20.08.2015
№216.013.7223

Способ идентификации печати на цифровом изображении

Изобретение относится к способу идентификации печати на цифровом изображении. Техническим результатом является снижение временных затрат на распознавание изображения печати. Способ идентификации печати на цифровом изображении заключается в том, что предварительно приводят изображение объекта,...
Тип: Изобретение
Номер охранного документа: 0002560789
Дата охранного документа: 20.08.2015
20.12.2015
№216.013.9bea

Способ поиска похожих электронных документов, размещенных на устройствах хранения данных

Изобретение относится к способам поиска на устройствах хранения данных электронных документов, похожих стилистически и по смыслу на выбранный документ. Техническим результатом является повышение точности поиска подобных электронных документов в массиве документов различного стиля. В способе...
Тип: Изобретение
Номер охранного документа: 0002571539
Дата охранного документа: 20.12.2015
10.05.2016
№216.015.3af3

Многопроцессорная корабельная вычислительная система

Изобретение относится к вычислительной технике и предназначено для сбора информации от внешних источников, последующей ее обработки и выработки сигналов управления различным корабельным оружием. Техническим результатом предлагаемого изобретения является обеспечение...
Тип: Изобретение
Номер охранного документа: 0002583741
Дата охранного документа: 10.05.2016
+ добавить свой РИД