×
09.08.2018
218.016.7925

Результат интеллектуальной деятельности: СПОСОБ ПОИСКА ПОДОБНЫХ ФАЙЛОВ, РАЗМЕЩЁННЫХ НА УСТРОЙСТВАХ ХРАНЕНИЯ ДАННЫХ

Вид РИД

Изобретение

Аннотация: Изобретение относится к вычислительной технике для поиска информации. Технический результат заключается в повышении эффективности поиска подобных файлов. Технический результат достигается за счет сравнения, которое происходит с подгруппой ранее обработанных файлов, при этом для этого представляют загруженный файл в виде случайного марковского процесса, рассчитывают вероятности появления последовательностей бит размером, меньшим или равным заданной связности, путем деления количества появлений последовательностей бит на размер файла в битах, и производят сравнение только с теми файлами, у которых модуль разницы их размеров и размера проверяемого файла меньше рассчитанной границы максимально возможного изменения размера файла, и если вероятностное расстояние между загруженным файлом и каким-либо ранее обработанным файлом из полученной подгруппы меньше максимально возможного изменения вероятностного расстояния, то данные файлы признают подобными. 3 ил.

Изобретение относится к способам поиска информации, размещенной на локальных и удаленных устройствах хранения данных. В частности, изобретение относится к способам поиска на локальных и удаленных устройствах хранения данных файлов, похожих структурно на выбранный файл.

Известен способ поиска похожих электронных документов, размещенных на устройствах хранения данных, при помощи сравнения семантических сетей по патенту RU 2571539, кл. G06F 017/30. Известный способ включает следующую последовательность действий. Осуществляют загрузку двух электронных документов с устройств хранения данных, определяют параметры поиска путем задания правил формирования множества уникальных слов, формируют множество взвешенных уникальных слов и взвешенных связей между ними, строят семантическую сеть и производят поиск похожих по смыслу документов путем сравнения семантических сетей. При этом дополнительно задают правила формирования стилистических образов документов путем определения размера матриц частот переходов и выбора элементов матриц частот переходов. И, наконец, сравнивают матрицы частот переходов документов на схожесть путем вычисления коэффициента сходства.

Наиболее близким по технической сущности и выполняемым функциям аналогом (прототипом) к заявляемому изобретению является способ поиска похожих файлов с использованием гибкой свертки (патент RU №2580036, МПК G06 F 21/14). Он включает следующую последовательность действий. Выделяют множество признаков из файлов. Разделяют множество выделенных признаков файла, по меньшей мере, на два подмножества, в одном из которых есть как минимум один изменяемый признак, а в другом есть как минимум один неизменяемый признак. Получают свертку каждого из вышеописанных подмножеств признаков файла. Создают свертку файла как комбинацию сверток каждого из вышеописанных подмножеств признаков файла. Сравнивают свертку, по меньшей мере, одного файла с набором заранее созданных сверток файлов. Признают файл похожим на файлы из множества похожих файлов, имеющих одинаковую свертку, если при сравнении свертка указанного файла совпадает со сверткой файла из указанного множества.

В данной области техники существует техническая проблема, заключающаяся в том, что поиск похожих файлов осуществляют сравнением со всеми ранее обработанными файлами, что приводит к значительному снижению скорости поиска.

Техническая проблема решается разработкой способа поиска подобных файлов, размещенных на устройствах хранения данных, обеспечивающего при его реализации возможность повысить скорость поиска подобных файлов различных форматов путем сравнения загруженного файла не со всеми ранее обработанными файлами, а с подгруппой ранее обработанных файлов. Для этого представляют загруженный файл в виде случайного марковского процесса, для чего задают значение максимально возможного изменения вероятностного расстояния, а также задают связность используемой марковской цепи, которая показывает максимальный размер битовой последовательности, для которой учитывают корреляционные свойства. Далее рассчитывают вероятности появления последовательностей бит размером, меньшим и равным заданной связности, путем деления количества появлений последовательностей бит на размер файла в битах и определяют максимально возможное изменение размера файла, используя полученный ряд вероятностей и исходный размер файла. Производят сравнение только с теми файлами, у которых модуль разницы их размеров и размера проверяемого файла меньше рассчитанной границы максимально возможного изменения размера файла. И если вероятностное расстояние между загруженным файлом и каким-либо ранее обработанным файлом из полученной подгруппы меньше максимально возможного изменения вероятностного расстояния, то данные файлы признают подобными.

Перечисленная новая совокупность существенных признаков обеспечивает возможность повышения скорости поиска подобных файлов.

Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного технического решения, отсутствуют, что указывает на соответствие заявленного способа условию патентоспособности «новизна».

Результаты поиска известных решений в данной и смежных областях техники с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленного объекта, показали, что они не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность отличительных существенных признаков, обусловливающих тот же технический результат, который достигнут в заявляемом способе. Следовательно, заявленное изобретение соответствует условию патентоспособности «изобретательский уровень».

Заявленный способ поясняется чертежами, на которых показаны:

фиг. 1 - древовидная структура взаимосвязей вероятностей двоичных векторов различной длины;

фиг. 2 - блок-схема реализации способа поиска подобных файлов, размещенных на устройствах хранения данных;

фиг. 3 - сравнение результатов имитационного моделирования для способа-прототипа и заявленного способа.

Реализация заявленного способа поиска подобных файлов, размещенных на устройствах хранения данных, поясняется на фиг. 2:

Блок №1 - осуществляют загрузку файла с устройства хранения данных.

Блок №2 - задают связность используемой марковской цепи, которая показывает максимальный размер битовой последовательности, для которой учитываются корреляционные свойства. Иными словами, задают количество уровней в древовидной структуре взаимосвязей вероятностей, представленной на фиг. 1. Чем больше количество используемых уровней, тем больше точность оценки статистических свойств, но и тем выше требования к ресурсоемкости. Также задают параметр Мкр - максимально возможное изменение вероятностного расстояния.

Блоки №3, 4, 5, 6 - определяют значения вероятностей для каждого уровня в древовидной структуре взаимосвязей вероятностей, представленной на фиг. 3, меньше или равного заданной связности используемой марковской цепи. Например, для связности марковской цепи, равной двум, определяют вероятности на первом уровне: р(0), и вероятности на втором уровне: р(00), р(01), р(10), р(11). Определение каждой вероятности происходит следующим образом: количество появлений каждой комбинации последовательности бит в файле делится на длину файла в битах.

Блок №7 - определяют максимально возможное изменение размера файла, используя полученный ряд вероятностей и исходный размер файла L:

Блок №8 - выделяют подгруппу ранее обработанных файлов, у которых размер L' удовлетворяет условию:

Блоки №9, 10, 11, 12, 13, 14, 15 - осуществляют расчет вероятностного расстояния между загруженным файлом и каждым файлом их выделенной подгруппы. Расчет производится с использованием модифицированной нормированной метрики Евклида:

где K - связность используемой марковской цепи.

Сравнивают вероятностное расстояние между загруженным файлом и каждым файлом их выделенной подгруппы с максимально возможным изменением вероятностного расстояния Мкр, и если оно меньше максимально возможного, то принимают решение о подобности сравниваемых файлов.

Промышленная применимость изобретения обусловлена тем, что устройство, реализующее предложенный способ, может быть осуществлено с помощью современной элементной базы с достижением указанного в изобретении назначения.

Правомерность теоретических предпосылок проверялась с помощью машинного моделирования способа-прототипа и заявленного способа поиска подобных файлов, размещенных на устройствах хранения данных.

Показателем эффективности способа поиска подобных файлов, размещенных на устройствах хранения данных, является скорость поиска.

Для оценки качества функционирования разработанного способа были проведены эксперименты по поиску подобных файлов различных типов. С этой целью исследованы файлы с расширениями txt, pcm и dat, по которым затем осуществлялся поиск. Тестовый массив файлов составлял более 1000000 файлов. Результаты, представленные на фиг. 3, подтверждают существенное повышение скорости поиска при использовании разработанного способа.

Способ поиска подобных файлов, размещенных на устройствах хранения данных, заключающийся в том, что осуществляют загрузку файла с устройства хранения данных, создают его свертку и сравнивают полученную свертку со свертками ранее обработанных файлов для определения подобия файлов, отличающийся тем, что сравнение происходит не со всеми ранее обработанными файлами, а с подгруппой ранее обработанных файлов, для этого представляют загруженный файл в виде случайного марковского процесса, для чего задают значение максимально возможного изменения вероятностного расстояния, а также задают связность используемой марковской цепи, которая показывает максимальный размер битовой последовательности, для которой учитывают корреляционные свойства, после чего рассчитывают вероятности появления последовательностей бит размером, меньшим или равным заданной связности, путем деления количества появлений последовательностей бит на размер файла в битах, определяют максимально возможное изменение размера файла, используя полученный ряд вероятностей и исходный размер файла, и производят сравнение только с теми файлами, у которых модуль разницы их размеров и размера проверяемого файла меньше рассчитанной границы максимально возможного изменения размера файла, и если вероятностное расстояние между загруженным файлом и каким-либо ранее обработанным файлом из полученной подгруппы меньше максимально возможного изменения вероятностного расстояния, то данные файлы признают подобными.
СПОСОБ ПОИСКА ПОДОБНЫХ ФАЙЛОВ, РАЗМЕЩЁННЫХ НА УСТРОЙСТВАХ ХРАНЕНИЯ ДАННЫХ
СПОСОБ ПОИСКА ПОДОБНЫХ ФАЙЛОВ, РАЗМЕЩЁННЫХ НА УСТРОЙСТВАХ ХРАНЕНИЯ ДАННЫХ
СПОСОБ ПОИСКА ПОДОБНЫХ ФАЙЛОВ, РАЗМЕЩЁННЫХ НА УСТРОЙСТВАХ ХРАНЕНИЯ ДАННЫХ
СПОСОБ ПОИСКА ПОДОБНЫХ ФАЙЛОВ, РАЗМЕЩЁННЫХ НА УСТРОЙСТВАХ ХРАНЕНИЯ ДАННЫХ
Источник поступления информации: Роспатент

Показаны записи 11-20 из 69.
25.08.2017
№217.015.a3ce

Способ идентификации кадров потока мультимедийных данных на основе корреляционного анализа гистограмм изображений кадров

Изобретение относится к области вычислительной техники, а именно к системам анализа изображений, и предназначено для использования в сфере обработки данных изображений. Техническим результатом является повышение вероятности достоверного обнаружения кадров-вставок в потоке мультимедийных данных...
Тип: Изобретение
Номер охранного документа: 0002607415
Дата охранного документа: 10.01.2017
25.08.2017
№217.015.a789

Способ идентификации устройства и пользователя

Изобретение относится к области компьютерной безопасности, в частности к методам идентификации устройства и пользователя на основании данных cookies. Технический результат - повышение уровня защиты информации. Способ идентификации устройства и пользователя по данным cookies, заключающийся в...
Тип: Изобретение
Номер охранного документа: 0002607990
Дата охранного документа: 11.01.2017
25.08.2017
№217.015.a945

Способ адаптации режимов передачи информации по спутниковым каналам связи в условиях воздействия атмосферных возмущений и устройство его реализующее

Изобретение относятся к технике спутниковой радиосвязи и может быть использовано для организации спутниковой связи более высокого качества в условиях воздействия атмосферных возмущений. Технический результат состоит в повышении пропускной способности канала (сети) спутниковой связи. Для этого в...
Тип: Изобретение
Номер охранного документа: 0002611606
Дата охранного документа: 28.02.2017
25.08.2017
№217.015.ab9a

Способ мониторинга сетей связи в условиях ведения сетевой разведки и информационно технических воздействий

Изобретение относится к области телекоммуникаций, а именно к области диагностирования и контроля технического состояния информационно-телекоммуникационных сетей связи в условиях информационно-технических воздействий. Техническим результатом является создание способа мониторинга сетей связи в...
Тип: Изобретение
Номер охранного документа: 0002612275
Дата охранного документа: 06.03.2017
25.08.2017
№217.015.b644

Способ кодирования изображений на основе нелинейной формирующей системы

Изобретение относится к вычислительной технике. Технический результат заключается в повышении качества восстановленной видеоинформации. Предложен способ кодирования изображений на основе нелинейной формирующей системы, в котором на этапе формирования сигнала прогнозирования подразделяют...
Тип: Изобретение
Номер охранного документа: 0002614576
Дата охранного документа: 28.03.2017
25.08.2017
№217.015.b819

Способ динамического резервирования и распределения пропускной способности каналов в спутниковой сети и устройство его реализующее

Изобретение относится к области радиосвязи, а именно к области, связанной со способами, а именно к способам резервирования и распределения пропускной способности в спутниковых сетях с передачей мультимедийного пакетного трафика, обеспечивающим высокую эффективность использования пропускной...
Тип: Изобретение
Номер охранного документа: 0002614983
Дата охранного документа: 03.04.2017
25.08.2017
№217.015.b926

Способ обнаружения кодов вредоносных компьютерных программ в трафике сети передачи данных, в том числе подвергнутых комбинациям полиморфных преобразований

Изобретение относится к области компьютерной безопасности. Технический результат заключается в повышении полноты обнаружения вредоносных компьютерных программ, в том числе подвергнутых полиморфным преобразованиям. Способ, в котором упорядоченные ячейки памяти, содержащие зарегистрированный...
Тип: Изобретение
Номер охранного документа: 0002615317
Дата охранного документа: 04.04.2017
25.08.2017
№217.015.c0e8

Способ оценки параметров побочного электромагнитного излучения от элементов средств вычислительной техники

Изобретение предназначено для оценки параметров побочных электромагнитных излучений (ПЭМИ) от элементов средств вычислительной техники (СВТ) при определении электромагнитной совместимости, а также может быть использовано при выявлении технических каналов утечки (ТКУИ) за счет ПЭМИ посредством...
Тип: Изобретение
Номер охранного документа: 0002617453
Дата охранного документа: 25.04.2017
25.08.2017
№217.015.c579

Система передачи трафика в мультисервисных сетях связи

Изобретение относится к технике связи и мультисервисным сетям. Технический результат изобретения заключается в повышении эффективности использования канального ресурса. Система передачи трафика в мультисервисных сетях связи использует подключение нескольких пользовательских оконечных устройств...
Тип: Изобретение
Номер охранного документа: 0002618191
Дата охранного документа: 02.05.2017
25.08.2017
№217.015.c81e

Способ мониторинга распределенной системы управления и связи

Изобретение относится к области технической диагностики и может использоваться в системах автоматизированного контроля сетей связи. Технический результат заключается в повышении достоверности диагностирования за счет возможности нормирования значений всех параметров и характеристик,...
Тип: Изобретение
Номер охранного документа: 0002619205
Дата охранного документа: 12.05.2017
Показаны записи 11-18 из 18.
13.01.2017
№217.015.89e4

Способ встраивания информации в графический файл, сжатый фрактальным методом

Изобретение относится к области стеганографии, а именно к способам встраивания сообщения в цифровое изображение. Техническим результатом является обеспечение возможности скрытой передачи конфиденциальных данных, используя контейнер, представленный в виде фрактально сжатого изображения....
Тип: Изобретение
Номер охранного документа: 0002602670
Дата охранного документа: 20.11.2016
26.08.2017
№217.015.d7ac

Способ формирования маскирующей помехи для защиты речевой информации

Изобретение относится к области защиты информации. Техническим результатом изобретения является снижение уровня мощности маскирующей помехи при сохранении уровня эффективности защиты речевой информации от несанкционированного прослушивания. Способ формирования маскирующей помехи для защиты...
Тип: Изобретение
Номер охранного документа: 0002622631
Дата охранного документа: 16.06.2017
10.05.2018
№218.016.3be8

Регулятор давления

Регулятор давления содержит корпус с входным и выходным патрубками и расположенные внутри корпуса регулирующую пару в виде соплового вкладыша, запираемого подвижной иглой, пружину, контактирующую с шаровой опорой иглы через опорную шайбу, направляющие качения иглы и узел настройки силы пружины...
Тип: Изобретение
Номер охранного документа: 0002647814
Дата охранного документа: 19.03.2018
10.05.2018
№218.016.401c

Способ кодирования и декодирования видеоинформации пониженной, стандартной и высокой четкости

Изобретение относится к вычислительной технике. Технический результат заключается в повышении быстродействия и точности цифрового кодирования и декодирования видеоинформации. Способ кодирования и декодирования видеоинформации пониженной, стандартной и высокой четкости заключается в поэтапной...
Тип: Изобретение
Номер охранного документа: 0002648581
Дата охранного документа: 26.03.2018
02.02.2019
№219.016.b61d

Ракетный двигатель твердого топлива для увода отделяемых частей

Ракетный двигатель твердого топлива для увода отделяемых частей ракеты состоит из корпуса с твердотопливным многошашечным зарядом, расположенным между опорными решетками и двумя газосвязанными соплами. В предсопловых объемах корпуса соосно газоподводной трубке с пиропатроном закреплены...
Тип: Изобретение
Номер охранного документа: 0002678602
Дата охранного документа: 30.01.2019
21.02.2019
№219.016.c549

Способ распознавания контента сжатых неподвижных графических сообщений в формате jpeg

Изобретение относится к области распознавания данных. Технический результат − сокращение времени обработки сжатого НГС в формате JPEG за счет уменьшения количества операций и обеспечение правильного распознавания контента. Способ распознавания сжатого неподвижного графического сообщения основан...
Тип: Изобретение
Номер охранного документа: 0002680358
Дата охранного документа: 19.02.2019
02.10.2019
№219.017.cee8

Способ оценки эффективности проведения аллерген-специфической иммунотерапии при аллергическом рините

Изобретение относится к медицине, а именно к иммунологии и аллергологии, и может быть использовано для оценки эффективности проведения аллерген-специфической иммунотерапии (АСИТ) при аллергическом рините. Для этого у пациентов в периферической крови до и после проведения АСИТ определяют...
Тип: Изобретение
Номер охранного документа: 0002700788
Дата охранного документа: 23.09.2019
15.11.2019
№219.017.e2aa

Способ декодирования блочных помехоустойчивых кодов по критерию минимального среднего риска

Изобретение относится к области техники связи, а именно к системам передачи информации с помехоустойчивым кодированием, и может быть использовано в канальных кодерах систем передачи информации, в которых передача информационных сообщений осуществляется посредством радиоволн. Технический...
Тип: Изобретение
Номер охранного документа: 0002706171
Дата охранного документа: 14.11.2019
+ добавить свой РИД