×
26.08.2017
217.015.e153

Результат интеллектуальной деятельности: Способ преобразования документов для минимизации их объёма при хранении электронных документов с квазиструктурированным информационным наполнением

Вид РИД

Изобретение

Аннотация: Изобретение относится к способам организации хранения документов для минимизации их объема при хранении. Техническим результатом является снижение объема хранения электронных документов с квазиструктурированным информационным наполнением. В способе минимизации объема хранения электронных документов с квазиструктурированным информационным наполнением для коллекции однотипных электронных документов с квазиструктурированным информационным наполнением синтезируют квазиструктурированную модель информационного наполнения документов, выполняя разметку контента электронных документов и сохраняя квазиструктурированный контент в виде отдельных файлов. Затем разрабатывают шаблон формы документов обрабатываемого типа и реализуют архивацию шаблона формы и квазиструктурированного контента документов. Причем восстановление электронного документа выполняют путем извлечения шаблона формы и контента документа из архива и применения шаблона формы к полученному контенту документа. 3 ил.

Изобретение относится к способам организации хранения документов для минимизации их объема при хранении и может быть использовано для организации баз или банков документов.

Известен способ сокращения объемов сохраняемых документов в памяти компьютера при помощи программ-архиваторов [Черников Б.В. Офисные информационные технологии: Практикум. - М.: Финансы и статистика, 2007; Ратушняк А., Юкин В., Ватолин Д., Смирнов М. Методы сжатия данных. Устройство архиваторов, сжатие изображения и видео. - М: Диалог-МИФИ, 2003].

К недостаткам данного способа следует отнести то, что обработка документа в этом случае производится после его создания и сохранения на диске, а для восстановления его в первоначальном виде необходимо «распаковать» созданный архив, проведя обратную архивированию операцию. Сокращение объема при таком способе преобразования документа (архивировании) в большей степени относится именно к его содержательной (текстовой) части, в то время как объем графических элементов сокращается (сжимается) незначительно.

Известен способ преобразования слабоформулизуемых документов, предусматривающие лексикологический синтез документов для минимизации, который заключается в осуществлении лексикологического синтеза документа, формировании документарной индексной последовательности, определяющей номер формы документа и условные номера опорных слов, выбранных по лексикологическому дереву сформированного документа с дополнением введенной неунифицированной информации, фиксации индексной последовательности, сжатии индексной последовательности, формировании информационного пакета документа, хранении его в компьютерной памяти, последующем восстановлении документа, при котором осуществляют чтение информационного пакета, восстановлении исходного состояния индексной последовательности путем применения процедуры, обратной процедуре сжатия, затем восстановление сформированного документа на основе полученной индексной последовательности путем последовательного прохождения по установленным ветвям лексикологического дерева документа с восстановлением необходимых опорных слов для внедрения нужных формулировок в документ, формируемый при восстановлении [Патент РФ №2413985, МПК G06F 17/2,1 опубл. 10.03.2011 г., автор Черников Б.В. «Способ преобразования слабоформулизуемых документов для минимизации их объема при хранении»].

К недостаткам данного способа следует отнести отсутствие математической модели информационного наполнения обрабатываемых документов, отсутствие возможности описания лексикологическим деревом фактографического контента (неунифицированной информации) для документов.

Данное техническое решение выбрано автором в качестве прототипа.

Техническим результатом предлагаемого способа является сокращение объема хранения электронных документов за счет однократного хранения формы документа данного типа и содержание (контента) документов коллекции, в результате хранится большой объем электронных документов.

Технический результат достигается тем, что в предлагаемом способе минимизации объема хранения электронных документов с квазиструктурированным информационным наполнением для коллекции синтезируют каждый документ коллекции квазиструктурированной модели информационного наполнения документов, выполняя разметку контента электронных документов и сохраняя квазиструктурированный контент в виде отдельных файлов, а разработанный шаблон сжимают вместе с фактографическими данными всех документов в архив шаблона формы и квазиструктурированного контента документов, причем восстановление электронного документа выполняют извлечением из архива фактографических данных шаблона формы и заданного контента документа и применением шаблона формы к вновь полученному контенту документа.

Сущность изобретения поясняется чертежами

На фиг. 1 изображена блок-схема последовательностей операций, иллюстрирующая сущность способа минимизации объема хранения электронных документов с квазиструктурированным информационным наполнением.

На фиг. 2 изображена блок-схема последовательностей операций, иллюстрирующая процесс восстановления документа.

На фиг. 3 - пример применения квазиструктурированной модели информационного наполнения к фрагменту документа документации газоконденсатного месторождения.

Предлагаемый способ реализуется следующим образом.

Выбирается коллекция однотипных электронных документов с квазиструктурированным информационным наполнением.

По известному способу выбранного типа документов синтезируют квазиструктурированную модель информационного наполнения документа.

Способ формирования квазиструктурированных моделей фактографического информационного наполнения документов, заключающийся в построении первоначальной модели, определении параметров эффекта и целевой функции для каждого документа первоначальной модели, вычислении среднего значения целевой функции первоначальной модели, выполнении анализа контента структурных единиц полученной модели с внесением изменений в структуру первоначальной модели для уменьшения значений параметров эффекта за исключением параметра валидации, определении параметров эффекта и целевой функции для каждого документа скорректированной модели, вычислении среднего значения целевой функции скорректированной модели, сравнении средних значений целевой функции для первоначальной и скорректированной моделей в рамках хотя бы одной итерации, причем в качестве параметров эффекта выбирают валидацию модели, степень детализации модели, равномерность распределения структурных единиц модели по документу, насыщенность структурных единиц модели в документе, гибкость модели, а в качестве целевой функции выбирают свертку параметров эффекта, причем валидацию модели определяют из соответствия модели стандарту на содержание и она равна единице, степень детализации модели определяют из отношения количества символов контента структурных единиц модели к общему количеству структурных единиц модели и она минимизирована, равномерность распределения структурных единиц модели по документу определяют из отношения количества символов фрагмента к количеству структурных единиц модели данного фрагмента и она минимизирована, насыщенность структурных единиц модели в документе определяют из отношения количества символов документа к количеству символов контента структурных единиц модели и она минимизирована, гибкость модели определяют из отношения общего количества структурных единиц модели без учета необязательных и повторяющихся структурных единиц модели к общему количеству структурных единиц модели и она стремится к нулю, а целевую функцию определяют из отношения суммы значений всех вышеперечисленных параметров эффекта к значению параметра валидации модели [Полищук Ю.В. Способ формирования квазиструктурированных моделей фактографического информационного наполнения документов. Патент РФ №2517428]. Эта модель информационного наполнения может быть записана следующим образом:

где root - корневой объект, root ∈ sObj; sObj - конечное множество объектов, каждый из которых содержит фрагмент информационного наполнения документа (текст, рисунок и т.д.) или выполняет роль контейнера для одного или нескольких объектов. Для объектов-контейнеров доступны следующие метасвойства: smetc - определяет объект в качестве контейнера; mixed - разрешает использование объектов-потомков в произвольном порядке; kol_о - количество объектов модели; LObj - отображение, определенное на множестве sObj, такое что , где obji - дочерний объект, obji ∈ sObj; i=1, …, n, n - число дочерних объектов; minOccurs - функция, определяющая минимально возможное число раз использования объекта в модели; maxOccurs - функция, определяющая максимально возможное число раз использования объекта в модели; sMet - конечное множество метасвойств ограничений на содержимое объекта; Obj_smet - отображение, определенное на множестве sObj, такое что , где smetj - метасвойство ограничения на содержимое объекта, smetj ∈ sMet, j=1, …, kol_m, kol_m - количество доступных метасвойств модели.

Документ, состоит из пяти объектов. Объект А - выполняет роль контейнера для объектов В и С, объект В - выполняет роль контейнера для объектов D и E. Объекты A, B, D - обязательно должны быть использованы при разработке документа, объект С - является необязательным к использованию, объект Е в рассматриваемом примере должен быть использован от трех до пяти раз. Объекту-контейнеру А соответствует метасвойство ограничения smetc, а для объекта-контейнера В определено дополнительно метасвойство mixed. Объект С представлен числовым наполнением, т.е. ему соответствует метасвойство ограничения smet2. Объекты D, Е - имеют символьное информационное наполнение, которому соответствует метасвойство ограничения smet1.

Модель документа имеет вид:

Затем применяем полученную модель ко всем документам коллекции (на фиг. 3 представлен фрагмент разметки контента электронного документа с модели) и сохраняем квазиструктурированный контент обрабатываемых документов.

Выполняем разработку шаблона формы в виде XSLT-шаблона для обрабатываемого типа документов, который сохраняем в виде отдельного файла.

Производим архивацию шаблона формы и квазиструктурированный контент всех документов. Данную операцию реализуем, например, с помощью архиватора 7-ZIP. Архив сохраняем в памяти компьютера.

Для восстановления документа необходимо выполнить следующие операции (фиг. 2).

Выбрать требуемый для восстановления файл.

Извлечь из архива и сохранить в памяти компьютера контент выбранного документа и шаблон формы.

Применить шаблон формы к контенту документа и сохранить восстановленный документ в памяти компьютера.

Анализ результатов экспериментальной проверки предлагаемого способа минимизации объема хранения электронных документов с квазиструктурированным информационным наполнением показывает существенное сокращение объема. На примере документации газоконденсатного месторождения преимущество в сравнении с традиционным архивированием составило в 20 и более раз.

Предлагаемое техническое решение позволяет минимизировать объем хранения электронных документов с квазиструктурированным информационным наполнением до 20 раз, счет однократного хранения формы документа данного типа и содержания (контента) документов коллекции.

Способ преобразования документов для минимизации их объема при хранении электронных документов с квазиструктурированным информационным наполнением, состоящий в выборе коллекции однотипных электронных документов с квазиструктурированным информационным наполнением, синтезе квазиструктурированной модели информационного наполнения для обрабатываемого типа документов и извлечении из документов квазиструктурированного контента с помощью синтезированной модели, и разработке шаблона формы электронного документа обрабатываемого типа, сохранении шаблона формы и контентов документов коллекции в виде архива, затем в восстановлении в памяти компьютера электронных документов путем извлечения из архива и применения шаблона формы к контентам документов, отличающийся тем, что синтезируют каждый документ коллекции квазиструктурированной модели информационного наполнения документов, выполняя разметку контента электронных документов и сохраняя квазиструктурированный контент в виде отдельных файлов, а разработанный шаблон сжимают вместе с фактографическими данными всех документов в архив шаблона формы и квазиструктурированного контента документов, причем восстановление электронного документа выполняют извлечением из архива фактографических данных шаблона формы и заданного контента документа и применением шаблона формы к вновь полученному контенту документа.
Способ преобразования документов для минимизации их объёма при хранении электронных документов с квазиструктурированным информационным наполнением
Способ преобразования документов для минимизации их объёма при хранении электронных документов с квазиструктурированным информационным наполнением
Способ преобразования документов для минимизации их объёма при хранении электронных документов с квазиструктурированным информационным наполнением
Способ преобразования документов для минимизации их объёма при хранении электронных документов с квазиструктурированным информационным наполнением
Источник поступления информации: Роспатент

Showing 51-60 of 66 items.
10.06.2016
№216.015.46e0

Способ определения количества и качества клейковины в зерне пшеницы

Изобретение относится к хлебопекарной промышленности, в частности к определению количества и качества клейковины в зерне пшеницы. Для этого проводят измельчение зерна для получения муки с последующим просеиванием средней пробы через сита. Затем производят микроснимки тонкой фракции муки не...
Тип: Изобретение
Номер охранного документа: 0002586780
Дата охранного документа: 10.06.2016
10.06.2016
№216.015.4879

Станочная гитара с переменными межосевыми расстояниями

Станочная гитара содержит основной комплект из двадцати одного колеса с числами зубьев, образующими ряд чисел с заданным шагом, и дополнительный комплект из пяти колес, в том числе колеса с числами зубьев 47, 63, 97 и 127. Для увеличения реализуемых передаточных отношений наименьшее из колес...
Тип: Изобретение
Номер охранного документа: 0002587005
Дата охранного документа: 10.06.2016
12.01.2017
№217.015.619f

Прессующий ролик пресс-гранулятора

Изобретение относится к оборудованию для гранулирования измельченного полуфабриката растительного происхождения. Прессующий ролик пресс-гранулятора содержит обечайку, подшипники качения, торцевые крышки для фиксации обечайки относительно наружных колец подшипников и измеритель нормальных...
Тип: Изобретение
Номер охранного документа: 0002588925
Дата охранного документа: 10.07.2016
13.01.2017
№217.015.7583

Система безопасности легкового автомобиля

Изобретение относится к автомобилестроению, в частности к системам, обеспечивающим пассивную безопасность пешеходов и участников дорожного движения, передвигающихся на двухколесных транспортных средствах, при их столкновении с передней частью легковых автомобилей. Система безопасности легкового...
Тип: Изобретение
Номер охранного документа: 0002598654
Дата охранного документа: 27.09.2016
13.01.2017
№217.015.75dc

Применение производных 1,3-дигидроксибензола в качестве сенсибилизаторов бактериальных клеток к повреждающему воздействию наноструктурированных соединений углерода

Группа изобретений относится к области дезинфектологии, санитарии и гигиены, а именно к способам обеззараживания различных сред и поверхностей с использованием химических соединений и их композиций. Группа изобретений раскрывает применение 1,3-дигидрокси-4-гексилбензола, предварительное...
Тип: Изобретение
Номер охранного документа: 0002598731
Дата охранного документа: 27.09.2016
13.01.2017
№217.015.7655

Система пассивной безопасности легкового автомобиля

Изобретение относится к автомобилестроению, в частности к системам, обеспечивающим пассивную безопасность пешеходов и участников дорожного движения, передвигающихся на двухколесных транспортных средствах, при их столкновении с передней частью легковых автомобилей. Система пассивной безопасности...
Тип: Изобретение
Номер охранного документа: 0002598433
Дата охранного документа: 27.09.2016
25.08.2017
№217.015.b8c0

Устройство для повышения пассивной безопасности автотранспортного средства

Изобретение относится к системам, обеспечивающим пассивную безопасность участников дорожного движения при их столкновении с передней частью легковых автомобилей. Устройство для повышения пассивной безопасности содержит набор датчиков перегрузок и модуль управления, связанные с газогенераторами,...
Тип: Изобретение
Номер охранного документа: 0002615260
Дата охранного документа: 04.04.2017
25.08.2017
№217.015.ba02

Устройство для защиты водителей двухколёсных транспортных средств и пешеходов при их лобовом столкновении с автомобилем

Изобретение относится к системам, обеспечивающим пассивную безопасность пешеходов и участников дорожного движения при их столкновении с передней частью легковых автомобилей. Устройство для защиты водителей двухколесных транспортных средств содержит датчики перегрузки и модуль управления,...
Тип: Изобретение
Номер охранного документа: 0002615603
Дата охранного документа: 05.04.2017
25.08.2017
№217.015.bc0a

Дифференциал к автотранспортному средству

Изобретение относится к дифференциальным механизмам с устройствами блокировки. Дифференциал содержит установленные в корпусе полуосевые шестерни, введенные в зацепление с сателлитами, и блокировочное устройство для связи корпуса дифференциала и полуосевых шестерен, выполненное в виде лопастного...
Тип: Изобретение
Номер охранного документа: 0002616109
Дата охранного документа: 12.04.2017
25.08.2017
№217.015.bc40

Система для повышения безопасности автотранспортного средства

Изобретение относится к автомобилестроению, в частности к системам, обеспечивающим пассивную безопасность пешеходов и участников дорожного движения, передвигающихся на двухколесных транспортных средствах при их столкновении с передней частью легковых автомобилей. Система содержит набор датчиков...
Тип: Изобретение
Номер охранного документа: 0002616112
Дата охранного документа: 12.04.2017
Showing 51-60 of 128 items.
10.05.2014
№216.012.c06d

Противобуксовочное устройство для автотранспортного средства

Изобретение относится к транспортному машиностроению, в частности к средствам для предотвращения буксования ведущих колес. Противобуксовочное устройство для автотранспортного средства содержит связанный с несущей системой корпус с горловинами подачи и отвода песка, сообщающийся через...
Тип: Изобретение
Номер охранного документа: 0002515010
Дата охранного документа: 10.05.2014
27.05.2014
№216.012.c87f

Способ термической обработки режущего инструмента с напаянной твердосплавной пластиной

Изобретение относится к области машиностроения, в частности к инструментальному производству, для упрочнения режущего инструмента с напаянной твердосплавной пластиной. Техническим результатом изобретения является повышение стойкостных свойств твердосплавных пластин и посадочного места под...
Тип: Изобретение
Номер охранного документа: 0002517093
Дата охранного документа: 27.05.2014
27.05.2014
№216.012.c906

Способ производства корма для рыб

Способ производства кормов для рыб предусматривает смешивание муки рыбной, муки мясокостной, шрота подсолнечного, шрота соевого, масла растительного, муки пшеничной и премикса ПМ-2 с наночастицами комплекса железо-кобальт. Процентное соотношение железа к кобальту в комплексе 70 к 30. Комплекс...
Тип: Изобретение
Номер охранного документа: 0002517228
Дата охранного документа: 27.05.2014
27.05.2014
№216.012.c909

Дробилка

Изобретение относится к устройствам для изучения процесса измельчения зернопродуктов в комбикормовом производстве. Дробилка содержит ротор 1, корпус рабочей камеры 11, который установлен с возможностью свободного вращения относительно оси ротора. В боковых стенках 3 корпуса рабочей камеры 11...
Тип: Изобретение
Номер охранного документа: 0002517231
Дата охранного документа: 27.05.2014
10.06.2014
№216.012.cb72

Способ снижения содержания ртути, алюминия и свинца в организме птицы

Изобретение относится к сельскому хозяйству, а именно к способу снижения содержания ртути, алюминия и свинца в организме птицы. Для выведения вышеуказанных токсичных элементов птице в дополнение к основному рациону скармливают микрочастицы цинка в количестве 35-140 мг/кг корма в период с 1 по...
Тип: Изобретение
Номер охранного документа: 0002517853
Дата охранного документа: 10.06.2014
10.06.2014
№216.012.d093

Система пассивной безопасности автобуса

Изобретение относится к транспортному машиностроению, в частности к системам, обеспечивающим пассивную безопасность автобуса и пассажиров при боковом наезде на него, боковом ударе о препятствие при его заносе или опрокидывании. Система пассивной безопасности содержит наружную подушку...
Тип: Изобретение
Номер охранного документа: 0002519166
Дата охранного документа: 10.06.2014
10.06.2014
№216.012.d182

Устройство для отбора проб отработавших газов двигателя транспортного средства

Изобретение относится к устройствам для отбора проб отработавших газов двигателя, позволяющего производить отбор проб на движущемся транспортном средстве, и может быть использовано при контроле технического состояния транспортных средств и для оценки опасности воздействия транспортного средства...
Тип: Изобретение
Номер охранного документа: 0002519405
Дата охранного документа: 10.06.2014
10.06.2014
№216.012.d20a

Турбокомпрессор

Турбокомпрессор включает корпус турбокомпрессора, корпус подшипников с маслоподводящими каналами, ротор, на валу которого расположены подшипники, маслосливную полость, маслосливную трубку. В корпусе турбокомпрессора установлен поворотный угольник с болтом поворотного угольника. Осевое отверстие...
Тип: Изобретение
Номер охранного документа: 0002519541
Дата охранного документа: 10.06.2014
10.06.2014
№216.012.d218

Система пассивной безопасности локомотива

Изобретение относится к транспортному машиностроению, в частности к системам, обеспечивающим пассивную безопасность при столкновении с передней частью локомотива. Система содержит наружную подушку безопасности с корпусом, газогенераторы и источник электропитания, снабжена катушкой зажигания...
Тип: Изобретение
Номер охранного документа: 0002519555
Дата охранного документа: 10.06.2014
27.06.2014
№216.012.d906

Способ выявления групп риска лиц, склонных к агрессивным видам поведения

Изобретение относится к области медицины, в частности к физиологии, неврологии, нейропсихологии, восстановительной медицине, и касается способа выявления групп риска лиц, склонных к агрессивным видам поведения, путем определения уровня элементов в волосах, где определяют содержание Са, Mg, Fe,...
Тип: Изобретение
Номер охранного документа: 0002521336
Дата охранного документа: 27.06.2014
+ добавить свой РИД