×
26.08.2017
217.015.e153

Результат интеллектуальной деятельности: Способ преобразования документов для минимизации их объёма при хранении электронных документов с квазиструктурированным информационным наполнением

Вид РИД

Изобретение

Аннотация: Изобретение относится к способам организации хранения документов для минимизации их объема при хранении. Техническим результатом является снижение объема хранения электронных документов с квазиструктурированным информационным наполнением. В способе минимизации объема хранения электронных документов с квазиструктурированным информационным наполнением для коллекции однотипных электронных документов с квазиструктурированным информационным наполнением синтезируют квазиструктурированную модель информационного наполнения документов, выполняя разметку контента электронных документов и сохраняя квазиструктурированный контент в виде отдельных файлов. Затем разрабатывают шаблон формы документов обрабатываемого типа и реализуют архивацию шаблона формы и квазиструктурированного контента документов. Причем восстановление электронного документа выполняют путем извлечения шаблона формы и контента документа из архива и применения шаблона формы к полученному контенту документа. 3 ил.

Изобретение относится к способам организации хранения документов для минимизации их объема при хранении и может быть использовано для организации баз или банков документов.

Известен способ сокращения объемов сохраняемых документов в памяти компьютера при помощи программ-архиваторов [Черников Б.В. Офисные информационные технологии: Практикум. - М.: Финансы и статистика, 2007; Ратушняк А., Юкин В., Ватолин Д., Смирнов М. Методы сжатия данных. Устройство архиваторов, сжатие изображения и видео. - М: Диалог-МИФИ, 2003].

К недостаткам данного способа следует отнести то, что обработка документа в этом случае производится после его создания и сохранения на диске, а для восстановления его в первоначальном виде необходимо «распаковать» созданный архив, проведя обратную архивированию операцию. Сокращение объема при таком способе преобразования документа (архивировании) в большей степени относится именно к его содержательной (текстовой) части, в то время как объем графических элементов сокращается (сжимается) незначительно.

Известен способ преобразования слабоформулизуемых документов, предусматривающие лексикологический синтез документов для минимизации, который заключается в осуществлении лексикологического синтеза документа, формировании документарной индексной последовательности, определяющей номер формы документа и условные номера опорных слов, выбранных по лексикологическому дереву сформированного документа с дополнением введенной неунифицированной информации, фиксации индексной последовательности, сжатии индексной последовательности, формировании информационного пакета документа, хранении его в компьютерной памяти, последующем восстановлении документа, при котором осуществляют чтение информационного пакета, восстановлении исходного состояния индексной последовательности путем применения процедуры, обратной процедуре сжатия, затем восстановление сформированного документа на основе полученной индексной последовательности путем последовательного прохождения по установленным ветвям лексикологического дерева документа с восстановлением необходимых опорных слов для внедрения нужных формулировок в документ, формируемый при восстановлении [Патент РФ №2413985, МПК G06F 17/2,1 опубл. 10.03.2011 г., автор Черников Б.В. «Способ преобразования слабоформулизуемых документов для минимизации их объема при хранении»].

К недостаткам данного способа следует отнести отсутствие математической модели информационного наполнения обрабатываемых документов, отсутствие возможности описания лексикологическим деревом фактографического контента (неунифицированной информации) для документов.

Данное техническое решение выбрано автором в качестве прототипа.

Техническим результатом предлагаемого способа является сокращение объема хранения электронных документов за счет однократного хранения формы документа данного типа и содержание (контента) документов коллекции, в результате хранится большой объем электронных документов.

Технический результат достигается тем, что в предлагаемом способе минимизации объема хранения электронных документов с квазиструктурированным информационным наполнением для коллекции синтезируют каждый документ коллекции квазиструктурированной модели информационного наполнения документов, выполняя разметку контента электронных документов и сохраняя квазиструктурированный контент в виде отдельных файлов, а разработанный шаблон сжимают вместе с фактографическими данными всех документов в архив шаблона формы и квазиструктурированного контента документов, причем восстановление электронного документа выполняют извлечением из архива фактографических данных шаблона формы и заданного контента документа и применением шаблона формы к вновь полученному контенту документа.

Сущность изобретения поясняется чертежами

На фиг. 1 изображена блок-схема последовательностей операций, иллюстрирующая сущность способа минимизации объема хранения электронных документов с квазиструктурированным информационным наполнением.

На фиг. 2 изображена блок-схема последовательностей операций, иллюстрирующая процесс восстановления документа.

На фиг. 3 - пример применения квазиструктурированной модели информационного наполнения к фрагменту документа документации газоконденсатного месторождения.

Предлагаемый способ реализуется следующим образом.

Выбирается коллекция однотипных электронных документов с квазиструктурированным информационным наполнением.

По известному способу выбранного типа документов синтезируют квазиструктурированную модель информационного наполнения документа.

Способ формирования квазиструктурированных моделей фактографического информационного наполнения документов, заключающийся в построении первоначальной модели, определении параметров эффекта и целевой функции для каждого документа первоначальной модели, вычислении среднего значения целевой функции первоначальной модели, выполнении анализа контента структурных единиц полученной модели с внесением изменений в структуру первоначальной модели для уменьшения значений параметров эффекта за исключением параметра валидации, определении параметров эффекта и целевой функции для каждого документа скорректированной модели, вычислении среднего значения целевой функции скорректированной модели, сравнении средних значений целевой функции для первоначальной и скорректированной моделей в рамках хотя бы одной итерации, причем в качестве параметров эффекта выбирают валидацию модели, степень детализации модели, равномерность распределения структурных единиц модели по документу, насыщенность структурных единиц модели в документе, гибкость модели, а в качестве целевой функции выбирают свертку параметров эффекта, причем валидацию модели определяют из соответствия модели стандарту на содержание и она равна единице, степень детализации модели определяют из отношения количества символов контента структурных единиц модели к общему количеству структурных единиц модели и она минимизирована, равномерность распределения структурных единиц модели по документу определяют из отношения количества символов фрагмента к количеству структурных единиц модели данного фрагмента и она минимизирована, насыщенность структурных единиц модели в документе определяют из отношения количества символов документа к количеству символов контента структурных единиц модели и она минимизирована, гибкость модели определяют из отношения общего количества структурных единиц модели без учета необязательных и повторяющихся структурных единиц модели к общему количеству структурных единиц модели и она стремится к нулю, а целевую функцию определяют из отношения суммы значений всех вышеперечисленных параметров эффекта к значению параметра валидации модели [Полищук Ю.В. Способ формирования квазиструктурированных моделей фактографического информационного наполнения документов. Патент РФ №2517428]. Эта модель информационного наполнения может быть записана следующим образом:

где root - корневой объект, root ∈ sObj; sObj - конечное множество объектов, каждый из которых содержит фрагмент информационного наполнения документа (текст, рисунок и т.д.) или выполняет роль контейнера для одного или нескольких объектов. Для объектов-контейнеров доступны следующие метасвойства: smetc - определяет объект в качестве контейнера; mixed - разрешает использование объектов-потомков в произвольном порядке; kol_о - количество объектов модели; LObj - отображение, определенное на множестве sObj, такое что , где obji - дочерний объект, obji ∈ sObj; i=1, …, n, n - число дочерних объектов; minOccurs - функция, определяющая минимально возможное число раз использования объекта в модели; maxOccurs - функция, определяющая максимально возможное число раз использования объекта в модели; sMet - конечное множество метасвойств ограничений на содержимое объекта; Obj_smet - отображение, определенное на множестве sObj, такое что , где smetj - метасвойство ограничения на содержимое объекта, smetj ∈ sMet, j=1, …, kol_m, kol_m - количество доступных метасвойств модели.

Документ, состоит из пяти объектов. Объект А - выполняет роль контейнера для объектов В и С, объект В - выполняет роль контейнера для объектов D и E. Объекты A, B, D - обязательно должны быть использованы при разработке документа, объект С - является необязательным к использованию, объект Е в рассматриваемом примере должен быть использован от трех до пяти раз. Объекту-контейнеру А соответствует метасвойство ограничения smetc, а для объекта-контейнера В определено дополнительно метасвойство mixed. Объект С представлен числовым наполнением, т.е. ему соответствует метасвойство ограничения smet2. Объекты D, Е - имеют символьное информационное наполнение, которому соответствует метасвойство ограничения smet1.

Модель документа имеет вид:

Затем применяем полученную модель ко всем документам коллекции (на фиг. 3 представлен фрагмент разметки контента электронного документа с модели) и сохраняем квазиструктурированный контент обрабатываемых документов.

Выполняем разработку шаблона формы в виде XSLT-шаблона для обрабатываемого типа документов, который сохраняем в виде отдельного файла.

Производим архивацию шаблона формы и квазиструктурированный контент всех документов. Данную операцию реализуем, например, с помощью архиватора 7-ZIP. Архив сохраняем в памяти компьютера.

Для восстановления документа необходимо выполнить следующие операции (фиг. 2).

Выбрать требуемый для восстановления файл.

Извлечь из архива и сохранить в памяти компьютера контент выбранного документа и шаблон формы.

Применить шаблон формы к контенту документа и сохранить восстановленный документ в памяти компьютера.

Анализ результатов экспериментальной проверки предлагаемого способа минимизации объема хранения электронных документов с квазиструктурированным информационным наполнением показывает существенное сокращение объема. На примере документации газоконденсатного месторождения преимущество в сравнении с традиционным архивированием составило в 20 и более раз.

Предлагаемое техническое решение позволяет минимизировать объем хранения электронных документов с квазиструктурированным информационным наполнением до 20 раз, счет однократного хранения формы документа данного типа и содержания (контента) документов коллекции.

Способ преобразования документов для минимизации их объема при хранении электронных документов с квазиструктурированным информационным наполнением, состоящий в выборе коллекции однотипных электронных документов с квазиструктурированным информационным наполнением, синтезе квазиструктурированной модели информационного наполнения для обрабатываемого типа документов и извлечении из документов квазиструктурированного контента с помощью синтезированной модели, и разработке шаблона формы электронного документа обрабатываемого типа, сохранении шаблона формы и контентов документов коллекции в виде архива, затем в восстановлении в памяти компьютера электронных документов путем извлечения из архива и применения шаблона формы к контентам документов, отличающийся тем, что синтезируют каждый документ коллекции квазиструктурированной модели информационного наполнения документов, выполняя разметку контента электронных документов и сохраняя квазиструктурированный контент в виде отдельных файлов, а разработанный шаблон сжимают вместе с фактографическими данными всех документов в архив шаблона формы и квазиструктурированного контента документов, причем восстановление электронного документа выполняют извлечением из архива фактографических данных шаблона формы и заданного контента документа и применением шаблона формы к вновь полученному контенту документа.
Способ преобразования документов для минимизации их объёма при хранении электронных документов с квазиструктурированным информационным наполнением
Способ преобразования документов для минимизации их объёма при хранении электронных документов с квазиструктурированным информационным наполнением
Способ преобразования документов для минимизации их объёма при хранении электронных документов с квазиструктурированным информационным наполнением
Способ преобразования документов для минимизации их объёма при хранении электронных документов с квазиструктурированным информационным наполнением
Источник поступления информации: Роспатент

Showing 11-20 of 66 items.
20.09.2014
№216.012.f4f2

Способ получения режущего инструмента из карбидсодержащих сплавов вольфрамовой (вк) и титано-вольфрамовой (тк) групп

Изобретение относится к области металлургии, в частности к изделиям из карбидсодержаших твердых сплавов, применяемым для холодной и горячей механической обработки металлов и сплавов, например, резанием. Способ получения режущего инструмента из карбидсодержащих сплавов вольфрамовой (ВК) и...
Тип: Изобретение
Номер охранного документа: 0002528539
Дата охранного документа: 20.09.2014
20.09.2014
№216.012.f5a5

Способ затворения формовочных смесей

Изобретение относится к безреагентным способам увеличения удобоукладываемости формовочных смесей посредством обработки воды и может быть использовано при производстве силикатных, керамических, бетонных, железобетонных и других изделий, а также в технологиях, основанных на использовании...
Тип: Изобретение
Номер охранного документа: 0002528718
Дата охранного документа: 20.09.2014
27.09.2014
№216.012.f84d

Способ выявления девиантных тенденций по комплексу психофизиологических показателей

Изобретение относится к области медицины, физиологии, неврологии, психиатрии для диагностики склонностей к девиантным видам поведения у человека. Проводят балльную оценку анамнеза, результатов неврологического и психиатрического обследования, психофизиологического тестирования с присуждением 0...
Тип: Изобретение
Номер охранного документа: 0002529402
Дата охранного документа: 27.09.2014
20.10.2014
№216.012.fe59

Жидкостно-жидкостный теплообменник для двигателей внутреннего сгорания

Изобретение относится к теплотехнике и может использоваться в жидкостных теплообменниках. В жидкостно-жидкостном теплообменнике, соединяющем секции труб, закрепленных в герметичном корпусе и подключенных к раздельным коллекторам по контурам охлаждающих теплоносителей, в контуре...
Тип: Изобретение
Номер охранного документа: 0002530969
Дата охранного документа: 20.10.2014
20.11.2014
№216.013.067f

Устройство для распознавания образов

Изобретение относится к автоматике и вычислительной технике. Технический результат - повышение производительности устройства. Устройство для распознавания образов содержит многоканальный коммутатор, аналого-цифровой преобразователь, блок памяти коэффициентов ассоциативности признаков, блок...
Тип: Изобретение
Номер охранного документа: 0002533064
Дата охранного документа: 20.11.2014
10.12.2014
№216.013.0cb5

Способ упрочнения твердых сплавов

Изобретение относится к области металлургии, в частности к изделиям из твердых сплавов, применяемым для холодной и горячей механической обработки металлов и сплавов, например, резанием. Техническим результатом предлагаемого изобретения является упрощение технического процесса термообработки...
Тип: Изобретение
Номер охранного документа: 0002534670
Дата охранного документа: 10.12.2014
10.12.2014
№216.013.0e88

Способ приготовления вискоэластичного протектора эндотелия роговицы

Изобретение относится к фармацевтической промышленности и представляет собой способ приготовления вискоэластичного протектора эндотелия роговицы, включающий растворение исходного терапевтического компонента с избыточной вязкостью в фосфатном буфере, фильтрацию и стерилизацию до получения...
Тип: Изобретение
Номер охранного документа: 0002535137
Дата охранного документа: 10.12.2014
10.12.2014
№216.013.0eb5

Устройство для распознавания образов

Изобретение относится к автоматике и вычислительной технике и может быть использовано в системах автоматического распознавания образов для распознавания состояний объектов по значениям их параметров. Технический результат изобретения заключается в повышении производительности устройства за счет...
Тип: Изобретение
Номер охранного документа: 0002535182
Дата охранного документа: 10.12.2014
10.12.2014
№216.013.0f5b

Система пассивной безопасности легкового автомобиля

Изобретение относится к автомобилестроению, в частности к системам, обеспечивающим пассивную безопасность пешеходов и участников дорожного движения, передвигающихся на двухколесных транспортных средствах, при их столкновении с передней частью легковых автомобилей. Система содержит набор...
Тип: Изобретение
Номер охранного документа: 0002535348
Дата охранного документа: 10.12.2014
20.12.2014
№216.013.10ee

Система пассивной безопасности легкового автомобиля

Изобретение относится к автомобилестроению, в частности к системам, обеспечивающим пассивную безопасность пешеходов и участников дорожного движения, передвигающихся на двухколесных транспортных средствах, при их столкновении с передней частью легковых автомобилей. Система содержит набор...
Тип: Изобретение
Номер охранного документа: 0002535757
Дата охранного документа: 20.12.2014
Showing 11-20 of 128 items.
27.06.2013
№216.012.4fd5

Способ термического упрочнения деталей из порошковых материалов на основе железа

Изобретение относится к порошковой металлургии, в частности к получению деталей из низколегированных порошковых материалов на основе железа с повышенными физико-механическими и эксплуатационными свойствами. Детали пропитывают маслом при температуре 80-90°С и закаливают путем нагрева в интервале...
Тип: Изобретение
Номер охранного документа: 0002486030
Дата охранного документа: 27.06.2013
27.06.2013
№216.012.513c

Коробка передач для автотранспортного средства

Изобретение относится к коробкам переключения передач с автоматической системой переключения. Коробка передач включает планетарный понижающий цилиндрический косозубый редуктор и автоматическую систему переключения с первой передачи на вторую. Планетарный редуктор состоит из ведущего вала (1),...
Тип: Изобретение
Номер охранного документа: 0002486389
Дата охранного документа: 27.06.2013
10.07.2013
№216.012.54c6

Тригенерационная установка на базе микротурбинного двигателя

Изобретение относится к области теплоэнергетики и энергосбережения, предназначено для одновременной выработки электрической, тепловой энергий и низкотемпературного носителя. Тригенерационная установка на базе микротурбинного двигателя включает в себя компрессор, камеру сгорания топлива, газовую...
Тип: Изобретение
Номер охранного документа: 0002487305
Дата охранного документа: 10.07.2013
10.08.2013
№216.012.5c59

Пресс-гранулятор

Изобретение относится к прессовому оборудованию для гранулирования предварительно измельченных материалов растительного, животного и минерального происхождения. Пресс-гранулятор содержит смонтированную на планшайбе активную кольцевую матрицу, в которой размещены пассивные прессующие ролики,...
Тип: Изобретение
Номер охранного документа: 0002489262
Дата охранного документа: 10.08.2013
10.08.2013
№216.012.5d3c

Способ определения бактерицидных свойств сыворотки крови

Изобретение относится к области биомедицинских измерительных технологий. Сущностью изобретения является количественная оценка воздействия сыворотки крови человека или животных на лабораторный штамм Bacillus subtilis ВКПМ В-10548, эффективно экспрессирующий luxAB-гены грамотрицательного морского...
Тип: Изобретение
Номер охранного документа: 0002489489
Дата охранного документа: 10.08.2013
20.08.2013
№216.012.5efa

Линия производства экструдированных комбикормов

Изобретение относится к переработке вторичных материальных ресурсов и отходов агропромышленного комплекса и может быть использовано в производстве экструдированных комбикормов и кормовых добавок. Линия включает экструдер, сушилку, две емкости для лузги и мучнистого сырья с дозаторами, бункера...
Тип: Изобретение
Номер охранного документа: 0002489946
Дата охранного документа: 20.08.2013
20.08.2013
№216.012.5efb

Установка для исследования поведения экструдируемого пластического материала при изменяющейся температуре

Изобретение относится к области экструдирования материалов растительного происхождения и может быть использовано для определения свойств экструдируемых и гранулируемых древесных опилок и компонентов комбикормов. Установка включает цилиндрическую камеру предварительного сжатия прессуемого...
Тип: Изобретение
Номер охранного документа: 0002489947
Дата охранного документа: 20.08.2013
20.08.2013
№216.012.60c5

Трехшарнирная рама для сейсмостойкого строительства

Изобретение относится к области строительства, а именно к трехшарнирным рамам зданий, возводимых в сейсмических районах. Техническим результатом изобретения является повышение эксплуатационной надежности рамы. Трехшарнирная рама включает симметрично расположенные два ригеля, две стойки и два...
Тип: Изобретение
Номер охранного документа: 0002490405
Дата охранного документа: 20.08.2013
27.08.2013
№216.012.62cc

Способ производства комбикорма

Изобретение относится к области кормопроизводства, в частности к способам получения экструдированных комбикормов из отходов растительного сырья, и может быть использовано на комбикормовых предприятиях и в животноводческих хозяйствах. Способ производства комбикорма включает обработку зернового...
Тип: Изобретение
Номер охранного документа: 0002490929
Дата охранного документа: 27.08.2013
27.08.2013
№216.012.63bd

Пресс-экструдер

Изобретение относится к оборудованию для экструдирования сырья, состоящего из нескольких компонентов, и предназначено для использования в перерабатывающих отраслях. Пресс-экструдер содержит цилиндр с загрузочным отверстием и размещенный в цилиндре шнек с лопастями и выходной матрицей с...
Тип: Изобретение
Номер охранного документа: 0002491170
Дата охранного документа: 27.08.2013
+ добавить свой РИД