×
13.01.2017
217.015.8d98

Результат интеллектуальной деятельности: ВИЗУАЛИЗАЦИЯ МАШИННО-ГЕНЕРИРУЕМОГО ИЗОБРАЖЕНИЯ ДОКУМЕНТА

Вид РИД

Изобретение

№ охранного документа
0002604668
Дата охранного документа
10.12.2016
Аннотация: Изобретение относится к области оптического и интеллектуального распознавания символов. Технический результат - обеспечение визуализации результатов машинной интерпретации при помощи технологии оптического распознавания символов изображения документа посредством снабжения изображения документа визуально различимыми линейными идентификаторами. Способ сопровождения изображения документа средствами визуализации содержит: обнаружение структурных блоков или их фрагментов на изображении документа с использованием технологии оптического распознавания символов; снабжение обнаруженных на изображении документа структурных блоков или их фрагментов визуально различимыми линейными идентификаторами, где каждый линейный идентификатор несет указание на свойства содержимого соответствующего структурного блока или его фрагмента, обнаруженные в ходе машинной интерпретации изображения; отображение изображения документа, снабженного визуально различимыми линейными идентификаторами. 3 н. и 18 з.п. ф-лы, 3 ил.

УРОВЕНЬ ТЕХНИКИ

ОБЛАСТЬ ПРИМЕНЕНИЯ ИЗОБРЕТЕНИЯ

Настоящее изобретение относится к области оптического распознавания символов (OCR) и интеллектуального распознавания символов (ICR).

УРОВЕНЬ ТЕХНИКИ НАСТОЯЩЕГО ИЗОБРЕТЕНИЯ

Методы OCR/ICR по существу используются для преобразования изображений печатных документов в машиночитаемые и редактируемые форматы, а также для извлечения данных из документов. В процессе функционирования устройства с поддержкой OCR/ICR выполняют компьютеризованное сканирование документов и машинный анализ полученных сканированных изображений (т.е. файлов сканированных документов).

При отображении результатов машинного анализа устройства с поддержкой OCR/ICR, как правило, выявляют распознанные и нераспознанные фрагменты документов с использованием различных схем выделения. Однако различия в цветопередаче компьютерных дисплеев и принтеров, а также различия в восприятии цвета пользователями могут ограничивать объем выводимой информации с цветовым кодированием или приводить к ошибкам при интерпретации.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

Предложены методы визуализации машинно-генерируемого изображения документа. Изображение по существу получается при помощи устройств с поддержкой OCR/ICR. На изображении выявляются структурные блоки документа и дополняются линейными идентификаторами, которые обозначают свойства и состояния машинной интерпретации содержимого структурных блоков.

В приложениях такие идентификаторы (одиночные или множественные непрерывные, штриховые, пунктирные или штрихпунктирные линии, имеющие участки одинаковой или разной ширины, линии, образованные с использованием предварительно выбранных символов, и т.п.) используются для выборочного разделения, подчеркивания или штриховки по меньшей мере фрагментов структурных блоков.

В дополнительных вариантах реализации пользователям, работающим с изображением документа, предложены инструменты графического интерфейса пользователя (GUI), выполненные с возможностью применения дополнительных идентификаторов на машинно-генерируемом изображении или изменения/замены существующих идентификаторов. Впоследствии такие редакторские правки, выполненные пользователем, можно встроить в изображение документа.

Различные другие объекты и варианты реализации изобретения более подробно описаны ниже. Предполагается, что элементы одного варианта реализации изобретения могут быть использованы в других вариантах его реализации без дополнительного перечисления.

Раскрытие изобретения не представляет собой в полной мере и в полном объеме настоящее изобретение и не должно считаться таковым. Все объекты, элементы и преимущества настоящего изобретения будут очевидны из следующего подробного письменного описания и в соответствии с прилагаемыми рисунками.

Новые элементы, которые считаются характерными для описания, изложены в прилагаемых пунктах формулы изобретения.

Техническим результатом описанного ниже изобретения является визуализация результатов машинной интерпретации при помощи технологии оптического распознавания символов OCR/ICR изображения документа для пользователя путем снабжения входящего в систему изображения документа визуально различимыми линейными идентификаторами, каждый из которых несет указание на свойства содержимого соответствующего структурного блока или его фрагмента, обнаруженные в ходе машинной интерпретации изображения. В частности, обеспечивается визуализация результатов обработки документа таким образом, что на изображении выявляются структурные блоки документа и дополняются линейными идентификаторами, которые обозначают свойства содержимого структурных блоков. По существу, каждый идентификатор выборочно визуализирует конкретную характеристику машинной интерпретации документа, а доступность большого объема визуально различимых идентификаторов позволяет предоставить пользователям, просматривающим изображение, подробную информацию о результатах этого процесса.

КРАТКОЕ ОПИСАНИЕ РИСУНКОВ

На Фиг.1 представлена схема, на которой показан способ визуализации машинно-генерируемого изображения документа в соответствии с одним вариантом реализации настоящего изобретения.

На Фиг.2 представлен пример машинно-генерируемого изображения, на котором показан способ, изображенный на Фиг.1, в соответствии с одним вариантом реализации настоящего изобретения.

На Фиг.3 представлен пример компьютерной платформы, на которой используется способ, изображенный на Фиг.1, в соответствии с одним вариантом реализации настоящего изобретения.

Изображения на рисунках представлены в упрощенном виде для целей иллюстрации и приведены без соблюдения масштаба.

Для облегчения понимания на рисунках по возможности используются идентичные номера позиций для обозначения, где это возможно, идентичных элементов на рисунках, за исключением того, что к ним могут быть добавлены буквенно-цифровые дополнительные элементы и/или суффиксы, если это необходимо, для разграничения таких элементов.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

Объекты, элементы и преимущества настоящего изобретения описаны ниже в отношении средства визуализации машинно-генерируемых изображений печатных документов, анализируемых с использованием устройств с поддержкой OCR/ICR. Предполагается, что по меньшей мере фрагменты настоящего изобретения также могут использоваться для визуализации свойств или редактирования других типов документов или их изображений (например, компьютерной графики, документов после машинного перевода и т.п.).

На Фиг.1 представлена схема, на которой показан способ 100 визуализации машинно-генерируемого изображения документа в соответствии с одним вариантом реализации настоящего изобретения, а на Фиг.2 представлен пример машинно-генерируемого изображения 200, на котором показан способ, изображенный на Фиг.1. Для лучшего понимания изобретения рекомендовано рассматривать Фиг.1 и 2 одновременно.

Способ 100 начинается с этапа 102 и переходит к этапу 110.

На этапе 110 формируется машинно-генерируемое изображение документа (например, печатного документа). Как правило, изображение формируется с использованием компьютеризованного сканирования документа, выполняемого с использованием устройства с поддержкой OCR/ICR, и включает в себя результаты «машинного анализа» файла сканированного документа на компьютере. Затем изображение предлагается пользователю (-ям) для визуального осмотра в форме одного или нескольких изображений на экране, снимков экрана или их распечатки (-ок).

Как правило, в процессе машинного анализа файла сканированного документа на компьютере генерируется изображение, в котором содержимое документа представлено в форме отдельных структурных или логических блоков. Такой процесс описан, например, в патенте Соединенных Штатов Америки №8,260,049 В2, выданном 4 сентября 2012 г. и принадлежащем тому же правообладателю.

Фрагменты структурных блоков могут быть представлены в монохромном (например, черно-белом, сине-белом и т.д.) или многоцветном форматах, а также могут быть обеспечены другими элементами форматирования для разделения конкретных текстовых и графических элементов документа. В некоторых вариантах реализации изображение также может включать в себя машинно-генерируемые примечания, которые помогают пользователям (например, просматривающим изображение) оценить точность машинного анализа документа или его конкретных структурных блоков.

На Фиг.2 представлен пример машинно-генерируемого изображения 200 сканированного и интерпретированного компьютером документа, которое включает в себя структурные блоки 210, 220, 230, 240 и 250. Для иллюстрации показано, что структурные блоки 210, 220, 230 и 240 представляют собой преимущественно структурные блоки с текстом (например, заголовок, реферат, таблица, верхний колонтитул, нижний колонтитул и т.д.) сканированного документа (конкретные текстовые объекты структурных блоков не показаны для целей ясности), а структурный блок 250 содержит графический/изображаемый объект 256.

На этапе 120 машинно-генерируемое изображение документа (например, изображение 200) представлено с линейными идентификаторами свойств и результатов машинного анализа (т.е. интерпретацией файла сканирования, выполненной компьютерной программой OCR/ICR) содержимого структурных блоков документа. В отображаемом/распечатанном изображении документа такие идентификаторы могут применяться к структурным блокам или их фрагментам в форме отдельных линий, линий границ, линий подчеркивания, линий штриховки и т.п.

В различных вариантах реализации в качестве идентификаторов могут использоваться различные одиночные или множественные (например, включающие две или более параллельных ветвей) прямые или кривые линии, имеющие участки одинаковой или разной ширины, а также линии, образованные с использованием предварительно выбранных символов (например, «#», «*», «» и т.д.), или комбинации этих линий. Примеры одиночных и множественных линий, подходящих для использования в качестве идентификаторов, включают в себя, помимо прочих линий, образованных с использованием предварительно выбранных геометрических образцов, сплошные, волнистые, штриховые, пунктирные или штрихпунктирные линии, а также ломаные или зазубренные («зигзагообразные») линии. Количество таких визуально различимых линейных идентификаторов практически бесконечно. Таким образом, пользователи могут получать большие объемы информации о статусе машинного анализа сканированного документа.

По существу каждый идентификатор выборочно визуализирует конкретную характеристику или предварительно выбранный этап процесса машинной интерпретации документа, а доступность большого объема визуально различимых идентификаторов позволяет предоставить пользователям, просматривающим изображение, подробную информацию о результатах этого процесса. В вариантах реализации способа 100 количество, геометрические характеристики и значения используемых идентификаторов могут различаться, а пользователям также могут быть предоставлены списки (библиотеки) идентификаторов.

Помимо прочих результатов машинной интерпретации документа конкретные идентификаторы могут указывать на тип содержимого структурного блока (текст, таблица, графический элемент, рисунок и т.д.), направление чтения или ориентации символов текста, наличие текста, написанного на конкретных языках, степень уверенности в интерпретации содержимого. В дополнительных вариантах реализации пользователи могут выбрать геометрические параметры или внешний вид идентификаторов (например, типы или ширину линий и т.д.), а также их конфигурацию или положение на изображении документа. В частности, идентификаторы можно расположить рядом с одной или несколькими сторонами структурного блока или образовать из них замкнутые или в альтернативном варианте частично открытые линии границ, расположенные рядом с периферийными участками одного или нескольких структурных блоков. Например, два одинаковых или разных идентификатора могут быть расположены перпендикулярно друг другу для образования угловой границы рядом с, например, нижней и правой сторонами (или периферийными участками) структурного блока.

В предпочтительном варианте реализации цвет идентификаторов (т.е. цвет элементов линий, образующих соответствующие идентификаторы) является черным. Однако в альтернативных вариантах реализации все идентификаторы или их часть могут быть образованы с использованием линий одинакового (т.е. монохромные линии) или разных цветов с предварительно выбранными оттенками или яркостью, включая многоцветные линии и линии, элементы которых имеют разные цвета (например, линии, имеющие штрихи, точки и т.д. разных цветов). В частности, идентификаторы могут включать в себя линии, имеющие их фрагменты или конкретные элементы, представленные с использованием, например, черного, синего, красного, зеленого, желтого, оранжевого и других цветов, а также комбинаций таких цветов.

На Фиг.2 представлены структурные блоки 210, 220, 230, 240 и 250 с произвольно выбранными линейными идентификаторами, описанными выше на этапе 120 способа 100. Для иллюстрации в настоящем описании верхняя горизонтальная одиночная сплошная линия указывает на то, что содержимое структурного блока представляет собой текст, написанный на родном языке пользователя (идентификаторы 211, 221, 241), верхняя одиночная штрихпунктирная линия указывает на то, что содержимое структурного блока представляет собой текст, написанный на иностранном языке (идентификатор 231), вертикальная одиночная пунктирная линия указывает на то, что содержимое структурного блока представляет собой таблицу (идентификаторы 232, 242), вертикальная одиночная штриховая линия указывает на направление чтения текста или таблицы (идентификаторы 214, 224, 234, 244), подчеркивающая (нижняя) одиночная волнистая линия указывает на завершение интерпретации содержимого структурного блока (идентификаторы 223, 243), а подчеркивающая двойная штриховая линия указывает на то, что структурный блок представляет собой заголовок/подзаголовок (идентификатор 213).

Соответственно, вертикальная одиночная сплошная линия указывает на то, что результаты машинной интерпретации содержимого были проверены/утверждены (идентификаторы 212, 222), нижняя горизонтальная двойная сплошная линия указывает на запрос на ввод пользователем в процессе интерпретации содержимого структурного блока (идентификатор 233), двойная штрихпунктирная линия указывает на то, что содержимое структурного блока является графическим элементом (идентификаторы 251-254), а линии штриховки (идентификатор 255) указывают на площадь, занятую графическим/изображаемым объектом.

В одном варианте реализации после завершения этапа 120 способ 100 заканчивается на этапе 142. В альтернативном варианте реализации после завершения этапа 120 способ 100 выполняет необязательные этапы 130 и 140.

На необязательном этапе 130 пользователям, работающим с машинно-генерируемым изображением сканированного документа, предлагаются инструменты графического интерфейса пользователя (GUI), которые позволяют применять, изменять или заменять идентификаторы структурных блоков на отображаемом изображении документа. Такие инструменты редактирования GUI могут быть предложены пользователям компьютерного терминала, выполненного с возможностью обеспечивать редактирование отображаемого изображения в режиме реального времени.

На необязательном этапе 140 результаты выполненного пользователем редактирования машинно-генерируемого изображения документа (т.е. примененные, измененные или замененные идентификаторы) встраиваются в отображаемое изображение. В одном варианте реализации отредактированные пользователем версии изображения сохраняются и впоследствии используются в качестве его исправленных версий.

После завершения необязательного этапа 140 способ 100 заканчивается на этапе 142.

На Фиг.3 представлен пример компьютеризованной платформы 300, на которой используется способ 100, изображенный на Фиг.1, в соответствии с одним вариантом реализации настоящего изобретения. Специалисту в данной области будет понятно, что аппаратные и программные конфигурации, изображенные на Фиг.3, могут меняться.

Платформа 300 по существу включает в себя компьютер 310, периферийные устройства 340 (сканеры, дисплеи, принтеры и т.д.) и необязательно подключена к сети 340 (например, внутренней сети, локальной/глобальной сети (LAN/WAN) или сети Интернет). В качестве компьютера 310 может использоваться рабочая станция общего или специального назначения, стационарный или мобильный компьютер или мобильное устройство связи (например, карманный компьютер (PDA), мобильный телефон и т.п.).

Компьютер 310 по существу включает в себя процессор 312, память 314, вспомогательные системы 318, системный интерфейс 302 и контроллер ввода/вывода - 316, обеспечивающий возможность связи с периферийными устройствами 340 и сетью 350. В качестве компонентов компьютера 310 могут использоваться аппаратные устройства, программные модули, микропрограммное обеспечение или их комбинации.

В изображенном варианте реализации в модуле памяти 314 хранится операционная система (ОС) 320 (например, Microsoft Windows®, GNU®/Linux® и т.д.) и прикладные программы (т.е. программные продукты для компьютера) 322. В альтернативных вариантах реализации по меньшей мере фрагменты ОС 320 и прикладные программы 322 могут находиться на удаленном вычислительном устройстве (например, сервере в сети 350), соединенном с компьютером 310.

Прикладные программы 322 на компьютере 310 включают в себя программу (-ы) OCR/ICR 324. В число считываемых процессором команд, подаваемых программой (-ами) OCR/ICR 324, входят команды, исполнение которых приводит к выполнению компьютером 310 следующих действий: (i) определение структурных блоков на машинно-генерируемом изображении сканированного документа и (ii) снабжение изображения линейными идентификаторами свойств и состояний интерпретации содержимого структурных блоков.

Другие считываемые процессором команды, подаваемые программой (-ами) OCR/ICR 324, дополнительно определяют функции и элементы таких идентификаторов, а также их использование для визуализации машинно-генерируемого изображения документа, как описано выше в отношении способа 100. Считываемые процессором команды также необязательно или дополнительно предлагают пользователям компьютера 310 инструменты GUI, выполненные с возможностью редактировать идентификаторы, используемые в сканированных документах.

Объекты настоящего изобретения были описаны выше в отношении визуализации машинно-генерируемых изображений документов, сформированных с использованием методов на основе OCR/ICR, однако предполагается, что фрагменты данного изобретения могут быть альтернативно или дополнительно реализованы в виде отдельных программных продуктов или элементов других программных продуктов. Также предполагается, что все утверждения, в которых перечислены принципы, объекты, варианты реализации изобретения и его конкретные примеры, охватывают как структурные, так и функциональные эквиваленты изобретения.

Специалистам в данной области будет понятно, что в устройства, способы и программные продукты настоящего изобретения можно вносить различные изменения, не отклоняясь от сущности или объема изобретения. Таким образом, предполагается, что настоящее изобретение включает в себя изменения, которые находятся в рамках объема изобретения и его эквивалентов.


ВИЗУАЛИЗАЦИЯ МАШИННО-ГЕНЕРИРУЕМОГО ИЗОБРАЖЕНИЯ ДОКУМЕНТА
ВИЗУАЛИЗАЦИЯ МАШИННО-ГЕНЕРИРУЕМОГО ИЗОБРАЖЕНИЯ ДОКУМЕНТА
ВИЗУАЛИЗАЦИЯ МАШИННО-ГЕНЕРИРУЕМОГО ИЗОБРАЖЕНИЯ ДОКУМЕНТА
ВИЗУАЛИЗАЦИЯ МАШИННО-ГЕНЕРИРУЕМОГО ИЗОБРАЖЕНИЯ ДОКУМЕНТА
Источник поступления информации: Роспатент

Showing 31-40 of 69 items.
25.08.2017
№217.015.c462

Устройство для сбора и откачки нефтепродуктов из подземного горизонта

Изобретение относится к области охраны окружающей среды и может быть использовано для очистки подземных горизонтов от загрязнения нефтепродуктами. Устройство для сбора и откачки нефтепродуктов из подземного горизонта включает цилиндрическую камеру, выполненную в виде поплавка 1, погружной насос...
Тип: Изобретение
Номер охранного документа: 0002618311
Дата охранного документа: 03.05.2017
25.08.2017
№217.015.cda2

Оптическое распознавание символов серии изображений

Изобретение относится к технологиям оптического распознавания символов серий изображений с текстовыми символами. Техническим результатом является повышение качества оптического распознавания символов за счет определения порядка кластеров символьных последовательностей посредством определения...
Тип: Изобретение
Номер охранного документа: 0002619712
Дата охранного документа: 17.05.2017
25.08.2017
№217.015.d1c5

Устранение искривлений изображения документа

Изобретение относится к области распознавания символов. Технический результат заключается в повышении точности устранения искажений. Способ для устранения искривлений изображения документа включает: определение границ по меньшей мере фрагмента документа в исходном изображении, определение...
Тип: Изобретение
Номер охранного документа: 0002621601
Дата охранного документа: 06.06.2017
26.08.2017
№217.015.df39

Устройства и способы, которые порождают параметризованные символы для преобразования изображений документов в электронные документы

Группа изобретений относится к технологиям автоматической обработки изображений отсканированных документов, содержащих текст. Техническим результатом является повышение эффективности оптического распознавания символов текста на различных языках. Предложено устройство для реализации способа...
Тип: Изобретение
Номер охранного документа: 0002625020
Дата охранного документа: 11.07.2017
26.08.2017
№217.015.e0c7

Устройства и способы, которые строят иерархически упорядоченную структуру данных, содержащую непараметризованные символы, для преобразования изображений документов в электронные документы

Изобретение относится к автоматической обработке изображений отсканированных документов. Технический результат заключается в повышении точности преобразования печатных документов, содержащих текст на арабском языке и текст на других языках. Устройство, которое преобразует источники текста на...
Тип: Изобретение
Номер охранного документа: 0002625533
Дата охранного документа: 14.07.2017
26.08.2017
№217.015.e593

Определение последовательности команд вывода текста в pdf документах

Изобретение относится к области документов, содержащих текст. Техническим результатом является определение последовательности команд вывода текста в документах. Способ определения последовательности команд вывода текста в документах включает: получение устройством обработки документа, который...
Тип: Изобретение
Номер охранного документа: 0002626657
Дата охранного документа: 31.07.2017
26.08.2017
№217.015.e594

Способ и подсистема определения содержащих документ фрагментов цифрового изображения

Изобретение относится в обработке изображений. Технический результат заключается в обеспечении возможности определения содержащих документ фрагментов цифрового изображения. Такой результат достигается тем, что определяются контуры на цифровом изображении, выявленные контуры делятся на четыре...
Тип: Изобретение
Номер охранного документа: 0002626661
Дата охранного документа: 31.07.2017
26.08.2017
№217.015.e5e4

Способ и система определения ориентации изображения текста

Изобретение относится к способам и системам автоматического определения ориентации областей изображений отсканированных документов. Технический результат – обеспечение возможности преобразования в соответствующие электронные документы печатных документов, содержащих текст на неалфавитных...
Тип: Изобретение
Номер охранного документа: 0002626656
Дата охранного документа: 31.07.2017
26.08.2017
№217.015.e9d7

Способ и система определения протяженных контуров на цифровых изображениях

Изобретение относится к области обработки изображений. Технический результат – обеспечение определения на цифровых изображениях криволинейных и прямолинейных контуров. Подсистема обработки изображений включает: отдельный аппаратный уровень или аппаратный уровень, используемый совместно с...
Тип: Изобретение
Номер охранного документа: 0002628172
Дата охранного документа: 15.08.2017
26.08.2017
№217.015.eb68

Способ и система подготовки содержащих текст изображений к оптическому распознаванию символов

Группа изобретений относится к технологиям обработки изображений и оптическому распознаванию символов. Техническим результатом является расширение арсенала технических средств систем оптического распознавания текста. Предложена подсистема обработки изображений в составе устройства, прибора или...
Тип: Изобретение
Номер охранного документа: 0002628266
Дата охранного документа: 15.08.2017
Showing 31-40 of 55 items.
26.08.2017
№217.015.e0c7

Устройства и способы, которые строят иерархически упорядоченную структуру данных, содержащую непараметризованные символы, для преобразования изображений документов в электронные документы

Изобретение относится к автоматической обработке изображений отсканированных документов. Технический результат заключается в повышении точности преобразования печатных документов, содержащих текст на арабском языке и текст на других языках. Устройство, которое преобразует источники текста на...
Тип: Изобретение
Номер охранного документа: 0002625533
Дата охранного документа: 14.07.2017
26.08.2017
№217.015.e593

Определение последовательности команд вывода текста в pdf документах

Изобретение относится к области документов, содержащих текст. Техническим результатом является определение последовательности команд вывода текста в документах. Способ определения последовательности команд вывода текста в документах включает: получение устройством обработки документа, который...
Тип: Изобретение
Номер охранного документа: 0002626657
Дата охранного документа: 31.07.2017
26.08.2017
№217.015.e594

Способ и подсистема определения содержащих документ фрагментов цифрового изображения

Изобретение относится в обработке изображений. Технический результат заключается в обеспечении возможности определения содержащих документ фрагментов цифрового изображения. Такой результат достигается тем, что определяются контуры на цифровом изображении, выявленные контуры делятся на четыре...
Тип: Изобретение
Номер охранного документа: 0002626661
Дата охранного документа: 31.07.2017
26.08.2017
№217.015.e5e4

Способ и система определения ориентации изображения текста

Изобретение относится к способам и системам автоматического определения ориентации областей изображений отсканированных документов. Технический результат – обеспечение возможности преобразования в соответствующие электронные документы печатных документов, содержащих текст на неалфавитных...
Тип: Изобретение
Номер охранного документа: 0002626656
Дата охранного документа: 31.07.2017
26.08.2017
№217.015.e9d7

Способ и система определения протяженных контуров на цифровых изображениях

Изобретение относится к области обработки изображений. Технический результат – обеспечение определения на цифровых изображениях криволинейных и прямолинейных контуров. Подсистема обработки изображений включает: отдельный аппаратный уровень или аппаратный уровень, используемый совместно с...
Тип: Изобретение
Номер охранного документа: 0002628172
Дата охранного документа: 15.08.2017
26.08.2017
№217.015.eb68

Способ и система подготовки содержащих текст изображений к оптическому распознаванию символов

Группа изобретений относится к технологиям обработки изображений и оптическому распознаванию символов. Техническим результатом является расширение арсенала технических средств систем оптического распознавания текста. Предложена подсистема обработки изображений в составе устройства, прибора или...
Тип: Изобретение
Номер охранного документа: 0002628266
Дата охранного документа: 15.08.2017
29.12.2017
№217.015.fac1

Способ и устройство для определения пригодности документа для оптического распознавания символов (ocr) на сервере

Изобретение относится к средствам анализа цифрового изображения документа в вычислительной системе. Технический результат заключается в расширении арсенала технических средств анализа цифрового изображения документа. Вычислительная система, включающая: электронное устройство пользователя;...
Тип: Изобретение
Номер охранного документа: 0002640296
Дата охранного документа: 27.12.2017
29.12.2017
№217.015.fb11

Способы и системы эффективного автоматического распознавания символов

Изобретение относится к компьютерной технике для распознавания символов. Технический результат заключается в повышении эффективности оптического распознавания символов. Технический результат достигается за счет обнаружения изображений символов в отсканированном изображении, содержащем текст;...
Тип: Изобретение
Номер охранного документа: 0002640322
Дата охранного документа: 27.12.2017
29.12.2017
№217.015.fe63

Способ определения приоритета задач, находящихся в очереди серверной системы

Изобретение относится к области определения приоритета задач в очереди, обрабатываемой локальной или облачной серверной системой. Техническим результатом является определение приоритета множества задач от множества пользователей по меньшей мере для одного процессора. Способ определения...
Тип: Изобретение
Номер охранного документа: 0002638635
Дата охранного документа: 14.12.2017
19.01.2018
№218.016.065e

Способы и устройства, которые преобразуют изображения документов в электронные документы с использованием trie-структуры данных, содержащей непараметризованные символы для определения слов и морфем на изображении документа

Изобретение относится к способам и устройствам преобразования изображений документов, содержащих текст на арабском языке и текст на других языках, в которых символы, соединяясь вместе, образуют слитные слова и фрагменты слов, в соответствующие электронные документы. Технический результат –...
Тип: Изобретение
Номер охранного документа: 0002631168
Дата охранного документа: 19.09.2017
+ добавить свой РИД