×
10.04.2019
219.017.0546

Результат интеллектуальной деятельности: СПОСОБ СЕГМЕНТАЦИИ ТЕКСТА ПО ЦВЕТОВОМУ ПРИЗНАКУ В ПРОЦЕССЕ КОПИРОВАНИЯ

Вид РИД

Изобретение

№ охранного документа
0002368007
Дата охранного документа
20.09.2009
Аннотация: Изобретение относится к цифровой обработке изображения в процессе сканирования и копирования и особенно к области сегментации цветного и черно-белого текста, когда текст автоматически извлекается из отсканированного документа. Техническим результатом является универсальный подход к предварительной обработке исходного документа, обеспечивающий ускоренную печать копии и экономию ресурсов МФУ. В соответствии с настоящим изобретением способ сегментации текста по цветовому признаку заключается в выполнении следующих операций: разбивают исходное изображение на неперекрывающиеся блоки пикселей; формируют новое изображение Z, в котором каждый пиксел представляет собой соответствующий блок исходного изображения; выбирают в процессе сканирования последовательные блоки из исходного изображения; выполняют для текущего блока классификацию по признаку «монохромный/цветной» в пространстве противоположных цветов; разбивают исходный цветной блок RGB на монохромные блоки R, G и В; применяют детектор краев лапласиан гауссиана с заданным порогом Т к монохромному блоку; вычисляют число краев для каждого пикселя в Z; выполняют классификацию «текстовый/нетекстовый блок» путем сопоставления числа краев с заданным порогом С; объединяют классифицированные каналы, используя логический оператор ИЛИ. 3 з.п. ф-лы, 3 ил.

Изобретение относится к цифровой обработке изображения в процессе сканирования и копирования и особенно к области сегментации цветного и черно-белого текста, когда текст автоматически извлекается из отсканированного документа.

Основной набор процедур, которые выполняет копировальная техника, в частности Многофункциональное Цифровое Устройство (МФУ) или, иными словами, Многофункциональный Принтер (МФП), включает в себя получение отсканированных изображений от сканнера, обработку изображений и отправку их на встроенный принтер для печати. МФУ должно быть в состоянии обрабатывать различные виды оригиналов. Эти оригиналы могут иметь различное содержание, такое как текст, диаграммы, графику, фотографии; они могут быть напечатаны на различных носителях, например на бумаге различного качества; они могут быть созданы с использованием других методов, таких, например, как полутоновые или полноцветные изображения. Эти разные виды оригиналов могут при копировании подвергаться различным воздействиям в зависимости от возможностей и ограничений, имеющихся у конкретного МФУ, в частности, на копии могут появляться полосы, рассеянный свет, паразитное окрашивание, смещение объектов, изменение спектра, появления муара и т.д. При этом даже фиксированные установки параметров копирования приводят к различному качеству репродукции в зависимости от вида оригинала. Для решения этой проблемы и получения репродукций в соответствии с предпочтениями пользователя необходимо предусмотреть возможность адаптации процедур, выполняемых МФУ.

Широко распространенным подходом к решению этой проблемы является разработка алгоритмов, позволяющих управлять процедурой копирования в МФУ. Многие алгоритмы такого рода основываются на сегментации страницы и индексации каждого сегментированного участка в соответствии со специальной классификацией. Эти алгоритмы требуют одновременного доступа ко всему изображению страницы и предусматривают многократный анализ каждого пикселя. С другой стороны, любой алгоритм, применяющийся к процедуре копирования, должен быть способен обрабатывать изображение поблочно и не повторять обработку ранее обработанных блоков. Это требование практически невыполнимо на основе применения известных методов.

С другой стороны, очень важно определить цветовые параметры оригинала, поскольку, например, отнесение (классификация) изображения к черно-белым оригиналам позволило бы упростить процедуру его обработки и печати, в частности, появляется возможность использовать только картридж с черной краской и сэкономить другие краски не в ущерб качеству. Различные варианты применения классификации при обработке документов описаны в патентной литературе.

Так, патент США №6972866 [1], являющийся аналогом заявляемого изобретения, описывает способ классификации пикселей в одну из двух категорий: - к первой из которых относят монохромные пиксели, а к другой - цветные пиксели. Цвет каждого из пикселов представлен соответствующим цветовым индексом в цветовом пространстве L'a'b'. Средний цветовой индекс определяется как функция цветовых индексов пикселей в группе.

Выложенная заявка на патент США №20020081023 [2], являющаяся аналогом-прототипом заявляемого изобретения, раскрывает способ выявления цвета текста для обработки изображения в копировальном устройстве. В рамках этого способа предусмотрена поблочная обработка данных вводимого изображения путем отбора блоков вместо попиксельной обработки. Согласно этому изобретению объекты на исходном изображении выявляются путем отбора блоков и подразделяются на две категории: «текст» или «не текст». Затем для каждого текстового объекта определяют цвет переднего плана, используя данные текста переднего плана. После сбора данных о переднем плане вычисляют усредненный цвет переднего плана в некотором цветовом пространстве, например в пространстве L'a'b'. Используя информацию об усредненном цвете, определяют, является ли текстовый объект черно-белым или нет.

Общим недостатком упомянутых аналогов является то, что каждый из них решает только часть задачи, заключающейся в повышении эффективности обработки и распечатки документов со смешанным содержанием, т.е. с текстом и графикой.

Задача, на решение которой направлено заявляемое изобретение, состоит в том, чтобы разработать универсальный подход к предварительной обработке исходного документа, обеспечивающий ускоренную печать копии и экономию ресурсов МФУ.

Основной технический результат достигается за счет внедрения усовершенствованного способа сегментации текста по цветовому признаку в процессе копирования, причем заявляемый способ предусматривает выполнение следующих операций:

- исходное изображение разбивают на неперекрывающиеся блоки пикселей;

- формируют новое изображение Z, в котором каждый пиксел представляет собой соответствующий блок исходного изображения;

- последовательно выбирают в процессе сканирования блоки исходного изображения;

- выполняют классификацию для текущего блока по признаку «монохромный/цветной» в пространстве противоположных цветов;

- разбивают исходный цветной блок RGB на монохромные блоки R, G и В;

- применяют детектор краев лапласиан гауссиана с заданным порогом Т к монохромному блоку;

- вычисляют число краев для каждого пикселя в Z;

- выполняют классификацию «текстовый/нетекстовый блок» путем сопоставления числа краев с заданным порогом С;

- объединяют классифицированные каналы, используя логический оператор ИЛИ.

Для оптимального функционирования заявляемого способа важно, чтобы в процессе классификации по признаку «монохромный/цветной» выполняли следующие операции:

- преобразуют изображение из цветового пространства RGB в изображение, представленное в пространстве противоположных цветов;

- классифицируют пиксели как монохромные или цветные по признаку отдаленности от оси интенсивности в пространстве противоположных цветов;

- формируют блоки пикселей путем разбиения изображения на неперекрывающиеся квадраты;

- рассчитывают цветовую насыщенность блока пикселей как сумму расстояний для всех пикселей, принадлежащих этому блоку;

- задают порог цветовой насыщенности с учетом результатов обучения по обучающей выборке;

- классифицируют изображение как цветное, если цветовая насыщенность превышает заданный порог;

- классифицируют изображение как монохромное, если цветовая насыщенность не превышает заданный порог.

Для оптимального функционирования заявляемого способа целесообразно, чтобы сегментацию текста по признаку «монохромный/цветной» выполняли по отдельным R, G, В каналам.

Для оптимального функционирования заявляемого способа имеет смысл, чтобы сегментацию текста выполняли на произвольном цветном фоне.

Для лучшего понимания существа заявляемого изобретения далее приводится детальное описание выполняемой последовательности операций с привлечением графических материалов.

Фиг.1. Блок-схема алгоритма выполнения классификации по признаку «монохромное/цветное».

Фиг.2. Блок-схема алгоритма выполнения классификации по признаку «текст/не текст».

Фиг.3. Выявление текста на изображении документа.

Заявляемый способ реализуется путем выполнения следующих этапов:

- определение монохромности изображения выполняется в пространстве противоположных цветов L'a'b' [3], которое задается тремя каналами - интенсивности L' и цвета а' и b':

L'=(R+G+B)/3

- положение точки вдоль оси L' представляет различные уровни интенсивности серого. Монохромный пиксел определяется как

цветной пиксел определяется как

где а'2+b'2 представляет квадрат расстояния от оси L' до любой точки (а', b') вдоль оси L' и определяет расстояние или порог от оси L', выше которого пиксел рассматривается цветным. Функция T(L') представляет цилиндр. Следовательно, все точки в цветовом пространстве L'a'b' лежащие внутри этого цилиндра рассматриваются как монохромные; все точки вне цилиндра рассматриваются как цветные.

Цветовая насыщенность С(В) блока пикселей В определяется как сумма расстояний для всех пикселей, которые принадлежат блоку В. Изображение классифицируется как цветное, если С(В) больше чем порог и изображение классифицируется как монохромное в противном случае. Порог определяется из обучающей выборки.

Фиг.1 представляет блок-схему алгоритма выполнения классификации по признаку «монохромное/цветное». В 101 выполняется выбор блока в процессе сканирования документа. В 102 выполняется классификация блока по признаку «монохромное/цветное». Если изображение монохромное, в 103 блоку присваивается метка «монохромное». Если изображение монохромное, в 104 выполняется классификация блока по признаку «текст/не текст». Если изображение цветное, в 105 блоку присваивается метка «цветное». В 106 выполняется разбиение RGB на отдельные R, G и В изображения. В 107 выполняется классификация каждого R, G и В изображения по признаку «текст/не текст». В 108 выполняется объединение классифицированных R, G и В изображений, используя логическое «ИЛИ».

Фиг.2 представляет блок-схему алгоритма выполнения классификации по признаку «текст/не текст». В 201 выполняется получение выбранного блока в процессе сканирования документа. В 202 блок обрабатывается с помощью детектора краев лапласиан гауссиана. В 203 выполняется вычисление числа краев в блоке. В 204 проверяется, превышает ли число краев заданный порог С. Если да, в 205 блок классифицируется как «текст» и ему присваивается метка «текст». Если нет, в 206 блок классифицируется как «не текст» и ему присваивается метка «не текст».

Фиг.3. представляет результаты выявления текста на изображении документа. Выявленные текстовые области помечены серым цветом.

Заявляемый способ промышленно применим для цифровой обработки изображения в процессе сканирования и копирования, в частности, при сегментации цветного и черно-белого текста, когда текст автоматически извлекается из отсканированного документа, например, в многофункциональных цифровых устройствах.

Источники информации

1. Патент США №6972866.

2. Выложенная заявка на патент США №20020081023.

3. К.Dabov, A.Foi, V.Katkovnik, and К.Egiazarian, "Image denoising by sparse 3D transform-domain collaborative filtering," IEEE Trans. Image Process., vol.16, no.8, pp.2080-2095, August 2007.

Источник поступления информации: Роспатент

Показаны записи 11-20 из 20.
10.04.2019
№219.017.046b

Система и способ формирования справки

Изобретение относится к вычислительной технике, к устройствам и способам обработки данных, а более конкретно к системам и способам формирования справки, и может быть использовано для формирования справки в компьютерных приложениях. Техническим результатом является уменьшение трудоемкости и...
Тип: Изобретение
Номер охранного документа: 0002370811
Дата охранного документа: 20.10.2009
29.04.2019
№219.017.4106

Система и способ оповещения о проблемах в работе многофункционального периферийного устройства

Изобретение относится к области радиоэлектроники, в частности к устройствам, позволяющим осуществлять выявление и контроль ошибок в работе многофункционального периферийного устройства (МФП). Техническим результатом является повышение эффективности работы и удобство использования МФП. Указанный...
Тип: Изобретение
Номер охранного документа: 0002310904
Дата охранного документа: 20.11.2007
29.04.2019
№219.017.4271

Объектив с переменным фокусным расстоянием

Объектив включает расположенные по ходу распространения излучения вдоль оптической оси объектива первую и вторую группы оптических элементов, апертурную диафрагму, третью, четвертую и пятую группы оптических элементов, оптический низкочастотный фильтр и датчик изображения. Пятая группа...
Тип: Изобретение
Номер охранного документа: 0002330315
Дата охранного документа: 27.07.2008
29.04.2019
№219.017.4308

Цифроаналоговый преобразователь

Цифроаналоговый преобразователь, содержащий несколько источников тока и такое же число дифференциальных усилителей, каждый из которых соединен с одним источником тока и выполнен с возможностью питания от данного источника тока, причем выходы дифференциальных усилителей соединены, отличающийся...
Тип: Изобретение
Номер охранного документа: 0002360359
Дата охранного документа: 27.06.2009
09.05.2019
№219.017.4cab

Проекционная оптическая система

Проекционная оптическая система, содержащая: предмет, в виде пространственного модулятора света, смещенный относительно оптической оси системы на расстояние, не меньшее половины размера самого предмета; набор вращательно-симметричных оптических элементов, имеющих общую ось симметрии,...
Тип: Изобретение
Номер охранного документа: 0002315344
Дата охранного документа: 20.01.2008
09.05.2019
№219.017.4e50

Устройство и способ обработки цвета видеоизображения в режиме реального времени

Изобретение относится к обработке видеоизображения в режиме реального времени. Техническим результатом является увеличение глубины цвета изображения с одновременным удалением ложных контуров в режиме реального времени. Технический результат достигается тем, что блок увеличения битовой глубины...
Тип: Изобретение
Номер охранного документа: 0002324299
Дата охранного документа: 10.05.2008
29.05.2019
№219.017.65d7

Система и способ редактирования изображения

Изобретение относится к системам и способам редактирования изображения. Техническим результатом является создание более простой системы и менее трудоемкого способа редактирования изображения. Технический результат достигается тем, что система редактирования включает в себя соединенные шиной...
Тип: Изобретение
Номер охранного документа: 0002310912
Дата охранного документа: 20.11.2007
09.06.2019
№219.017.7c7c

Способ автоматического кадрирования фотографий

Изобретение относится к области цифровой фотографии. Техническим результатом является собственно создание усовершенствованного способа интеллектуального кадрирования и обрезки цифровых изображений для использования в автоматических устройствах обработки и печати. Предложен способ...
Тип: Изобретение
Номер охранного документа: 0002329535
Дата охранного документа: 20.07.2008
10.07.2019
№219.017.aeb9

Отражательная призма для поворота плоскости поляризации

Изобретение относится к отражательным призмам для поворота плоскости поляризации и может быть использовано в проекционных дисплеях и других оптических приборах. Отражательная призма для поворота плоскости поляризации изготовлена из оптически прозрачного материала и имеет форму прямоугольного...
Тип: Изобретение
Номер охранного документа: 0002321031
Дата охранного документа: 27.03.2008
10.07.2019
№219.017.aedc

Способ автоматической коррекции эффекта красных глаз

Изобретение относится к области фотографической техники, а более конкретно к способам обработки изображений, в частности к методам автоматической коррекции эффекта красных глаз. Технический результат заключается в обеспечении высокого качества автоматической коррекции эффекта красных глаз....
Тип: Изобретение
Номер охранного документа: 0002320011
Дата охранного документа: 20.03.2008
Показаны записи 21-27 из 27.
29.04.2019
№219.017.3f40

Система и способ коррекции темных оттенков на цифровых фотографиях

Изобретение относится к цифровой обработке изображений и может быть использовано в технике глобальной и локальной коррекции яркости цифровых фотографий. Технический результат заключается в отсутствии halo-эффекта. Сущность изобретения состоит в том, что система и способ коррекции темных...
Тип: Изобретение
Номер охранного документа: 0002298223
Дата охранного документа: 27.04.2007
29.04.2019
№219.017.418c

Способ адаптивного повышения резкости цифровых фотографий в процессе печати

Изобретение относится к области цифровой обработки изображений и конкретно к способам адаптивного повышения резкости фотоотпечатков. Техническим результатом изобретения является обеспечение более высокой степени адаптивности. Способ адаптивного повышения резкости цифровых фотографий в процессе...
Тип: Изобретение
Номер охранного документа: 0002383924
Дата охранного документа: 10.03.2010
29.05.2019
№219.017.65d7

Система и способ редактирования изображения

Изобретение относится к системам и способам редактирования изображения. Техническим результатом является создание более простой системы и менее трудоемкого способа редактирования изображения. Технический результат достигается тем, что система редактирования включает в себя соединенные шиной...
Тип: Изобретение
Номер охранного документа: 0002310912
Дата охранного документа: 20.11.2007
09.06.2019
№219.017.7c7c

Способ автоматического кадрирования фотографий

Изобретение относится к области цифровой фотографии. Техническим результатом является собственно создание усовершенствованного способа интеллектуального кадрирования и обрезки цифровых изображений для использования в автоматических устройствах обработки и печати. Предложен способ...
Тип: Изобретение
Номер охранного документа: 0002329535
Дата охранного документа: 20.07.2008
29.06.2019
№219.017.a078

Способ и система для снижения расхода краски при печати

Изобретение относится к области цифровой печати. Техническим результатом является снижение расхода краски при выводе текста или изображения на принтер. Результат достигается тем, что cистема для снижения расхода краски при печати посредством растеризации шрифтов включает в себя растеризатор...
Тип: Изобретение
Номер охранного документа: 0002405201
Дата охранного документа: 27.11.2010
10.07.2019
№219.017.aedc

Способ автоматической коррекции эффекта красных глаз

Изобретение относится к области фотографической техники, а более конкретно к способам обработки изображений, в частности к методам автоматической коррекции эффекта красных глаз. Технический результат заключается в обеспечении высокого качества автоматической коррекции эффекта красных глаз....
Тип: Изобретение
Номер охранного документа: 0002320011
Дата охранного документа: 20.03.2008
20.05.2023
№223.018.67b5

Способ и система измерения краевого угла смачивания

Использование: для измерения краевого угла смачивания для капли флюида на поверхности образца материала в окружении другого флюида. Сущность изобретения заключается в том, что образец материала, имеющий плоскую поверхность, помещают в рентгенопрозрачную ячейку, установленную на регулируемой...
Тип: Изобретение
Номер охранного документа: 0002794567
Дата охранного документа: 21.04.2023
+ добавить свой РИД