×
10.04.2019
219.017.0546

СПОСОБ СЕГМЕНТАЦИИ ТЕКСТА ПО ЦВЕТОВОМУ ПРИЗНАКУ В ПРОЦЕССЕ КОПИРОВАНИЯ

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
№ охранного документа
0002368007
Дата охранного документа
20.09.2009
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится к цифровой обработке изображения в процессе сканирования и копирования и особенно к области сегментации цветного и черно-белого текста, когда текст автоматически извлекается из отсканированного документа. Техническим результатом является универсальный подход к предварительной обработке исходного документа, обеспечивающий ускоренную печать копии и экономию ресурсов МФУ. В соответствии с настоящим изобретением способ сегментации текста по цветовому признаку заключается в выполнении следующих операций: разбивают исходное изображение на неперекрывающиеся блоки пикселей; формируют новое изображение Z, в котором каждый пиксел представляет собой соответствующий блок исходного изображения; выбирают в процессе сканирования последовательные блоки из исходного изображения; выполняют для текущего блока классификацию по признаку «монохромный/цветной» в пространстве противоположных цветов; разбивают исходный цветной блок RGB на монохромные блоки R, G и В; применяют детектор краев лапласиан гауссиана с заданным порогом Т к монохромному блоку; вычисляют число краев для каждого пикселя в Z; выполняют классификацию «текстовый/нетекстовый блок» путем сопоставления числа краев с заданным порогом С; объединяют классифицированные каналы, используя логический оператор ИЛИ. 3 з.п. ф-лы, 3 ил.
Реферат Свернуть Развернуть

Изобретение относится к цифровой обработке изображения в процессе сканирования и копирования и особенно к области сегментации цветного и черно-белого текста, когда текст автоматически извлекается из отсканированного документа.

Основной набор процедур, которые выполняет копировальная техника, в частности Многофункциональное Цифровое Устройство (МФУ) или, иными словами, Многофункциональный Принтер (МФП), включает в себя получение отсканированных изображений от сканнера, обработку изображений и отправку их на встроенный принтер для печати. МФУ должно быть в состоянии обрабатывать различные виды оригиналов. Эти оригиналы могут иметь различное содержание, такое как текст, диаграммы, графику, фотографии; они могут быть напечатаны на различных носителях, например на бумаге различного качества; они могут быть созданы с использованием других методов, таких, например, как полутоновые или полноцветные изображения. Эти разные виды оригиналов могут при копировании подвергаться различным воздействиям в зависимости от возможностей и ограничений, имеющихся у конкретного МФУ, в частности, на копии могут появляться полосы, рассеянный свет, паразитное окрашивание, смещение объектов, изменение спектра, появления муара и т.д. При этом даже фиксированные установки параметров копирования приводят к различному качеству репродукции в зависимости от вида оригинала. Для решения этой проблемы и получения репродукций в соответствии с предпочтениями пользователя необходимо предусмотреть возможность адаптации процедур, выполняемых МФУ.

Широко распространенным подходом к решению этой проблемы является разработка алгоритмов, позволяющих управлять процедурой копирования в МФУ. Многие алгоритмы такого рода основываются на сегментации страницы и индексации каждого сегментированного участка в соответствии со специальной классификацией. Эти алгоритмы требуют одновременного доступа ко всему изображению страницы и предусматривают многократный анализ каждого пикселя. С другой стороны, любой алгоритм, применяющийся к процедуре копирования, должен быть способен обрабатывать изображение поблочно и не повторять обработку ранее обработанных блоков. Это требование практически невыполнимо на основе применения известных методов.

С другой стороны, очень важно определить цветовые параметры оригинала, поскольку, например, отнесение (классификация) изображения к черно-белым оригиналам позволило бы упростить процедуру его обработки и печати, в частности, появляется возможность использовать только картридж с черной краской и сэкономить другие краски не в ущерб качеству. Различные варианты применения классификации при обработке документов описаны в патентной литературе.

Так, патент США №6972866 [1], являющийся аналогом заявляемого изобретения, описывает способ классификации пикселей в одну из двух категорий: - к первой из которых относят монохромные пиксели, а к другой - цветные пиксели. Цвет каждого из пикселов представлен соответствующим цветовым индексом в цветовом пространстве L'a'b'. Средний цветовой индекс определяется как функция цветовых индексов пикселей в группе.

Выложенная заявка на патент США №20020081023 [2], являющаяся аналогом-прототипом заявляемого изобретения, раскрывает способ выявления цвета текста для обработки изображения в копировальном устройстве. В рамках этого способа предусмотрена поблочная обработка данных вводимого изображения путем отбора блоков вместо попиксельной обработки. Согласно этому изобретению объекты на исходном изображении выявляются путем отбора блоков и подразделяются на две категории: «текст» или «не текст». Затем для каждого текстового объекта определяют цвет переднего плана, используя данные текста переднего плана. После сбора данных о переднем плане вычисляют усредненный цвет переднего плана в некотором цветовом пространстве, например в пространстве L'a'b'. Используя информацию об усредненном цвете, определяют, является ли текстовый объект черно-белым или нет.

Общим недостатком упомянутых аналогов является то, что каждый из них решает только часть задачи, заключающейся в повышении эффективности обработки и распечатки документов со смешанным содержанием, т.е. с текстом и графикой.

Задача, на решение которой направлено заявляемое изобретение, состоит в том, чтобы разработать универсальный подход к предварительной обработке исходного документа, обеспечивающий ускоренную печать копии и экономию ресурсов МФУ.

Основной технический результат достигается за счет внедрения усовершенствованного способа сегментации текста по цветовому признаку в процессе копирования, причем заявляемый способ предусматривает выполнение следующих операций:

- исходное изображение разбивают на неперекрывающиеся блоки пикселей;

- формируют новое изображение Z, в котором каждый пиксел представляет собой соответствующий блок исходного изображения;

- последовательно выбирают в процессе сканирования блоки исходного изображения;

- выполняют классификацию для текущего блока по признаку «монохромный/цветной» в пространстве противоположных цветов;

- разбивают исходный цветной блок RGB на монохромные блоки R, G и В;

- применяют детектор краев лапласиан гауссиана с заданным порогом Т к монохромному блоку;

- вычисляют число краев для каждого пикселя в Z;

- выполняют классификацию «текстовый/нетекстовый блок» путем сопоставления числа краев с заданным порогом С;

- объединяют классифицированные каналы, используя логический оператор ИЛИ.

Для оптимального функционирования заявляемого способа важно, чтобы в процессе классификации по признаку «монохромный/цветной» выполняли следующие операции:

- преобразуют изображение из цветового пространства RGB в изображение, представленное в пространстве противоположных цветов;

- классифицируют пиксели как монохромные или цветные по признаку отдаленности от оси интенсивности в пространстве противоположных цветов;

- формируют блоки пикселей путем разбиения изображения на неперекрывающиеся квадраты;

- рассчитывают цветовую насыщенность блока пикселей как сумму расстояний для всех пикселей, принадлежащих этому блоку;

- задают порог цветовой насыщенности с учетом результатов обучения по обучающей выборке;

- классифицируют изображение как цветное, если цветовая насыщенность превышает заданный порог;

- классифицируют изображение как монохромное, если цветовая насыщенность не превышает заданный порог.

Для оптимального функционирования заявляемого способа целесообразно, чтобы сегментацию текста по признаку «монохромный/цветной» выполняли по отдельным R, G, В каналам.

Для оптимального функционирования заявляемого способа имеет смысл, чтобы сегментацию текста выполняли на произвольном цветном фоне.

Для лучшего понимания существа заявляемого изобретения далее приводится детальное описание выполняемой последовательности операций с привлечением графических материалов.

Фиг.1. Блок-схема алгоритма выполнения классификации по признаку «монохромное/цветное».

Фиг.2. Блок-схема алгоритма выполнения классификации по признаку «текст/не текст».

Фиг.3. Выявление текста на изображении документа.

Заявляемый способ реализуется путем выполнения следующих этапов:

- определение монохромности изображения выполняется в пространстве противоположных цветов L'a'b' [3], которое задается тремя каналами - интенсивности L' и цвета а' и b':

L'=(R+G+B)/3

- положение точки вдоль оси L' представляет различные уровни интенсивности серого. Монохромный пиксел определяется как

цветной пиксел определяется как

где а'2+b'2 представляет квадрат расстояния от оси L' до любой точки (а', b') вдоль оси L' и определяет расстояние или порог от оси L', выше которого пиксел рассматривается цветным. Функция T(L') представляет цилиндр. Следовательно, все точки в цветовом пространстве L'a'b' лежащие внутри этого цилиндра рассматриваются как монохромные; все точки вне цилиндра рассматриваются как цветные.

Цветовая насыщенность С(В) блока пикселей В определяется как сумма расстояний для всех пикселей, которые принадлежат блоку В. Изображение классифицируется как цветное, если С(В) больше чем порог и изображение классифицируется как монохромное в противном случае. Порог определяется из обучающей выборки.

Фиг.1 представляет блок-схему алгоритма выполнения классификации по признаку «монохромное/цветное». В 101 выполняется выбор блока в процессе сканирования документа. В 102 выполняется классификация блока по признаку «монохромное/цветное». Если изображение монохромное, в 103 блоку присваивается метка «монохромное». Если изображение монохромное, в 104 выполняется классификация блока по признаку «текст/не текст». Если изображение цветное, в 105 блоку присваивается метка «цветное». В 106 выполняется разбиение RGB на отдельные R, G и В изображения. В 107 выполняется классификация каждого R, G и В изображения по признаку «текст/не текст». В 108 выполняется объединение классифицированных R, G и В изображений, используя логическое «ИЛИ».

Фиг.2 представляет блок-схему алгоритма выполнения классификации по признаку «текст/не текст». В 201 выполняется получение выбранного блока в процессе сканирования документа. В 202 блок обрабатывается с помощью детектора краев лапласиан гауссиана. В 203 выполняется вычисление числа краев в блоке. В 204 проверяется, превышает ли число краев заданный порог С. Если да, в 205 блок классифицируется как «текст» и ему присваивается метка «текст». Если нет, в 206 блок классифицируется как «не текст» и ему присваивается метка «не текст».

Фиг.3. представляет результаты выявления текста на изображении документа. Выявленные текстовые области помечены серым цветом.

Заявляемый способ промышленно применим для цифровой обработки изображения в процессе сканирования и копирования, в частности, при сегментации цветного и черно-белого текста, когда текст автоматически извлекается из отсканированного документа, например, в многофункциональных цифровых устройствах.

Источники информации

1. Патент США №6972866.

2. Выложенная заявка на патент США №20020081023.

3. К.Dabov, A.Foi, V.Katkovnik, and К.Egiazarian, "Image denoising by sparse 3D transform-domain collaborative filtering," IEEE Trans. Image Process., vol.16, no.8, pp.2080-2095, August 2007.

Источник поступления информации: Роспатент

Showing 1-10 of 20 items.
27.02.2014
№216.012.a78a

Цифровой радиовещательный приемник (варианты) и способ обработки сигналов

Изобретение относится к цифровому радиовещательному приемнику и способу обработки сигналов, который может улучшать характеристики приема системы путем ввода известной последовательности в поток данных в системе частичного подавления боковой полосы (VSB) и последующей передачи потока данных с...
Тип: Изобретение
Номер охранного документа: 0002508605
Дата охранного документа: 27.02.2014
20.02.2019
№219.016.bd32

Способ оценки канала в многочастотных системах радиосвязи с несколькими передающими и приемными антеннами

Изобретение относится к области радиотехники, в частности к способам оценки канала в многочастотных системах радиосвязи с несколькими передающими и приемными антеннами. Технический результат состоит в повышении точности оценки канала в многочастотных системах радиосвязи с несколькими...
Тип: Изобретение
Номер охранного документа: 0002298286
Дата охранного документа: 27.04.2007
11.03.2019
№219.016.d717

Проекционный дисплей

Проекционный дисплей, включающий в себя корпус, внутри которого расположены проекционный экран, источник света, пространственный модулятор света, оптическая система и отражатель Френеля. Корпус имеет плоскую лицевую сторону, на которой расположен проекционный экран. Источник света выполнен с...
Тип: Изобретение
Номер охранного документа: 0002297657
Дата охранного документа: 20.04.2007
11.03.2019
№219.016.d925

Способ определения и сглаживания ступенчатых краев на изображении

Изобретение относится к способам обработки изображения, и в частности к сглаживанию ступенчатых краев на цифровом изображении. Техническим результатом является увеличение быстродействия обработки зашумленного изображения в реальном времени и повышение качества коррекции ступенчатых краев....
Тип: Изобретение
Номер охранного документа: 0002383055
Дата охранного документа: 27.02.2010
11.03.2019
№219.016.da68

Способ передачи обслуживания абонентских станций в беспроводной сети по стандарту ieee 802.16

Изобретение относится к области радиотехники, в частности к способу передачи обслуживания абонентских станций в беспроводной сети, и может быть использовано в беспроводных сетях по стандарту IEEE 802.16. Достигаемый технический результат - повышение эффективности беспроводной сети по стандарту...
Тип: Изобретение
Номер охранного документа: 0002307466
Дата охранного документа: 27.09.2007
11.03.2019
№219.016.dadc

Способ передачи голосовых данных в системе цифровой радиосвязи и способ перемежения последовательности кодовых символов (варианты)

Изобретение относится к области кодирования, в частности к системам для объединенного кодирования с исправлением и обнаружением ошибок с целью повышения эффективности использования спектра при передаче голосовых данных в цифровой системе связи. Согласно первому варианту перемежения...
Тип: Изобретение
Номер охранного документа: 0002323520
Дата охранного документа: 27.04.2008
20.03.2019
№219.016.e5a4

Устройство для подключения к компьютеру внешних устройств

Устройство для подключения к компьютеру внешних устройств включает в себя установленные в гнезде корпуса компьютера элементы в виде контейнера-переходника, внутри которого размещена приемная часть разъема USB. На одной из сторон контейнера закреплена упругая металлическая пластина-фиксатор...
Тип: Изобретение
Номер охранного документа: 0002318277
Дата охранного документа: 27.02.2008
10.04.2019
№219.017.0096

Проекционный дисплей

Проекционный дисплей, включающий в себя источник света, пространственный модулятор света, оптическую систему, по меньшей мере, один отражатель и экран. По меньшей мере, один отражатель выполнен асферическим и имеет осевую симметрию с возможностью компенсации дисторсии изображения. Оптическая...
Тип: Изобретение
Номер охранного документа: 0002297658
Дата охранного документа: 20.04.2007
10.04.2019
№219.017.009b

Система подсветки жидкокристаллического дисплея (варианты)

Система подсветки жидкокристаллического дисплея, содержащая расположенные последовательно источник света, оптическую систему, оптическую пленку, поляризационную пленку и микропризменную пленку, при этом оптическая пленка выполнена из светопропускающего материала и имеет, по меньшей мере, один...
Тип: Изобретение
Номер охранного документа: 0002297727
Дата охранного документа: 20.04.2007
10.04.2019
№219.017.031e

Устройство фоновой подсветки

Изобретение относится к устройствам подсветки жидкокристаллических панелей. Устройство фоновой подсветки содержит источник света с большой расходимостью, световодную пластину, световыводящее средство и оптический элемент, предназначенный для ввода излучения в световодную пластину, расположенный...
Тип: Изобретение
Номер охранного документа: 0002316031
Дата охранного документа: 27.01.2008
Showing 1-10 of 27 items.
10.05.2013
№216.012.3e74

Оптическая измерительная система и способ измерения критического размера наноструктур на плоской поверхности

Изобретение может быть использовано при измерении геометрических параметров нанообъектов путем исследования рассеянного излучения при сканировании объектов. Оптическая измерительная система содержит: оптический модуль освещения и регистрации изображения, модуль управления параметрами оптической...
Тип: Изобретение
Номер охранного документа: 0002481555
Дата охранного документа: 10.05.2013
10.05.2013
№216.012.3ec4

Адаптивный способ создания и печати цветных анаглифных изображений

Изобретение относится к средствам подготовки печати анаглифных изображений. Техническим результатом является адаптация для печати анаглифного изображения с сохранением трехмерного восприятия напечатанного изображения для конкретных стереоочков. В способе печатают тестовый цветной образец на...
Тип: Изобретение
Номер охранного документа: 0002481635
Дата охранного документа: 10.05.2013
10.05.2013
№216.012.3ec9

Способ и система генерации анимированных художественных эффектов на статичных изображениях

Изобретение относится к средствам обработки изображений. Техническим результатом является исключение повторов генерируемых кадров анимации при воспроизведении и обеспечение соответствия кадров фоновому звуковому сопровождению. Система содержит модуль детектирования областей интереса,...
Тип: Изобретение
Номер охранного документа: 0002481640
Дата охранного документа: 10.05.2013
10.02.2014
№216.012.a02c

Способ межкадрового прогнозирования для кодирования многоракурсной видеопоследовательности

Изобретение относится к вычислительной технике. Технический результат заключается в уменьшении объема служебной информации в области сжатия многоракурсных видеопоследовательностей с картами глубин. Способ межкадрового прогнозирования для кодирования многоракурсной видеопоследовательности, в...
Тип: Изобретение
Номер охранного документа: 0002506712
Дата охранного документа: 10.02.2014
10.03.2014
№216.012.aa83

Система и способ преобразования тонов плоских и объемных изображений

Изобретение относится к средствам обработки цифровых изображений. Техническим результатом является повышение качества цифровых изображений за счет повышения глобального и локального контраста без формирования нежелательных артефактов и искажений. В способе выбирают функцию преобразования тонов...
Тип: Изобретение
Номер охранного документа: 0002509366
Дата охранного документа: 10.03.2014
10.03.2014
№216.012.aa8e

Способ и система и для просмотра изображения на устройстве отображения

Изобретение относится к системам и способам для просмотра и навигации по цифровому изображению, размеры которого превышают размеры экрана. Техническим результатом является обеспечение возможности более детального просмотра частей изображений за счет их масштабирования. Технический результат...
Тип: Изобретение
Номер охранного документа: 0002509377
Дата охранного документа: 10.03.2014
27.05.2014
№216.012.caf9

Способ расчета движения с коррекцией окклюзий

Изобретение относится к средствам обработки видеоданных. Техническим результатом является получение карты расчета движения с четкими границами движения и коррекцией окклюзии с повышенным качеством. В способе выполняют начальный расчет четырех векторных полей движения с помощью алгоритма...
Тип: Изобретение
Номер охранного документа: 0002517727
Дата охранного документа: 27.05.2014
27.06.2014
№216.012.d565

Способ и система улучшения текста при цифровом копировании печатных документов

Изобретение относится к средствам копирования текстовых документов. Техническим результатом является уменьшение степени деградации текста при многократном копировании печатного документа. В способе сканируют печатный документ, получают сканированное изображение, выявляют связные области...
Тип: Изобретение
Номер охранного документа: 0002520407
Дата охранного документа: 27.06.2014
27.07.2014
№216.012.e31b

Система и способ для автоматического планирования видов в объемных изображениях мозга

Изобретение относится к автоматическому планированию видов в объемных изображениях мозга. Техническим результатом является обеспечение надежности за счет повышения точности обработки изображений как высокой, так низкой разрешающей способности. Способ содержит: получение трехмерного...
Тип: Изобретение
Номер охранного документа: 0002523929
Дата охранного документа: 27.07.2014
27.07.2014
№216.012.e34e

Способ и система для визуализации набора мультимедиа объектов на 3d дисплее

Изобретение относится к области представления коллекции (набора) мультимедиа объектов на трехмерных дисплеях и направлено на создание в реальном времени реалистичного трехмерного перехода между такими мультимедиа объектами, как двумерные и трехмерные изображения и видео, визуализируемые в...
Тип: Изобретение
Номер охранного документа: 0002523980
Дата охранного документа: 27.07.2014
+ добавить свой РИД