×
19.04.2019
219.017.3343

Результат интеллектуальной деятельности: СПОСОБ ВЫЯВЛЕНИЯ ДВУМЕРНОГО ЭКРАННОГО МЕНЮ НА СТЕРЕО ВИДЕОПОСЛЕДОВАТЕЛЬНОСТИ

Вид РИД

Изобретение

№ охранного документа
0002431939
Дата охранного документа
20.10.2011
Аннотация: Изобретение относится к способу обработки видео данных, в частности к выявлению двумерного экранного меню на стереокадре. Техническим результатом является обеспечение обнаружения экранного меню, сформированного сторонним устройством для корректного отображения упомянутого меню на экране трехмерного дисплея. Результат достигается тем, что разделяют стереокадр на два цветных изображения, цветокалибруют изображения, сравнивают гистограммы пары первоначальных цветных изображений и пары цветокалиброванных изображений, при этом вычисляют скалярную величину разности гистограмм и выбирают минимальную разность гистограмм двух пар, классифицируют данный стереокадр как экранное меню, если минимальная разность гистограмм двух пар превосходит первый предопределенный порог T, значение которого задают в пределах диапазона T∈[0…5], классифицируют данный стереокадр как не являющийся экранным меню, если минимальная разность гистограмм двух пар меньше второго предопределенного порога Т, значение которого задают в пределах диапазона Т∈[150…200], выполняют поиск геометрических элементов на изображениях, при этом, если минимальная величина разности гистограмм больше или равна первому предопределенному порогу T и больше второго предопределенного порога Т, выполняют дополнительные операции. 6 з.п. ф-лы, 6 ил.

Заявляемое изобретение относится к способу обработки видео данных, а более конкретно к способу определения характера искажений в стерео видеопоследовательности при отображении в стерео режиме, и может применяться для определения типа экранного меню, которое наложено на стерео видео последовательность.

Экранное меню - это изображение, наложенное на картинку на экране, содержащее элементы управления и часто используемое в современном телевидении, видеомагнитофонах и DVD плеерах для отображения информации о настройках звука, текущем канале, времени и т.д. При двумерном воспроизведении видео последовательности отображение экранного меню не является проблемой, но в 3D режиме отображение экранного меню может вызвать множество видимых искажений и порождает серьезные проблемы из-за ошибок в алгоритме оценки глубины и дальнейшего генерирования изображения. Это приводит к неудовлетворенности пользователей качеством трехмерных (3D) и 3D-ready дисплеев.

В настоящее время экранное меню используется в большинстве устройств, которые могут быть подключены к телевизору. Но в случае стереоскопического (3D) телевизора экранное меню должно быть сформировано в специальном трехмерном формате. В настоящее время DVD-устройства и Blue-ray плееры не умеют различать моно видео последовательности и стерео видео последовательности, то есть экранное меню отображается в моно формате для обоих случаев. Когда стерео последовательность с таким моноэкранным меню анализируется встроенными блоками стереоскопического телевизора, возникает множество искажений.

Следует принимать во внимание тот факт, что современный рынок телевизионных устройств развивается за счет использования новых технологий воспроизведения изображения, в частности, на основе новых типов стереоскопических (известных также под названием трехмерных или 3D) дисплеев. В связи с этим приходится решать многочисленные проблемы, относящиеся к обработке стерео видео последовательностей для таких трехмерных дисплеев. На протяжении последних пяти лет опубликовано большое число изобретений по этой тематике. Одна из проблем, возникшая в связи с появлением стереоскопических телевизоров, состоит в правильном отображении экранного меню в случае стерео видео последовательностей. Если экранное меню отображается самим телевизором, то информация о текущем типе видео последовательностей и само экранное меню будут отображаться корректно. Но в случае, если экранное меню открывается другим устройством, например, DVD проигрывателем, то информация о том, является ли данная видеопоследовательность с наложенным экранным меню стерео видео последовательностью или нет, недоступна и обычно отображается экранное меню в монорежиме. Моноэкранное меню формируется как одноцветный или многоцветный прямоугольник с текстом и пиктограммами. Экранное меню может быть различного уровня прозрачности и различных цветов. Добавление простого моноэкранного меню ведет к появлению искажений в процессе обработки видео. По этой причине возникает необходимость в применении некоторых «умных» процедур для выявления этих случаев.

Опубликованная заявка на европейский патент ЕР 2091241 [1] описывает предназначенный для домашних кинотеатров способ отображения прозрачных экранных меню, основанный на выявлении изменений движения в пределах последовательных видео кадров отображаемого видео. Это техническое решение позволяет пользователям легко просматривать видео в фоновом режиме одновременно с отображением экранного меню.

Патентная заявка США 20040027267 [2] описывает систему для выборочного воспроизведения изображений для просмотра стереоизображений или моноизображений, причем такая система включает в себя стереоскопическую систему обработки стерео изображений, переключатель моно/стерео режимов и дисплей, способный отображать моно и стерео изображения. Система обработки стереоизображений выполнена с возможностью генерации сигналов для управления дисплеем на основе входных видеосигналов, состояния переключателя моно/стерео режимов и типа дисплея. Это позволяет определять и корректировать характер экранного меню для различных режимов отображения видео.

Патентная заявка США 20090060280 [3] предлагает систему стереоскопического изображения, которая включает модуль предобработки изображения для предобработки правого и левого изображений и модель сопоставления стереопары для выполнения стерео сопоставления правого и левого изображений для получения карты глубины правого и левого изображений при низком разрешении и информации о расстоянии правого и левого изображений высокого разрешения после обнаружения объекта в пределах диапазона расстояний на основе информации о расстоянии при низком разрешении. Патентная заявка США 20080089577 [4] относится к формированию трехмерного векторного объекта, представляющего одну из характеристик в пределах сцены, путем анализа двумерных векторных объектов, представляющих эту характеристику в стереопаре. Двумерные векторные объекты анализируются с помощью алгоритмов стереоскопического зрения для формирования трехмерного векторного объекта. Результаты анализа позволяют получать данные, касающиеся трехмерного положения соответствующих точек двумерных векторных объектов. Трехмерный векторный объект формируется на основе результатов анализа стереоизображения. Трехмерный векторный объект может быть сопоставлен с трехмерной моделью цифровой точки. Трехмерный векторный объект также может быть сопоставлен с другим трехмерным векторным объектом, сформированным из стереопары и отснятым при других условиях. Этот способ, недостатком которого является сложность его практической реализации, наиболее близок к заявляемому решению и поэтому выбран в качестве прототипа.

Задача, на решение которой направлено заявляемое изобретение, состоит в том, чтобы разработать более простой и надежный в работе способ выявления экранного меню на стерео видеопоследовательности и определения его характера. При этом новый способ должен обеспечивать возможность обнаруживать присутствие моноэкранного меню на стерео видео последовательностях в различных форматах и не вносить искажений в работу устройства отображения (DVD проигрывателя или телевизора) в случаях, когда экранное меню корректно отображается для стерео видео последовательностей.

Технический результат достигается за счет выбора подхода, основанного на применении алгоритма обнаружения «Да/Нет» (в специальной литературе нередко используется терминология "OSD/non", т.е. "on screen display/non") к экранным меню для оценки, присутствует ли экранное меню на текущем кадре. Если такое меню будет обнаружено, предлагается выключать стерео режим и показывать видеопоследовательность в монорежиме до момента, когда экранное меню исчезнет. При этом заявляемый способ предусматривает выполнение следующих операций:

- разделяют стереокадр на два цветных изображения;

- цветокалибруют изображения;

- сравнивают гистограммы пары первоначальных цветных изображений и пары цветокалиброванных изображений, при этом вычисляют скалярную величину разности гистограмм и выбирают минимальную разность гистограмм двух пар;

- классифицируют данный стереокадр как экранное меню, если минимальная разность гистограмм двух пар превосходит первый предопределенный порог T1, значение которого задают в пределах диапазона Т1∈[0…5];

- классифицируют данный стереокадр как не являющийся экранным меню, если минимальная разность гистограмм двух пар меньше второго предопределенного порога Т2, значение которого задают в пределах диапазона T2∈[150…200];

- выполняют поиск геометрических элементов на изображениях, если минимальная величина разности гистограмм больше или равна первому предопределенному порогу T1 и больше второго предопределенного порога T2, выполняя следующие шаги:

- вычисляют разности двух пар изображений, а именно пары первоначальных изображений и пары цветокалиброванных изображений, путем применения формулы

где - первое первоначальное изображение, - второе первоначальное изображение, и - цветокалиброванные изображения, W - ширина и Н - высота этих изображений, R, G, В - цветовые компоненты;

- вычисляют минимальную разность D=min(D1,D2) между разностями пар первоначальных и цветокалиброванных изображений;

- вычисляют двоичное изображение путем установления порога вычисленной минимальной разности, применяя соотношение

,

при этом выбирают значение порога Т в зависимости от величины разности гистограмм:

,

где const1>const2, причем выбирают константы из соответствующих диапазонов значений, а именно: const1∈[25…40], const2∈[15…35];

- выполняют морфологическую обработку вычисленного двоичного изображения путем применения к DT операции размыкания и последующего замыкания, при этом структурированный элемент SEopening для размыкания DT имеет размер 1 на 2 и состоит из "1":

SEopening=[1 1]

где DO - двоичное изображение-результат применения операции размыкания к DT, а замыкание производят для соединения частей горизонтальных линий, которые сохранились в процессе размыкания, при этом структурированный элемент SEclosing для замыкания имеет размер 1 на 5 и также состоит из "1":

SEclosing=[1 1 1 1 1],

где DM - двоичное изображение-результат применения операции размыкания к DO;

- подсчитывают количество геометрических элементов на итоговом двоичном изображении DM;

- сравнивают полученное на предыдущем шаге значение с предопределенным порогом Т3, значение которого задают в пределах диапазона T3∈[1…5], причем если эта величина больше предопределенного порога Т3, то данный стереокадр относят к категории экранного меню; в противном случае данный стереокадр не относят к категории экранного меню.

В случае, когда величина разности гистограмм не слишком велика или не слишком мала, выполняют поиск геометрических элементов на изображениях с помощью вычисления разности изображений, вычисляя двоичное изображение путем установления порога вычисленной разности, морфологически обрабатывая вычисленное двоичное изображение, учитывая ненулевые элементы итогового изображения и сравнивая это число с предопределенным порогом.

Далее существо изобретения поясняется в деталях с привлечением графических материалов.

Фиг.1. Основные этапы способа выявления экранного меню.

Фиг.2. Пояснение разделения видео кадра на два изображения и цветокалибровки изображений.

Фиг.3. Пояснение разделения изображений на блоки.

Фиг.4. Пояснение промежуточных изображений, полученных в процессе выполнения процесса, изображенного на Фиг.1.

Фиг.5. Процесс вычисления числа геометрических элементов на двоичном изображении, полученном после установления порога для разности изображений.

Фиг.6. Вариант устройства для реализации заявленного способа.

Схема на Фиг.1 описывает способ более подробно. Входная стерео видео последовательность может быть представлена в различных форматах: лево-право, верх-низ, в шахматном порядке и т.д. На шаге 101 входной стерео кадр стерео видеопоследовательности (стерео-пара) разделяют на два цветных изображения, это заключается в том, что половину стерео-пары копируют в один буфер памяти, а вторую половину - в другой буфер памяти. Эти изображения, т.е. первое изображение и второе изображение, могут уменьшаться в процессе копирования способом ближайшего соседства, это означает, что только каждый n-ый элемент каждой n-ой строки копируется вместо копирования каждого элемента. Число n может варьироваться от 2 до 10, в зависимости от ресурсов памяти. В данном примере осуществления изобретения n равняется 8. На шаге 102 одно из двух получаемых в результате изображений цветокалибруют (подгоняют по цвету) к другому изображению (тогда пара цветокалиброванных изображений состоит из одного первоначального и цветокалиброванного к нему второго изображения), используя, например, способ растяжения или способ сопоставления гистограмм (оба способа описаны, в частности, в опубликованной работе Gonzales and Woods "Обработка цифровых изображений", Prentice Hall, Upper Saddle River, New Jersey 07458, ISBN 0-201-18075-8) [5], и сохраняют в дополнительном буфере памяти (Фиг.2 поясняет шаги 101 и 102.) На шаге 103 ко всем трем изображениям, а именно к двум первоначальным цветным изображениям и одному цветокалиброванному изображению, применяют горизонтальное размытие. Процедура размытия тоже детально изложена в [5]. В данном случае размытие применяется с использованием фильтра с ядром F размера 1, разделенного на m:

Такой фильтр, примененный построчно, позволяет производить быструю обработку, так как изображения хранятся в памяти по строкам. На шаге 104 пара первоначальных изображений сравнивается с помощью вычисленной разности гистограмм ΔH1. Сначала, каждое изображение (исходное первое и исходное второе) разделяют на 9 частей одинакового размера (три горизонтально и три вертикально), и 9 частей изображения затем сравниваются (см. Фиг.3 для пояснения).

Для каждой части изображения вычисляют три гистограммы (для каждого из трех цветных компонентов, обозначенных, как R, G и В), для каждого из двух изображений, , , для первого изображения и , , для второго изображения. Все гистограммы сортируются по возрастанию. Это помогает преодолеть большую разность из-за сдвига освещенности. Затем разность гистограмм для текущей части изображения ΔHpart вычисляют в соответствии со следующей формулой:

Максимальную разность гистограмм ΔH1 между всеми частями изображений вычисляют в соответствии со следующей формулой:

На шаге 105 процедуру шага 104 повторяют для пары цветокалиброванных изображений. В результате вычисляют разность гистограмм ΔH2. В конечном счете, на шаге 106 общую разность гистограмм выбирают как наименьшую между ΔH1 и ΔH2:

На шаге 107 ΔH сравнивают с предопределенным порогом T1. Это означает, что если разность гистограмм достаточно мала, то текущий кадр относят к категории «non». Если разность достаточно велика, т.е. больше некоторого предопределенного порога Т2, то текущий кадр относят к категории «OSD». Это условие проверяют на шаге 108. В противном случае, когда невозможно сделать заключение на основе величины разности гистограмм, то для анализа применяют следующие шаги (109-112).

На шаге 109 вычисляют разность отображений между кадрами. Пусть первое первоначальное изображение обозначается как , второе первоначальное изображение обозначается как и цветокалиброванные изображения обозначаются как и . Ширина и высота этих изображений одинакового размера обозначается как W и Н соответственно, цветовые компоненты обозначаются как R, G, В. Затем вычисляют две величины, D1 и D2:

Затем, на шаге 110 вычисляют минимальную разность изображений

На шаге 111 устанавливают порог для разности изображений D:

,

Выбирают порог Т в зависимости от величины разности гистограмм:

где const1>const2. На шаге 112 применяют морфологическую операцию размыкания и последующего замыкания к DT. Операция размыкания - это дилатация эрозии набора. Эта операция применяется для удаления небольших точек и вкраплений. Структурированный элемент для размыкания DT имеет размер 1 на 2 и состоит из "1":

Замыкание производится для соединения частей горизонтальных линий, которые сохранились в процессе размыкания. Структурированный элемент для замыкания имеет размер 1 на 5 и также состоит из "1":

После морфологических операций производят поиск геометрических элементов в DT (шаг 113). Этот процесс проиллюстрирован на Фиг.5. На шаге 114 N сравнивают с предопределенным порогом T3. В случае, если N больше Т3, то текущий кадр относят к категории «non» (шаг 115). В противном случае, текущий кадр относят к категории «OSD» (шаг 116).

Фиг.4 показывает промежуточные изображения, полученные в процессе выполнения процесса, изображенного на Фиг.1.

Фиг.5 раскрывает в деталях процесс поиска геометрических элементов (Шаг 112). На шаге 501 i, j, N задают некоторыми istart, ≥0,0 и 0 соответственно. На шаге 502 num (номер) задают как 0. На шаге 503 проверяют условие, является ли num больше предопределенной константы S. Если нет, то выполняют следующий шаг 506. В случае, если DM(i, j) равен 1 (условие 506), то num увеличивают на 1 (см. шаг 507). Затем проверяют условие 508, т.е. достиг ли процесс конца текущей линии. Если нет, то i увеличивают на 1 (шаг 504), и процесс переходит к условию 503. Если результат 503 является положительным, то N увеличивают на 1 (см. шаг 505). На шаге 510 проверяют, достиг ли способ последней допустимой линии изображения. Если нет, то i увеличивают на 1 (см. шаг 509). Если да, то на следующем шаге 511 на выход подают полученное значение N.

Необходимо отметить, что значения T1, T2, Т3, K, L, const1, const2 задают некоторыми константами. Эти константы могут выбираться из следующих диапазонов:

T1∈[0…5], Т2∈[150…200], Т3∈[1…5], K∈[1…5], L=[5…15], const1∈[25…40], const2∈[15…35], S∈[10…30].

Заявляемый способ реализуется с помощью известных из уровня техники устройств, В частности в простейшем варианте (см. Фиг.6) такое устройство состоит из процессора (или множества процессоров) 601, памяти 602 и шины данных 603, по которой данные передаются из памяти в процессор и обратно. В начале исходный стерео-кадр записывают в память, и устройство начинает обработку, ответ записывается также в память и может быть оттуда считан.

Изобретение может быть использовано в стерео телевидении для предобработки видеопотоков до отображения изображений в трехмерном режиме, в частности в случаях, когда телевизор подключен к DVD или Blue-ray плееру, и когда невозможно определить тип видео последовательности.

Следует отметить, что специалисты должны учитывать и возможность других вариантов реализации изобретения, не выходящих за рамки формулы изобретения. Таким образом, чертежи и описание могут рассматриваться лишь в качестве иллюстраций заявленного решения.

Источник поступления информации: Роспатент

Showing 51-60 of 125 items.
27.09.2014
№216.012.f955

Система и способ печати интегральных фотографий, обеспечивающих полный параллакс и высокое разрешение трехмерного изображения (варианты)

Способ выполняют с помощью системы печати, включающей модуль управления, выполненный с возможностью согласования работы основных узлов системы во время печати; модуль генерации изображений под микролинзами на основе трехмерной модели объекта; проекционный модуль, выполненный с возможностью...
Тип: Изобретение
Номер охранного документа: 0002529666
Дата охранного документа: 27.09.2014
10.10.2014
№216.012.fb76

Система и способ для автоматической регистрации анатомических точек в объемных медицинских изображениях

Изобретение относится к способам и устройствам для автоматической регистрации анатомических точек на медицинских изображениях. Техническим результатом является повышение точности автоматической регистрации анатомических точек в трехмерных медицинских изображениях. Способ предусматривает...
Тип: Изобретение
Номер охранного документа: 0002530220
Дата охранного документа: 10.10.2014
27.10.2014
№216.013.01a4

Способ придания материалам гидрофильных свойств при помощи органосилоксанового покрытия с нитрилотриметиленфосфоновой кислотой

Изобретение относится к производству модифицированных материалов, например текстильных, полимерных, из силикатного стекла, дерева, кожи, металла, керамики, и может быть использовано для придания гидрофильных свойств поверхностям этих материалов. Для придания материалам различной природы...
Тип: Изобретение
Номер охранного документа: 0002531818
Дата охранного документа: 27.10.2014
20.11.2014
№216.013.0775

Вспомогательный способ и система для обнаружения беспроводных сигналов мобильными устройствами

Изобретение относится к коммуникационным технологиям, в частности к мобильным устройствам. Достигаемый технический результат - повышение эффективности работы мобильных устройств за счет получения информации об источниках беспроводного сигнала. Предложены способ и система для обнаружения...
Тип: Изобретение
Номер охранного документа: 0002533310
Дата охранного документа: 20.11.2014
20.11.2014
№216.013.0924

Система боковой подсветки жидкокристаллических дисплеев (варианты)

Изобретение относится к системам боковой подсветки. Система боковой подсветки содержит источник излучения в виде, по меньшей мере, одного светодиода; нижнее зеркало с зеркальным покрытием; верхнюю зеркально-диффузную пленку, расположенную выше нижнего зеркала и боковые зеркала, расположенные с...
Тип: Изобретение
Номер охранного документа: 0002533741
Дата охранного документа: 20.11.2014
20.11.2014
№216.013.0993

Способ кодирования/декодирования многоракурсной видеопоследовательности на основе адаптивной компенсации локальных различий яркости при межкадровом предсказании (варианты)

Изобретение относится к средствам кодирования и декодирования многоракурсной видеопоследовательности. Техническим результатом является повышение эффективности межкадрового предсказания за счет компенсации различий яркости между опорным блоком и текущим кодируемым блоком на основе пикселей из...
Тип: Изобретение
Номер охранного документа: 0002533852
Дата охранного документа: 20.11.2014
27.11.2014
№216.013.0a25

Способ и система преобразования моментального снимка экрана в метафайл

Изобретение относится к средствам преобразования растрового изображения в метафайл. Техническим результатом является повышение четкости текстовых символов на скриншоте. В способе обнаруживают фрагменты сглаженного текста на снимке экрана, оценивают цвет фона и цвет символов сглаженного текста...
Тип: Изобретение
Номер охранного документа: 0002534005
Дата охранного документа: 27.11.2014
27.11.2014
№216.013.0a34

Система беспроводной зарядки мобильных устройств

Изобретение относится к электротехнике, а более конкретно к системам и устройствам для беспроводной передачи энергии, предназначенным для одновременной зарядки нескольких мобильных устройств. Технический результат - возможность зарядки различных мобильных устройств с пониженным излучением в...
Тип: Изобретение
Номер охранного документа: 0002534020
Дата охранного документа: 27.11.2014
10.02.2015
№216.013.2475

Способ и система динамической генерации трехмерных анимационных эффектов

Изобретение относится к средствам генерации анимационных эффектов на трехмерном дисплее. Техническим результатом является обеспечение автоматического создания трехмерных анимационных эффектов на изображении в режиме реального времени. В способе выбирают визуальный мультимедиа объект для показа,...
Тип: Изобретение
Номер охранного документа: 0002540786
Дата охранного документа: 10.02.2015
10.03.2015
№216.013.2fbc

Камера и оптическая система для получения 3d изображений (варианты)

Изобретение касается техники цифровой съемки и обработки цифрового изображения. В одном из вариантов предложена оптическая система отображения, включающая объектив, первый и второй датчики изображения с разными размерами, светоделитель и, по меньшей мере, один оптический элемент, расположенный...
Тип: Изобретение
Номер охранного документа: 0002543688
Дата охранного документа: 10.03.2015
Showing 11-11 of 11 items.
29.05.2019
№219.017.65a6

Способ увеличения разрешения цифровой видеопоследовательности

Изобретение относится к способам обработки видеоданных, а более конкретно к способам увеличения размерности видеопоследовательностей. Технический результат заключается в обеспечении увеличения размера изображения в четыре и более раз без заметных искажений. Способ увеличения размерности...
Тип: Изобретение
Номер охранного документа: 0002393540
Дата охранного документа: 27.06.2010
+ добавить свой РИД