×
20.01.2013
216.012.1dce

СПОСОБ ОБНАРУЖЕНИЯ ПОРНОГРАФИИ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ (ВАРИАНТЫ)

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
№ охранного документа
0002473124
Дата охранного документа
20.01.2013
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится средствам анализа цифровых изображений. Техническим результатом является повышение точности анализа содержимого цифрового изображения. В способе выявляют фрагменты цифрового изображения, сходные с человеческими лицами во всех областях цифрового изображения, на этих фрагментах определяют показатель доли пикселей цветов кожи внутри области фрагмента, обнаружение лица фиксируют при превышении заданного порогового значения, в случае превышения порогового значения долей цвета кожи внутри области найденного лица корректируют исходную палитру цветов человеческой кожи, определяют контуры объекта цвета кожи, вычисляют показатель геометрического сходства найденного контура с типичным контуром тела, осуществляют поиск фрагментов, сходных с типичными частями обнаженного тела, оценивают изображение на наличие порнографического визуального содержания. 2 н. и 14 з.п. ф-лы, 2 ил.
Реферат Свернуть Развернуть

Изобретение относится к смысловому анализу содержания цифровых изображений: статических изображений, например фотографий, видеоизображений, наборов кадров в интернет-ресурсах, а также в файлах изображений на устройствах хранения данных или в приложениях к электронным письмам. Изобретение предназначено для формирования количественной и качественной оценок возможного наличия или отсутствия визуального порнографического содержания в изображениях, поступающих с интернет-ресурсов, находящихся в ресурсах локальных сетей или на персональных компьютерах, в приложениях к электронной почте и т.п.

Известен способ обнаружения порнографического содержания в последовательности видеокадров, при котором анализируют содержимое памяти видеокарты для того, чтобы обнаружить порнографическое содержание в последовательности видеокадров (US 2010306793). Данный способ включает в себя анализ смены подмножества видеокадров, чтобы генерировать векторы движения, идентификацию в указанных кадрах групп векторов движения, имеющих одинаковые направление и модуль, идентификацию присутствия в кадрах указанной последовательности типов движения, определяемых группами векторов движения, объединенных наличием соответствующих особенностей движения, обнаружение в указанных типах движения инверсий движения соответствующей группы векторов, подсчет числа инверсий в движениях в заданном интервале, и если их число достигает заданного количественного порога, то в указанной последовательности кадров идентифицируется периодическое движение и делается вывод, что последовательность видеокадров имеет порнографическое содержание. Следует отметить, что данный способ имеет узкое применение: только для видео и только в динамике. Использование его для статических изображений невозможно в принципе. Необходимо дополнительно отметить низкую надежность и точность обнаружения, поскольку данный способ основан на одной идее, что повторяющиеся колебательные движения характеризуют половой акт, и, следовательно, является односторонним и недостаточно объективным. Также следует отметить невозможность выдачи дифференцированных вероятностных результатов.

Известен метод обнаружения порнографического видео, который включает шаги использования модели цвета лица и модели "нецвета" лица, чтобы вычислить вероятность наличия цвета лица и вероятность наличия "нецвета" лица каждого пикселя в видеокадрах подлежащего проверке видео, создание шаблонов изображений для видеокадров, извлечение особенностей изображения на видеокадрах согласно шаблонам, формирование данных для наблюдений при помощи особенностей изображений в непрерывных видеокадрах и вводе наблюдаемой последовательности в модель порнографических снимков, чтобы обнаружить, является ли проверяемое видео порнографическим (CN 101441717). Данный способ также имеет узкое применение: только для видео. Причем фактически суждение о наличии подозрительных кадров делается на основе определения статистическими методами вероятности нахождения данного пикселя в зоне, похожей в некотором смысле на типовые порнофрагменты именно по критерию распределения вероятности в данной зоне (п.7 формулы, стр.10, 11 описания). Однако практика применения алгоритмов сравнения распределений вероятности для обнаружения объектов на данный момент в целом негативна, поэтому данный метод не может считаться надежным, причем это может быть обусловлено по существу неверным выбором исходных данных.

Известен выполняемый с помощью компьютера способ идентификации порнографических изображений, включающий получение цифровых данных изображения, анализ цифровых данных изображения на предмет обнаружения на цифровом изображении одной или более соответствующих частей тела; если цифровое изображение включает, по крайней мере, одну из указанных частей тела, то определяют наличие порнографии, при этом учитывают размер части тела путем сравнения с заданным пороговым значением (US 2008159627). При использовании данного способа принимают положительное решение, если на изображении найдена хотя бы одна часть тела, характерная для порно, что не обеспечивает достаточно надежного результата. Все оценки даются на основе выявления или невыявления соответствующих частей тела, анализ линий тела не применяется. Также не используется детектирование лиц, которое имеет значение для точности обнаружения, поскольку указанные сюжеты относятся исключительно к людям и на подобных изображениях в подавляющем большинстве случаев встречается лицо. Факт его наличия усиливает дальнейший анализ, дает возможность определить форму тела и ограничить дальнейшую область поиска элементов тела, а также подстроить цветовую палитру кожи под кожу лица. Следует дополнительно отметить, что этот способ, по существу, пригоден для обнаружения порнографического содержания только на статических изображениях.

Известен метод для обнаружения порнографического изображения, включающий определение множества номеров цветов из выбранного изображения образца кожи, выбранного из множества изображений; фильтрацию сомнительного изображения, указанная фильтрация включает сравнение цвета сомнительного пикселя сомнительного изображения с номерами цвета; выполнение анализа текстуры в области, окружающей сомнительный пиксель, если его цвет соответствует номеру цвета, где анализ текстуры определяет дисперсию в цвете между сомнительным пикселем и цветом пикселей в области; и классифицирование пикселя как потенциального пикселя кожи, если анализ текстуры указывает, что у области есть текстура кожи. Метод также включает подготовку базы данных очертаний, содержащей множество изображений очертаний, а указанная фильтрация далее включает сравнение очертания сомнительного изображения, включая пиксель кожи, с изображением очертания из базы данных, классифицирование указанного сомнительного изображения, включая потенциальный пиксель кожи, как нежелательное изображение, если очертание сомнительного изображения соответствует изображению очертания прототипа. Номера цвета сохранены в конечной базе цветовых данных прототипа, которая включает множество различных цветных баз данных для использования в обнаружении цвета специфического типа, а также множество различных баз данных формы для использования при обнаружении формы специфической категории формы - лица и/или других частей тела, таких как гениталии, либо для обнаружения эротической позиции (US 2004208361). Явным недостатком данного изобретения является то, что основными двумя этапами являются анализ цвета кожи и анализ формы тела. Нет попытки определения характерных элементов тела. Вывод делается только на основании расположения тела и фактов типа «лицо» - «не лицо», т.е. анализ недостаточно глубок. Существенная часть изобретения посвящена анализу цвета кожи. Фактически этот фактор, по сути, ставится во главу угла, что в действительности может вызвать большое число ложных срабатываний в фото интерьеров (например, на фоне розовых стен или бежевого дивана), а также в видео, на что справедливо указывают авторы. Анализ очертаний содержит слишком много очень неочевидных допущений. Например, если найдено лицо, то почему-то делается вывод о том, что имеет место «портрет», который якобы вряд ли должен часто оказываться в числе порноизображений. Из реальной жизни очевидно, что это крайне ошибочное утверждение, которое ведет к снижению качества обнаружения, либо требуется слишком большое число ручных операций обработки. Таким образом, данный метод не дает существенных преимуществ при обработке большого числа изображений.

Наиболее близким аналогом заявленного изобретения является способ обнаружения порнографических цифровых изображений, заключающийся в том, что на цифровом изображении выявляют пиксели цветов кожи человека, вычисляют показатель, характеризующий долю пикселей цветов кожи человека на цифровом изображении, в случае превышения долей пикселей цветов человека на цифровом изображении заданного порогового значения выявляют фрагменты цифрового изображения, сходные с человеческими лицами, выявляют фрагменты изображения, сходные с типичными частями обнаженного человеческого тела (US 2009034851). Данный способ предусматривает последовательное обнаружение и исключение из области пикселей цветов кожи человека области выявленного лица и области текстуры, после чего определяют очертания изображения «для взрослых». Недостаток данного решения заключается в том, что поиск лица осуществляется только в районах с цветом кожи (как указано в заявке US 2009034851), поэтому качество такого поиска будет низкого уровня. Например, лицо из-за изменений освещения или качества съемки может быть разбито на зону с характерным цветом кожи и зону серого оттенка, которое будет в решении по патенту US 2009034851 отброшено при поиске районов с кожей. Вследствие этого лицо в данной зоне искаться не будет вообще, в ряде случаев даже при преимущественном содержании цвета кожи в данной зоне, поскольку все же существенная ее часть будет изначально отброшена. Кроме того, исследование текстуры также может давать ошибку (например, в некоторых взрослых сценах нельзя отбрасывать анализируемый регион вследствие того, что «там» волосы).

Технический результат заключается в повышении точности определения порнографического содержания и возможности представления качественного итога анализа, например «порно», «подозрительно», «не порно».

Технический результат достигается тем, что в первом варианте способ обнаружения порнографических цифровых изображений заключается в том, что на цифровом изображении выявляют пиксели цветов кожи человека, вычисляют показатель, характеризующий долю пикселей цветов кожи человека на цифровом изображении, в случае превышения долей пикселей цветов кожи человека на цифровом изображении заданного порогового значения выявляют фрагменты цифрового изображения, сходные с человеческими лицами, выявляют фрагменты изображения, сходные с типичными частями обнаженного человеческого тела, фрагменты цифрового изображения, сходные с человеческими лицами, выявляют во всех областях цифрового изображения, на выявленных фрагментах цифрового изображения, сходных с человеческими лицами, определяют показатель, характеризующий долю пикселей цветов кожи человека внутри области соответствующего фрагмента, обнаружение человеческого лица фиксируют в случае превышения долей пикселей цветов кожи человека внутри области фрагмента заданного порогового значения, при этом в случае превышения долей цвета человеческой кожи внутри области найденного лица порогового значения по пикселям лица, отнесенным к коже человека, корректируют исходную палитру цветов человеческой кожи, после чего определяют контуры объекта, имеющего цвет кожи человека и относящегося к соответствующему обнаруженному человеческому лицу, вычисляют показатель, характеризующий геометрическое сходство найденного контура с типичным контуром тела человека, осуществляют поиск фрагментов изображения, сходных с типичными частями обнаженного человеческого тела в области контура объекта, имеющего цвет кожи человека, при этом оценивают цифровое изображение на предмет возможного наличия порнографического визуального содержания по значениям функции указанных показателей с учетом факта выявления или невыявления фрагментов изображения, сходных с типичными частями обнаженного человеческого тела в области контура объекта, имеющего цвет кожи лица человека.

Технический результат в другом варианте способа обнаружения порнографических цифровых изображений достигается тем, что на цифровом изображении выявляют пиксели цветов кожи человека, вычисляют показатель, характеризующий долю пикселей цветов кожи человека на цифровом изображении, в случае превышения долей пикселей цветов кожи человека на цифровом изображении заданного порогового значения выявляют фрагменты цифрового изображения, сходные с человеческими лицами, выявляют фрагменты изображения, сходные с типичными частями обнаженного человеческого тела, фрагменты цифрового изображения, сходные с человеческими лицами, и фрагменты изображения, сходные с типичными частями обнаженного человеческого тела, выявляют параллельно во всех областях цифрового изображения, на выявленных фрагментах цифрового изображения, сходных с человеческими лицами, определяют показатель, характеризующий долю пикселей цветов кожи человека внутри области соответствующего фрагмента, обнаружение человеческого лица фиксируют в случае превышения долей пикселей цветов кожи человека внутри области фрагмента заданного порогового значения, при этом в случае превышения долей цвета человеческой кожи внутри области найденного лица порогового значения по пикселям лица, отнесенным к коже человека, корректируют исходную палитру цветов человеческой кожи, после чего определяют контуры объекта, имеющего цвет кожи человека, начиная от обнаруженного человеческого лица, вычисляют показатель, характеризующий геометрическое сходство найденного контура с типичным контуром тела человека, при этом оценивают цифровое изображение на предмет возможного наличия порнографического визуального содержания по значениям функции указанных показателей с учетом факта выявления или невыявления фрагментов изображения, сходных с типичными частями обнаженного человеческого тела в области контура объекта, имеющего цвет кожи лица человека.

В обоих вариантах дополнительно определяют показатели надежности обнаружения лица и типичных частей обнаженного человеческого тела и вводят их в функцию, по значениям которой оценивают цифровое изображение на предмет возможного наличия порнографического визуального содержания.

Показатель надежности обнаружения лиц и типичных частей обнаженного человеческого тела определяют либо как функцию доли цвета кожи внутри области соответствующего объекта, либо как функцию устойчивости обнаружения указанного объекта. Устойчивость обнаружения объекта может определяться, например, на основе анализа числа близкорасположенных областей с вероятным положением объекта.

Кроме того, определяют показатель степени похожести найденного контура на один из заданных типичных вариантов расположения человеческого тела по отношению к лицу, вводят его в функцию, по значениям которой оценивают цифровое изображение на предмет возможного наличия порнографического визуального содержания.

Обнаружение порнографических цифровых изображений может проводиться как на копии цифрового статического изображения, так и на наборе кадров видео с интернет-ресурса, либо на файле на устройстве хранения данных, либо в приложении к электронной почте и т.п.

В случае анализа последовательности видеокадров обнаружение порнографических цифровых изображений могут проводить на каждом изображении.

Осуществление способа

Предложенные варианты способа обнаружения порнографических цифровых изображений иллюстрируются последовательностью операций, приведенных на фиг.1 и 2.

Способ по первому и второму вариантам включает следующие операции:

110 - копия цифрового статического изображения либо набор кадров видео;

120 - операция вычисления доли пикселей цвета человеческой кожи на каждом изображении;

130 - операция сравнения доли пикселей цвета человеческой кожи с пороговым значением;

140 - операция поиска человеческого лица;

150 - операция проверки количества найденных лиц;

160 - операция вычисления доли пикселей цвета человеческой кожи внутри области найденного лица;

170 - операция сравнения доли пикселей цвета человеческой кожи внутри области найденного лица с пороговым значением;

180 - операция корректировки палитры цветов человеческой кожи;

190 - операция анализа контура объекта с преобладанием цвета человеческой кожи вблизи лица;

1100 - операция поиска типичных частей обнаженного человеческого тела;

1110 - операция вычисления оценки наличия порнографического визуального содержания;

1120 - качественный результат анализа.

На первом этапе осуществления способа по первому варианту - операция 120 - определяется доля пикселей цвета человеческой кожи на каждом изображении. Принадлежность пикселя изображения к цвету кожи может быть определена одним из известных методов, основанных на построении области пикселей кожи в различных цветовых схемах YCrCb, RGB и т.п. и/или путем пересечения или объединения этих областей. Далее область пикселей в цветовой схеме, определяющей цвет кожи, будем называть палитрой человеческой кожи. Если доля пикселей цвета человеческой кожи на изображении меньше порогового значения (операция 130), то осуществляется переход к вычислению оценки наличия порнографического визуального содержания к операции 1110. Если порог превышен - осуществляется переход к поиску лиц - операции 140.

Если не найдено ни одного лица (операция 150), то осуществляется переход к операции 1100. Если найдено одно лицо или несколько лиц, то для каждого из них рассчитывается доля цвета человеческой кожи внутри области найденного лица - операция 160. Если доля цвета человеческой кожи внутри области найденного лица (операция 170) меньше порогового значения, то осуществляется переход к операции 1100. Если доля цвета человеческой кожи внутри области найденного лица превышает пороговое значение, то по пикселям лица, отнесенным к коже человека, корректируется исходная палитра цветов человеческой кожи (операция 180) для дальнейшего анализа при операциях 190, 1100. Корректировка палитры цветов человеческой кожи может выполняться, например, но не ограничиваясь данным подходом, путем сужения области пикселей в цветовом пространстве, определяющей пиксели кожи, вокруг цветов пикселей кожи, присутствующих на найденном лице.

Далее для каждого лица анализируются контуры объекта, с преобладанием цвета кожи в районе лица, по отношению к геометрии каждого изображения по аналогии с типичными вариантами расположения человеческого тела по отношению к лицу - операция 190. В области, определенной контуром тела вблизи лица (результат операции 190), осуществляется поиск типичных частей обнаженного человеческого тела - операция 1100. Оценка наличия порнографического визуального содержания (операция 1110) для каждого изображения вычисляется как функция численных показателей, полученных в каждой ветви процесса анализа изображения. Для случая подачи на вход алгоритма нескольких связанных изображений (кадры видеопотока) оценка всей группы вычисляется как функция оценок для каждого отдельного кадра группы. Причем не имеет значения, какая конкретная функция здесь используется. Известно множество приемов функционального преобразования переменных. В принципе может быть использована любая зависимость, важен сам факт ее получения и правильный выбор исходных данных, а не то, какими конкретными математическими действиями объединены аргументы функции.

В случае перехода к операции 1100 из операции 170 поиск частей тела осуществляется на заранее определенном расстоянии от лица и по исходной палитре цветов человеческой кожи. В случае перехода к операции 1100 из операции 150 поиск частей осуществляется по всему изображению и по исходной палитре цветов человеческой кожи. При выполнении операций 160, 190, 1100 могут быть дополнительно вычислены показатели надежности обнаружения соответствующих объектов. Надежность обнаружения лиц и типичных частей обнаженного человеческого тела может вычисляться либо как функция доли цвета кожи внутри области объекта, либо как функция устойчивости обнаружения объекта. Устойчивость определения объекта может определяться, например, но не ограничиваясь данным подходом, на основе анализа числа близкорасположенных областей с вероятным положением объекта. Для контура тела вблизи лица оценка может вычисляться как функция степени похожести выделенного контура на один из типичных вариантов расположения человеческого тела по отношению к лицу.

Вариант способа, представленный на фиг.2, позволяет выполнять процессы поиска лиц и частей тела параллельно, что дополнительно позволит повысить скорость обработки изображений при технической реализации.


СПОСОБ ОБНАРУЖЕНИЯ ПОРНОГРАФИИ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ (ВАРИАНТЫ)
СПОСОБ ОБНАРУЖЕНИЯ ПОРНОГРАФИИ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ (ВАРИАНТЫ)
Источник поступления информации: Роспатент
+ добавить свой РИД