27.01.2014
216.012.9cd8

СПОСОБ ОЦЕНКИ ВОЗРАСТА ПОЛЬЗОВАТЕЛЯ ПО ДАННЫМ БОЛЬШОГО ОБЪЕМА И СООТВЕТСТВУЮЩАЯ СИСТЕМА

Вид РИД

Изобретение

Юридическая информация Свернуть Развернуть
№ охранного документа
0002505858
Дата охранного документа
27.01.2014
Краткое описание РИД Свернуть Развернуть
Аннотация: Изобретение относится к способу и системе, обеспечивающим определение возраста пользователя в сети по данным большого объема. Техническим результатом является обеспечение возможности точной фильтрации пользователей сети по возрасту. Предложенный способ содержит следующие этапы: получение базовых данных о возрасте пользователя и задание начального веса для каждого типа этих данных; получение веса возраста пользователя в каждом типе базовых данных о возрасте в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах этих данных; поиск в базовых данных о возрасте возраста с наибольшим весом и оценка возраста пользователя по возрасту с наибольшим весом. Предложенные способ и система позволяют увеличить точность определения возраста пользователя. 2 н. и 12 з. п. ф-лы. 6 ил, 1 табл.
Реферат Свернуть Развернуть

Область техники

[0001] Настоящее изобретение относится к методам обработки данных большого объема, в частности к способу и системе, обеспечивающим определение возраста пользователя по данным большого объема.

Уровень техники

[0002] С ростом популярности Интернета сеть стала одной из важных областей повседневной жизни людей. Интернет может предоставлять пользователям различные услуги, например электронные покупки, запрос информации, развлечения. Возраст - основной атрибут пользователя сети. Пользователям разных возрастов могут предоставляться разные настраиваемые интернет-услуги. Однако пользователи обычно не указывают в Интернете свой фактический возраст. Поэтому встал вопрос, как точно определить фактический возраст пользователя?

[0003] Согласно существующему в настоящее время способу, возраст пользователя оценивается по полученным от него данным с применением простой фильтрации по граничному значению. В частности, возрастной диапазон пользователей оценивают по накопленным данным, и значения за пределами этого диапазона фильтруют. В результате определяется возраст пользователей. Однако этот способ во многом полагается на данные о возрасте, предоставляемые самими пользователями, и поэтому является неточным.

Сущность изобретения

[0004] В настоящем изобретении предложен способ оценки возраста пользователя по данным большого объема для повышения точности результата.

[0005] В настоящем изобретении предложена также система оценки возраста пользователя по данным большого объема для повышения точности результата.

[0006] Согласно настоящему изобретению, предложенный способ оценки возраста пользователя, содержит следующие этапы:

получение базовых данных о возрасте пользователя и задание начального веса для каждого типа этих данных;

получение веса возраста пользователя в каждом типе базовых данных о возрасте в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах этих данных;

поиск в разных типах базовых данных о возрасте возраста с наибольшим весом и оценка возраста пользователя по возрасту с наибольшим весом.

[0007] Согласно другому аспекту изобретения, предложена система оценки возраста пользователя. Эта система содержит:

блок задания веса, выполненный с возможностью получения базовых данных о возрасте пользователя, а также с возможностью задания начального веса для каждого типа этих данных;

блок обработки веса, соединенный с блоком задания веса и выполненный с возможностью получения веса возраста пользователя в каждом типе базовых данных о возрасте в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах этих данных;

блок оценки возраста, соединенный с блоком обработки веса и выполненный с возможностью поиска в разных типах базовых данных о возрасте возраста с наибольшим весом, а также с возможностью оценки возраста пользователя по возрасту с наибольшим весом.

[0008] Согласно предложенным в настоящем изобретении способу и системе, обеспечивающим определение возраста пользователя, для базовых данных о возрасте задается начальный вес, вес возраста пользователя в разных базовых данных о возрасте определяется в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах этих данных, и в качестве возраста пользователя определяется возраст с наибольшим весом. Поскольку несколько типов предоставляемых пользователем базовых данных о возрасте оцениваются вместе, возраст с наибольшим весом точнее соответствует фактическому возрасту пользователя. Следовательно, точность определения возраста пользователя увеличивается.

Краткое описание чертежей

[0009] На фиг.1 показана блок-схема предложенного способа определения возраста пользователя по данным большого объема.

[0010] На фиг.2 приведена блок-схема предложенного способа задания начального веса для базовых данных о возрасте.

[0011] На фиг.3 представлена блок-схема предложенного способа получения весовых коэффициентов возраста пользователя в разных типах базовых данных о возрасте.

[0012] На фиг.4 показана блок-схема предложенного способа определения

возраста пользователя по данным среды одноклассников.

[0013] На фиг.5 представлена структурная схема предложенной системы

определения возраста пользователя по данным большого объема.

[0014] На фиг.6 приведена структурная схема системы определения возраста пользователя по данным большого объема, соответствующей другому варианту изобретения.

Подробное описание изобретения

[0015] На фиг.1 показана блок-схема предложенного способа определения возраста пользователя по данным большого объема. В этом способе предусмотрено выполнение следующих этапов.

[0016] На этапе S10 принимают базовые данные о возрасте пользователя и задают начальный вес для каждого типа этих данных, причем базовые данные о возрасте предоставляются пользователем при вводе информации посредством различных сетевых продуктов, например службы обмена мгновенными сообщениями, социальной сети и т.д.

[0017] Как видно из фиг.2, предложенный способ задания начального веса для базовых данных о возрасте предусматривает выполнение следующих этапов.

[0018] На этапе S100 принимают опорные данные о возрасте пользователя.

[0019] Эти опорные данные могут быть получены с помощью сетевой анкеты. Поскольку вопросы, сформулированные в такой анкете, достаточно конкретны, возраст, полученный с ее помощью, более точен, чем непосредственно введенный пользователем.

[0020] На этапе S102 базовые данные о возрасте сравнивают с опорными данными о возрасте и определяют коэффициент точности базовых данных.

[0021] Во всех типах базовых данных о возрасте выполняют поиск пользователей, возраст которых соответствует возрасту в опорных данных о возрасте, и количество найденных пользователей делят на общее число пользователей в группе пользователей, получая в результате коэффициент точности базовых данных о возрасте.

[0022] В частности, для каждого типа базовых данных о возрасте выполняют поиск в соответствующей им группе пользователей, получая тем самым число пользователей, возраст которых по базовым данным соответствует их возрасту по опорным данным. Затем определяют отношение между этим числом и общим числом пользователей в группе пользователей, соответствующей базовым данным о возрасте. Это отношение представляет коэффициент точности типа базовых данных пользователей. Термин "соответствовать" означает, что возраст по базовым данным совпадает с возрастом по опорным данным или различие между этими значениями возраста находится в определенных пределах, например в пределах трех лет.

[0023] Базовые данные о возрасте, полученные разными способами, рассматривают как принадлежащие к разным типам данных о возрасте. Например, базовые данные о возрасте, полученные посредством службы обмена мгновенными сообщениями, относят к одному типу данных, а базовые данные о возрасте, полученные через социальную сеть, - к другому типу данных.

[0024] На этапе S104 задают начальный вес для базовых данных о возрасте согласно указанному коэффициенту точности.

[0025] В соответствии с одним из вариантов изобретения коэффициент точности базовых данных о возрасте имеет три уровня: низкий, средний и высокий. Согласно коэффициенту точности на этих трех уровнях для базовых данных о возрасте задают начальные весовые коэффициенты P1, P2 и P3, соответственно. Например, P1=1, P2=5 и Р3=9. Предположим, что базовые данные о возрасте IM1, IM2,…, IMn n пользователей принимают через службу обмена мгновенными сообщениями, базовые данные о возрасте SNS1, SNS2, …, SNSn n пользователей принимают через социальную сеть, а опорные данные о возрасте R1, R2, …, Rn n пользователей собирают посредством анкетирования. Сравнив данные IM1, IM2, …, IMn с данными R1, R2, …, Rn, можно определить коэффициент точности базовых данных о возрасте, полученных с помощью службы обмена мгновенными сообщениями. Предположим, что этот коэффициент точности низкий. Тогда в качестве начального веса базовых данных о возрасте, полученных с помощью службы обмена мгновенными сообщениями, задают значение P1. Аналогичным образом можно определить коэффициент точности базовых данных о возрасте, полученных через социальную сеть. Предположим, что этот коэффициент точности средний. Тогда в качестве начального веса базовых данных о возрасте, полученных через социальную сеть, задают значение P2.

[0026] В соответствии с другим вариантом изобретения можно также задать начальные весовые коэффициенты для разных типов базовых данных о возрасте в зависимости от их источников. Например, данные о возрасте, полученные из регистрационной информации сетевой службы, такой как запись выпускника, являются более точными. Следовательно, начальный вес, заданный для этого типа базовых данных о возрасте, может быть относительно высоким по сравнению с весом других данных.

[0027] На этапе S12 определяют вес возраста пользователя в каждом типе базовых данных о возрасте в соответствии с их начальным весом и степенью схожести возраста пользователя в разных типах этих данных.

[0028] Как видно из фиг.3, предложенный способ получения весовых коэффициентов возраста пользователя в разных типах базовых данных о возрасте предусматривает выполнение следующих этапов.

[0029] На этапе S120 сравнивают разные типы базовых данных о возрасте. В частности, сравнивают значения возраста пользователя в разных типах базовых данных о возрасте, полученных разными способами.

[0030] На этапе S122 задают показатель веса возраста пользователя в соответствии с начальными весовыми коэффициентами разных типов базовых данных о возрасте и степенью схожести возраста пользователя в разных типах этих данных. В соответствии с одним из вариантов изобретения степень схожести возраста пользователя в разных типах базовых данных о возрасте является следующей: одинаковый возраст, схожий возраст и разный возраст, причем возраст считается схожим, если он различается не более чем на три года, и разным, если разница в возрасте составляет более трех лет. Затем сравнивают начальные весовые коэффициенты разных типов базовых данных о возрасте для получения отношения веса этих данных. Отношение веса может быть следующим: одинаковый вес, схожий вес и разный вес, причем вес считают одинаковым, если в двух типах базовых данных о возрасте уровень веса один и тот же (высокий, средний или низкий), схожим, если в двух типах базовых данных о возрасте он различается на один уровень (высокий и средний или средний и низкий), и разным, если в двух типах базовых данных о возрасте он различается на два уровня (высокий и низкий). В соответствии с одним из вариантов изобретения показатели веса возраста пользователя задают, как показано в таблице.

Степень схожести возраста
Отношение веса
Одинаковый возраст Схожий возраст Разный возраст
Одинаковый вес +А1 +А4 0
Схожий вес +А2 +А5 0
Разный вес +А3 +А6 0

[0031] Например, А1=1, А2=2, А3=3, А4=4, А5=5 и А6=6.

[0032] На этапе S124 определяют вес возраста пользователя согласно сумме начального веса и показателя веса возраста. В приведенном выше варианте изобретения сравнивают разные типы базовых данных о возрасте. Для каждого типа базовых данных о возрасте определяют отношение веса между данным типом и всеми другими типами базовых данных о возрасте, а также степень схожести возраста пользователя при данном отношении веса. Показатель веса возраста пользователя в базовых данных о возрасте равен сумме всех показателей веса возраста, полученных путем сравнения этих базовых данных о возрасте с другими базовыми данными о возрасте.

[0033] Согласно одному из вариантов изобретения, используют три типа базовых данных о возрасте пользователя - М, N и О. Предположим, что в этом варианте начальные весовые коэффициенты этих трех типов базовых данных - P1, P2 и P3, соответственно. Предположим также, что возраст трех пользователей a, b и с в базовых данных о возрасте М - Ma, Mb и Мс, соответственно, возраст этих пользователей в базовых данных о возрасте N - Na, Nb и Nc, соответственно, и их возраст в базовых данных о возрасте О - Оа, Ob и Ос, соответственно. Сравним базовые данные о возрасте М, N и О. Предположим, что весовые коэффициенты базовых данных М и базовых данных N схожи, весовые коэффициенты базовых данных М и базовых данных О различны, и весовые коэффициенты базовых данных N и базовых данных О схожи. Для пользователя а предположим, что Ма=25, Na=25 и Оа=23, т.е. возраст Ма и Na одинаков, возраст Ма и Оа схож, и возраст Na и Оа тоже схож. С учетом показателей веса возраста, указанных в таблице 1, получается, что вес возраста Ма - P1+А2+А6, вес возраста Na - P2+А2+А5, и вес возраста Оа - P3+А6+А5. Аналогичным способом можно получить весовые коэффициенты возраста пользователей b и с.

[0034] На этапе S14 в базовых данных разных типов возраста ищут возраст с наибольшим весом и возраст с наибольшим весом определяют как оценочный возраст пользователя. Для приведенного выше примера возраст с наибольшим весом среди значений Ма, Na и Оа определяют как оценочный возраст пользователя а. Поскольку возраст с наибольшим весом лучше соответствует фактическому возрасту пользователя, его определяют как более точный.

[0035] В одном из вариантов изобретения после получения оценочного возраста пользователя вес этого возраста сравнивают с начальным весом и классифицируют как вес одного из трех уровней - высокий, средний или низкий. Для примера предположим, что начальные весовые коэффициенты трех типов базовых данных о возрасте - P1, P2 и P3. Если вес оценочного возраста меньше или равен P2, вес возраста низкий. Если вес оценочного возраста больше, чем P2, но меньше или равен P3, вес возраста средний. Если вес оценочного возраста больше, чем P3, вес возраста высокий.

[0036] На фиг.4 показана блок-схема предложенного способа определения возраста пользователя по данным среды одноклассников. В этом способе предусмотрено выполнение следующих этапов.

[0037] На этапе S20 в данных среды одноклассников выясняют число пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый оценочный возраст. Данные среды одноклассников - это набор данных пользователей, связанных отношением одноклассников. Пользователи с отношениями одноклассников обычно имеют одинаковый или схожий возраст. Данные среды одноклассников могут быть получены от членов группы одноклассников и группы друзей пользователя.

[0038] На этапе S22 определяют, удовлетворяет ли число пользователей заранее заданному условию. Если число пользователей удовлетворяет заранее заданному условию, выполняют этап S24; в противном случае процедура завершается. В одном из примеров заранее заданное условие следующее: m>3 и m/n>=1/4, где m - число пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый оценочный возраст, а n - общее число пользователей в среде одноклассников.

[0039] На этапе S24 оценочный возраст пользователей со средними и низкими весовыми коэффициентами оценочного возраста в среде одноклассников корректируют до оценочного возраста пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый оценочный возраст. Если в одном из примеров число пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый оценочный возраст, удовлетворяет указанному выше заранее заданному условию, то, поскольку оценочный возраст этих пользователей более точен и возраст пользователей в среде одноклассников обычно одинаков или схож, возраст пользователей с низкими и средними весовыми коэффициентами возраста корректируют согласно оценочному возрасту пользователей с высокими весовыми коэффициентами возраста. В результате значения оценочного возраста становятся более точными.

[0040] На фиг.5 представлена структурная схема предложенной системы определения возраста пользователя по данным большого объема. Как видно из фиг.5, система содержит блок 10 задания веса, блок 20 обработки веса и блок 30 оценки возраста.

[0041] Блок 10 задания веса служит для получения базовых данных о возрасте пользователя и задания начального веса для каждого типа этих данных.

[0042] Блок 20 обработки веса соединен с блоком 10 задания веса и служит для получения веса возраста пользователя в каждом типе базовых данных о возрасте в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах этих данных.

[0043] Блок 30 оценки возраста соединен с блоком 20 обработки веса и служит для поиска в базовых данных о возрасте возраста с наибольшим весом и определения возраста с наибольшим весом в качестве оценочного возраста пользователя.

[0044] На фиг.6 представлена структурная схема предложенной системы оценки возраста пользователя по данным большого объема, соответствующей другому варианту настоящего изобретения. Как видно из фиг.6, помимо блока 10 задания веса, блока 20 обработки веса и блока 30 оценки возраста, система содержит также блок 40 хранения данных о возрасте и блок 50 хранения данных среды одноклассников.

[0045] Блок 40 хранения данных о возрасте соединен с блоком 10 задания веса, блоком 20 обработки веса и блоком 30 оценки возраста и служит для хранения базовых и опорных данных о возрасте. Базовые данные о возрасте предоставляются пользователем посредством различных сетевых продуктов, а опорные данные о возрасте собираются с помощью сетевой анкеты. Поскольку вопросы, сформулированные в такой анкете, достаточно конкретны, опорные данные о возрасте точнее базовых данных.

[0046] Блок 50 хранения данных среды одноклассников соединен с блоком 30 оценки возраста и предназначен для хранения данных среды одноклассников. Пользователи с отношениями одноклассников обычно имеют одинаковый или схожий возраст. Данные среды одноклассников можно получить от членов группы одноклассников или группы друзей пользователя.

[0047] В одном из примеров блок 10 задания веса должен также получать опорные данные о возрасте пользователя, сравнивать базовые данные о возрасте с опорными данными о возрасте, определять коэффициент точности базовых данных о возрасте и задавать начальный вес базовых данных о возрасте в соответствии с коэффициентом точности. Возможно выполнение поиска во всех типах базовых данных о возрасте, чтобы найти пользователей, возраст по базовым данным которых соответствует возрасту по опорным данным. Коэффициент точности определяют путем деления числа пользователей, возраст по базовым данным которых соответствует возрасту по опорным данным, на общее число пользователей. Блок 10 задания веса должен также относить коэффициент точности к одному из трех уровней (высокий, средний и низкий) и устанавливать начальный вес базовых данных о возрасте в соответствии с этими уровнями.

[0048] В одном из примеров блок 20 обработки веса должен также сравнивать базовые данные о возрасте и задавать показатель веса возраста пользователя в соответствии с начальным весом и степенью схожести возраста пользователя в разных типах базовых данных о возрасте. Вес возраста пользователя равен сумме начального веса и показателя веса возраста. Блок 20 обработки веса сравнивает разные типы базовых данных о возрасте и для каждого их типа определяет отношение веса между данным типом и другими типами базовых данных о возрасте, а также степень схожести возраста пользователя при данном отношении веса. Показатель веса возраста пользователя в базовых данных о возрасте равен сумме всех показателей веса возраста, полученных путем сравнения этих и других базовых данных о возрасте. После расчета веса возраста блоком 20 обработки веса блок 30 оценки возраста выполняет поиск возраста с наибольшим весом и определяет этот возраст в качестве оценочного возраста пользователя.

[0049] В одном из примеров после того как блок 30 оценки возраста определяет оценочный возраст пользователя, блок 20 обработки веса сравнивает вес оценочного возраста с начальным весом и в зависимости от полученного результата классифицирует вес оценочного возраста как высокий, средний или низкий (возможно также использование большего количества уровней веса).

[0050] В одном из примеров блок 30 оценки возраста должен также выполнять поиск в данных среды одноклассников пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый возраст, определять, удовлетворяет ли число найденных пользователей заранее заданному условию, и, если да, изменять возраст пользователей в среде одноклассников со средними и низкими весовыми коэффициентами возраста на оценочный возраст пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый возраст. В одном из примеров заранее заданное условие следующее: m>3 и m/n>=1/4, где m - число пользователей с высокими весовыми коэффициентами оценочного возраста, которым соответствует одинаковый возраст в данных среды одноклассников, а n - общее число пользователей в среде одноклассников. Поскольку возраст пользователей в среде одноклассников обычно одинаков или схож, возраст пользователей с низкими и средними весовыми коэффициентами возраста корректируется в соответствии с оценочным возрастом пользователей с высокими весовыми коэффициентами. В результате значения оценочного возраста становятся более точными.

[0051] Выше были представлены предпочтительный пример изобретения и некоторые из его вариантов. Использованные в заявке термины, характеристики и рисунки предназначены только для пояснения изобретения и не должны рассматриваться как ограничение патентных притязаний. Объем патентной охраны данного изобретения допускает его различные модификации, не выходящие за рамки сущности настоящего изобретения, и определяется представленными ниже пунктами формулы (и их эквивалентами), все признаки которых следует трактовать в самом широком смысле, если не указано обратное.


СПОСОБ ОЦЕНКИ ВОЗРАСТА ПОЛЬЗОВАТЕЛЯ ПО ДАННЫМ БОЛЬШОГО ОБЪЕМА И СООТВЕТСТВУЮЩАЯ СИСТЕМА
СПОСОБ ОЦЕНКИ ВОЗРАСТА ПОЛЬЗОВАТЕЛЯ ПО ДАННЫМ БОЛЬШОГО ОБЪЕМА И СООТВЕТСТВУЮЩАЯ СИСТЕМА
СПОСОБ ОЦЕНКИ ВОЗРАСТА ПОЛЬЗОВАТЕЛЯ ПО ДАННЫМ БОЛЬШОГО ОБЪЕМА И СООТВЕТСТВУЮЩАЯ СИСТЕМА
СПОСОБ ОЦЕНКИ ВОЗРАСТА ПОЛЬЗОВАТЕЛЯ ПО ДАННЫМ БОЛЬШОГО ОБЪЕМА И СООТВЕТСТВУЮЩАЯ СИСТЕМА
СПОСОБ ОЦЕНКИ ВОЗРАСТА ПОЛЬЗОВАТЕЛЯ ПО ДАННЫМ БОЛЬШОГО ОБЪЕМА И СООТВЕТСТВУЮЩАЯ СИСТЕМА
СПОСОБ ОЦЕНКИ ВОЗРАСТА ПОЛЬЗОВАТЕЛЯ ПО ДАННЫМ БОЛЬШОГО ОБЪЕМА И СООТВЕТСТВУЮЩАЯ СИСТЕМА
Источник поступления информации: Роспатент

Всего документов: 78
Всего документов: 75

Похожие РИД в системе