×
09.02.2020
220.018.0138

Результат интеллектуальной деятельности: СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ

Вид РИД

Изобретение

№ охранного документа
0002713761
Дата охранного документа
07.02.2020
Аннотация: Изобретение относится к области вычислительной техники для обработки данных. Технический результат заключается в обеспечении определения местоположения участников транзакции с помощью используемых IP-адресов при их отнесении к заданному территориальному кластеру. Технический результат достигается за счет получения данных о транзакциях пользователей, содержащих IP-адреса отправителей и получателей транзакций; выполнения ранжирования частоты использования IP-адресов и количества транзакций между упомянутыми IP-адресами; формирования графа на основании данных ранжирования, в котором вершинами являются IP-адреса, а ребрами - количество переводов за определенный период времени между отправителями и получателями, использующими соответствующие IP-адреса; осуществления построения территориальных кластеров на основании сформированного графа, причем каждый кластер содержит несколько IP-адресов; получения транзакционной информации пользователя, содержащей по меньшей мере IP-адрес; осуществления поиска полученного IP-адреса в территориальном кластере и, в случае нахождения IP-адреса, присвоения пользователю соответствующего территориального кластера. 2 н. и 3 з.п. ф-лы, 5 ил.

ОБЛАСТЬ ТЕХНИКИ

[0001] Заявленное решение относится, в общем, к области обработки данных, а в частности к способу и системе поиска принадлежности IP-адресов территориальным кластерам на основе транзакционных данных.

УРОВЕНЬ ТЕХНИКИ

[0002] Все большая доля транзакций проводятся клиентами в удаленных каналах обслуживания, в которых единственным параметром, позволяющим определить фактическое расположение клиента, является IP-адрес. На текущий момент существуют справочники, которые сопоставляют конкретный IP-адрес с городом. Такие справочники не позволяют полноценно решать задачи, где необходимо понимать территориальное расположение клиента. Например, для случая противодействия мошенничеству, когда необходимо определение территориальной близости между двумя близкими по времени клиентскими сессиями в удаленном канале обслуживания, выполненными с различными IP-адресами. Основной причиной является то, что справочники устаревают, также IP-адреса могут переходить к другим провайдерам, принцип написания наименования населенных пунктов тоже не является формализованным в привязке к IP-адресам (один и тот же город зачастую имеет несколько написаний), точность для IP-адресов сотовых операторов крайне низкая.

[0003] Для целей анализа мошеннических действий при осуществлении транзакций существующие методы основываются на анализе удаленности пользователей от места выполнения транзакции, например, POS-терминалов, банкоматов и т.п. Для целей идентификации местонахождения участника транзакции может использоваться геолокация пользовательских устройств для выполнения транзакции, например, мобильных телефонов.

[0004] Такие решения, например, раскрываются в следующих патентных документах: US 20120215701 A1 (Playspan Inc., 23.08.2012), US 20190043054 A1 (Capital One Services LLC, 07.02.2019), US 20120209773 A1 (PayPal Inc., 16.08.2012).

[0005] Общим недостатком известных решений является необходимость использования уточняющих данных, характеризующих конкретные точки выполнения транзакций, в частности, известные решения основываются исключительно на использовании гео-позиции пользователя и средств выполнения транзакций для анализа точек предположительного местоположения, что не позволяет получить сегментированную информацию о территориальной принадлежности клиента тому или иному кластеру, соответствующему наиболее часто используемым IP-адресам, что позволит более быстро определить местоположение пользователя.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

[0006] Решаемой технической проблемой или технической задачей с помощью заявленного изобретения является формирование кластеров, указывающих территориальную принадлежность IP-адресов.

[0007] Технический результат заключается в обеспечении определения местоположения участников транзакции с помощью используемых IP-адресов при их отнесении к заданному территориальному кластеру.

[0008] Дополнительным техническим результатом является повышение скорости определения метаположения пользователя за счет сформированных кластеров, соответствующих территориальному распределению IP-адресов.

[0009] Заявленный результат достигается за счет компьютерно-реализуемого способа поиска принадлежности IP-адреса территориальному кластеру на основе данных транзакций, который выполняется с помощью процессора и содержит этапы, на которых:

- получают данные о транзакциях пользователей, содержащие IP-адреса отправителей и получателей транзакций;

- выполняют ранжирование частоты использования IP-адресов и количества транзакций между упомянутыми IP-адресами;

- формируют граф на основании данных ранжирования, в котором вершинами являются IP-адреса, а ребрами - количество переводов за определенный период времени между отправителями и получателями, использующими соответствующие IP-адреса;

- осуществляют построение территориальных кластеров на основании сформированного графа, причем каждый кластер содержит несколько IP-адресов;

- получают транзакционную информацию пользователя, содержащую по меньшей мере IP-адрес;

- осуществляют поиск полученного IP-адреса в территориальном кластере и в случае нахождения IP-адреса присваивают пользователю соответствующий территориальный кластер.

[0010] В одном из частных вариантов осуществления способа данные о транзакциях получают от устройств выполнения транзакций.

[0011] В другом частном варианте осуществления способа устройства представляют собой: мобильные устройства, банкоматы, POS-терминалы или их сочетания.

[0012] В другом частном варианте осуществления способа данные о транзакциях дополнительно содержат гео-координаты пользователя.

[0013] Заявленное решение также реализуется за счет компьютерной системы, содержащей по меньшей мере один процессор и память, хранящую исполняемые процессором инструкции для реализации вышеуказанного способа.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0014] Признаки и преимущества настоящего технического решения станут очевидными из приводимого ниже подробного описания изобретения и прилагаемых чертежей, на которых:

[0015] Фиг. 1 иллюстрирует блок-схему выполнения заявленного способа.

[0016] Фиг. 2 иллюстрирует пример построения графа на основании IP-адресов.

[0017] Фиг. 3 - Фиг. 4 иллюстрируют примеры сформированных кластеров.

[0018] Фиг. 5 иллюстрирует пример вычислительного устройства.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

[0019] На Фиг. 1 представлен процесс выполнения заявленного способа (100) поиска принадлежности IP-адреса территориальному кластеру. На первом шаге (101) осуществляется сбор данных о транзакциях, которые могут включать в себя историю трат, историю входов в интернет-банк, устройства клиента, финансовое поведение клиента, остатки на счетах и т.д. Данные транзакций пользователя содержат IP-адреса пользователей в формате ХХХ.ХХХ.ХХХ.ХХХ, участвующих в переводах денежных средств, в частности р2р транзакции (англ. Payer-to-payer). Данные транзакций, как правило, поступают от устройств осуществления транзакций, например, банкоматов, POS-терминалов, мобильных устройств пользователей с установленным приложением для выполнения транзакций и т.п.

[0020] По собранным данным транзакций, отбираются переводы между пользователями (р2р транзакции). Для каждого клиента определяется его IP-адрес класса С (ХХХ.ХХХ.ХХХ), с которого он осуществлял вход в канал выполнения транзакций, например, мобильное приложение Сбербанк Онлайн или использование банкомата наибольшее число раз. Далее на этапе (102) в каждой транзакции клиент-отправитель платежа и клиент-получатель платежа сопоставляются с IP-адресом класса С, полученным ранее. Затем все транзакции агрегируются по уникальной паре IP-адрес отправителя и IP-адрес получателя, а также подсчитывается число транзакций по этой паре. Пример статистики представлен в Таблице 1.

[0021]

[0022] На основе полученных данных по переводам между клиентами и их сессиям в удаленных каналах обслуживания (например, мобильное приложение, WEB-интерфейс) строится граф (этап 103), вершинами которого являются IP-адреса класса xxx.xxx.xxx, ребрами - количество переводов за определенный период времени между клиентами, использующими такие IP-адреса. Пример такого графа представлен на Фиг. 2. Граф ненаправленный. В случае, если между вершинами количество транзакций меньше заданного порога N (экспериментально N=40, если период 30 дней), то такое ребро исключается.

[0023] К построенному графу применяется алгоритм кластеризации (например, label propagation - https://en.wikipedia.org/wiki/Label_Propagation_Algorithm). Алгоритм кластеризации вершин графа позволяет отнести IP-адрес к определенному кластеру. Такая группировка позволяет выявлять IP-адреса, используемые клиентами, имеющими социальные и финансовые связи между собой (осуществление транзакций, обмен сообщениями посредством сети Интернет и т.п.). Алгоритм построения графа может быть реализован на основе алгоритма, раскрытого в статье «Community Detection via Semi-Synchronous Label Propagation Algorithms» (arXiv:1103.4450vl, 23.03.2011). Работа алгоритма основывается на ранжировании и отборе наибольших кластеров, их которых выбирается заданное число кластеров (например, 11 кластеров, что является оптимальных в ходе проведенных экспериментов), оставшиеся кластеры объединяются в один. На основании кластеризации графа формируются территориальные кластеры (104), которые позволяют на основе данных об использовании клиентами средств выполнения транзакций (банкоматов, POS-терминалов, мобильного приложения, посещения офисов банка и др.) определить фактическое местоположение клиента в определенный временной период. Результатом данного алгоритма является многоугольник, заданный гео-координатами на поверхности земли с плотностью распределения точек активности клиента.

[0024] Границы многоугольника могут определяться методом, схожим с картографированием ареала живых организмов (контурный метод), при котором на карту наносятся линейные границы ареала, с формированием контурной линии всей территории, в пределах которой можно встретить клиента, проявившего транзакционную активность. Дополнительно определяется центр многоугольника (медиана значений координат точек, входящих в многоугольник) и, в случае нахождения выброса в данных (координата, выделяющаяся от общей выборки по клиенту и определяемая «правилом трех сигм»), многоугольник перестраивается заново без точек-выбросов.

[0025] Данный подход позволяет каждого клиента, участвующего в кластеризации, отнести к определенному кластеру следующим способом:

• найти его самый часто используемый IP-адрес класса С (ХХХ.ХХХ.ХХХ);

• найти, к какому кластеру относится этот IP-адрес;

• присвоить клиенту выявленный кластер.

[0026] Алгоритм сопоставления гео-позиционирования клиента с IP-адресами клиентских сессий - используются для составления базы данных, с помощью которой можно определить территориальный кластер IP-адреса. Территориальный кластер представляет собой многоугольник, заданный гео-координатами на поверхности земли, построенный на основе данных клиентов, использующих IP-адрес с вычисленным кластером и по которым известны точные гео-кординаты местонахождения (например, при посещении офиса банка) (105). При получении информации по текущим сессиям клиентов, осуществляющих транзакции, в частности данным использующихся IP-адресов при использовании устройств осуществления транзакций, выполняется сравнение полученного IP-адреса со сформированными территориальными кластерами, и при выявлении соответствующего IP-адреса в том или ином кластере клиенту присваивается территориальное месторасположение в рамках заданного кластера.

[0027] Определение наиболее часто используемого IP-адреса клиентом может выполняться с помощью анализа его транзакционной активности за заданный промежуток времени, например, день, неделя, месяц и т.п. Дополнительно в процессе кластеризации IP-адресов клиентов могут использоваться личные идентификаторы клиентов, например, данные паспорта, идентифицирующие территориальную регистрацию клиентов.

[0028] Примеры сформированных кластеров представлены на Фиг. 3 - Фиг. 4. Для валидации полученных результатов работы алгоритма (100) было отобрано по 10000 клиентов из каждого кластера, по каждому клиенту была вычислена его средняя точка обитания (по использованию банкоматов и POS-терминалов). Точки нанесены на географическую карту и разбиты по сформированным кластерам.

[0029] На основании полученной информации по кластерам была оценена бизнес-метрика, в ходе которой были отобраны данные транзакций между клиентами, по которым поступала информация по подозрению в осуществлении мошеннических действий (фрод) от системы фрод-мониторинга. За заданный период времени было получено 86 519 срабатываний. Уникальное количество клиентов, участвующих в этих транзакциях (отправитель и получатель) - 142847. По 118536 (83%) клиентам был сформирован кластер.

[0030] Если из транзакционных переводов исключить транзакции, по которым у отправителя и получателя нет кластера либо он «0» (объединение малых кластеров), то для оценки остается 50199 транзакций (58%). Если ввести признак «равенство кластера отправителя и получателя», то распределение: перевод в разрезе легитимных ("G") и мошеннических ("F") транзакций будет выглядеть, как представлено в Таблице 2.

[0031] Созданный способ (100) кластеризации клиентов инструмент позволяет по истории входов в интернет-банк (IP-адреса) разделить клиентов по принадлежности к географической общности, не используя знания об их гео-координтах. На сегодняшний момент многие клиенты пользуются только мобильным приложением интернет-банка (узнают остатки денежных средств, осуществляют переводы и т.д.). Есть также клиенты, использующие и мобильное приложение и банкоматную сеть (внос/снятие наличных, подключение мобильного банка и т.д.). При использовании банкомата можно определить, в каком месте находился клиент, получая услугу. Составленный алгоритм позволяет использовать знания о поведении клиентов, использующих как банкоматы, так и мобильное приложение, при обогащении профилей клиентов, не оставляющих географический след. Таким образом, реализуется возможность применимости моделей, в которых есть необходимость понимания фактического месторасположения клиента, на тех, кто пользуется только интернет-банком с отключенным модулем определения геолокации.

[0032] Результаты работы кластеризации могут использоваться в качестве дополнительного признака для повышения эффективности модели скоринга транзакции. При осуществлении легитимных транзакций клиенты чаще осуществляют переводы клиентам, которые находятся в одной географической местности с отправителем. При этом в мошеннических переводах чаще наблюдается паттерн поведения, в котором отправитель и получатель находятся на далеком расстоянии друг от друга: мошенникам не всегда известна локация жертвы и подобрать клиента получателя из того же региона, что и отправитель - затруднительно. При создании модели оценки перевода на возможное мошенничество признак одного географического местоположения отправителя и получателя оказывает сильное влияние на снижение ложных срабатываний антифрод системы.

[0033] На Фиг. 5 представлен пример общего вида вычислительной системы (200) на базе вычислительного устройства (200), которое обеспечивает реализацию заявленного способа (100). Устройство (200) может является частью компьютерной системы, например, сервером, обрабатывающим необходимые данные для осуществления способа (100).

[0034] В общем случае, вычислительное устройство (200) содержит объединенные общей шиной информационного обмена один или несколько процессоров (201), средства памяти, такие как ОЗУ (202) и ПЗУ (203), интерфейсы ввода/вывода (204), устройства ввода/вывода (205), и устройство для сетевого взаимодействия (206).

[0035] Процессор (201) (или несколько процессоров, многоядерный процессор) могут выбираться из ассортимента устройств, широко применяемых в текущее время, например, компаний Intel™, AMD™, Apple™, Samsung Exynos™, MediaTEK™, Qualcomm Snapdragon™ и т.п. Под процессором также необходимо учитывать графический процессор, например, GPU NVIDIA или ATI, который также является пригодным для полного или частичного выполнения способа (100). При этом, средством памяти может выступать доступный объем памяти графической карты или графического процессора.

[0036] ОЗУ (202) представляет собой оперативную память и предназначено для хранения исполняемых процессором (201) машиночитаемых инструкций для выполнение необходимых операций по логической обработке данных. ОЗУ (202), как правило, содержит исполняемые инструкции операционной системы и соответствующих программных компонент (приложения, программные модули и т.п.).

[0037] ПЗУ (203) представляет собой одно или более устройств постоянного хранения данных, например, жесткий диск (HDD), твердотельный накопитель данных (SSD), флэш-память (EEPROM, NAND и т.п.), оптические носители информации (CD-R/RW, DVD-R/RW, BlueRay Disc, MD) и др.

[0038] Для организации работы компонентов устройства (200) и организации работы внешних подключаемых устройств применяются различные виды интерфейсов В/В (204). Выбор соответствующих интерфейсов зависит от конкретного исполнения вычислительного устройства, которые могут представлять собой, не ограничиваясь: PCI, AGP, PS/2, IrDa, FireWire, LPT, COM, SAT A, IDE, Lightning, USB (2.0, 3.0, 3.1, micro, mini, type C), TRS/Audio jack (2.5, 3.5, 6.35), HDMI, DVI, VGA, Display Port, RJ45, RS232 и т.п.

[0039] Для обеспечения взаимодействия пользователя с вычислительным устройством (200) применяются различные средства (205) В/В информации, например, клавиатура, дисплей (монитор), сенсорный дисплей, тач-пад, джойстик, манипулятор мышь, световое перо, стилус, сенсорная панель, трекбол, динамики, микрофон, средства дополненной реальности, оптические сенсоры, планшет, световые индикаторы, проектор, камера, средства биометрической идентификации (сканер сетчатки глаза, сканер отпечатков пальцев, модуль распознавания голоса) и т.п.

[0040] Средство сетевого взаимодействия (206) обеспечивает передачу данных устройством (200) посредством внутренней или внешней вычислительной сети, например, Интранет, Интернет, ЛВС и т.п. В качестве одного или более средств (206) может использоваться, но не ограничиваться: Ethernet карта, GSM модем, GPRS модем, LTE модем, 5G модем, модуль спутниковой связи, NFC модуль, Bluetooth и/или BLE модуль, Wi-Fi модуль и др.

[0041] Дополнительно могут применяться также средства спутниковой навигации в составе устройства (200), например, GPS, ГЛОНАСС, BeiDou, Galileo.

[0042] Представленные материалы заявки раскрывают предпочтительные примеры реализации технического решения и не должны трактоваться как ограничивающие иные, частные примеры его воплощения, не выходящие за пределы испрашиваемой правовой охраны, которые являются очевидными для специалистов соответствующей области техники.


СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
Источник поступления информации: Роспатент

Showing 1-10 of 46 items.
23.11.2018
№218.016.a020

Способ и система выявления и классификации причин возникновения претензий пользователей в устройствах самообслуживания

Изобретение относится к системам и способам выявления причин возникновения претензий и инцидентов в сети устройств самообслуживания. Техническими результатами являются повышение качества анализа клиентских обращений, повышение точности и скорости анализа претензий пользователей устройства...
Тип: Изобретение
Номер охранного документа: 0002673001
Дата охранного документа: 21.11.2018
01.03.2019
№219.016.c8ca

Компьютеризированный способ разработки и управления моделями скоринга

Изобретение относится к области вычислительной техники. Техническим результатом является повышение качества создаваемых моделей кредитного скоринга. Раскрыт компьютеризированный способ разработки и управления моделями скоринга, включающий следующие шаги: получают данные за заданный период...
Тип: Изобретение
Номер охранного документа: 0002680760
Дата охранного документа: 26.02.2019
21.03.2019
№219.016.eb69

Способ и система передачи информации о р2р-переводе

Изобретение относится к области передачи информации о р2р-переводе. Техническим результатом является обеспечение надежности передачи данных между автоматизированными информационными системами. Раскрыт способ передачи информации о р2р-переводе, включающий следующие шаги: записывают посредством...
Тип: Изобретение
Номер охранного документа: 0002682426
Дата охранного документа: 19.03.2019
01.04.2019
№219.016.fa42

Система управления сетью pos-терминалов

Изобретение относится к области вычислительной техники, а в частности к системам управления сетью POS-терминалов. Технический результат заключается в осуществлении технического решения для конфигурации POS-терминалов, обеспечивающего реализацию механизма удаленной загрузки конфигурационных...
Тип: Изобретение
Номер охранного документа: 0002683613
Дата охранного документа: 29.03.2019
03.04.2019
№219.016.fada

Способ и система автоматической генерации программного кода для корпоративного хранилища данных

Изобретение относится к способу и системе автоматической генерации программного кода для корпоративного хранилища данных. Технический результат заключается в управлении обновлением хранилища данных. В способе получают метаданные, описывающие настройку механизмов трансформации данных для их...
Тип: Изобретение
Номер охранного документа: 0002683690
Дата охранного документа: 01.04.2019
12.04.2019
№219.017.0bfa

Система мониторинга технического состояния сети pos-терминалов

Изобретение относится к средствам мониторинга технического состояния POS-терминалов. Система мониторинга технического состояния сети POS-терминалов, содержащая множество POS-терминалов, объединенных сетью передачи данных с системой обработки транзакций, клиентских вычислительных устройств и...
Тип: Изобретение
Номер охранного документа: 0002684494
Дата охранного документа: 09.04.2019
27.04.2019
№219.017.3c18

Способ и система предиктивного избегания столкновения манипулятора с человеком

Изобретение относится к области вычислительной технике. Технический результат заключается в повышении уровня безопасности работы персонала вблизи промышленного манипулятора. Технический результат достигается за счет формирования виртуального графа проходимости промышленного манипулятора;...
Тип: Изобретение
Номер охранного документа: 0002685996
Дата охранного документа: 23.04.2019
24.05.2019
№219.017.5e1c

Способ и система для выстраивания диалога с пользователем в удобном для пользователя канале

Изобретение относится к вычислительной технике. Технический результат – увеличение скорости обслуживания пользователя. Способ для выстраивания диалога с пользователем в канале передачи данных включает: получение данных пользовательского ввода; предобработку пользовательского ввода посредством...
Тип: Изобретение
Номер охранного документа: 0002688758
Дата охранного документа: 22.05.2019
29.05.2019
№219.017.6336

Система мониторинга сети устройств самообслуживания

Изобретение относится к системам мониторинга сети устройств самообслуживания (УС). Технический результат заключается в автоматизации устранения технических нарушений в работе УС. Система содержит УС, связанное с сервером, причем УС содержит вычислительное устройство, запоминающее устройство и...
Тип: Изобретение
Номер охранного документа: 0002688254
Дата охранного документа: 21.05.2019
31.05.2019
№219.017.70c4

Способ интерпретации искусственных нейронных сетей

Изобретение относится к области вычислительной техники и может быть использовано для интерпретации работы моделей искусственных нейронных сетей. Техническим результатом является повышение качества и точности интерпретации работы искусственной нейронной сети. Способ содержит этапы, на которых...
Тип: Изобретение
Номер охранного документа: 0002689818
Дата охранного документа: 29.05.2019
Showing 1-1 of 1 item.
05.08.2020
№220.018.3ca0

Способ и система определения схожести векторных представлений участников транзакций

Изобретение относится к способу и системе определения схожести векторных представлений участников транзакций. Технический результат заключается в повышении точности определения местоположения клиентов на основании данных о транзакции без использования географических координат. Способ содержит...
Тип: Изобретение
Номер охранного документа: 0002728953
Дата охранного документа: 03.08.2020
+ добавить свой РИД