×
09.02.2020
220.018.0138

Результат интеллектуальной деятельности: СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ

Вид РИД

Изобретение

№ охранного документа
0002713761
Дата охранного документа
07.02.2020
Аннотация: Изобретение относится к области вычислительной техники для обработки данных. Технический результат заключается в обеспечении определения местоположения участников транзакции с помощью используемых IP-адресов при их отнесении к заданному территориальному кластеру. Технический результат достигается за счет получения данных о транзакциях пользователей, содержащих IP-адреса отправителей и получателей транзакций; выполнения ранжирования частоты использования IP-адресов и количества транзакций между упомянутыми IP-адресами; формирования графа на основании данных ранжирования, в котором вершинами являются IP-адреса, а ребрами - количество переводов за определенный период времени между отправителями и получателями, использующими соответствующие IP-адреса; осуществления построения территориальных кластеров на основании сформированного графа, причем каждый кластер содержит несколько IP-адресов; получения транзакционной информации пользователя, содержащей по меньшей мере IP-адрес; осуществления поиска полученного IP-адреса в территориальном кластере и, в случае нахождения IP-адреса, присвоения пользователю соответствующего территориального кластера. 2 н. и 3 з.п. ф-лы, 5 ил.

ОБЛАСТЬ ТЕХНИКИ

[0001] Заявленное решение относится, в общем, к области обработки данных, а в частности к способу и системе поиска принадлежности IP-адресов территориальным кластерам на основе транзакционных данных.

УРОВЕНЬ ТЕХНИКИ

[0002] Все большая доля транзакций проводятся клиентами в удаленных каналах обслуживания, в которых единственным параметром, позволяющим определить фактическое расположение клиента, является IP-адрес. На текущий момент существуют справочники, которые сопоставляют конкретный IP-адрес с городом. Такие справочники не позволяют полноценно решать задачи, где необходимо понимать территориальное расположение клиента. Например, для случая противодействия мошенничеству, когда необходимо определение территориальной близости между двумя близкими по времени клиентскими сессиями в удаленном канале обслуживания, выполненными с различными IP-адресами. Основной причиной является то, что справочники устаревают, также IP-адреса могут переходить к другим провайдерам, принцип написания наименования населенных пунктов тоже не является формализованным в привязке к IP-адресам (один и тот же город зачастую имеет несколько написаний), точность для IP-адресов сотовых операторов крайне низкая.

[0003] Для целей анализа мошеннических действий при осуществлении транзакций существующие методы основываются на анализе удаленности пользователей от места выполнения транзакции, например, POS-терминалов, банкоматов и т.п. Для целей идентификации местонахождения участника транзакции может использоваться геолокация пользовательских устройств для выполнения транзакции, например, мобильных телефонов.

[0004] Такие решения, например, раскрываются в следующих патентных документах: US 20120215701 A1 (Playspan Inc., 23.08.2012), US 20190043054 A1 (Capital One Services LLC, 07.02.2019), US 20120209773 A1 (PayPal Inc., 16.08.2012).

[0005] Общим недостатком известных решений является необходимость использования уточняющих данных, характеризующих конкретные точки выполнения транзакций, в частности, известные решения основываются исключительно на использовании гео-позиции пользователя и средств выполнения транзакций для анализа точек предположительного местоположения, что не позволяет получить сегментированную информацию о территориальной принадлежности клиента тому или иному кластеру, соответствующему наиболее часто используемым IP-адресам, что позволит более быстро определить местоположение пользователя.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

[0006] Решаемой технической проблемой или технической задачей с помощью заявленного изобретения является формирование кластеров, указывающих территориальную принадлежность IP-адресов.

[0007] Технический результат заключается в обеспечении определения местоположения участников транзакции с помощью используемых IP-адресов при их отнесении к заданному территориальному кластеру.

[0008] Дополнительным техническим результатом является повышение скорости определения метаположения пользователя за счет сформированных кластеров, соответствующих территориальному распределению IP-адресов.

[0009] Заявленный результат достигается за счет компьютерно-реализуемого способа поиска принадлежности IP-адреса территориальному кластеру на основе данных транзакций, который выполняется с помощью процессора и содержит этапы, на которых:

- получают данные о транзакциях пользователей, содержащие IP-адреса отправителей и получателей транзакций;

- выполняют ранжирование частоты использования IP-адресов и количества транзакций между упомянутыми IP-адресами;

- формируют граф на основании данных ранжирования, в котором вершинами являются IP-адреса, а ребрами - количество переводов за определенный период времени между отправителями и получателями, использующими соответствующие IP-адреса;

- осуществляют построение территориальных кластеров на основании сформированного графа, причем каждый кластер содержит несколько IP-адресов;

- получают транзакционную информацию пользователя, содержащую по меньшей мере IP-адрес;

- осуществляют поиск полученного IP-адреса в территориальном кластере и в случае нахождения IP-адреса присваивают пользователю соответствующий территориальный кластер.

[0010] В одном из частных вариантов осуществления способа данные о транзакциях получают от устройств выполнения транзакций.

[0011] В другом частном варианте осуществления способа устройства представляют собой: мобильные устройства, банкоматы, POS-терминалы или их сочетания.

[0012] В другом частном варианте осуществления способа данные о транзакциях дополнительно содержат гео-координаты пользователя.

[0013] Заявленное решение также реализуется за счет компьютерной системы, содержащей по меньшей мере один процессор и память, хранящую исполняемые процессором инструкции для реализации вышеуказанного способа.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0014] Признаки и преимущества настоящего технического решения станут очевидными из приводимого ниже подробного описания изобретения и прилагаемых чертежей, на которых:

[0015] Фиг. 1 иллюстрирует блок-схему выполнения заявленного способа.

[0016] Фиг. 2 иллюстрирует пример построения графа на основании IP-адресов.

[0017] Фиг. 3 - Фиг. 4 иллюстрируют примеры сформированных кластеров.

[0018] Фиг. 5 иллюстрирует пример вычислительного устройства.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

[0019] На Фиг. 1 представлен процесс выполнения заявленного способа (100) поиска принадлежности IP-адреса территориальному кластеру. На первом шаге (101) осуществляется сбор данных о транзакциях, которые могут включать в себя историю трат, историю входов в интернет-банк, устройства клиента, финансовое поведение клиента, остатки на счетах и т.д. Данные транзакций пользователя содержат IP-адреса пользователей в формате ХХХ.ХХХ.ХХХ.ХХХ, участвующих в переводах денежных средств, в частности р2р транзакции (англ. Payer-to-payer). Данные транзакций, как правило, поступают от устройств осуществления транзакций, например, банкоматов, POS-терминалов, мобильных устройств пользователей с установленным приложением для выполнения транзакций и т.п.

[0020] По собранным данным транзакций, отбираются переводы между пользователями (р2р транзакции). Для каждого клиента определяется его IP-адрес класса С (ХХХ.ХХХ.ХХХ), с которого он осуществлял вход в канал выполнения транзакций, например, мобильное приложение Сбербанк Онлайн или использование банкомата наибольшее число раз. Далее на этапе (102) в каждой транзакции клиент-отправитель платежа и клиент-получатель платежа сопоставляются с IP-адресом класса С, полученным ранее. Затем все транзакции агрегируются по уникальной паре IP-адрес отправителя и IP-адрес получателя, а также подсчитывается число транзакций по этой паре. Пример статистики представлен в Таблице 1.

[0021]

[0022] На основе полученных данных по переводам между клиентами и их сессиям в удаленных каналах обслуживания (например, мобильное приложение, WEB-интерфейс) строится граф (этап 103), вершинами которого являются IP-адреса класса xxx.xxx.xxx, ребрами - количество переводов за определенный период времени между клиентами, использующими такие IP-адреса. Пример такого графа представлен на Фиг. 2. Граф ненаправленный. В случае, если между вершинами количество транзакций меньше заданного порога N (экспериментально N=40, если период 30 дней), то такое ребро исключается.

[0023] К построенному графу применяется алгоритм кластеризации (например, label propagation - https://en.wikipedia.org/wiki/Label_Propagation_Algorithm). Алгоритм кластеризации вершин графа позволяет отнести IP-адрес к определенному кластеру. Такая группировка позволяет выявлять IP-адреса, используемые клиентами, имеющими социальные и финансовые связи между собой (осуществление транзакций, обмен сообщениями посредством сети Интернет и т.п.). Алгоритм построения графа может быть реализован на основе алгоритма, раскрытого в статье «Community Detection via Semi-Synchronous Label Propagation Algorithms» (arXiv:1103.4450vl, 23.03.2011). Работа алгоритма основывается на ранжировании и отборе наибольших кластеров, их которых выбирается заданное число кластеров (например, 11 кластеров, что является оптимальных в ходе проведенных экспериментов), оставшиеся кластеры объединяются в один. На основании кластеризации графа формируются территориальные кластеры (104), которые позволяют на основе данных об использовании клиентами средств выполнения транзакций (банкоматов, POS-терминалов, мобильного приложения, посещения офисов банка и др.) определить фактическое местоположение клиента в определенный временной период. Результатом данного алгоритма является многоугольник, заданный гео-координатами на поверхности земли с плотностью распределения точек активности клиента.

[0024] Границы многоугольника могут определяться методом, схожим с картографированием ареала живых организмов (контурный метод), при котором на карту наносятся линейные границы ареала, с формированием контурной линии всей территории, в пределах которой можно встретить клиента, проявившего транзакционную активность. Дополнительно определяется центр многоугольника (медиана значений координат точек, входящих в многоугольник) и, в случае нахождения выброса в данных (координата, выделяющаяся от общей выборки по клиенту и определяемая «правилом трех сигм»), многоугольник перестраивается заново без точек-выбросов.

[0025] Данный подход позволяет каждого клиента, участвующего в кластеризации, отнести к определенному кластеру следующим способом:

• найти его самый часто используемый IP-адрес класса С (ХХХ.ХХХ.ХХХ);

• найти, к какому кластеру относится этот IP-адрес;

• присвоить клиенту выявленный кластер.

[0026] Алгоритм сопоставления гео-позиционирования клиента с IP-адресами клиентских сессий - используются для составления базы данных, с помощью которой можно определить территориальный кластер IP-адреса. Территориальный кластер представляет собой многоугольник, заданный гео-координатами на поверхности земли, построенный на основе данных клиентов, использующих IP-адрес с вычисленным кластером и по которым известны точные гео-кординаты местонахождения (например, при посещении офиса банка) (105). При получении информации по текущим сессиям клиентов, осуществляющих транзакции, в частности данным использующихся IP-адресов при использовании устройств осуществления транзакций, выполняется сравнение полученного IP-адреса со сформированными территориальными кластерами, и при выявлении соответствующего IP-адреса в том или ином кластере клиенту присваивается территориальное месторасположение в рамках заданного кластера.

[0027] Определение наиболее часто используемого IP-адреса клиентом может выполняться с помощью анализа его транзакционной активности за заданный промежуток времени, например, день, неделя, месяц и т.п. Дополнительно в процессе кластеризации IP-адресов клиентов могут использоваться личные идентификаторы клиентов, например, данные паспорта, идентифицирующие территориальную регистрацию клиентов.

[0028] Примеры сформированных кластеров представлены на Фиг. 3 - Фиг. 4. Для валидации полученных результатов работы алгоритма (100) было отобрано по 10000 клиентов из каждого кластера, по каждому клиенту была вычислена его средняя точка обитания (по использованию банкоматов и POS-терминалов). Точки нанесены на географическую карту и разбиты по сформированным кластерам.

[0029] На основании полученной информации по кластерам была оценена бизнес-метрика, в ходе которой были отобраны данные транзакций между клиентами, по которым поступала информация по подозрению в осуществлении мошеннических действий (фрод) от системы фрод-мониторинга. За заданный период времени было получено 86 519 срабатываний. Уникальное количество клиентов, участвующих в этих транзакциях (отправитель и получатель) - 142847. По 118536 (83%) клиентам был сформирован кластер.

[0030] Если из транзакционных переводов исключить транзакции, по которым у отправителя и получателя нет кластера либо он «0» (объединение малых кластеров), то для оценки остается 50199 транзакций (58%). Если ввести признак «равенство кластера отправителя и получателя», то распределение: перевод в разрезе легитимных ("G") и мошеннических ("F") транзакций будет выглядеть, как представлено в Таблице 2.

[0031] Созданный способ (100) кластеризации клиентов инструмент позволяет по истории входов в интернет-банк (IP-адреса) разделить клиентов по принадлежности к географической общности, не используя знания об их гео-координтах. На сегодняшний момент многие клиенты пользуются только мобильным приложением интернет-банка (узнают остатки денежных средств, осуществляют переводы и т.д.). Есть также клиенты, использующие и мобильное приложение и банкоматную сеть (внос/снятие наличных, подключение мобильного банка и т.д.). При использовании банкомата можно определить, в каком месте находился клиент, получая услугу. Составленный алгоритм позволяет использовать знания о поведении клиентов, использующих как банкоматы, так и мобильное приложение, при обогащении профилей клиентов, не оставляющих географический след. Таким образом, реализуется возможность применимости моделей, в которых есть необходимость понимания фактического месторасположения клиента, на тех, кто пользуется только интернет-банком с отключенным модулем определения геолокации.

[0032] Результаты работы кластеризации могут использоваться в качестве дополнительного признака для повышения эффективности модели скоринга транзакции. При осуществлении легитимных транзакций клиенты чаще осуществляют переводы клиентам, которые находятся в одной географической местности с отправителем. При этом в мошеннических переводах чаще наблюдается паттерн поведения, в котором отправитель и получатель находятся на далеком расстоянии друг от друга: мошенникам не всегда известна локация жертвы и подобрать клиента получателя из того же региона, что и отправитель - затруднительно. При создании модели оценки перевода на возможное мошенничество признак одного географического местоположения отправителя и получателя оказывает сильное влияние на снижение ложных срабатываний антифрод системы.

[0033] На Фиг. 5 представлен пример общего вида вычислительной системы (200) на базе вычислительного устройства (200), которое обеспечивает реализацию заявленного способа (100). Устройство (200) может является частью компьютерной системы, например, сервером, обрабатывающим необходимые данные для осуществления способа (100).

[0034] В общем случае, вычислительное устройство (200) содержит объединенные общей шиной информационного обмена один или несколько процессоров (201), средства памяти, такие как ОЗУ (202) и ПЗУ (203), интерфейсы ввода/вывода (204), устройства ввода/вывода (205), и устройство для сетевого взаимодействия (206).

[0035] Процессор (201) (или несколько процессоров, многоядерный процессор) могут выбираться из ассортимента устройств, широко применяемых в текущее время, например, компаний Intel™, AMD™, Apple™, Samsung Exynos™, MediaTEK™, Qualcomm Snapdragon™ и т.п. Под процессором также необходимо учитывать графический процессор, например, GPU NVIDIA или ATI, который также является пригодным для полного или частичного выполнения способа (100). При этом, средством памяти может выступать доступный объем памяти графической карты или графического процессора.

[0036] ОЗУ (202) представляет собой оперативную память и предназначено для хранения исполняемых процессором (201) машиночитаемых инструкций для выполнение необходимых операций по логической обработке данных. ОЗУ (202), как правило, содержит исполняемые инструкции операционной системы и соответствующих программных компонент (приложения, программные модули и т.п.).

[0037] ПЗУ (203) представляет собой одно или более устройств постоянного хранения данных, например, жесткий диск (HDD), твердотельный накопитель данных (SSD), флэш-память (EEPROM, NAND и т.п.), оптические носители информации (CD-R/RW, DVD-R/RW, BlueRay Disc, MD) и др.

[0038] Для организации работы компонентов устройства (200) и организации работы внешних подключаемых устройств применяются различные виды интерфейсов В/В (204). Выбор соответствующих интерфейсов зависит от конкретного исполнения вычислительного устройства, которые могут представлять собой, не ограничиваясь: PCI, AGP, PS/2, IrDa, FireWire, LPT, COM, SAT A, IDE, Lightning, USB (2.0, 3.0, 3.1, micro, mini, type C), TRS/Audio jack (2.5, 3.5, 6.35), HDMI, DVI, VGA, Display Port, RJ45, RS232 и т.п.

[0039] Для обеспечения взаимодействия пользователя с вычислительным устройством (200) применяются различные средства (205) В/В информации, например, клавиатура, дисплей (монитор), сенсорный дисплей, тач-пад, джойстик, манипулятор мышь, световое перо, стилус, сенсорная панель, трекбол, динамики, микрофон, средства дополненной реальности, оптические сенсоры, планшет, световые индикаторы, проектор, камера, средства биометрической идентификации (сканер сетчатки глаза, сканер отпечатков пальцев, модуль распознавания голоса) и т.п.

[0040] Средство сетевого взаимодействия (206) обеспечивает передачу данных устройством (200) посредством внутренней или внешней вычислительной сети, например, Интранет, Интернет, ЛВС и т.п. В качестве одного или более средств (206) может использоваться, но не ограничиваться: Ethernet карта, GSM модем, GPRS модем, LTE модем, 5G модем, модуль спутниковой связи, NFC модуль, Bluetooth и/или BLE модуль, Wi-Fi модуль и др.

[0041] Дополнительно могут применяться также средства спутниковой навигации в составе устройства (200), например, GPS, ГЛОНАСС, BeiDou, Galileo.

[0042] Представленные материалы заявки раскрывают предпочтительные примеры реализации технического решения и не должны трактоваться как ограничивающие иные, частные примеры его воплощения, не выходящие за пределы испрашиваемой правовой охраны, которые являются очевидными для специалистов соответствующей области техники.


СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
СПОСОБ И СИСТЕМА ПОИСКА ПРИНАДЛЕЖНОСТИ IP-АДРЕСА ТЕРРИТОРИАЛЬНОМУ КЛАСТЕРУ НА ОСНОВЕ ДАННЫХ ТРАНЗАКЦИЙ
Источник поступления информации: Роспатент

Showing 31-40 of 46 items.
17.06.2020
№220.018.26f2

Способ и система для создания мимики на основе текста

Изобретение относится к области обработки данных изображения. Технический результат заключается в обеспечении возможности создания видеопотока с анимированным изображением 3D-модели головы с размещенной на ней динамической текстурой лицевой маски на основе данных речевого сигнала. Получают...
Тип: Изобретение
Номер охранного документа: 0002723454
Дата охранного документа: 11.06.2020
17.06.2020
№220.018.26fb

Компьютерно-реализуемый способ и система централизованного управления операционным днем финансово-кредитной организации

Изобретение относится к способу централизованного управления операционным днем финансово-кредитной организации. Технический результат заключается в повышении уровня управляемости и контроля выполнения внутридневных процедур операционного дня и снижения количества ошибок при формировании...
Тип: Изобретение
Номер охранного документа: 0002723452
Дата охранного документа: 11.06.2020
17.06.2020
№220.018.2713

Способ расчета кредитного рейтинга клиента

Изобретение относится к автоматизированному способу оценки кредитного рейтинга клиентов на основании данных транзакционной активности с помощью алгоритма машинного обучения. Техническим результатом является обеспечение автоматизированного расчета кредитного рейтинга клиента на основании его...
Тип: Изобретение
Номер охранного документа: 0002723448
Дата охранного документа: 11.06.2020
17.06.2020
№220.018.271e

Способ и система для оплаты услуг

Изобретение относится к способу и системе оплаты услуг. Технический результат заключается в повышении скорости и надежности обработки данных при переводе денежных средств со счета плательщика на счет получателей денежных средств, в том числе поставщиков услуг напрямую. Способ содержит этапы, на...
Тип: Изобретение
Номер охранного документа: 0002723459
Дата охранного документа: 11.06.2020
17.06.2020
№220.018.2775

Способ и система поиска устройства самообслуживания

Изобретение относится к средствам обработки цифровой информации. Технический результат заключается в обеспечении автоматизированного подбора УС с необходимым функционалом для выполнения транзакции. Способ поиска устройства самообслуживания (УС) включает этапы, на которых: формируют с помощью...
Тип: Изобретение
Номер охранного документа: 0002723456
Дата охранного документа: 11.06.2020
29.06.2020
№220.018.2c6b

Способ обработки информации для наполнения библиотеки моделей данных и устройство для его осуществления

Изобретение относится к области вычислительной техники, а в частности к способу и устройству обработки информации для наполнения библиотеки модели моделей данных. Техническим результатом заявленного решения является повышение эффективности формирования моделей за счет повышения их точности....
Тип: Изобретение
Номер охранного документа: 0002724799
Дата охранного документа: 25.06.2020
01.07.2020
№220.018.2d9d

Способ и система сонификации событий кибербезопасности на основании анализа действий средств сетевой защиты

Изобретение относится к области сонификации событий кибербезопасности. Техническим результатом является повышение эффективности реагирования на возникающие события кибербезопасности в сетевых зонах за счет применения схемы сонификации событий. Осуществляют сбор данных событий кибербезопасности,...
Тип: Изобретение
Номер охранного документа: 0002724984
Дата охранного документа: 29.06.2020
29.07.2020
№220.018.38b3

Способ и система выявления вредоносных файлов с помощью генерирования объявлений на торговых онлайн платформах

Изобретение относится к области компьютерных технологий для выявления вредоносного ПО. Технический результат направлен на расширение арсенала средств того же назначения. Способ выявления вредоносных файлов с помощью генерирования объявлений на торговых онлайн платформах (ТОП), выполняемый с...
Тип: Изобретение
Номер охранного документа: 0002727932
Дата охранного документа: 27.07.2020
05.08.2020
№220.018.3ca0

Способ и система определения схожести векторных представлений участников транзакций

Изобретение относится к способу и системе определения схожести векторных представлений участников транзакций. Технический результат заключается в повышении точности определения местоположения клиентов на основании данных о транзакции без использования географических координат. Способ содержит...
Тип: Изобретение
Номер охранного документа: 0002728953
Дата охранного документа: 03.08.2020
12.04.2023
№223.018.4351

Способ и система защиты информации от утечки при печати документов с помощью смещения символов

Изобретение относится к области защиты информации, в частности к решениям для предотвращения утечки информации при печати документов. Технический результат заключается в повышении эффективности защиты данных от утечки, за счет внедрения уникального кода пользователя в документ для последующей...
Тип: Изобретение
Номер охранного документа: 0002793611
Дата охранного документа: 04.04.2023
Showing 1-1 of 1 item.
05.08.2020
№220.018.3ca0

Способ и система определения схожести векторных представлений участников транзакций

Изобретение относится к способу и системе определения схожести векторных представлений участников транзакций. Технический результат заключается в повышении точности определения местоположения клиентов на основании данных о транзакции без использования географических координат. Способ содержит...
Тип: Изобретение
Номер охранного документа: 0002728953
Дата охранного документа: 03.08.2020
+ добавить свой РИД