Публикация Школы траблшутеров

Не поймать и обезвредить, а найти и заставить заплатить

Время чтения: 9 мин 10 сек
1 февраля 2020 г. Просмотров: 6

В предыдущем материале рассказал о построении системы принятия мгновенных кредитных решений CreditCheck, пришёл черёд поведать к чему привела достигнутая скорость. Нет, не к повышенному уровню просрочки – она то как раз в процентном отношении снизилась, доказав гипотезу, что при лидирующем росте объёма портфеля уровень мошенников начинает за ним не поспевать.

None

Быстрая выдача займов привела к накоплению громадных объёмов разноструктурированной информации, которую руки зачесались использовать для Skip Tracing – процесса поиска скрывающихся должников с целью мирного принуждения к погашению долгов. Классическая технология работы с просрочкой обычно выглядела так:

  1. Вежливый намёк – push-уведомление или SMS.
  2. Твёрдое напоминание – звонок или письмо в почтовый ящик.
  3. Грозный визит – приход в гости с нудным разговором о совести и долгах.

Далее следовало обращение в суд и юридическая канитель, заканчивающаяся решением в пользу банка (проигрышные пакеты документов не подавались), не гарантирующая возврат пропущенных платежей. Затем задолженность списывалась, но разве ради этого затевалась гонка? Да и резервы из-за ухудшения качества кредитного портфеля банку приходилось наращивать.

Мы решили добавить новый этап в борьбу с просрочкой под названием «Социальная смерть», при котором вознамерились поставить в известность всех, кто когда-либо контактировал со злостным должником о его непорядочности. Первым делом построили «вселенную» объектов, через которые планировали «негодяев» доставать (см. рис. 1).

Рис. 1. Вселенная объектов поиска скрывающихся должников

Провели анализ информации, предоставленной апликантами при оформлении кредитных заявок, чтобы оценить полноту, достоверность, актуальность и применимость для розыска. Оценив каждое поле анкеты займа, а также их совокупности получили теоретический индекс успешности в обнаружении надёжных контактов (см. рис. 2).

Рис. 2. Индексы теоретической успешности использования поисковых полей и их сочетаний

Выполнив полные переборы строк кредитных анкет при реальном поиске 10’000 «забывчивых», разделили известные текстовые и числовые данные на три категории перспективности поиска:

  1. Использование обязательно, внедрение в процесс произведено
  2. Применение целесообразно, реализация возможна
  3. Поиск желателен, технически не доступен (см. рис. 3).

Рис. 3. Карта перспективности реального применения полей анкеты в поисковых запросах

На коленке сверстали «мордочку» будущего приложения, назвав SAGA.Finder, соединив простейшими запросами с SQL-сервером, что позволило немедленно приступить к тестированию поисков по адресам и телефонам (см. рис. 4).

Рис. 4. Окно Saga.Finder для поисков по телефонам и адресам

В единую базу данных стали передавать информацию юридических и физических лиц из CreditCheck, а из вбиваемых в интерфейс текстовых строк принялись формировать массивы с отклонением в единицу по расстоянию Левенштейна – разницей в один знак: пропущенный, вставленный или изменивший позицию. Оператор вбивал несколько известных строк или текстовых фрагментов, а машина перебирала в словарях доступные варианты фамилий, имён, отчеств, названий организаций, улиц, варьировала цифры в номерах телефонов и выводила «полотно» грядущего исследования (см. рис. 5).

Каждая из строк ответа SAGA.Finder не на начальный запрос, а на массив потенциальных отклонений снабжалась упреждающими маркерами, которые в зависимости от результативности поиска оставались либо пассивны, что означало «объект не найден», либо активны – «варианты есть»:

  1. Первый диез – найдены персональные данные.
  2. Телефон – обнаружены телефонные номера.
  3. Треугольник – имеются коллеги по работе.
  4. Мяч – объект присутствует в «цветных» списках.
  5. Личная карточка – есть фотография.
  6. Второй диез – найдены данные организации.

Рис. 5. Окно результатов множественного поиска по телефонам и адресам

Выбором активного маркера можно было переместиться на соответствующее представление, что на ИТ-шном сленге называется Drill Down. Персональная карточка агрегировала информацию, которую можно было явно или косвенно ассоциировать с искомой персоналией (см. рис. 6). Данные приоретизировались, таким образом, чтобы первыми строками указывалась наиболее вероятная текущая информация, а после неё шла косвенная и отдалённая, с учётом коэффициентов достоверности.

Рис. 6. Окно персональной карточки скрывающегося должника

«Проваливание» в цветные списки, отражало вариации:

  1. Белый – предыдущий кредит выплачен без пени и просрочек.
  2. Серый – займ пришлось «выбивать» или возврат произведён не до нуля.
  3. Зелёный – организация места работы сотрудничает с банком по кредитованию.
  4. Синий – предприятие «замерло»: проводит всё меньше операций по счетам в банке.
  5. Красный – организация находится в стадии ликвидации или погрязла в судебных тяжбах.
  6. Чёрный – клиент отказывается вернуть долг и пытается скрыться от правосудия (см. рис. 7).

Рис. 7. Окно нахождения похожих людей в цветных списках

Следующим режимом предусмотрели оповещение бывших или действующих коллег по работе, начиная с отдела кадров, бухгалтерии, директоров и акционеров (исключительно для ООО с малыми уставными фондами) (см. рис. 8).

Рис. 8. Окно нахождения бывших или действующих коллег

Естественно, требовалось действовать взвешенно, поэтому разработали «секретный» алгоритм под кодовым названием «Круги по воде», целью которого было концентрически вычислять:

  1. наиболее подходящих сослуживцев, желательно проживающих неподалёку: в соседних частных домах или квартирах на смежных этажах
  2. организации, числящиеся по тем же физическим и юридическим адресам (см. рис. 9).

Рис. 9. Окно «телефонных» кругов, начиная с приоритетных

Особой гордостью стал механизм поиска потенциальных родственников по: фамилии и отчеству, датам рождения, адресам предыдущего совместного проживания (см. рис. 10). Именно благодаря ему удалось войти в контакт с 11,7% людей, которые уговорили должников вернуть деньги и спать спокойно. Наиболее авторитетными оказались контактные лица женского пола: мамы, жёны и сёстры – их скрывающиеся слушали чаще всего.

Рис. 10. Окно предположений о вероятном родстве

Когда исчерпывались возможности предыдущих вариантов, в дело вступала тяжёлая артиллерия, ковровое бомбометание: о нерадивости заёмщика сообщали соседям по подъезду, дому или улице, в зависимости от квартирности здания и количества жителей населённого пункта (см. рис. 11).

Рис. 11. Окно обзвона соседей по дому

Следующим логичным шагом стала пакетная обработка больших массивов должников с выгрузкой кампаний для обзвона через CRM. На рис. 12 приведён пример Excel-версии, которая использовалась во время отладки.

Рис. 12. Пакетная обработка поиска скрывающихся должников

Многие ответственные граждане корректировали операторов колл-центра, что позволило исправлять ошибки, часто встречавшиеся в названиях улиц городов (см. рис. 13). Поэтому даже безрезультативные в моменте звонки нередко оказывались полезны в перспективе дальнейших поисков.

Рис. 13. Окно улиц населённого пункта

Мы замеряли количество режимов, которые выбирали операторы при ручных операциях розыска с тем, чтобы совершенствовать средства автоматизации (см. рис. 14).

Рис. 14. Статистика произведённых поисков

Отдельно изучали корреляцию между трудолюбием сотрудников и результативностью обнаружения «негодяев» (см. рис. 15).

Рис. 15. Отчёт о производительности сотрудников

Итогом экспериментов стала универсальная автоматизированная система поисков скрывающихся должников кредитно-финансового учреждения из стандартного браузера, которая за 18 месяцев помогла вернуть 3,1% безнадёжно просроченных займов крупного банка, что с лихвой оплатило процесс проектирования и разработки.

Пользователями SAGA.Finder кроме подразделения розыска «пропавших» клиентов стали:

  • команда противодействия мошенничеству
  • служба экономической безопасности
  • полевые коллекторы.

В пике нагрузки с системой работали более 2’000 человек, а объём знаний к концу второго года эксплуатации составлял семь миллионов записей о связанности физических и юридических лиц между собой, документами, телефонами, адресами, прочими идентификаторами. Среднее время поиска информации за день ни разу не превысило 2 секунды. Журналируемый доступ позволил выявлять оптимальные методы работы лучших «сыскарей» и тиражировать на коллективы смен подразделения Skip Tracing.

Открытый протокол взаимодействия с внешними системами не один раз сыграл добрую службу при оказании дружественной помощи силовым структурам при расследовании особо тяжких преступлений. Да-да, вам не показалось: SAGA.Finder неоднократно демонстрировал алгоритмическое преимущество даже перед более наполненными и централизованными системами хранения данных государственного значения. Не без обоюдной выгоды.