Где взять данные для скоринга? 16.08.2018
Об альтернативных источниках данных для построения скоринг-модели на примере зарубежных компаний и о моделях, объединяющих розничные подходы к оценке заемщика с корпоративными. // 16.08.2018
Оценка заемщика
Если вы занимаетесь кредитным скорингом, то знаете, что существует два пути повышения качества статистической модели:
- Model fitting (настройка модели) – подбор и настройка модели, наилучшим образом описывающей имеющиеся данные;
- Feature generation (генерация фичей) – процесс получения необработанных, неструктурированных данных и определения фичей (факторов модели) для потенциального использования в вашей статистической модели.
Хочу на примере сегмента малого и микробизнеса показать, где можно взять данные для генерации новых фичей в том случае, если внутренние ресурсы банка уже использованы. Специфика малого и микробизнеса заключается в том, что мы находимся между розничным и корпоративным бизнесом: наши клиенты – уже не физические лица, но еще не полноценные компании. Принять кредитное решение на основании только социально-демографических факторов заявителя (пола, возраста и т.д.) уже проблематично, а полноценной финансовой отчетности у малых компаний и предпринимателей еще нет. Поэтому в своих моделях мы объединяем розничные подходы к оценке заемщика с корпоративными.
Рис. 1. Скоринг МСБ объединяет скоринг физических лиц и финансовый анализ корпоративных клиентов
Альтернативные источники данных под конкретные задачи
В последнее время в связи с развитием финтеха появилось множество альтернативных источников данных, используемых для кредитного скоринга. Каждый отдельный источник обладает собственным уровнем надежности, качеством данных, их доступностью и уровнем покрытия. На возможность применения данных также влияют локальная платежная культура, практики ведения бизнеса, культурные нормы региона и отрасли. Поэтому нельзя выделить ценные источники среди общего множества: возможность использования данных зависит от конкретной бизнес-задачи. Для иллюстрации широты альтернативных источников данных мы собрали примеры их применения различными банками и финтех-компаниями.
Bintbond
К примеру, немецкий сервис p2p-кредитования Bintbond при оценке заемщика использует данные личных кабинетов онлайн-сервисов: каждый заемщик должен дать доступ как минимум к двум онлайн-профилям для завершения заполнения заявки на кредит. Это могут быть PayPal, eBay, Amazon, MercadoLibre, Google Analytics, Debitoor (онлайн-бухгалтерия) или личный кабинет интернет-банка. На Amazon, к примеру, можно увидеть количество доставленных заказов, адреса доставки и список товаров, из аккаунта eBay – получить информацию о количестве и качестве отзывов покупателей: эти данные, несомненно, отражают деловую активность клиента и коррелируют с вероятностью возврата кредита. Доступ к интернет-банку либо PayPal-аккаунту проливает свет на финансовое состояние заемщика и показывает текущую задолженность. Доступ к Google Analytics предоставляет информацию об объеме трафика и доходе, генерируемых сайтом компании. При подключении к аккаунтам в таких сетях, как Facebook, Twitter и LinkedIn, можно получить тысячи дополнительных атрибутов для анализа. Дополнительно компания использует видеоверификацию как заемщиков, так и кредиторов. Единовременно, при регистрации, клиент показывает сотруднику безопасности паспорт через веб-камеру, после чего на e-mail приходит код верификации.
Funding Circle
Английский p2p-сервис Funding Circle автоматически накапливает используемую для принятия решения информацию из множества доступных источников через API, что позволяет компании принимать более быстрые и гибкие решения по сравнению с традиционными банками. В дополнение к классическим бизнес-метрикам, таким как отчетность компании, документы собственника, информация о залоге и об активах, компания использует альтернативные источники данных для принятия решения о выдаче кредита, в том числе: транзакционные и платежные данные банков-партнеров (в частности, Santander и RBS), данные облачной бухгалтерии (Intuit и Sage), сведения о поиске сотрудников и об открытых вакансиях с сайтов по поиску работы. Также детально анализируются персональная кредитная история собеседника и его финансовое состояние как физического лица. Дополнительно требуется персональная гарантия собственника по каждой компании-заемщику.
Iwoca
Компания онлайн-кредитования малого бизнеса Iwoca использует данные платежных сервисов, обслуживающих точки безналичной оплаты (таких как Magento, Skrill, Shopify, Sage Pay, PayPal, Linnworks), а также данные облачной бухгалтерии (например, FreeAgent и Sage), банковские API, данные об уплаченных налогах (VAT, можно скачать с сайта государственного учреждения HMRC). Информация об уплаченных налогах (VAT) свидетельствует о наличии продаж у компании-заявителя. Iwoca также интегрирована с сервисом облачной бухгалтерии Xero, что позволяет подавать заявку напрямую из Xero без сбора пакета документов, путем нажатия одной кнопки. Iwoca кредитует малый и средний бизнес в Великобритании и некоторых странах Европы.
Branch
Несмотря на то что клиентами являются юридические лица, в скоринговые модели зачастую попадает информация, касающаяся физических лиц, например история звонков или поведение в интернете. Американская компания Branch кредитует в основном физических лиц, но также и сегмент микробизнеса. В основе скоринговых моделей лежат данные, полученные из мобильного телефона: логи SMS, данные социальных сетей, история звонков, данные геопозиционирования и список контактов. Латвийский сервис р2р-кредитования для сегмента малого и микробизнеса использует при заполнении заявки модели оценки поведения клиента в интернете, историю посещения сайтов, историю предыдущих заявок. Логика в этом есть: если заявитель не читает информацию полностью, использует copy-paste, это значит, что он не думает о возврате кредита и хочет получить деньги максимально быстро. Если заявитель тратит много времени на изучение информации, пробует различные параметры кредита – это свидетельствует о планировании возврата кредита.
Aprenita
Существуют узкоспециализированные направления кредитования: например, сервис Aprenita, расположенный в Нью-Йорке, занимается кредитованием компаний – разработчиков мобильных приложений. Для оценки кредитоспособности заемщиков компания использует данные AppStore и GooglePlay. С помощью аналитических платформ, таких как Flurry, Localytics, MixPanel и AppsFigures, она получает данные о количестве загрузок приложений, объемах продаж, отзывах пользователей, рекламных кампаниях и т.д. Aprenita не требует персональных гарантий собственников бизнеса и данных кредитного бюро.
Kabbage
Крупный американский сервис кредитования малого бизнеса Kabbage при оценке кредитного риска в числе множества источников альтернативных данных использует данные службы доставки UPS, Facebook business, Yelp, Foursquare, Amazon и eBay для определения геолокации, отзывов клиентов, рейтингов. По информации Kabbage, клиенты, которые предоставляют информацию о своих аккаунтах в социальных сетях, на 20% менее склонны к дефолту по сравнению с теми, кто этого не делает. Сервис доставки UPS измеряет почтовую активность, количество доставленных посылок, тенденцию к увеличению или снижению объемов корреспонденции, число возвращенных посылок, длительность ведения бизнеса по конкретному адресу. К примеру, если мы знаем, что заявитель – индивидуальный предприниматель, продающий антикварные кружки в течение как минимум двух лет через eBay и Amazon, всегда пользуется двухдневной доставкой UPS, имеет более 500 друзей на Facebook и регулярно постит новости в Twitter, то такой клиент получит дополнительные скоринговые баллы. Kabbage предлагает малым предпринимателям на рынке США кредитную линию для развития бизнеса с автоматически корректируемым кредитным лимитом. Средний размер кредитной линии – $25 000, при этом рост выручки кредитуемых предпринимателей составляет 72% в год.
Lendingkart
Еще несколько альтернативных источников данных применяет индийская компания Lendingkart, которая оценивает продажи на сайте клиента через сервисы электронной коммерции, такие как Flipkart, Paytm, Voonik и Craftsvilla. Данные из приложения SmartShift используются для оценки транспортных компаний. Приложение позволяет заказать грузовик в зависимости от размера, веса и других параметров перевозимого груза. Также используются данные Unicommerce – мультиканальной системы автоматического заполнения полей.
AliExpress – Ant Finance
Финансовое подразделение AliExpress – Ant Finance – предлагает малым предпринимателям сервис кредитования 24/7. Процесс получения кредита занимает 3 минуты от начала регистрации клиента в системе. Для принятия решения используются информация об объемах продаж на сайте AliExpress, денежных потоках через Alipay, комментарии и отзывы покупателей.
Таблица. Наиболее популярные источники данных и компании, их использующие
Тип источника данных |
Что используют? |
Кто использует? |
Электронные кошельки |
PayPal, Magento, Skrill, Shopify, Sage Pay |
Iwoca, Funding Circle, Bintbond |
Интернет-магазины и сервисы доставки товаров |
eBay, Amazon, Facebook business, AliExpress, Flipkart |
Kabbage, Ant Finance, Lendingkart, Bintbond |
Геосервисы |
Foursquare, Yelp |
Kabbage, Funding Circle |
Сервисы доставки |
UPS, Amazon, eBay, SmartShift |
Kabbage |
Статистические веб-сервисы |
AppStore, GooglePlay, Flurry, Localytics, MixPanel, AppsFigures, Google Analytics |
Aprenita |
Сотовые операторы |
Звонки, SMS |
Branch |
Госорганы |
Налоги (HMRC) |
Iwoca |
Онлайн-бухгалтерия |
Intuit, Sage, Debitoor, FreeAgent, Xero |
Funding Circle |
Социальные сети |
Facebook, Twitter, LinkedIn |
Bintbond, Kabbage |
Как мы видим, применительно к сегменту микро- и малого бизнеса в мире используются различные источники данных. Пограничное положение сегмента между физическими лицами и компаниями позволяет использовать данные, относимые к этим двум сегментам кредитования. Возможности использования тех или иных данных расширяются в зависимости от бизнес-модели кредитора, специфики отрасли, локальной платежной культуры, практик ведения бизнеса и т.д.
Дата: 16.08.2018
Автор: Игорь Бархатов