eng
1 июня 2020 журнал "Риск-менеджмент в кредитной организации"

Как повысить эффективность проверки контрагентов в условиях кризиса и сэкономить на этом

Скоринги на публичных данных: сильные и слабые стороны 

Преимущества публичных скорингов состоят в следующем. Во-первых, они строятся на данных о генеральной совокупности, а не на неболь­ших выборках, что повышает их предсказательную силу и стати­стическую значимость (т.е. увеличивается вероятность того, что входящие в модель параметры, например коэффициенты в регрес­сионной модели, не нулевые). Во-вторых, сбор и обработка огромных массивов данных, как и моделирование, происходят на стороне поставщика таких скорингов, что существенно облегчает оценку контрагентов. В-третьих, публичные данные, как правило, открыты и верифицированы, что обеспечивает доверие как к самим данным, так и к моделям, построенным на них. 

Слабая же сторона аналитических моделей, построенных на публич­ных данных, проявляется в том, что определенная часть факторного пространства по объективным причинам не может быть задейство­вана, поскольку составляет коммерческую тайну или относится к другим чувствительным конфиденциальным сведениям. Однако на своей стороне банк может использовать в том числе и такие данные о своих контрагентах. 

Что мы знаем о своем контрагенте? 

Сегодня "СПАРК-Интерфакс" изменил алгоритмы учета отраслей: отрасли, наиболее пострадавшие от пандемии, получили новые поправки к скоринговой оценке. Резко возросло влияние факторов, данные по которым обновляются оперативно, в частности данные по платежной дисциплине, онлайн-кассам, исковой нагрузке и т.п. 

Индекс платежной дисциплины показывает, насколько вовремя компания или ИП рассчитывается со своими поставщиками. Для этого СПАРК собирает от своих крупных партнеров (поставщиков сферы ЖКХ, телекоммуникационных и транспортных компаний, оптовиков) реальные сведения о своевременности оплаты счетов сотнями тысяч их контрагентов. 

По опыту предыдущих лет, нарастание неплатежей предсказывало банкротства (которые теперь, правда, под мораторием). Девяносто процентов компаний, которые затем обанкротились, сначала задер­живали платежи контрагентам. 

В то же время влияние отчетности компаний за 2019 г., которую мы увидим в сентябре 2020 г., на реальное положение вещей будет практически незначимым и позволит оценить только некий нако­пленный резерв прочности перед наступлением текущих событий. 

Кроме публичных данных, доступных, например, в СПАРК, орга­низации также обладают внутренней информацией, характеризую­щей различные факторы и историю отношений с контрагентами. Это:

— платежная дисциплина контрагента (на основе внутренних реестров);
— наличие просроченной дебиторской задолженности по уже существующим контрактам;
— при наличии соответствующего согласия — кредитная история контрагента и его ключевых персоналий;
— наличие претензий к выполнению договорных обязательств;
— наличие претензий со стороны официальных органов, о которых неизвестно широкому кругу лиц;
— документы, подтверждающие наличие активов, основных средств, необходимого объема ресурсов;
— налоговые декларации и выписки со счетов бухгалтерского учета, получаемые непосредственно из бухгалтерских программ. 

Все эти (и не только эти) источники корпоративных данных могут сослужить хорошую службу при разработке кастомизированного скоринга, построенного на основе объединения внутренних и внеш­них данных. 

Пример 

Крупный нефтехимический холдинг построил работу по внедрению системы следующим образом. 

На первом этапе для участия в эксперименте были приглашены примерно 2000 контрагентов, которые предоставляли перечисленные выше данные о себе в добровольном порядке. Это привело к форми­рованию простой модели на основе бинарных признаков, которая позволяла скорректировать существующие публичные скоринги контрагента. 

На втором этапе, когда количество контрагентов охватило уже около 50% по каждому региону и отрасли, рассчитывался средний уровень показателя, который использовался для сравнения вместе с бинарными признаками. При этом отклонение от среднего или медианы для каждого значимого показателя из предоставленных данных находилось в диапазоне 25–30%. 

На третьем этапе, когда объем покрытия системой мониторинга контрагентов приблизился к 100% (тут важно отметить, что система мониторинга не охватывала особо крупные и всемирно известные компании и контрагентов с оборотами ниже критерия существен­ности), число бинарных признаков стало минимальным, а количе­ственные признаки сравнивались не только со средним значением, но и со средним или модой или медианой по сегменту. В качестве сегментов использовались регион, отрасль, аналогичные компании- конкуренты и другие сегменты, для определения которых была применена кластеризация статистическими методами. Также на третьем этапе появилась возможность использовать шкалирование переменных. 

Для расчета поправки на первом и втором этапах использовались простые линейные функции, на третьем — дерево решений. 

Как интегрировать внутренние и внешние данные 

Процесс интеграции внутренних и внешних данных основан на под­ключении данных из API СПАРК к данным внешних провайдеров и внутренних информационных систем. Этот процесс представляет собой комплекс интеграционных решений и требует существенной проработки с точки зрения как юридической, так и компьютерной безопасности. 

В отличие от терминального доступа, шлюз СПАРК позволяет выполнять непосредственные запросы к базе данных, минуя интер­фейс. Это в гораздо большей степени соответствует современным стандартам бизнес-анализа, так как аналитик может на формальном языке описать запрос, который делался для того, чтобы получить данные, использованные для моделирования. Также можно опера­тивно отслеживать изменения показателей в режиме онлайн и стро­ить динамические модели, что при наличии только терминального доступа не так просто. 

Рассмотрим примеры. 

Мониторинг дилерской сити, лизингополучателей и клиентов интернет-магазина 

Основными потребителями такого подхода к мониторингу контр­агентов являются крупные компании, которые предоставляют более мелким компаниям возможность пользоваться своими товарами с отсрочкой платежа. Это могут быть лизинговые компании, предо­ставляющие технику, транспорт и оборудование, металлургические, нефтехимические компании и др. 

Всех этих пользователей систем мониторинга объединяет то, что они хотят обновлять данные о состоянии своего контрагента в режиме онлайн и, несмотря на разные профили своей деятельности, пре­следуют одну-единственную цель: оперативно мониторить финан­совое состояние контрагента, определять текущий кредитный лимит, на который ему можно отгружать продукцию, резервировать нужное количество средств при наступлении неблагоприятных сценариев в работе с контрагентом. 

Вторая общая черта этой группы — все они имеют примерно одни и те же наборы данных для кастомизации индекса финансового риска. 

Во-первых, это история взаимоотношений с данным контрагентом, которая может быть получена без вовлечения каких-то дополни­тельных ресурсов или юридических согласований: достаточно только вести самостоятельный учет своевременности оплаты контрагентом выставленных счетов. 

Во-вторых, мы можем предложить контрагенту регулярно предо­ставлять нам отчетность и налоговые декларации и рассчитывать коэффициенты на актуальные даты. На основе деклараций контр­агентов и данных, накопленных провайдером услуг по кастомизации, выявляются значительные отклонения показателей, характеризую­щих налоговые и финансовые риски контрагента, от базисного уровня, в качестве которого выступают среднеотраслевой, среднерегиональ­ный уровни, целевые показатели ФНС России и предыдущий период. Среди показателей рассчитываются совокупное и частное налоговое бремя, финансовые коэффициенты, абсолютные и относительные показатели доходов, расходов, активов и обязательств. Данные пока­затели позволяют в оперативном режиме выявить опасные откло­нения от базисного уровня и рекомендовать либо прекращение отно­шений с контрагентом, либо запрос у него подробной объясняющей информации доказательственного характера. 

В-третьих, мы можем получить согласие на обработку кредитной истории как самого дилера, так и его учредителей и директоров. Данный пункт вызывает самое большое количество дискуссий, так как не все компании (а тем более физические лица) согласны давать согласие на обработку своей кредитной истории. Также возникает техническая и юридическая проблема передачи полученных сведе­ний провайдеру услуг по кастомизации. Возможным решением здесь могут быть скоринги, составленные совместно с бюро кредитных историй.

Зачастую в этой группе решений возрастает роль отраслевой и региональной информации. Для ее анализа могут использоваться макроэкономические данные, которые относятся не к конкретной компании, а к отрасли в целом. Тогда их также можно получать в оперативном режиме и обновлять регулярно; это могут быть отрас­левые индексы, ставки, доходности облигаций и другие параметры. 

Расширенный анализ компаний 

Несмотря на то что предыдущий пример охватывает достаточно большой сегмент систем мониторинга, скоринг часто должен под­страиваться под специфические потребности. 

В первую очередь такие специфические потребности возникают в отраслях, где присутствуют государственные финансы или высо­кая толерантность подрядчиков к коррупционным практикам, напри­мер в строительстве. В эту группу попадают компании — получатели государственных субсидий (в т.ч. через региональные корпорации развития), стартапы, профинансированные государством, резиденты особых экономических зон и др. 

Для мониторинга таких компаний в режиме онлайн добавляется значительное количество требований в самых разных проявлениях их активности. Это и мониторинг прозрачности и эффективности закупочных процедур, и соблюдение процедур комплаенса, так как контрагенты получателей государственных средств не должны быть связаны с лицами, имеющими криминальное прошлое. Но главное —привязка транзакций этих контрагентов к проектному финансирова­нию и ограничению нецелевого использования средств инвесторов. 

Для данной группы скоринги играют роль в создании технологий премодерации транзакций, которая в силу определенных причин пока не получила широкого распространения. Представьте себе, что некая компания получила субсидию от корпорации развития реги­она и собирается направить деньги контрагенту, вызывающему серьезные опасения с точки зрения добросовестности. Очевидно, что разбираться потом, чем руководствовался менеджмент компа­нии, будет гораздо сложнее, чем просто приостановить исполнение платежа и попросить оперативно предоставить объяснения. 

Еще одна интересная сфера применения кастомизированных ско­рингов — это расширенный анализ компаний МСБ. Здесь уже накоплено много решений как со стороны банков, которые их кредитуют, так и со стороны провайдеров вне банковского сектора. 

В этой сфере на первое место выходят данные онлайн-касс и тран­закционные данные, так как отчетность малого бизнеса зачастую или отсутствует вовсе, или не позволяет рассчитать достаточно коэффициентов; отсутствуют данные об исковой нагрузке компаний (малый бизнес может обрушиться под воздействием всего одного крупного судебного процесса с большой компанией или государ­ством). Важное значение имеет кредитная история и самой компа­нии, и ее учредителей и директоров. 

Наконец, непростой, но интересной задачей являются распозна­вание и анализ франчайзинговых сетей и расчет их параметров, таких как отношение открытых и закрытых франчайзи и их доход­ности. Важно отметить, что в последнее время многие собственники товарных знаков не заключают прозрачных договоров на их исполь­зование. Более того, зачастую широко известный потребителям товарный знак оказывается в собственности офшорной компании. Несмотря на эти сложности, расчет силы бренда на основе открытой информации и экстраполяция успехов или неудач правообладателя на всех лицензиатов являются довольно перспективными методами построения кастомизированных решений. Существуют решения для анализа силы крупных брендов, основанные на получении инфор­мации из медиапространства и соцсетей. Однако данные решения теряют свою значимость, если есть количественные критерии. Если мы знаем, сколько денег дал заработать бренд, то зачем нам ана­лизировать его медийный фон? 

Расширенный анализ компаний помогает и в тех случаях, когда мы смотрим на компанию с точки зрения работодателя. Это важно и при автоматическом анализе резюме претендентов, и при креди­товании физических лиц, работодатели которых не обслуживаются в банке, и во многих других случаях. 

Как перестраивается скоринг 

Одна из наиболее интересных тем сегодня — это возможность пере­стройки скоринга по мере поступления новых подтвержденных данных о контрагенте. Основные вопросы, которые при этом воз­никают:

— как часто обновляются данные и как часто нужно обновлять скоринговую модель?
— позволяют ли внутренние данные сделать поправку к скорингу или каждый раз нужно перестраивать модель по-новому?

Выделим два основных способа кастомизации скоринга:

1. Корректировка скоринга с использованием решающих правил:
а) на основе внутренних данных создаем решающие правила (фак­торы);
б) в зависимости от значения новых факторов находим значения x_i:
x_i = {1, если парам_i ≤ крит_знач_i, иначе 0},
где парам_i — строка отчетности, финансовый коэффициент или иная пере­менная;
крит_знач_i — критическое значение в зависимости от региона/отрасли;
в) рассчитываем s = SUM(w_i × x_i), где w_i — вес каждого пара­метра;
г) корректируем публичный скоринг на значение s.

2. Разработка кастомной регрессионной модели:
а) на основе внутренних данных компании рассчитываем регрес­сионные переменные (факторы);
б) полученные факторы вместе с публичным скорингом исполь­зуем для создания индивидуальной регрессионной модели. В роли алгоритма могут выступать логистическая регрессия, дерево реше­ний, случайный лес и др. 

Первый способ имеет смысл использовать, когда объема внутрен­них данных не хватает для разработки статистически значимой регрессионной модели, а также при наличии эмпирического опыта и предметных знаний о влиянии тех или иных факторов на риск контрагента. 

Второй способ более оптимален при наличии достаточного объ­ема корпоративных данных, так как автоматизированные алгоритмы позволяют избежать когнитивных искажений, присущих экспертным оценкам. 

Периодичность обновления скоринговой модели зависит от дина­мики изменений как макроэкономики, так и взаимоотношений с контрагентами. В целом при стабильной ситуации достаточно пере­страивать скоринг раз в два года; в ином случае рекомендуемая частота обновления модели иногда возрастает до ежеквартальной. 

Более сложные алгоритмы возникают тогда, когда используется обучение с подкреплением, которое позволяет нам оперативно реа­гировать на изменения окружающей среды и подстраивать модель под воздействием внешних факторов в режиме реального времени. Для применения таких алгоритмов требуется значительный объем данных, поступающий в режиме реального времени. 

Как повысить эффективность 

В силу того, что большая часть корпоративных знаний о контраген­тах является конфиденциальной информацией, их обработка как перед моделированием, так и в рамках промышленного использо­вания готовой модели происходит на стороне компании (в отличие от публичного скоринга). По этой причине на повышении эффектив­ности использования кастомизированного скоринга сказываются имеющиеся ресурсы и внутренняя экспертиза по работе с такими данными. 

Первым, достаточно очевидным, решением в такой ситуации является озеро данных. Для создания такого озера нам потребуется:

— взять все источники внешних данных в режиме онлайн: это может быть API СПАРК, источник макроэкономических индикато­ров, API БКИ, провайдер информации о социальном профиле физи­ческих лиц, данные онлайн-касс, оперативная ценовая информация и многое другое;
— совместить их (соблюдая требования безопасности и юридиче­ские ограничения на использование персональных данных и данных, составляющих банковскую, налоговую или иную тайну) с данными корпоративной ERP и добавить к этому аналитический сервис для построения модели соответствующей сложности. 

Проблема использования озера данных состоит в том, что в него могут попасть не всегда достоверные и легко проверяемые данные. Выходом здесь может быть использование блокчейн-сети. В таком случае за счет создания системы распределенного реестра отправка недостоверных данных в общую сеть не становится невозможной, но становится экономически бессмысленной. В перспективе это приведет к существенному повышению производительности системы, так как сейчас нам приходится за счет довольно сложного модели­рования проверять и перепроверять данные, полученные из разных источников, не доверяя абсолютно ни одному из них. Технология распределенного реестра может решить эту проблему, что приведет к удешевлению построения доверительных систем расчетов с контр­агентами и позволит заменить хлопотный процесс сбора информа­ции из различных источников с последующей их обработкой мето­дами сложного моделирования на довольно простые скрипты. 

Еще одна важная проблема повышения эффективности кастоми­зированных скоринговых систем — это проблема черного ящика, когда скоринг выдает некое решение, не обосновывая его аналити­чески. Современный тренд настройки скоринговых моделей состоит в том, чтобы модель умела объяснять пользователю, почему приняла то или иное решение. Это повышает доверие к самому инструменту автоматизации принятия решений и позволяет устранить ошибки, когда модель по каким-то причинам использовала ошибочные дан­ные: например, когда клиент получает отказ по кредиту на основе недостоверных данных, в силу технической ошибки оказавшихся в его кредитной истории. 

За счет чего возникает экономия 

Хотя построенные на публичных данных скоринги сами по себе обладают достаточно высокой предсказательной силой, кастомные модели дают возможность повысить точность оценивания контраген­тов и более своевременно получать сигналы о повышенных рисках работы с некоторыми из них. Это позволяет вовремя приостановить взаимодействие и избежать финансового или репутационного ущерба. 

Если говорить о масштабах экономии в материальном выражении, то наиболее адекватным критерием здесь может быть удельная стоимость проверки одного контрагента. Если говорить о годовой стоимости мониторинга одного контрагента, включающей стоимость всех используемых данных и регулярной калибровки моделей, то она довольно сильно разнится, однако на основе анализа уже реа­лизованных успешных кейсов можно сказать, что такая стоимость колеблется в диапазоне от 500 до 3500 руб. на одного контрагента. Много это или мало? 

Давайте представим себе сотрудника компании, обладающего компетенциями проводить финансовый анализ, рассчитывать кре­дитные лимиты, анализировать судебные дела и делать из них выводы, проводить комплаенс-процедуры и анализировать закупки. 

Сколько такой специалист может проверить компаний в ручном режиме, даже если данные по ним обновляются не каждый день? Пять или, может быть, десять? Кастомизированные системы ско­рингов обрабатывают данные десятков тысяч компаний, что дает колоссальную экономию средств. 

Сегодня разработка кастомизированнных скорингов важна еще и потому, что даже до кризиса наблюдался заметный рост компаний, действующих в сфере неналогового мошенничества. Теперь же мно­гие даже добросовестные предприниматели для спасения своего бизнеса будут готовы совершать не всегда законные действия в отношении своих контрагентов. Но и когда начнется восстановление экономики, именно скоринговые системы начнут сигнализировать о точках роста, восстановлении компаний и секторов и новых пер­спективных клиентах. 

Журнал "Риск-менеджмент в кредитной организации"