Ответ на вопрос

Исторический контекст. В последние годы BNPL (Buy Now Pay Later) стал стандартом fintech-интеграций в ритейле, позволяя пользователям разбивать платеж без процентов. Аналитики сталкиваются с фундаментальной проблемой: невозможно провести рандомизированный эксперимент, так как отказ в одобрении кредита по этическим и юридическим причинам невозможен, а пользователи самоотбираются по кредитоспособности. Это создает классическую эндогенность, когда наблюдаемая корреляция между использованием BNPL и высоким чеком обусловлена предсуществующими характеристиками платежеспособных клиентов, а не самим продуктом.

Постановка проблемы. Основные вызовы включают резкий разрыв в характеристиках на границе порога одобрения (например, 700 баллов), сезонность (черная пятница, предновогодний период), каннибализацию будущих продаж (intertemporal substitution) и рост возвратов из-за импульсивных покупок. Требуется изолировать чистый инкрементальный эффект (LATE — Local Average Treatment Effect) для пользователей на «границе» одобрения, минимизируя влияние confounders.

Подробное решение. Оптимальный подход — Sharp Regression Discontinuity Design (RDD) на пороге скоринга с полосой (bandwidth) ±30-50 баллов. Методология опирается на предположение локальной случайности: пользователи с 695 и 705 баллами статистически неотличимы по наблюдаемым и ненаблюдаемым характеристикам, но попадают в разные группы (контроль и тритмент). Дополнительно применяется Difference-in-Differences (DiD) для отслеживания динамики до и после внедрения внутри этой полосы, что контролирует сезонность. Для оценки каннибализации используется Event Study с лагами (spending в t-3, t-2 месяца до использования BNPL). Если доступен инструмент (порог одобрения), но есть не-compliance (одобренные, но не использовавшие BNPL), применяется Fuzzy RDD через Two-Stage Least Squares (2SLS). Важно проверить баланс ковариат (Covariate Balance Tests) и плотность распределения (McCrary test) для валидации дизайна.

Ситуация из жизни

Маркетплейс электроники интегрировал BNPL от банка-партнера с жестким порогом одобрения в 650 баллов по внутренней шкале. Бизнес фиксировал рост среднего чека на 35% у пользователей с BNPL, но подозревал, что это эффект самоотбора более состоятельных клиентов. Необходимо было принять решение о расширении кредитного лимита, но требовалась оценка истинного причинно-следственного эффекта.

Вариант 1: Простое сравнение «использовали BNPL» vs «не использовали» без учета порога. Плюсы: максимально простая реализация в SQL, не требует сложной статистики. Минусы: критическое смещение выбора (selection bias) — одобренные пользователи имеют более высокий доход и историю покупок, что дает завышенную оценку эффекта до +40%, не связанную с продуктом. Результат непригоден для принятия решений.

Вариант 2: Before-After анализ для всей аудитории без разделения на группы. Плюсы: учитывает общие тренды роста платформы и прост в интерпретации. Минусы: невозможно отделить эффект BNPL от сезонного всплеска (новогодние продажи) и одновременных маркетинговых кампаний. Оценка оказывается смещена из-за временных шоков спроса.

Вариант 3: Regression Discontinuity Design (RDD) на пороге 650 баллов с полосой ±40 баллов. Плюсы: использует резкий разрыв в вероятности одобрения как естественный эксперимент, оценивая эффект для «маргинальных» пользователей, которые «едва-едва» прошли или не прошли порог. Контролирует за неизмеримыми характеристиками в локальной окрестности. Минусы: оценивает только локальный эффект (LATE), который нельзя безоговорочно экстраполировать на всех пользователей с высоким скорингом; требует большой выборки в окрестности порога для статистической мощности.

Выбранное решение: комбинация Sharp RDD для пользователей в полосе 610-690 баллов с Propensity Score Matching по историческим тратам и категориям покупок, дополненная Difference-in-Differences для отслеживания динамики в течение 90 дней после покупки. Для контроля сезонности были введены фиксированные эффекты по неделям (Week Fixed Effects). Это позволило изолировать чистый эффект продукта от характеристик заемщика.

Итоговый результат: выявлен статистически значимый прирост среднего чека на 17% (ITT — Intent-to-Treat) для маргинальных пользователей, но рост доли возвратов на 11% из-за импульсивных покупок. Эффект оказался гетерогенным: высокий для электроники (+24%), нулевой для бытовой химии. На основе данных был скорректирован порог одобрения для рисковых категорий товаров, что снизило уровень возвратов на 4% без потери выручки.

Что кандидаты часто упускают

Как различать эффект «новизны» (novelty effect) от устойчивого изменения поведения при использовании RDD?

Необходимо проводить Dynamic RDD с анализом эффекта по временным интервалам (cohort-level RDD). Оцениваем эффект отдельно для недели 1-2 (новизна) и месяцев 3-6 (устойчивое поведение). Если коэффициенты значимо различаются (проверка через Chow test), используем только долгосрочное окно или вводим интеракцию времени с treatment. Важно также проверить pre-trend parallel — отсутствие разрыва в исходах (spending) в периоды до момента пересечения порога, что подтвердит валидность дизайна и отсутствие anticipation effects.

Как корректно оценить каннибализацию будущих продаж (intertemporal substitution) при внедрении BNPL?

Стандартный RDD оценивает только статический эффект на момент покупки. Для каннибализации строим Event Study с лагами и лидами (leads/lags) относительно момента первого использования BNPL. Анализируем spending в периоды t-3, t-2, t-1 (до) и t+1, t+2, t+3 (после) месяцев. Если сумма коэффициентов на лидах (pre-periods) отрицательна и значима, это свидетельствует о заимствовании из будущего (пользователь планировал покупку и ускорил ее благодаря BNPL). Используем Local Projections метода Jordà для динамических множителей, что позволяет оценить чистый инкрементальный эффект на длительный период.

Почему в данном случае нельзя использовать простое сопоставление по склонности (Propensity Score Matching) без RDD, и какие предположения нарушаются?

PSM требует предположения Unconfoundedness (Ignorability), что невозможно при наличии неизмеримых характеристик, влияющих на одобрение (например, «финансовая дисциплина», неформальные источники дохода, не попавшие в скоринг). Эти латентные переменные коррелируют и с одобрением, и с тратами, создавая смещение. RDD ослабляет это требование до локальной случайности около порога (Local Randomization), где неизмеримые характеристики распределены случайно. Кандидаты часто игнорируют необходимость проверки плотности распределения скоров (McCrary test) и баланса ковариат (Covariate balance tests) в окрестности порога, что критично для валидности выводов.