質問への回答

歴史的文脈。 近年、BNPL（今すぐ購入、後で支払い）は小売業におけるフィンテック統合の標準となり、ユーザーが無利子で支払いを分割できるようになりました。分析者は基本的な問題に直面しています。倫理的および法的理由から、クレジットの拒否が行えないため、ランダム化実験を実施することができず、ユーザーは信用力に基づいて自己選択を行います。これにより、BNPLの使用と高い購入額の間の観察可能な相関が、製品ではなく支払い能力のあるクライアントの事前特性によって決まるという古典的な内生性が生じます。

問題設定。 主な課題は、承認の閾値（例えば700ポイント）での特性の急激な断絶、季節性（ブラックフライデー、年末のピーク）、未来の販売のカニバリゼーション（時間的代替）および衝動買いによる返品の増加です。承認の「境界」にいるユーザーの純粋な増分効果（LATE — Local Average Treatment Effect）を分離し、交絡因子の影響を最小限に抑える必要があります。

詳細な解決策。 最適なアプローチは、スコアリングの閾値での**Sharp Regression Discontinuity Design (RDD)**で、幅は±30-50ポイントです。この方法論は、ローカルな偶然性の仮定に基づいています。695ポイントと705ポイントのユーザーは、観察可能および非観察可能な特性の点で統計的に区別できませんが、異なるグループ（コントロールと処置）に分かれます。加えて、**Difference-in-Differences (DiD)を用いて、導入前後のダイナミクスをこの幅の中で追跡し、季節性をコントロールします。カニバリゼーションを評価するために、Event Studyを用い、ラグ（t-3、t-2ヶ月）が使用されます。もし楽器（承認の閾値）が利用可能であるが、非遵守（承認はされたがBNPLを使用しなかった場合）がある場合、Fuzzy RDDをTwo-Stage Least Squares (2SLS)**を通じて適用します。共変量のバランス（Covariate Balance Tests）と密度分布（McCrary test）を確認することが、デザインの検証において重要です。

生活の例

電子機器のマーケットプレイスは、内部スコアで650ポイントの厳しい承認基準によるパートナー銀行のBNPLを統合しました。ビジネスは、BNPLを利用するユーザーの平均購入額が35%増加したことを記録しましたが、これはより裕福なクライアントの自己選択効果であると疑いました。信用限度の拡大に関する決定を下す必要がありましたが、真の因果効果の評価が求められました。

オプション1: 「BNPLを使用した」対「使用しなかった」の単純比較。 利点: SQLでの実装が非常に簡単で、複雑な統計を必要としません。欠点: 選択バイアス（selection bias）が著しい — 承認されたユーザーは収入が高く、購入履歴を持っており、製品とは関係のない効果を+40%過大評価します。結果は意思決定には不適切です。

オプション2: 全オーディエンスのBefore-After分析。 利点: プラットフォーム全体の成長トレンドを考慮し、解釈が簡単です。欠点: BNPLの効果を季節的な波（年末商戦）や同時のマーケティングキャンペーンから分離することができません。評価は需要の時間的ショックにより偏ります。

オプション3: 650ポイントの閾値におけるRegression Discontinuity Design (RDD)、幅は±40ポイント。 利点: 承認確率の急激な断絶を自然実験として利用し、「ギリギリ」閾値を通過した「マージナル」ユーザーに対して効果を評価します。局所的な近傍における計測不可能な特性をコントロールします。欠点: 評価されるのは局所的効果（LATE）のみであり、高いスコアを持つ全ユーザーに無条件に外挿することはできず、統計的パワーのためには閾値近傍での大きなサンプルサイズが必要です。

選択された解決策: 610-690ポイントのユーザーに対してSharp RDDを、歴史的支出および購入カテゴリに基づくPropensity Score Matchingと組み合わせ、購入後90日間のダイナミクスを追跡するためにDifference-in-Differencesを追加しました。季節性を制御するために、週ごとの固定効果（Week Fixed Effects）を導入しました。これにより、借り手の特性から製品の純粋な効果を分離することができました。

最終結果: マージナルユーザーに対して17%の統計的に有意な平均購入額の増加が見られました（ITT — Intent-to-Treat）が、衝動買いにより返品率が11%上昇しました。効果は異質であり、電子機器では高く(+24%)、日用品ではゼロでした。データに基づいて、リスクの高い商品カテゴリの承認閾値が調整され、収益を失うことなく返品率が4%減少しました。

候補者が見落とすことが多いこと

RDDを使用する際に「新しさの効果」(novelty effect)と持続的な行動変化をどのように区別しますか？

Dynamic RDDを実施して、時間間隔ごとに効果を分析します（cohort-level RDD）。週1-2（新しさ）および3-6ヶ月（持続的行動）ごとに効果を評価します。係数が有意に異なる場合（Chow testを通じての検証）、長期的なウィンドウのみを使用するか、時間と処置の相互作用を導入します。さらにpre-trend parallel — 閾値を超える前の期間における結果（支出）の断絶がないことを確認することも重要です。これにより、デザインの妥当性と予期効果の不存在が確認されます。

BNPL導入時に将来の販売のカニバリゼーション（intertemporal substitution）をどのように適切に評価しますか？

標準的なRDDは購入時の静的効果のみを評価します。カニバリゼーションについては、BNPLの初回利用に関連するラグおよびリードを含むEvent Studyを構築します。t-3、t-2、t-1（前）およびt+1、t+2、t+3（後）か月の支出を分析します。リードでの係数の合計が負で有意である場合、それは将来からの借用を示します（ユーザーは購入を計画し、BNPLによってその計画を加速しました）。動的乗数の評価のために、Local ProjectionsメソッドのJordàを使用し、純粋な増分効果を長期的に評価します。

この場合、RDDなしで単純な傾向に基づくマッチング（Propensity Score Matching）を使用することができない理由と、どの仮定が破られるのか？

PSMは、承認に影響を与える計測不可能な特性が存在するため、**Unconfoundedness (Ignorability)**の仮定を必要とします（例えば、「財務的規律」、スコアリングに含まれない非公式な収入源など）。これらの潜在変数は承認と支出の両方に相関しており、バイアスを生じさせます。RDDはこの要求を閾値近くのローカルな偶然性に緩め（Local Randomization）、計測不可能な特性がランダムに分布している領域です。候補者は、スコアの分布密度（McCrary test）や閾値近傍での共変量のバランス（Covariate balance tests）を確認する必要性をしばしば無視しますが、これは結論の妥当性にとって重要です。