Antwort auf die Frage

Historischer Kontext: Die Funktion der Rechnungsteilung (Split Payment) dominierte traditionell in den Bereichen Reise und B2B-Dienste, jedoch begann ihre massenhafte Einführung im klassischen E-Commerce (Elektronik, Mode) erst relativ kürzlich mit dem Anstieg mobiler Zahlungen. Die zentrale analytische Herausforderung besteht darin, dass sich Nutzer in soziale Cluster (Jugendgruppen, Familien) selbst auswählen, in denen die Kaufentscheidung kollektiv getroffen wird, was Interferenz zwischen der Test- und der Kontrollgruppe schafft und standardisierte A/B-Tests ungültig macht.

Problemstellung: Es gilt, den reinen kausalen Effekt von Split Payment auf die Kennzahlen der Einheitökonomie zu isolieren und ihn von (1) saisonalen Nachfrageverschiebungen für teure Produkte, (2) der natürlichen Tendenz zum Anstieg des durchschnittlichen Warenkorbwerts in jungen Kohorten, (3) der Endogenität sozialer Verbindungen (reiche Freunde laden reiche Freunde ein) und (4) der schrittweisen Einführung nach Kategorien zu trennen, die die zeitlichen Schnitte verzerrt.

Detaillierte Lösung: Der optimale Ansatz ist eine Kombination von Difference-in-Differences (DiD) mit Cluster-Randomisierung auf der Ebene des „sozialen Graphen“ (nicht Nutzer), ergänzt durch Fuzzy Regression Discontinuity Design (RDD) basierend auf dem Schwellenwert für die Aktivierung der Funktion (z.B. 30.000 ₽). Zur Korrektur der Endogenität sozialer Verbindungen wird der IV (Instrumental Variables)-Ansatz angewendet, wobei das Instrument die ordinalen Nummern der Kategorie im Rollout-Plan (exogene Variation) ist, die dem tatsächlichen Einsatz der Funktion vorausgehen. Zur Bewertung der Heterogenität des Effekts in Segmenten wird der Causal Forest verwendet, der es ermöglicht, bedingte durchschnittliche Effekte (CATE) für unterschiedliche Nutzercluster zu identifizieren. Die Kennzahlen werden in zwei Modi bewertet: Intent-to-Treat (ITT) — Effekt der Verfügbarkeit der Schaltfläche und Treatment-on-the-Treated (TOT) — Effekt der tatsächlichen Nutzung, was eine korrekte Behandlung von Non-Compliance durch Two-Stage Least Squares (2SLS) erfordert.

Lebenssituation

Kontext: Ein großer Elektronik-Marktplatz startet die Funktion „Warenkorb teilen“ für Einkäufe über 50.000 ₽ und ermöglicht es zwei Nutzern, die Zahlung hälftig zu teilen. Der Pilot wird in der Kategorie „Smartphones“ durchgeführt, mit einer geplanten Ausweitung auf „Laptops“. Nach dem ersten Monat verzeichnet der Handel einen Anstieg des durchschnittlichen Warenkorbwerts in der Testkategorie um 25 %, doch der Analyst vermutet, dass 70 % der Nutzer der Funktion Studenten im Alter von 18-22 Jahren sind, die historisch gesehen einen niedrigen ARPU hatten, aber im Pilotprojekt iPhones gemeinsam kauften, was den Effekt der „Gruppensammelbestellung“ erzeugt.

Lösungsvorschlag 1: Einfache Vergleichsanalyse Before/After (t-Test auf Mittelwerte). Vorteile: Sofortige Umsetzung, erfordert keine komplexe Infrastruktur. Nachteile: Ignoriert vollständig Saisonalität (Beginn des Schuljahres erhöht die Nachfrage nach Gadgets), allgemeine Trends des Wachstums im mobilen Handel und die Selbstselektion hochpreisiger Bestellungen bis zur Schwelle von 50.000 ₽. Das Ergebnis ist um 15-18 Prozentpunkte nach oben verzerrt.

Lösungsvorschlag 2: Difference-in-Differences mit der Kategorie „Zubehör“ als Kontrolle. Vorteile: Beseitigt allgemeine zeitliche Trends, einfache Interpretation. Nachteile: Verletzung der Annahme über parallele Trends — die Smartphone-Kategorie hat eine andere Nachfrageelastizität und Preisentwicklung als Zubehör. Darüber hinaus gibt es einen Spillover-Effekt: Nutzer können ein Smartphone im Kollektiv kaufen, aber die Hülle — bereits ohne Split Payment in der Kontrollkategorie, was die Kontrollgruppe verpestet.

Lösungsvorschlag 3: Regression Discontinuity Design (RDD) strikt nach Schwellenwert von 50.000 ₽. Vorteile: Nutzt den exogenen Schwellenwert für das Quasi-Experiment, bewertet den lokalen Effekt (LATE) für Bestellungen an der Schwelle. Nachteile: Nicht auf den gesamten Preisbereich skalierbar, ignoriert Bestellungen über 80.000 ₽ (dort kann der Effekt unterschiedlich sein). Zudem ist die fuzzy Eigenschaft — Nutzer können den Preis manipulieren (ein Zubehörteil hinzufügen), um unter die Bedingung zu fallen.

Ausgewählte Lösung und Begründung: Ein hybrider Ansatz wurde implementiert: Fuzzy RDD für Bestellungen im Bereich von 45.000–55.000 ₽ (saubere Identifikation an der Schwelle) + DiD für den Gesamtrend unter Anwendung der Synthetic Control Method (SCM) — Erstellung einer gewichteten künstlichen Kontrolle aus anderen Kategorien, die die Dynamik der Smartphones vor der Einführung nachbildet. Für die sozialen Effekte wurde eine Clusterung nach device ID (Identifikation der von einer Gruppe von Menschen verwendeten Geräte) als Proxy für soziale Verbindungen angewendet.

Endergebnis: Der wahre inkrementelle Effekt betrug +8,4 % des durchschnittlichen Warenkorbwerts (statt der beobachteten +25 %), während die Konversionsrate im Segment 18-25 Jahre um 12 % zunahm, die Kaufhäufigkeit jedoch im folgenden Quartal um 5 % zurückging (Effekt des „Hinausschiebens“ von Käufen bis zur Zusammenkunft der Gruppe). Die Funktion wurde nur in Kategorien mit einem Warenkorbwert von 40.000–70.000 ₽ eingeführt, wo der Effekt statistisch signifikant war.

Was Kandidaten oft übersehen

1. Das Problem der Interferenz (Verschmutzung) über soziale Graphen: Ein Benutzer aus der Kontrollgruppe kann von einem Freund aus der Testgruppe eingeladen werden, um gemeinsam zu kaufen.

Antwort: In einem klassischen A/B-Test wird die Stable Unit Treatment Value Assumption (SUTVA) — die Unabhängigkeit der Einheiten — angenommen. Im Fall von Split Payment ist dies jedoch verletzt, da die Behandlung (Verfügbarkeit der Schaltfläche) eines Nutzers das Verhalten eines anderen (Einladung) beeinflusst. Die korrekte Lösung ist die Cluster-Randomisierung auf der Ebene sozialer Komponenten (Freundschaftsgraphen) oder die Analyse von Netzwerkeffekten über Exposure Mapping, wobei Exposure als Anteil der Freunde definiert wird, die Zugang zur Funktion haben. Alternativ kann eine bipartite Graph-Clustering verwendet werden, um den Graphen vor dem Experiment in isolierte Cluster zu teilen.

2. Der Unterschied zwischen ITT (Intent-to-Treat) und TOT (Treatment-on-the-Treated) Effekten bei niedriger Durchdringung der Funktion.

Antwort: Viele Analysten bewerten fälschlicherweise den Effekt für alle, die die Schaltfläche gesehen haben (ITT), als Effekt für die, die sie genutzt haben (TOT). Wenn nur 10 % derjenigen, die die Schaltfläche sehen, auf „Teilen“ klicken, dann unterschätzt ITT den tatsächlichen Effekt um das 10-fache. Zur Bewertung von TOT ist ein IV-Ansatz erforderlich, bei dem das Instrument $Z$ die Tatsache des Vorhandenseins der Schaltfläche (randomisiert) ist und die endogene Variable $D$ die Nutzung darstellt. Die Schätzung mit 2SLS liefert den Local Average Treatment Effect (LATE) für Compliers — diejenigen, die die Funktion nur nutzen würden, wenn sie verfügbar ist. Dies ist entscheidend für den Geschäftscase: Der Effekt für „an Gruppenkäufen Interessierte“ ist 3-4 mal höher als der durchschnittliche Effekt.

3. Langfristige Kannibalisierung und forward-looking Bias: Split Payment könnte keinen neuen Bedarf schaffen, sondern nur zukünftige individuelle Käufe auf aktuelle kollektive Käufe umverteilen.

Antwort: Kandidaten betrachten oft nur die unmittelbaren Transaktionskennzahlen. Eine Kohortenanalyse mit einem Horizont von 90+ Tagen ist erforderlich, die die Kaufhäufigkeit (purchase frequency) der Nutzer vergleicht, die Split Payment genutzt haben, mit einer gematchten Kontrolle. Dies erfordert den Aufbau einer Propensity Score Matching (PSM) basierend auf prä-treatment Charakteristika (Scheckhistorie, Saisonalität). Darüber hinaus ist es wichtig, den compositional shift zu überprüfen — ob sich das Sortiment in Richtung hochmarginaler, aber weniger wiederholbarer Käufe verschoben hat (z.B. Konsolen statt Spiele), was den Eindruck eines Anstiegs des Warenkorbwerts bei sinkendem LTV erweckt.