Business analyseProduct Analyst / Productanalist

Welke statistische benadering kan de causaal-effect relatie van de implementatie van het algoritme voor dynamische prijsstelling (surge pricing) isoleren op de elasticiteit van de vraag en het evenwicht van vraag en aanbod in een tweezijdige marktplaats, wanneer de prijs een endogene variabele is die correleert met latent demand, en geografische randomisatie niet mogelijk is vanwege netwerkeffecten tussen de zijden van de markt binnen één regio?

Slaag voor sollicitatiegesprekken met de Hintsage AI-assistent

Antwoord op de vraag

De historische context verwijst naar het klassieke econometrische probleem van prijsendogeniteit, waar de waargenomen markgegevens het evenwicht van vraag en aanbod reflecteren in plaats van de pure reactie op prijs. Traditionele methoden voor het schatten van elasticiteit via OLS-regressie gaven bevooroordeelde schattingen, omdat hoge prijzen juist werden waargenomen bij hoge vraag, wat een positieve correlatie creëerde die de negatieve elasticiteit maskeert. Moderne productanalyses steunen op Causal Inference benaderingen, ontwikkeld in het onderwijs en de arbeidsmarkten, aangepast aan digitale tweezijdige markten (two-sided markets) zoals Uber, Airbnb of Delivery Hero.

Het probleem is dat directe A/B-tests van prijzen de consistentie van de gebruikerservaring schenden en arbitragemogelijkheden creëren (gebruikers migreren naar de controlegroep). Bovendien is er sprake van omgekeerde causaliteit: de prijs beïnvloedt het gedrag van aanbieders (supply), die zich tussen regio's herverdelen, waardoor de basismarktevenwicht verandert. De standaardopzet met verschillen in gemiddelden (difference in means) geeft een bevooroordeelde schatting, omdat hoge vraagomstandigheden (feestdagen, weer) zowel de prijs als de bereidheid om te betalen beïnvloeden.

De optimale oplossing combineert Regression Discontinuity Design (RDD) op algoritmische drempelwaarden van de belastingcoëfficiënt met de Instrumental Variables (IV) aanpak. De methodologie RDD maakt gebruik van het feit dat de nabijheid van de drempelwaarde (bijvoorbeeld 1.2x de basisprijs bij een bezettingsgraad van 85%) quasi-experimentele willekeur in de toewijzing van de behandeling creëert. Om de validiteit te versterken, wordt de twee-staps kleinste-kwadraten methode (2SLS) toegepast, waarbij instrumenten worden gebruikt die exogene schokken zijn (onvoorspelbare weersomstandigheden, sportevenementen) die invloed hebben op de prijs, maar niet rechtstreeks correleren met de individuele voorkeuren van gebruikers. Daarnaast wordt de Synthetic Control Method gebruikt om een contrafactuale regio te construeren op basis van een gewogen combinatie van gebieden die niet aan de implementatie van het algoritme zijn blootgesteld.

Levenssituatie

De case hing samen met een grote bezorgdienst voor kant-en-klare maaltijden die de implementatie van dynamische prijsstelling in piekuren plande om vraag en aanbod van koeriers in balans te brengen. De basismetriek — de orderuitvoeringsratio (fulfillment rate) — daalde tot 70% in de avonduren, wat leidde tot klantenverlies. Het productteam veronderstelde dat het verhogen van de prijs in piekuren de vraag zou verlagen en meer koeriers zou aantrekken door middel van verhoogde betaling, maar het was belangrijk om de elasticiteit van de vraag kwantitatief te beoordelen, zonder de gebruikerservaring in de teststad te verstoren.

De eerste overweging was geografische A/B-testen met een verdeling van naburige steden in controle en test. Voordelen: schone contrafactualen, eenvoud van interpretatie, geen kruiscontaminatie binnen de stad. Nadelen: fundamentele verschillen in de vraagstructuur tussen steden (verschillende restaurantdichtheid, verschillende inkomensniveaus), migratie van koeriers tussen steden (overtreedt SUTVA), onmogelijkheid om resultaten te schalen naar de doelmetropool met uniek verkeer.

De tweede optie was een tijdreeksanalyse met onderbrekingen (interrupted time series) met vergelijking van periodes voor en na de implementatie. Voordelen: werken met de volledige populatie van één stad, seizoenstrends in rekening brengen via CausalImpact. Nadelen: onmogelijkheid om het effect van prijsstelling van de groeitrends van de markt te scheiden, invloed van gelijktijdige marketingcampagnes, verandering van de concurrentieomgeving gedurende de observatieperiode.

De derde optie was de Regression Discontinuity Design met gebruik van de interne algoritmische drempel van de surge multiplier (bijvoorbeeld, de prijs stijgt bij een bezettingsgraad van 80% van de koeriers). Voordelen: lokale willekeur nabij de drempel (gebruikers net boven/onder de drempel zijn vergelijkbaar), isolatie van het pure prijs effect van de totale vraag, werken binnen één stad zonder externe controlegroepen. Nadelen: schatting van Local Average Treatment Effect (LATE) alleen voor marginale gebruikers nabij de drempel, behoefte aan grote steekproeven voor statistische kracht, gevoeligheid voor manipulatie van de drempel door het algoritme.

Er is voor een gecombineerde oplossing gekozen: RDD bij de bezettingsgraad met validatie door middel van Instrumental Variables (onverwachte neerslag als prijs instrument) en Synthetic Control op het niveau van de stadsdelen. Dit stelde ons in staat om het prijs effect te isoleren van het verwachtings effect (dat ook toeneemt met de bezettingsgraad). Het resultaat was dat de elasticiteit van de vraag -0.8 (matig elastisch) bedraagt, maar het effect op de marktbalans wordt alleen bereikt bij een verhouding van 1.5x+. Dit stelde ons in staat om de triggerdrempels te optimaliseren en de fulfilment rate tot 89% te verhogen zonder significante verlies van GMV.

Wat kandidaten vaak over het hoofd zien

Hoe het ware prijsveranderingseffect van de verwachtings effect (delay cost) te onderscheiden, wanneer de prijsstijging correleert met een toename van de levertijd?

Het antwoord vereist een decompensatie van het totale effect via mediation analyse of het gebruik van IV met twee instrumenten: de ene beïnvloedt alleen de prijs (de algoritmische drempel), de andere alleen de wachttijd (externe verkeersincidenten). Beginnende analisten verwarren vaak deze effecten, waardoor ze de prijselasticiteit overschatten. Het is noodzakelijk een structureel model op te bouwen, waarbij prijs en wachttijd endogene regressoren zijn, en de vraag het resultaat van hun interactie is. Zonder dit neemt een bedrijf beslissingen over prijsstellingen zonder te begrijpen dat een deel van de omzetdaling niet door de prijs, maar door een ontevreden service (wachttijd) wordt veroorzaakt.

Waarom geeft de standaard schatting van elasticiteit via log-log regressie bevooroordeelde resultaten in tweezijdige markten en hoe dit te corrigeren?

In tweezijdige markten bestaat er een simultaneity bias: de prijs beïnvloedt de vraag, maar de vraag beïnvloedt de prijs via het mechanisme van de surge-algoritme. OLS-schattingen zullen asymptotisch bevooroordeeld zijn. De correcte aanpak vereist het gebruik van Two-Stage Least Squares (2SLS), waarbij in de eerste fase de prijs wordt voorspeld door exogene schokken (weer, evenementen), en in de tweede fase de voorspelde waarden worden gebruikt om de elasticiteit te schatten. Kandidaten negeren vaak de noodzaak om de relevantie van instrumenten te controleren (F-statistic > 10) en hun validiteit (exclusion restriction), wat leidt tot ongeldig causal-inzichten.

Hoe netwerkeffecten (cross-side network effects) tussen klanten en aanbieders in aanmerking te nemen bij het beoordelen van het causale effect van prijsstelling?

Een prijsstijging trekt meer koeriers aan (positief effect op supply), waardoor de wachttijd afneemt en kan compenseren voor het negatieve prijsveranderingseffect op de vraag. Dit creëert een general equilibrium effect dat niet kan worden vastgelegd door een partieel evenwicht. Een structureel model van een tweezijdige markt (structural two-sided market model) moet worden opgezet of bipartite graph analysis moet worden gebruikt om de migratie van aanbieders tussen zones te volgen. Zonder dit kunnen analisten ten onrechte een effectieve prijsstrategie afwijzen, zonder de compenserende verbetering van de servicekwaliteit door een kortere levertijd te zien.