Réponse à la question

Le contexte historique remonte au problème économétrique classique de l'endogénéité du prix, où les données de marché observées reflètent l'équilibre offre-demande plutôt que la réaction directe au prix. Les méthodes traditionnelles d'estimation de l'élasticité par régression OLS fournissaient des estimations biaisées, car des prix élevés étaient observés précisément en période de forte demande, créant une corrélation positive qui masquait l'élasticité négative. L'analyse de produit moderne s'appuie sur des approches de Causal Inference, développées en économie de l'éducation et sur les marchés du travail, adaptées aux marchés bilatéraux numériques (two-sided markets) tels que Uber, Airbnb ou Delivery Hero.

Le problème est que les tests A/B directs sur les prix enfreignent le principe de consistance de l'expérience utilisateur et créent des opportunités d'arbitrage (les utilisateurs migrent vers le groupe de contrôle). De plus, il existe une causalité inverse : le prix affecte le comportement des fournisseurs (supply) qui se redistribuent entre les régions, modifiant l'équilibre de base du marché. La configuration standard avec une différence de moyennes (difference in means) fournit une estimation biaisée, car les conditions de forte demande (vacances, météo) influencent simultanément le prix et la volonté de payer.

La solution optimale combine le Regression Discontinuity Design (RDD) sur les seuils algorithmiques de déclenchement avec l'approche des Variables Instrumentales (IV). La méthodologie RDD utilise le fait que la proximité du seuil (par exemple, 1,2x du prix de base à 85% de taux d'occupation) crée un hasard quasi-experimental d'attribution de traitement. Pour renforcer la validité, une méthode des moindres carrés en deux étapes (2SLS) est utilisée, où les instruments sont des chocs exogènes (conditions météorologiques imprévisibles, événements sportifs) qui influencent le prix, mais ne sont pas directement corrélés aux préférences individuelles des utilisateurs. De plus, la Méthode de Contrôle Synthétique est utilisée pour construire une région contrefactuelle basée sur une combinaison pondérée de zones non soumises à l'implémentation de l'algorithme.

Situation de la vie réelle

Le cas concernait un grand service de livraison de nourriture, prévoyant d'implémenter une tarification dynamique aux heures de pointe pour équilibrer l'offre et la demande de coursiers. La métrique de base — le taux d'exécution des commandes (fulfillment rate) — tombait à 70% pendant les heures de soirée, entraînant une perte d'utilisateurs. L'équipe produit supposait que l'augmentation des prix pendant les heures de pointe réduirait la demande et attirerait plus de coursiers grâce à une rémunération accrue, mais il fallait évaluer quantitativement l'élasticité de la demande, sans perturber l'expérience utilisateur dans la ville test.

La première option envisagée était un test A/B géographique divisant les villes voisines en groupe de contrôle et groupe test. Avantages : contrefactuel pur, simplicité d'interprétation, absence de contamination croisée à l'intérieur de la ville. Inconvénients : différences fondamentales dans la structure de la demande entre les villes (densité de restaurants différente, niveau de revenu différent), migration des coursiers entre les villes (violates SUTVA), impossibilité de généraliser les résultats à une métropole cible avec un trafic unique.

La deuxième option était une analyse des interruptions temporelles (interrupted time series) comparant les périodes avant et après l'implémentation. Avantages : travail sur l'ensemble du public d'une ville, prise en compte de la saisonnalité via CausalImpact. Inconvénients : impossibilité de séparer l'effet de la tarification des tendances de croissance du marché, influence des campagnes marketing menées parallèlement, changement de la concurrence au fil du temps.

La troisième option impliquait le Regression Discontinuity Design utilisant le seuil algorithmiquement interne du multiplicateur de pic (par exemple, la hausse du prix se produit lorsque 80% d'occupation des coursiers est atteinte). Avantages : hasard local autour du seuil (les utilisateurs juste au-dessus/en dessous du seuil sont comparables), isolation de l'effet de prix pur de la demande totale, travail au sein d'une seule ville sans groupes de contrôle externes. Inconvénients : évaluation de l'effet de traitement moyen local (LATE) uniquement pour les utilisateurs marginaux autour du seuil, nécessité d'échantillons importants pour atteindre la puissance, sensibilité à la manipulation du seuil par l'algorithme.

Une solution combinée a été choisie : RDD au seuil de taux d'occupation avec validation via Variables Instrumentales (précipitations inattendues comme instrument du prix) et Contrôle Synthétique au niveau des quartiers de la ville. Cela a permis d'isoler l'effet du prix de l'effet d'attente (qui augmente également avec l'occupation). En conséquence, il a été établi que l'élasticité de la demande est de -0,8 (modérément élastique), mais l'effet sur l'équilibre du marché est atteint uniquement à un coefficient de 1,5x+. Cela a permis d'optimiser les seuils de déclenchement et d'augmenter le taux d'exécution des commandes à 89% sans perte significative de GMV.

Ce que les candidats oublient souvent

Comment distinguer le véritable déplacement de la demande lié au prix de l'effet d'attente (delay cost), lorsque l'augmentation du prix corrèle avec l'augmentation du temps de livraison ?

La réponse nécessite une décomposition de l'effet total via une analyse de médiation ou l'utilisation de IV avec deux instruments : un qui n'influence que le prix (seuil algorithmique), l'autre seulement le temps d'attente (incidents routiers externes). Les analystes débutants mélangent souvent ces effets, surestimant l'élasticité du prix. Il est nécessaire de construire un modèle structurel, où le prix et le temps d'attente sont des régresseurs endogènes, et la demande est le résultat de leur interaction. Sans cela, les entreprises prennent des décisions de prix sans comprendre qu'une partie de la baisse de conversion est due non pas au prix, mais à un service insatisfaisant (temps).

Pourquoi l'évaluation standard de l'élasticité par régression log-log donne-t-elle des résultats biaisés sur les marchés bilatéraux et comment corriger cela ?

Sur les marchés bilatéraux, il existe un biais de simultanéité : le prix influence la demande, mais la demande influence le prix à travers le mécanisme de l'algorithme de tarification dynamique. Les estimations OLS seront asymptotiquement biaisées. L'approche correcte nécessite l'utilisation des Moins Carrés à Deux Étapes (2SLS), où au premier niveau, le prix est prédit par des chocs exogènes (météo, événements), et au second niveau, les valeurs prédites sont utilisées pour estimer l'élasticité. Les candidats oublient souvent la nécessité de vérifier la pertinence des instruments (F-statistic > 10) et leur validité (exclusion restriction), ce qui entraîne des conclusions causales invalides.

Comment prendre en compte les effets de réseau (cross-side network effects) entre les clients et les prestataires lors de l'évaluation de l'effet causal de la tarification ?

L'augmentation du prix attire plus de coursiers (effet positif sur l'offre), ce qui réduit le temps d'attente et peut compenser le déplacement négatif du prix sur la demande. Cela crée un effet d'équilibre général, qui ne peut pas être capturé par un équilibre partiel. Il est nécessaire de construire un modèle structurel de marché bilatéral (structural two-sided market model) ou d'utiliser une analyse de graphe bipartite pour suivre la migration des prestataires entre les zones. Sans cela, les analystes peuvent à tort rejeter une politique tarifaire efficace, sans voir l'effet compensatoire de l'amélioration de la qualité du service à travers la réduction du temps de livraison.