Risposta alla domanda

Il contesto storico risale al classico problema econometrico dell'endogeneità del prezzo, dove i dati di mercato osservabili riflettono un equilibrio tra domanda e offerta, e non una pura reazione al prezzo. I metodi tradizionali di stima dell'elasticità attraverso la regressione OLS hanno fornito stime distorte, poiché prezzi elevati venivano osservati proprio in presenza di alta domanda, creando una correlazione positiva che mascherava la negativa elasticità. L'analisi dei prodotti moderna si basa su approcci di Causal Inference, sviluppati nell'economia dell'istruzione e dei mercati del lavoro, adattati ai mercati digitali bilaterali (two-sided markets) come Uber, Airbnb o Delivery Hero.

Il problema risiede nel fatto che il diretto A/B testing dei prezzi viola il principio di coerenza dell'esperienza utente e crea opportunità di arbitraggio (gli utenti migra nella gruppo di controllo). Inoltre, esiste una causazione inversa: il prezzo influisce sul comportamento dei fornitori (supply), che si redistribuiscono tra le regioni, modificando l'equilibrio di base del mercato. La normale impostazione con la differenza di medie (difference in means) fornisce una stima distorta, poiché le condizioni di alta domanda (vacanze, meteo) influenzano simultaneamente sia il prezzo che la disponibilità a pagare.

La soluzione ottimale combina il Regression Discontinuity Design (RDD) sui soglie algoritimiche di attivazione del coefficiente di carico con l'approccio delle Variable Strumentali (IV). La metodologia RDD sfrutta il fatto che la prossimità alla soglia (ad esempio, 1.2x del prezzo di base a una disponibilità del 85%) crea una casualità quasi sperimentale nell'assegnazione del trattamento. Per rafforzare la validità viene applicato il metodo dei minimi quadrati a due fasi (2SLS), dove gli strumenti sono shock esogeni (condizioni meteorologiche imprevedibili, eventi sportivi) che influenzano il prezzo, ma non sono direttamente correlati con le preferenze individuali degli utenti. Viene anche utilizzato il Synthetic Control Method per costruire una regione controfattuale basata su una combinazione pesata di aree non interessate dall'implementazione dell'algoritmo.

Situazione nella vita reale

Il caso riguardava un grande servizio di consegna di cibo pronto, che prevedeva di implementare il pricing dinamico nelle ore di punta per bilanciare domanda e offerta dei fattorini. La metrica di base — il tasso di completamento degli ordini (fulfillment rate) — scendeva al 70% nelle ore serali, portando a un deflusso di utenti. Il team del prodotto ipotizzava che l'aumento del prezzo durante le ore di punta avrebbe ridotto la domanda e attratto più fattorini grazie a un compenso maggiore, ma era necessario valutare quantitativamente l'elasticità della domanda, senza compromettere l'esperienza dell'utente nella città di prova.

La prima opzione considerata è stata il test A/B geografico, dividendo città vicine in gruppo di controllo e gruppo di test. Pro: controfattuale puro, semplicità di interpretazione, assenza di contaminazione incrociata all'interno della città. Contro: differenze fondamentali nella struttura della domanda tra le città (diversa densità di ristoranti, diverso livello di reddito), migrazione dei fattorini tra le città (viola SUTVA), impossibilità di scalare i risultati su una metropoli target con un traffico unico.

La seconda opzione è stata l'analisi temporale degli interventi (interrupted time series) confrontando i periodi prima e dopo l'implementazione. Pro: lavoro con l'intera audience di una città, considerazione della stagionalità attraverso CausalImpact. Contro: impossibilità di separare l'effetto del pricing dai trend di crescita del mercato, influenza delle campagne di marketing condotte in parallelo, cambiamento del contesto competitivo durante il periodo di osservazione.

La terza opzione è stata il Regression Discontinuity Design usando la soglia algoritmica interna di attivazione del moltiplicatore di surge (ad esempio, l'aumento di prezzo si verifica al raggiungimento dell'80% di disponibilità dei fattorini). Pro: casualità locale intorno alla soglia (gli utenti appena sopra/sotto la soglia sono comparabili), isolamento dell'effetto prezzo puro dalla domanda generale, lavoro all'interno di una sola città senza gruppi di controllo esterni. Contro: stima dell'Local Average Treatment Effect (LATE) solo per utenti marginali vicino alla soglia, necessità di campioni ampi per raggiungere la potenza, sensibilità alla manipolazione della soglia da parte dell'algoritmo.

È stata scelta una soluzione combinata: RDD sulla soglia di disponibilità con validazione tramite Variable Strumentali (precipitazioni impreviste come strumento per il prezzo) e Synthetic Control a livello di quartieri della città. Questo ha permesso di isolare l'effetto del prezzo dall'effetto dell'attesa (che cresce anche con la disponibilità). Di conseguenza, è stato stabilito che l'elasticità della domanda è pari a -0.8 (moderatamente elastica), ma l'effetto sull'equilibrio del mercato si realizza solo con un coefficiente 1.5x+. Questo ha permesso di ottimizzare le soglie di attivazione e aumentare il tasso di completamento fino all'89% senza una significativa perdita di GMV.

Cosa i candidati spesso trascurano

Come differenziare il vero spostamento del prezzo della domanda dall'effetto attesa (delay cost), quando l'aumento del prezzo è correlato all'aumento del tempo di consegna?

La risposta richiede una decomposizione dell'effetto totale attraverso l'analisi di mediazione o l'utilizzo di IV con due strumenti: uno che influisce solo sul prezzo (soglia algoritmica), l'altro — solo sul tempo di attesa (incidenti stradali esterni). Gli analisti neofiti spesso confondono questi effetti, sovrastimando l'elasticità del prezzo. È necessario costruire un modello strutturale, in cui il prezzo e il tempo di attesa siano regressori endogeni, e la domanda sia il risultato della loro interazione. Senza questo, le aziende prendono decisioni sui prezzi senza comprendere che parte del calo della conversione è causato non dal prezzo, ma da un servizio insoddisfacente (tempo).

Perché la stima standard dell'elasticità attraverso la regressione log-log fornisce risultati distorti nei mercati bilaterali e come correggerlo?

Nei mercati bilaterali esiste un simultaneity bias: il prezzo influisce sulla domanda, ma la domanda influisce sul prezzo attraverso il meccanismo dell'algoritmo di surge. Le stime OLS saranno asintoticamente distorte. L'approccio corretto richiede l'uso delle Two-Stage Least Squares (2SLS), dove al primo livello il prezzo è previsto attraverso shock esogeni (meteo, eventi), e al secondo — i valori previsti sono utilizzati per stimare l'elasticità. I candidati spesso ignorano la necessità di verificare la rilevanza degli strumenti (F-statistic > 10) e la loro validità (exclusion restriction), il che porta a conclusioni causali non valide.

Come considerare gli effetti di rete (cross-side network effects) tra clienti e fornitori nella valutazione dell'effetto causale della determinazione dei prezzi?

L'aumento del prezzo attira più fattorini (effetto positivo sulla fornitura), riducendo il tempo di attesa e può compensare il negativo spostamento del prezzo sulla domanda. Questo crea un general equilibrium effect, che non può essere catturato attraverso l'equilibrio parziale. È necessaria la costruzione di un modello strutturale di mercato bilaterale (structural two-sided market model) o l'uso dell'analisi del grafo bipartito per tracciare la migrazione dei fornitori tra le zone. Senza questo, gli analisti possono erroneamente rifiutare una politica di prezzo efficace, non vedendo l'effetto compensativo del miglioramento della qualità del servizio attraverso la riduzione del tempo di consegna.