Risposta alla domanda

Contesto storico

L'evoluzione dell'e-commerce ha portato allo sviluppo della logistica omnicanale, in cui Click&Collect e punti di ritiro (Pickup Points, P.V.Z.) sono diventati strumenti per ridurre i costi di consegna dell'ultima miglio. Tuttavia, a differenza delle funzionalità digitali, questi cambiamenti hanno un carattere geografico discreto e sono soggetti all'effetto di self-selection: i clienti ad alta valorizzazione del tempo ignorano i P.V.Z., mentre gli utenti più economici migrano dalla consegna con corriere. I tradizionali A/B test a livello utente sono qui impossibili a causa dell'assenza di randomizzazione a livello di località e della presenza di effetti di rete all'interno dei quartieri.

Definizione del problema

L'analisi affronta tre sfide chiave. In primo luogo, endogeneità dell'ubicazione: i punti vengono aperti in aree con alta densità di ordini, il che crea un legame di causa-effetto inverso (alta domanda → apertura del P.V.Z.). In secondo luogo, cannibalizzazione: parte degli utenti semplicemente cambia il modo di ricevere gli ordini dalla consegna al ritiro senza aumentare la spesa totale. In terzo luogo, violazione di SUTVA (Stable Unit Treatment Value Assumption): un utente vede l'apertura di un punto vicino casa e agita i vicini tramite i social network, creando inquinamento incrociato tra i quartieri "trattati" e "di controllo".

Soluzione dettagliata

Si consiglia una strategia multilivello di valutazione quasi-esperimentale. A livello macro (città) viene applicato il metodo Synthetic Control Method: creiamo una combinazione ponderata di città "donatrici" senza P.V.Z., che imita al massimo la dinamica delle metriche della città test prima dell'intervento. I pesi vengono determinati attraverso l'ottimizzazione convessa sui dati pre-intervento (12-18 mesi), includendo la stagionalità, indicatori macroeconomici e struttura delle categorie.

A livello micro (utenti), utilizziamo Difference-in-Differences con matching del punteggio di propensione (Propensity Score Matching) per controllare le caratteristiche osservabili, ma la chiave è l'implementazione di Strumenti Strumentali (IV). Come strumento, si utilizza la distanza più breve dall'abitazione dell'utente al P.V.Z. più vicino, calcolata attraverso la rete stradale. Questa variabile è correlata con la scelta del ritiro (prima fase del modello OLS a due stadi), ma non è correlata con l'inclinazione latente agli acquisti, isolando l'effetto trattamentale medio locale (LATE).

Per tenere conto degli ordini ibridi (magazzino intermedio), costruiremo modelli CausalForest che separano l'effetto in sottopopolazioni: immediate adopters, delayed users e never-takers. Infine, correggiamo gli errori standard per clustering a livello di distretto (clustered standard errors) e analizziamo la sensibilità agli effetti spillover attraverso l'analisi della concentrazione in un raggio di 500 metri.

Situazione della vita reale

Contesto: un grande marketplace di moda pianificava il lancio di una rete di 120 Pickup Points in 15 città test di media grandezza (500-800k di popolazione) con l'obiettivo di ridurre i costi logistici del 25%. La direzione voleva valutare se la presenza dei P.V.Z. aumentasse la frequenza degli acquisti (purchase frequency) tra i clienti esistenti o semplicemente spostasse il traffico dalla consegna con corriere.

Opzione 1: Semplice confronto "città con P.V.Z. vs città senza P.V.Z." Pro: Implementazione estremamente semplice, non richiede dati storici, risposta rapida per il business. Contro: Le città con P.V.Z. sono inizialmente più ricche e attive (selection bias), le differenze di stagionalità e ambiente competitivo possono dare uno scostamento fino al 40% nella stima dell'effetto. Il risultato risulta inaffidabile per la scalabilità.

Opzione 2: Analisi Before-After solo nelle città test Pro: Controlla le differenze inter-cittadine, si concentra sulla variazione della tendenza. Contro: Non considera le tendenze di crescita del mercato e-commerce (nell'anno della pandemia, la tendenza di base potrebbe essere stata del +30% anno su anno), il punto finale potrebbe coincidere con le festività locali, distorcendo il quadro.

Opzione 3: Synthetic Control a livello cittadino + IV a livello utente Pro: Synthetic Control crea uno scenario controfattuale "cosa sarebbe successo senza P.V.Z.", correggendo per le macro-tendenze e le Strumenti Strumentali (distanza dal punto come shock casuale per gli utenti "pigri") isola l'effetto causale dalla semplice correlazione. Contro: Richiede almeno 12 mesi di dati pre-interventionali per ciascuna città, complessità nell'interpretazione di LATE per gli stakeholders non tecnici, oneroso dal punto di vista computazionale.

Soluzione scelta e giustificazione Abbiamo scelto una combinazione di Synthetic Control per la validazione inter-cittadina e Two-Stage Least Squares (2SLS) con strumento geografico per la metrica utente. Questo ha permesso di separare l'effetto della presenza di infrastrutture (effetto strutturale) dall'effetto della scelta consapevole (self-selection comportamentale). È stato cruciale dimostrare che anche gli utenti "pigri", che vivono a 200 metri da un nuovo punto, iniziano ad acquistare più spesso senza modificare le loro caratteristiche economiche.

Risultato finale La valutazione ha mostrato un reale incremento incrementale della frequenza degli acquisti del 12% tra gli utenti che vivono nell'area di accessibilità al P.V.Z. (ITT), mentre la cannibalizzazione della consegna con corriere è stata del 18%, compensata da un aumento dell'importo medio d'acquisto del 8% grazie all'assenza di spese di consegna. Tuttavia, l'effetto è stato eterogeneo: solo per le categorie "calzature" e "accessori", mentre per "elettrodomestici" non è stato riscontrato un effetto significativo. Questo ha permesso di correggere la strategia di apertura dei punti, concentrandosi su centri commerciali di moda e rinunciando ai punti nelle aree residenziali dominate dalla tecnologia.

Cosa i candidati spesso trascurano

Come distinguere l'effetto dell'apertura dei P.V.Z. dall'effetto di una campagna di marketing che annuncia questi punti, se la campagna viene lanciata simultaneamente all'apertura?

Risposta: L'errore standard è ignorare la contaminazione del trattamento attraverso il canale di marketing. È necessario utilizzare il metodo Difference-in-Difference-in-Differences (DDD) o dividere il campione in due gruppi di controllo: città con campagna (supporto media) ma senza P.V.Z. fisici (solo annuncio "coming soon") e città con implementazione completa. Se l'effetto viene osservato solo nel secondo gruppo, ciò dimostra il ruolo causale della logistica, e non della comunicazione. È anche importante monitorare la brand search come variabile di controllo: se cresce allo stesso modo in entrambi i gruppi, la crescita delle entrate nel gruppo di test è causata proprio dalla comodità del servizio, e non dalla consapevolezza.

Perché non è possibile utilizzare un semplice confronto degli utenti in base alla distanza dal P.V.Z. (più vicino a 500m vs più lontano a 2km) come proxy per il test e il controllo, anche se si controlla per la demografia?

Risposta: Questo è in violazione dell'assunzione di positività e della selezione su non osservabili. Gli utenti che scelgono di vivere vicino ai centri commerciali (dove di solito si trovano i P.V.Z.) differiscono sistematicamente per reddito, occupazione e stile di vita rispetto ai residenti delle periferie. Anche con il Propensity Score Matching rimane un bias nascosto da confonditori non osservati (ad esempio, pianificazione del budget familiare). L'approccio corretto è utilizzare il Regression Discontinuity Design (RDD), considerando i confini delle zone di consegna o i confini amministrativi dei quartieri come soglia casuale, dove da un lato della strada le case si trovano a 300 metri (trattamento), e dall'altro a 900 metri (controllo), ma le caratteristiche socio-economiche sono identiche.

Come considerare correttamente il ritardo temporale tra l'apertura dei P.V.Z. e la formazione dell'abitudine comportamentale (habit formation), se le finestre standard di attribuzione (7-30 giorni) sottovalutano l'effetto a lungo termine?

Risposta: L'errore classico è utilizzare un periodo post-fisso. È necessario applicare il Event Study Design con lag dinamici, modellando l'effetto separatamente per il mese 1, 3, 6 dopo l'apertura. Questo consente di catturare l'eterogeneità dell'effetto del trattamento nel tempo — spesso l'effetto cresce man mano che si forma l'abitudine (learning curve) e poi si stabilizza. È importante utilizzare modelli Cox Proportional Hazards per il tempo fino al primo utilizzo del P.V.Z., tenendo conto dei rischi concorrenti (un utente potrebbe churn'are prima di adattarsi). Inoltre, è fondamentale correggere il survivorship bias: gli utenti che iniziano a utilizzare il P.V.Z. possono avere un basso tasso di churn per definizione, e devono essere paragonati a un gruppo di controllo con schemi di sopravvivenza simili, e non all'intera base.