Respuesta a la pregunta

Contexto histórico

La evolución del comercio electrónico ha llevado al desarrollo de logística omnicanal, donde Click&Collect y los puntos de recogida (Pickup Points, PVs) se han convertido en herramientas para reducir el costo de la última milla de entrega. Sin embargo, a diferencia de las características digitales, estos cambios tienen un carácter geográficamente discreto y están sujetos al efecto de self-selection — los clientes con un alto valor de tiempo ignoran los PVs, mientras que los usuarios ahorrativos migran de la entrega a domicilio. Las pruebas clásicas A/B a nivel de usuario son imposibles aquí debido a la falta de aleatorización a nivel de ubicación y la existencia de efectos de red dentro de los vecindarios.

Planteamiento del problema

El análisis se enfrenta a tres desafíos clave. En primer lugar, endogeneidad del emplazamiento: los puntos se abren en áreas con alta densidad de pedidos, lo que crea una retroalimentación causal inversa (alta demanda → apertura de PVs). En segundo lugar, cannibalización: algunos usuarios simplemente cambian el método de recogida de entrega a recogida en tienda sin aumentar el gasto total. En tercer lugar, violación de SUTVA (Suposición de Valor de Tratamiento de Unidad Estable): un usuario ve la apertura de un punto cerca de su casa y persuade a sus vecinos a través de redes sociales, lo que crea contaminación cruzada entre los microvecindarios “tratados” y “de control”.

Solución detallada

Se recomienda una estrategia de evaluación cuasi-experimental de múltiples niveles. A nivel macro (ciudades) se aplica el método Synthetic Control Method — creamos una combinación ponderada de “ciudades donantes” sin PVs que imita al máximo la dinámica de métricas de la ciudad de prueba antes de la intervención. Los pesos se ajustan a través de optimización convexa en los datos previos a la intervención (12-18 meses), incluyendo estacionalidad, indicadores macroeconómicos y estructura de categorías.

A nivel micro (usuarios) utilizamos Difference-in-Differences con apareamiento por puntaje de propensión (Propensity Score Matching) para controlar las características observadas, pero lo clave es la implementación de Variables Instrumentales (IV). Como instrumento, utilizamos la distancia más corta desde la casa del usuario hasta el PV más cercano, calculada mediante la red vial. Esta variable se correlaciona con la elección de la recogida en tienda (primer paso de dos etapas de MCO), pero no se correlaciona con la propensión latente a las compras, aislando el Efecto Promedio de Tratamiento Local (LATE).

Para tener en cuenta los pedidos híbridos (almacén intermedio), construimos modelos CausalForest, que separan el efecto en subpoblaciones: adoptadores inmediatos, usuarios retrasados y nunca adoptantes. Por último, corregimos los errores estándar por clusterización a nivel de vecindario (errores estándar agrupados) y verificamos la sensibilidad a los efectos de derrame mediante un análisis de concentración en un radio de 500 metros.

Situación de la vida real

Contexto: un gran mercado de moda planeaba lanzar una red de 120 Pickup Points en 15 ciudades de tamaño medio (500-800 mil habitantes) con el objetivo de reducir los costos logísticos en un 25%. La dirección requería evaluar si la presencia de los PVs aumenta la frecuencia de compras (purchase frequency) entre los clientes existentes o solo transfiere el tráfico de la entrega a domicilio.

Opción 1: Comparación simple “ciudad con PVs vs ciudad sin PVs” Pros: Implementación máxima simple, no requiere datos históricos, respuesta rápida para el negocio. Contras: Las ciudades con PVs son inicialmente más ricas y activas (sesgo de selección), las diferencias en la estacionalidad y el entorno competitivo pueden dar un sesgo de hasta el 40% en la estimación del efecto. El resultado es poco fiable para la escalabilidad.

Opción 2: Análisis Before-After solo en ciudades de prueba Pros: Controla las diferencias interurbanas, se concentra en el cambio de tendencia. Contras: No considera las tendencias de mercado generales de crecimiento del comercio electrónico (en el año de la pandemia, la tendencia base podría ser de +30% interanual), el punto final puede coincidir con fiestas locales de promociones, distorsionando la imagen.

Opción 3: Control Sintético a nivel de ciudades + IV a nivel de usuarios Pros: Synthetic Control crea un escenario contrafáctico “qué hubiera pasado sin los PVs”, ajustándose a las tendencias macro, y Variables Instrumentales (distancia al punto como un shock aleatorio para usuarios “perezosos”) aíslan el efecto causal de la simple correlación. Contras: Requiere al menos 12 meses de datos previos a la intervención por cada ciudad, complejidad de la interpretación del LATE para partes interesadas no técnicas, costoso computacionalmente.

Solución elegida y justificación Elegimos una combinación de Synthetic Control para la validación interurbana y Two-Stage Least Squares (2SLS) con un instrumento geográfico para la métrica del usuario. Esto permitió separar el efecto de la infraestructura (efecto estructural) del efecto de la elección consciente (self-selection conductual). Era crítico demostrar que incluso los usuarios “perezosos” que viven a 200 metros del nuevo punto comienzan a comprar con más frecuencia, sin cambiar sus características económicas.

Resultado final La evaluación mostró un verdadero aumento incremental del 12% en la frecuencia de compras entre los usuarios que viven en la zona de accesibilidad de los PVs (ITT), mientras que la canibalización de la entrega a domicilio fue del 18%, que fue compensada por un aumento del 8% en el ticket medio por la eliminación de la tarifa de entrega. Sin embargo, el efecto fue heterogéneo: solo para las categorías “zapatos” y “accesorios”, mientras que para “electrodomésticos” no se detectó ningún efecto significativo. Esto permitió ajustar la estrategia de apertura de puntos, enfocándose en los centros comerciales de moda y renunciando a los ubicados en áreas residenciales con predominancia de electrodomésticos.

Lo que los candidatos a menudo pasan por alto

¿Cómo diferenciar el efecto de la apertura de PVs del efecto de una campaña de marketing que anuncia estos puntos, si la campaña se lanza simultáneamente con la apertura?

Respuesta: El error estándar es ignorar la contaminación del tratamiento a través del canal de marketing. Es necesario utilizar el método Difference-in-Difference-in-Differences (DDD) o dividir la muestra en dos grupos de control: ciudades con campaña (apoyo mediático) pero sin PVs físicos (solo anuncio de “próximamente”) y ciudades con implementación completa. Si el efecto se observa solo en el segundo grupo, esto prueba el rol causal de la logística, no de la comunicación. También es importante rastrear la búsqueda de marca como variable de control — si crece de manera similar en ambos grupos, el aumento de ingresos en el grupo de prueba se debe precisamente a la conveniencia del servicio, no a la conciencia.

¿Por qué no se puede utilizar una simple comparación de usuarios según la distancia al PV (más cerca de 500m vs más lejos de 2km) como proxy para la prueba y control, incluso si se controla por demografía?

Respuesta: Esto viola la suposición de positividad y selección en no observables. Los usuarios que eligen vivir cerca de los centros comerciales (donde normalmente se encuentran los PVs) difieren sistemáticamente en ingresos, empleo y estilo de vida de los residentes de las periferias. Incluso con Propensity Score Matching, permanece un sesgo oculto de confusores no observados (por ejemplo, planificación del presupuesto familiar). El enfoque correcto es utilizar Regression Discontinuity Design (RDD), considerando los límites de las zonas de entrega o fronteras administrativas de los barrios como un umbral aleatorio, donde de un lado de la calle las casas están a 300 metros (tratamiento) y del otro lado a 900 metros (control), pero con características sociodemográficas idénticas.

¿Cómo tener en cuenta correctamente el retraso temporal entre la apertura de PVs y la formación de hábitos de comportamiento (habit formation), si las ventanas estándar de atribución (7-30 días) subestiman el efecto a largo plazo?

Respuesta: El error clásico es utilizar un período post fijo. Es necesario aplicar Event Study Design con retardos dinámicos, modelando el efecto por separado para el mes 1, 3, 6 después de la apertura. Esto permite capturar la heterogeneidad del efecto del tratamiento a lo largo del tiempo — a menudo el efecto se intensifica a medida que se forman los hábitos (curva de aprendizaje), y luego se estabiliza. También es importante utilizar modelos de riesgos proporcionales de Cox para el tiempo hasta el primer uso de los PVs, considerando los risgos competidores (el usuario puede darse de baja antes de la adaptación). Además, se debe corregir el sesgo de supervivencia — los usuarios que han comenzado a usar PVs pueden tener una baja tasa de abandono por definición, y se deben comparar con un grupo de control con patrones de supervivencia similares, no con toda la base.