Respuesta a la pregunta

Contexto histórico: La función de división de pagos (split payment) ha dominado tradicionalmente en verticales de viajes y servicios B2B, pero su implementación masiva en el e-commerce clásico (electrónica, moda) comenzó relativamente hace poco con el aumento de los pagos móviles. La dificultad analítica clave radica en que los usuarios se auto-seleccionan en clústeres sociales (grupos de jóvenes, familias), donde la decisión de compra se toma de manera colectiva, lo que crea interferencia entre los grupos de prueba y control y hace que las pruebas A/B estándar no sean válidas.

Planteamiento del problema: Es necesario aislar el efecto causal limpio del split payment en las métricas de economía de unidades, separándolo de (1) oscilaciones estacionales en la demanda de productos costosos, (2) la tendencia natural al aumento del ticket promedio en cohortes jóvenes, (3) la endogeneidad de las relaciones sociales (amigos ricos invitan a amigos ricos) y (4) el rollout gradual por categorías, que distorsiona los cortes temporales.

Solución detallada: El enfoque óptimo es una combinación de Difference-in-Differences (DiD) con aleatorización por clúster a nivel de "grafo social" (no usuario), complementada con Fuzzy Regression Discontinuity Design (RDD) según el precio umbral de activación de la función (por ejemplo, 30,000 ₽). Para corregir la endogeneidad de las relaciones sociales, se aplica el enfoque IV (Instrumental Variables), donde el instrumento es el número ordinal de la categoría en el plan de rollout (variación exógena), que precede al uso real de la función. Para evaluar la heterogeneidad del efecto por segmentos se utiliza Causal Forest, que permite identificar los efectos promedio condicionales (CATE) para diferentes clústeres de usuarios. Las métricas se evalúan en dos modos: Intent-to-Treat (ITT) — el efecto de la presencia del botón, y Treatment-on-the-Treated (TOT) — el efecto del uso real, lo que requiere un manejo correcto de la falta de cumplimiento a través de Two-Stage Least Squares (2SLS).

Situación de la vida real

Contexto: Un gran marketplace de electrónica lanza la función "Compartir el carrito" para compras superiores a 50,000 ₽, permitiendo que dos usuarios dividan el pago por la mitad. El piloto se lanzó en la categoría "Smartphones", con planes de expansión a "Laptops". Después del primer mes, el comercio informa un aumento del 25% en el ticket promedio en la categoría de prueba, pero un analista sospecha que el 70% de los usuarios de la función son estudiantes de 18-22 años, que históricamente han tenido un bajo ARPU, pero en el piloto comenzaron a comprar iPhones en grupo, creando un efecto de "compra colectiva".

Opción de solución 1: Comparación simple Before/After (t-test sobre medias). Pros: Implementación instantánea, no requiere infraestructura compleja. Contras: Ignora completamente la estacionalidad (el inicio del año académico aumenta la demanda de gadgets), las tendencias generales de crecimiento del comercio móvil y la auto-selección de pedidos de alto valor hacia el umbral de 50,000 ₽. El resultado se sesga hacia arriba en 15-18 puntos porcentuales.

Opción de solución 2: Difference-in-Differences con la categoría "Accesorios" como control. Pros: Elimina tendencias temporales generales, interpretación simple. Contras: Violación de la suposición de tendencias paralelas — la categoría de teléfonos inteligentes tiene una elasticidad de demanda diferente y una dinámica de precios diferente a la de los accesorios. Además, existe el spillover effect: los usuarios pueden comprar un teléfono inteligente de manera colectiva, pero la funda — ya sin el split payment en la categoría de control, lo que contamina el grupo de control.

Opción de solución 3: Regression Discontinuity Design (RDD) estrictamente según el umbral de 50,000 ₽. Pros: Utiliza un umbral exógeno para un cuasi-experimento, evalúa el efecto local (LATE) para pedidos en el umbral. Contras: No se puede escalar a todo el rango de precios, ignora pedidos de 80,000 ₽ (donde el efecto puede diferir). Además, la característica fuzzy — los usuarios pueden manipular el precio (añadir un accesorio) para cumplir con la condición.

Solución elegida y justificación: Se implementó un enfoque híbrido: Fuzzy RDD para pedidos en el rango de 45,000–55,000 ₽ (identificación clara en el umbral) + DiD para la tendencia general utilizando Synthetic Control Method (SCM) — creando un control sintético ponderado de otras categorías, que replica la dinámica de los teléfonos inteligentes antes de la implementación. Para los efectos sociales, se aplicó la clústerización por device ID (identificación de dispositivos utilizados por un grupo de personas) como proxy para las relaciones sociales.

Resultado final: El verdadero efecto incremental fue de +8.4% en el ticket promedio (en lugar del 25% observado), mientras que la conversión en el segmento de 18-25 años aumentó un 12%, pero la frecuencia de compras disminuyó un 5% en el siguiente trimestre (efecto de "aplazamiento" de compras hasta el momento de reunir compañía). La función se desplegó solo en categorías con un ticket de 40,000–70,000 ₽, donde el efecto fue estadísticamente significativo.

Qué a menudo pasan por alto los candidatos

1. Problema de interferencia a través de grafos sociales: un usuario del grupo de control puede ser invitado por un amigo del grupo de prueba para una compra conjunta.

Respuesta: En una prueba A/B clásica se asume el Stable Unit Treatment Value Assumption (SUTVA) — independencia de unidades. En el caso del split payment, esto se rompe, ya que el tratamiento (la presencia del botón) de un usuario influye en el comportamiento de otro (invitación). La solución correcta es la aleatorización por clúster (cluster randomization) a nivel de componentes sociales (grafos de amistad), o el análisis de efectos de red a través de exposure mapping, donde la exposición se define como la proporción de amigos con acceso a la función. Alternativamente — el uso de bipartite graph clustering para dividir el grafo en clústeres aislados antes del experimento.

2. Diferencia entre los efectos ITT (Intent-to-Treat) y TOT (Treatment-on-the-Treated) en condiciones de baja penetración de la función.

Respuesta: Muchos analistas evalúan erróneamente el efecto para todos los que vieron el botón (ITT), como el efecto para aquellos que lo utilizaron (TOT). Si solo el 10% de los que ven el botón hacen clic en "Dividir", entonces ITT subestima el verdadero efecto en 10 veces. Para evaluar TOT se necesita un IV-approach, donde el instrumento $Z$ — el hecho de mostrar el botón (randomizado), y la variable endógena $D$ — el hecho de uso. La estimación de 2SLS dará el Local Average Treatment Effect (LATE) para los cumplidores — aquellos que utilizarían la función solo si está disponible. Esto es crítico para el caso de negocio: el efecto para "propensos a la compra colectiva" es 3-4 veces mayor que el efecto promedio.

3. Cannibalización a largo plazo y bias hacia el futuro: el split payment puede no crear nueva demanda, sino simplemente redistribuir compras individuales futuras a compras colectivas actuales.

Respuesta: Los candidatos a menudo observan solo las métricas de transacción inmediatas. Se requiere un análisis de cohortes con un horizonte de 90+ días, que compare la frecuencia de compras (purchase frequency) de los usuarios que utilizaron el split payment contra un control emparejado. Esto requiere construir un propensity score matching (PSM) basado en características pre-tratamiento (historia de tickets, estacionalidad). Además, es importante verificar el compositional shift — si la oferta se ha desplazado hacia productos de alta margen, pero baja recurrencia de compra (por ejemplo, consolas en lugar de juegos), lo que crea una ilusión de crecimiento del ticket mientras disminuye el LTV.