Respuesta a la pregunta

Historia de la pregunta

El desafío de la agrupación de contenedores y la acumulación de lotes precede a las bases de datos relacionales, originándose en la investigación operativa y la optimización logística. En ANSI SQL, este problema históricamente no tenía solución sin extensiones procedimentales como PL/SQL o cursores T-SQL porque las operaciones basadas en conjuntos estándar carecen de la capacidad para hacer referencia a "totales acumulados con reinicio" dentro de los marcos de ventana. La introducción de CTEs recursivos en SQL:1999 proporcionó la base teórica para la acumulación iterativa, aunque muchas implementaciones inicialmente sufrieron limitaciones de rendimiento en conjuntos de datos grandes. Los optimizadores modernos de consultas han mejorado los planes de ejecución recursiva, permitiendo soluciones eficientes para el control de lotes de fabricación y la agrupación de transacciones financieras. Este patrón sigue siendo una prueba fundamental de la traducción de algoritmos procedimentales a la lógica declarativa de ANSI SQL.

El problema

Necesitamos procesar una secuencia ordenada de elementos, cada uno con un peso o valor, y asignarlos a lotes secuenciales de manera que el total acumulado de cada lote no exceda una capacidad predefinida. Cuando agregar el siguiente elemento superaría el umbral, comienza un nuevo lote. Esto requiere mantener un acumulador en ejecución que se reinicie condicionalmente, una operación con estado que desafía la simple agregación de funciones de ventana porque el límite de reinicio depende de la suma dinámica de todos los elementos anteriores desde el último reinicio, no solo de un desplazamiento de fila fijo. La solución debe manejar casos extremos, incluidos elementos que superan la capacidad individual (error o lote de desbordamiento de un solo elemento) y entradas vacías, operando estrictamente dentro de ANSI SQL sin extensiones procedimentales específicas del vendedor.

La solución

Empleamos un CTE recursivo que itera a través de la secuencia ordenada, llevando adelante el número del lote actual y el peso acumulado de ese lote. El miembro de anclaje inicializa el primer elemento con el lote 1 y su peso como la suma actual. El miembro recursivo se une al siguiente elemento secuencial, calculando si agregar su peso excede la capacidad; si es así, incrementa el número de lote y restablece el acumulador al peso del nuevo elemento, de lo contrario, retiene el lote actual y agrega al acumulador. Usamos ROW_NUMBER() para establecer un orden de recorrido estricto y evitar la recursión infinita filtrando en un contador de profundidad o uniéndonos solo a filas posteriores. Finalmente, seleccionamos las asignaciones de lotes distintas o agregamos resultados según sea necesario.

WITH RECURSIVE ordered_items AS (
    SELECT 
        item_id, 
        weight, 
        ROW_NUMBER() OVER (ORDER BY sequence_order) AS rn
    FROM items
),
batch_accumulator AS (
    -- Ancla: el primer elemento comienza el lote 1
    SELECT 
        item_id, 
        weight, 
        rn, 
        1 AS batch_number, 
        weight AS current_batch_sum
    FROM ordered_items
    WHERE rn = 1
    
    UNION ALL
    
    -- Recursivo: procesar el siguiente elemento
    SELECT 
        oi.item_id,
        oi.weight,
        oi.rn,
        CASE 
            WHEN ba.current_batch_sum + oi.weight > 100 THEN ba.batch_number + 1 
            ELSE ba.batch_number 
        END AS batch_number,
        CASE 
            WHEN ba.current_batch_sum + oi.weight > 100 THEN oi.weight 
            ELSE ba.current_batch_sum + oi.weight 
        END AS current_batch_sum
    FROM batch_accumulator ba
    JOIN ordered_items oi ON oi.rn = ba.rn + 1
)
SELECT item_id, batch_number, weight
FROM batch_accumulator
ORDER BY rn;

Situación de la vida real

Contexto: Automatización del empaquetado en un almacén para un centro de cumplimiento de comercio electrónico.

Descripción del problema: El sistema automatizado de transporte de pedidos procesa los pedidos secuencialmente, pero debe agruparlos en contenedores de envío con un límite de peso estricto de 20 kg. Cada pedido tiene un peso variable. El sistema necesita saber qué ID de contenedor imprimir en cada etiqueta de envío a medida que los elementos llegan a la línea, sin pausar el procesamiento por lotes. Los primeros intentos de usar código en la capa de aplicación crearon cuellos de botella y condiciones de carrera durante periodos de alta afluencia.

Diferentes soluciones consideradas:

Solución 1: Agrupación en la capa de aplicación con tablas temporales. La aplicación recuperaría elementos, calcularía totales acumulativos en un bucle e insertaría lotes en la base de datos. Este enfoque introdujo una latencia de red significativa y una sobrecarga de transacciones, requiriendo múltiples viajes de ida y vuelta entre el servidor de aplicaciones y la base de datos. También complicó el control de concurrencia cuando múltiples líneas de empaquetado operaban simultáneamente, lo que llevaba a la contención de bloqueo de tabla.

Solución 2: Enfoque puro de función de ventana utilizando SUM() OVER (ORDER BY ...) con aritmética de módulo. Esto intentó crear lotes dividiendo la suma acumulativa no acotada por la capacidad. Sin embargo, esto asigna incorrectamente elementos a los lotes en función de la posición absoluta en lugar del umbral de reinicio dinámico, resultando en lotes que consistentemente exceden la capacidad cuando los elementos individuales tienen pesos variables. El enfoque de módulo solo funciona para elementos de tamaño fijo, haciendo que sea inadecuado para el requisito de peso variable.

Solución 3: CTE recursivo implementado dentro de ANSI SQL. Esta solución realiza todos los cálculos en el servidor en una única ejecución de consulta, eliminando la sobrecarga de la red. Maneja correctamente la acumulación y la lógica de reinicio con estado procesando de forma iterativa el flujo ordenado. Si bien existen límites de profundidad de recursión en algunas configuraciones de bases de datos, las restricciones operativas del almacén (los lotes rara vez superan los 100 elementos) aseguraron que esto no superara los límites de la plataforma. Este enfoque fue seleccionado por su atomicidad, consistencia y eliminación de la gestión del estado de la aplicación.

Resultado: La consulta procesó con éxito 50,000 elementos por hora con latencia de sub-segundos, asignando correctamente IDs de contenedor mientras se respetaban las restricciones de peso. La solución eliminó las condiciones de carrera y redujo los costos de infraestructura al eliminar la necesidad de un microsservicio de agrupación separado.

Lo que a menudo pasan por alto los candidatos

1. ¿Cómo manejas correctamente el primer elemento cuando excede individualmente la capacidad del lote?

Muchos candidatos asumen que todos los elementos caben dentro de la capacidad. Cuando el peso de un elemento individual excede el umbral del lote, la lógica recursiva debe marcar un error o colocarla en un lote de desbordamiento aislado. La implementación correcta añade una declaración CASE en el miembro de anclaje para verificar la capacidad inicial, y en el miembro recursivo para forzar un nuevo lote cuando oi.weight > capacity, independientemente de la suma actual. Sin esto, el sistema podría intentar agregar elementos sobredimensionados a lotes existentes o crear recursión infinita al intentar dividir elementos.

2. ¿Por qué unirse a rn = rn + 1 arriesga una recursión infinita y cómo lo previenes?

Los candidatos a menudo usan oi.rn = ba.rn + 1 asumiendo una estricta secuencialidad, pero si los datos fuente contienen huecos o el ordenamiento de ROW_NUMBER() produce duplicados debido a claves de ordenación no únicas, la unión podría crear ciclos o saltar filas. Además, si los datos contienen referencias circulares en la definición de secuencia, la recursión nunca termina. La solución requiere asegurar que sequence_order sea determinista y único, y añadir una columna de contador de profundidad que se incremente con cada nivel de recursión, incluyendo una restricción de CHECK o cláusula WHERE depth < 1000 para prevenir consultas descontroladas durante la corrupción de datos.

3. ¿Cuáles son las implicaciones de rendimiento de la profundidad de recursión frente a la amplitud en este algoritmo?

Los desarrolladores junior a menudo tratan los CTEs recursivos como bucles iterativos, sin reconocer que cada nivel de recursión procesa todas las filas elegibles en esa profundidad (amplitud-primer). Pasan por alto que sin la indexación adecuada en rn, la unión oi.rn = ba.rn + 1 resulta en operaciones de bucle anidado que escalan cuadráticamente. El enfoque correcto requiere asegurar que la columna de secuencia esté indexada y comprender que la recursión en ANSI SQL materializa resultados intermedios, consumiendo potencialmente una cantidad significativa de memoria para grandes lotes. Los candidatos deben mencionar la optimización procesando en trozos más pequeños o mediante el uso de procesamiento por lotes iterativos para millones de filas en lugar de pura recursión.