Respuesta a la pregunta.

Historia de la pregunta

Este desafío se origina en los dominios de planificación de capacidad y asignación de recursos, particularmente en sistemas como plataformas de reservas de hoteles, escalado automático de infraestructura en la nube y programación de instalaciones médicas. Las soluciones tempranas dependían de la iteración basada en cursores o lógica de aplicaciones externas para iterar a través de las líneas de tiempo, sufriendo sanciones de rendimiento severas en conjuntos de datos grandes. La llegada de las funciones de ventana de ANSI SQL:2003 habilitó enfoques puramente relacionales para el análisis temporal, permitiendo que las bases de datos manejen aritmética de intervalos compleja de manera eficiente dentro del motor.

El problema

Dada una tabla de reservas de recursos con marcas de tiempo start_time y end_time, el objetivo es determinar el número máximo de reservas concurrentes activas en cualquier momento dado, e identificar la(s) ventana(s) de tiempo específica(s) en la que ocurrió este pico. La complejidad surge porque la agregación estándar colapsa los datos temporales, mientras que los joins simples crean explosiones cartesianas cuando los intervalos se superponen. Una solución robusta debe tratar los inicios y finales de intervalos como eventos discretos, calculando un total acumulado de recursos activos en cada punto de transición.

La solución

El enfoque canónico transforma intervalos en eventos discretos utilizando UNION ALL para separar inicios (peso +1) y finales (peso -1), y luego aplica una suma acumulativa a través de SUM() OVER (ORDER BY timestamp) para rastrear la concurrencia. Para manejar inicios y finales simultáneos de manera determinista, los eventos finales deben procesarse antes que los eventos de inicio en la misma marca de tiempo (utilizando una clave de orden secundario). Finalmente, envolver esto en un CTE para filtrar el valor máximo de concurrencia.

WITH events AS (
  SELECT start_time AS ts, 1 AS delta, 0 AS is_end
  FROM reservations
  UNION ALL
  SELECT end_time AS ts, -1 AS delta, 1 AS is_end
  FROM reservations
),
concurrency AS (
  SELECT ts,
         SUM(delta) OVER (ORDER BY ts, is_end, delta 
                          ROWS UNBOUNDED PRECEDING) AS concurrent_count
  FROM events
)
SELECT MAX(concurrent_count) AS peak_concurrency
FROM concurrency;

Para encontrar las ventanas de tiempo específicas de uso pico, vuelve a unirte para identificar períodos entre marcas de tiempo consecutivas donde el conteo es igual al máximo.

Situación de la vida real

Una plataforma SaaS rastreó millones de trabajos de transcodificación de video en una tabla jobs con marcas de tiempo started_at y completed_at. El equipo de operaciones necesitaba identificar períodos exactos en los que la utilización de la GPU alcanzó el 100% para optimizar el programador de colas.

Un enfoque considerado fue usar un cursor para iterar cronológicamente, incrementando un contador en inicios y decrementando en finales. Si bien era sencillo para los desarrolladores familiarizados con lenguajes imperativos, este método procesó filas de manera secuencial, tomando más de 45 minutos en los datos de producción y bloqueando tablas. También requería una gestión de transacciones compleja para garantizar la consistencia de lectura.

Otra alternativa involucró generar una tabla de series temporales con una fila por minuto y unirla contra los intervalos utilizando predicados BETWEEN. Esto produjo resultados precisos, pero requería miles de millones de filas para una precisión a nivel de minuto durante un año, consumiendo terabytes de almacenamiento temporal y sin capturar picos de uso de menos de un minuto.

El equipo seleccionó el enfoque basado en eventos de UNION ALL con funciones de ventana de ANSI SQL. Al tratar inicios y finales como eventos +1/-1, la consulta se ejecutó en 12 segundos utilizando índices B-tree estándar en las columnas de marcas de tiempo. Este método manejó correctamente los casos límite donde los trabajos finalizaban exactamente cuando otros comenzaban.

El análisis reveló que la concurrencia máxima ocurrió durante el procesamiento por lotes nocturnos entre las 02:00 y las 02:07 UTC, alcanzando 847 trabajos simultáneos. Al implementar un estrangulamiento dinámico de colas específicamente para esta ventana, evitaron fallos en cascada y redujeron la sobre-provisión de infraestructura en un 30%.

Lo que a menudo los candidatos pasan por alto

¿Cómo manejas intervalos de duración cero (start_time = end_time) sin inflar incorrectamente el conteo de concurrencia?

Los intervalos de duración cero representan eventos instantáneos que no deberían contribuir a la carga concurrente. Si se tratan como intervalos estándar, podrían contarse como activos durante su propio evento final. La solución requiere asignar una clave de ordenamiento estricta: procesar eventos finales (-1) antes que los eventos de inicio (+1) cuando las marcas de tiempo colisionan, y excluir intervalos de duración cero de la secuencia de eventos por completo o asignarles un delta de 0, dependiendo de la lógica de negocio. En ANSI SQL, esto se implementa agregando una columna discriminadora: ORDER BY ts, is_end ASC, delta ASC, asegurando que las terminaciones decrementen el conteo antes de que nuevas asignaciones lo incrementen en la misma marca de tiempo.

¿Por qué el enfoque basado en eventos puede devolver resultados incorrectos si utilizas UNION en lugar de UNION ALL al combinar eventos de inicio y final?

UNION realiza implícitamente una operación DISTINCT, colapsando marcas de tiempo duplicadas. Si dos reservas comienzan exactamente a 2023-10-01 10:00:00, UNION reduce esto a una sola fila, causando que la suma acumulativa omita un incremento de +1. Esto resulta en un conteo subestimado de concurrencia. UNION ALL preserva cada límite de intervalo individual como un evento separado, lo cual es matemáticamente necesario porque cada reserva contribuye de manera independiente a la carga total. Los candidatos a menudo pasan por alto esta distinción, asumiendo la unicidad de marcas de tiempo donde la multiplicidad es esencial para una agregación correcta.

Al calcular las ventanas de tiempo específicas de concurrencia máxima (no solo el valor máximo), ¿cómo evitas huecos en la salida si múltiples períodos de tiempo consecutivos comparten el mismo valor máximo?

Después de identificar el valor máximo de concurrencia, volver a unirse para encontrar todas las marcas de tiempo donde esto ocurre produce puntos discretos. Para reconstruir bloques de duración continua, debes aplicar la técnica de Gaps and Islands: utilizar LAG() para verificar si la fila anterior también estaba en el pico, y LEAD() para verificar si la siguiente fila está en el pico. Solo se deben devolver filas donde el valor anterior difiera (comienzos de islas) o el siguiente valor difiera (finales de islas). Luego, emparejar estos usando ROW_NUMBER() para crear pares de inicio-fin. Los candidatos frecuentemente devuelven listas de marcas de tiempo en bruto o utilizan GROUP BY en el valor de conteo, lo que pierde la información de adyacencia temporal necesaria para distinguir incidentes pico separados de un período pico continuo.

En escenarios que demandan análisis de la densidad de superposición temporal, ¿cómo calcularías los momentos precisos en que la utilización de recursos alcanzó su pico absoluto, utilizando estrictamente la lógica basada en conjuntos de **ANSI SQL** sin iteración procedural?