Risposta alla domanda

Storia della domanda

La sfida del bin packing e dell'accumulo di batch precede i database relazionali, originando nella ricerca operativa e nell'ottimizzazione della logistica. In ANSI SQL, questo problema è stato storicamente irrisolvibile senza estensioni procedurali come i cursori PL/SQL o T-SQL perché le operazioni standard basate su set mancano della capacità di fare riferimento ai "totali correnti con reset" all'interno dei frame di finestra. L'introduzione di CTE ricorsive in SQL:1999 ha fornito le basi teoriche per un accumulo iterativo, sebbene molte implementazioni inizialmente soffrissero di limitazioni di prestazioni nei grandi set di dati. I moderni ottimizzatori di query hanno migliorato i piani di esecuzione ricorsiva, consentendo soluzioni efficienti per il controllo dei batch di produzione e il raggruppamento delle transazioni finanziarie. Questo schema rimane un test fondamentale per tradurre algoritmi procedurali nella logica dichiarativa di ANSI SQL.

Il problema

Dobbiamo elaborare una sequenza ordinata di elementi, ognuno dei quali possiede un peso o un valore, e assegnarli a batch sequenziali in modo tale che il totale cumulativo di ciascun batch non superi una capacità predefinita. Quando l'aggiunta dell'elemento successivo violerebbe la soglia, inizia un nuovo batch. Questo richiede di mantenere un accumulatore corrente che si resetta in modo condizionale, un'operazione che sfida la semplice aggregazione delle funzioni di finestra perché il confine di reset dipende dalla somma dinamica di tutti gli elementi precedenti dall'ultimo reset, non solo da un offset di riga fisso. La soluzione deve gestire casi limite inclusi elementi che superano la capacità individuale (errore o batch di overflow di un singolo elemento) e input vuoti, operando rigorosamente all'interno di ANSI SQL senza estensioni procedurali specifiche per il fornitore.

La soluzione

Utilizziamo un CTE ricorsivo che itera attraverso la sequenza ordinata, portando avanti il numero corrente di batch e il peso accumulato di quel batch. Il membro d'ancora inizializza il primo elemento con il batch 1 e il suo peso come somma corrente. Il membro ricorsivo si unisce all'elemento sequenziale successivo, calcolando se l'aggiunta del suo peso supera la capacità; in tal caso, incrementa il numero di batch e resetta l'accumulatore al peso del nuovo elemento, altrimenti mantiene il batch corrente e aggiunge all'accumulatore. Utilizziamo ROW_NUMBER() per stabilire un ordine di attraversamento rigoroso e prevenire la ricorsione infinita filtrando su un contatore di profondità o unendoci solo a righe successive. Infine, selezioniamo le assegnazioni di batch distinte o aggregando i risultati come richiesto.

WITH RECURSIVE ordered_items AS (
    SELECT 
        item_id, 
        weight, 
        ROW_NUMBER() OVER (ORDER BY sequence_order) AS rn
    FROM items
),
batch_accumulator AS (
    -- Ancora: il primo elemento inizia il batch 1
    SELECT 
        item_id, 
        weight, 
        rn, 
        1 AS batch_number, 
        weight AS current_batch_sum
    FROM ordered_items
    WHERE rn = 1
    
    UNION ALL
    
    -- Ricorsivo: elabora l'elemento successivo
    SELECT 
        oi.item_id,
        oi.weight,
        oi.rn,
        CASE 
            WHEN ba.current_batch_sum + oi.weight > 100 THEN ba.batch_number + 1 
            ELSE ba.batch_number 
        END AS batch_number,
        CASE 
            WHEN ba.current_batch_sum + oi.weight > 100 THEN oi.weight 
            ELSE ba.current_batch_sum + oi.weight 
        END AS current_batch_sum
    FROM batch_accumulator ba
    JOIN ordered_items oi ON oi.rn = ba.rn + 1
)
SELECT item_id, batch_number, weight
FROM batch_accumulator
ORDER BY rn;

Situazione della vita

Contesto: Automazione dell'imballaggio in magazzino per un centro di evasione ordini e-commerce.

Descrizione del problema: Il sistema di conveyor automatizzato elabora gli ordini in sequenza ma deve raggrupparli in contenitori di spedizione con un rigoroso limite di peso di 20 kg. Ogni ordine ha un peso variabile. Il sistema deve sapere quale ID di contenitore stampare su ciascuna etichetta di spedizione mentre gli articoli arrivano sulla linea, senza fermarsi per elaborare gruppi. I primi tentativi usando il codice a livello di applicazione hanno creato colli di bottiglia e condizioni di gara durante i periodi di alta affluenza.

Diverse soluzioni considerate:

Soluzione 1: Batching a livello di applicazione con tabelle temporanee. L'applicazione avrebbe recuperato gli elementi, calcolato i totali cumulativi in un ciclo e inserito i batch nel database. Questo approccio ha introdotto un significativo ritardo di rete e overhead delle transazioni, richiedendo più round-trip tra il server delle app e il database. Ha anche complicato il controllo della concorrenza quando più linee di imballaggio operavano simultaneamente, portando a una contesa di blocco della tabella.

Soluzione 2: Approccio puro a funzione di finestra utilizzando SUM() OVER (ORDER BY ...) con aritmetica modulo. Questo ha tentato di creare batch dividendo la somma corrente illimitata per la capacità. Tuttavia, questo assegna erroneamente gli elementi ai batch in base alla posizione assoluta piuttosto che alla soglia di reset dinamica, risultando in batch che superano costantemente la capacità quando gli elementi individuali hanno pesi variabili. L'approccio modulo funziona solo per elementi di dimensione fissa, rendendolo inadatto per il requisito di peso variabile.

Soluzione 3: CTE ricorsivo implementato all'interno di ANSI SQL. Questa soluzione esegue tutti i calcoli lato server in un'unica esecuzione di query, eliminando l'overhead di rete. Gestisce correttamente l'accumulo e la logica di reset a stato mantenuto elaborando iterativamente il flusso ordinato. Sebbene esistano limiti alla profondità della ricorsione in alcune configurazioni di database, i vincoli operativi del magazzino (i batch raramente superano le 100 unità) hanno garantito che questo non violasse i limiti della piattaforma. Questo approccio è stato scelto per la sua atomicità, coerenza e eliminazione della gestione dello stato dell'applicazione.

Risultato: La query ha elaborato con successo 50.000 elementi all'ora con latenza sub-secondo, assegnando correttamente gli ID dei contenitori rispettando i vincoli di peso. La soluzione ha eliminato le condizioni di gara e ridotto i costi dell'infrastruttura rimuovendo la necessità di un microservizio di batching separato.

Cosa spesso i candidati trascurano

1. Come gestisci correttamente il primo elemento quando supera individualmente la capacità del batch?

Molti candidati presumono che tutti gli elementi rientrino nella capacità. Quando il peso di un singolo elemento supera la soglia del batch, la logica ricorsiva deve segnare un errore o collocarlo in un batch di overflow isolato. L'implementazione corretta aggiunge una dichiarazione CASE nel membro d'ancora per controllare la capacità iniziale e nel membro ricorsivo per forzare un nuovo batch quando oi.weight > capacity, indipendentemente dalla somma corrente. Senza questo, il sistema potrebbe tentare di aggiungere elementi sovradimensionati ai batch esistenti o creare ricorsioni infinite cercando di dividere gli elementi.

2. Perché unirsi su rn = rn + 1 rischia la ricorsione infinita, e come la previeni?

I candidati utilizzano frequentemente oi.rn = ba.rn + 1 presumendo una sequenzialità rigorosa, ma se i dati sorgente contengono lacune o l'ordinamento ROW_NUMBER() produce duplicati a causa di chiavi di ordinamento non uniche, l'unione potrebbe creare cicli o saltare righe. Inoltre, se i dati contengono riferimenti circolari nella definizione della sequenza, la ricorsione non termina mai. La soluzione richiede di garantire che sequence_order sia deterministico e unico, e di aggiungere una colonna di contatore di profondità che si incrementa ad ogni livello di ricorsione, inclusa una restrizione CHECK o una clausola WHERE depth < 1000 per prevenire query in esecuzione infinita durante la corruzione dei dati.

3. Quali sono le implicazioni delle prestazioni della profondità rispetto alla larghezza della ricorsione in questo algoritmo?

Gli sviluppatori junior trattano spesso i CTE ricorsivi come cicli iterativi, non riconoscendo che ogni livello di ricorsione elabora tutte le righe idonee a quel livello (in ampiezza). Trascurano che senza un indicizzazione corretta su rn, l'unione oi.rn = ba.rn + 1 risulta in operazioni a ciclo nidificato che si scalano quadraticamente. L'approccio corretto richiede di garantire che la colonna di sequenza sia indicizzata e di comprendere che la ricorsione di ANSI SQL materializza i risultati intermedi, consumando potenzialmente una significativa quantità di memoria per batch di grandi dimensioni. I candidati dovrebbero menzionare l'ottimizzazione elaborando in porzioni più piccole o utilizzando un'elaborazione batch iterativa per milioni di righe anziché pura ricorsione.