Antwort.

Die Massenaktualisierung von Daten in mehreren verknüpften Tabellen ist eine klassische Aufgabe im industriellen SQL-Programming. Mit der Entwicklung von Business-Anwendungen wurde die Notwendigkeit, große Datenmengen gleichzeitig zu aktualisieren, immer wichtiger, während gleichzeitig ihre Konsistenz gewährleistet wird. Historisch wurde dies durch zyklische Szenarien gelöst, was zu niedriger Leistung und langen Sperrzeiten führte. Später kamen fortgeschrittene DML-Operatoren (z.B. MERGE), Transaktionskonstrukte und Ansätze mit Staging-Tabellen hinzu.

Das Problem liegt darin, dass die Aktualisierung von Daten viele Tabellen mit Beziehungen betrifft (z.B. Bestellungen und Auftragsdetails), was zu "waisen" Verweisen (orphan rows), Verlust der Leistung aufgrund von Sperren und unvorhersehbarer Belastung der DBMS führen kann.

Die Lösung basiert auf der Verwendung atomarer Transaktionen, der Operationen UPDATE/DELETE/MERGE mit JOIN-Bedingungen sowie der Batchverarbeitung von Daten. Eine gute Praxis ist es, aggregierte Änderungen in temporären Staging-Tabellen zu verschieben und sie dann durch Transaktionen paketweise anzuwenden. Beispiel für SQL Server mit MERGE:

BEGIN TRANSACTION;

-- Beispiel einer Massenaktualisierung der Haupt- und verknüpften Tabelle mit MERGE
MERGE INTO orders AS tgt
USING temp_order_updates AS src
  ON tgt.id = src.id
WHEN MATCHED THEN
  UPDATE SET tgt.status = src.status, tgt.updated_at = src.updated_at;

MERGE INTO order_details AS tgt
USING temp_detail_updates AS src
  ON tgt.order_id = src.order_id AND tgt.sku = src.sku
WHEN MATCHED THEN
  UPDATE SET tgt.price = src.price, tgt.qty = src.qty;

COMMIT;

Hauptmerkmale:

Isolierung der Operationen in eine Transaktion: keine Zwischeninkonsistenzen.
Verwendung von Staging-Tabellen zur Vorbereitung der zu ändernden Daten.
Anwendung von Batch-Operationen zur Reduzierung von Sperren und Optimierung der Last.

Fangfragen.

Kann man einfach die Haupttabelle aktualisieren und dann separat die verknüpften Tabellen, ohne Transaktionen, wenn die Anforderungen an die Geschwindigkeit streng sind?

Trennte UPDATEs außerhalb einer Transaktion führen zu harter Inkonsistenz der Daten bei einem Fehler in einer der Phasen – zum Beispiel, wenn die Bestellungen aktualisiert wurden, aber die Details nicht, wird die Logik gestört. In modernen DBMS erhöht die Verwendung von Transaktionen fast nicht die Overhead-Kosten bei der Batchverarbeitung.

Wird die Leistung sinken, wenn man ein großes UPDATE mit einer Unterabfrage macht? Kann dies zu Sperren führen?

Ja, monolithische UPDATEs auf großen Tabellen führen zu Sperrankreisation, Tabellensperren und Ausfallzeiten für andere Benutzer. Es ist besser, die Verarbeitung in Batches mit einer Einschränkung über WHERE ... AND rownum/id/limit zu unterteilen.

Beispiel für ein Batch:

UPDATE orders
SET status = 'closed'
WHERE status = 'pending' AND id BETWEEN 100000 AND 199999;

Garantiert MERGE Atomarität und die richtige Reihenfolge der Verarbeitung von verknüpften Tabellen?

Nein, MERGE arbeitet im Rahmen einer Tabelle. Um verknüpfte Tabellen zu aktualisieren, sind separate MERGE- oder UPDATE-Operationen erforderlich, und beide Aktionen müssen unbedingt innerhalb einer Transaktion platziert werden.

Typische Fehler und Antipatterns

Fehlende Transaktionen bei Massenänderungen, was zu Dateninkonsistenzen führt
Große Einzel-UPDATE/DELETE auf riesigen Datensätzen ohne LIMIT/BATCH: Sperren und Ausfallzeiten
Falsche Reihenfolge der Operationen (z.B. zuerst die Details aktualisieren, dann die Haupttabelle)

Beispiel aus dem Leben

Negativer Fall

Ein Unternehmen aktualisierte den Status ("Abgeschlossen") in einer Million Bestellungen durch separate Abfragen außerhalb einer Transaktion: zuerst die Haupttabelle orders, dann die Details order_details. Unter Last "stürzte" der Server ab – bei einem Fehler blieben die Details im "offenen" Status. Vorteile:

Einfach zu implementieren
Minimaler Code

Nachteile:

Dateninkonsistenz und Schwierigkeiten bei der späteren Fehlersuche
Komplikationen bei der Rückgängig-Machung

Positiver Fall

Implementierung von Staging-Tabellen und Gruppenverarbeitung innerhalb einer Transaktion. Zuerst wurden alle Änderungen berechnet und in temporären Tabellen gespeichert, dann wurden beide Haupttabellen batchweise aktualisiert. Im Falle eines Fehlers – vollständige Rückgängigmachung. Vorteile:

Gewährleistung von Datenkonsistenz und -integrität
Bequeme Kontrolle und Rückgängigmachung