Ответ.

Массовое обновление данных в нескольких связанных таблицах — классическая задача в промышленном программировании на SQL. С развитием бизнес-приложений возникла необходимость обновлять большие объёмы данных одновременно, одновременно гарантируя их согласованность. Исторически обходились циклическими сценариями, что приводило к низкой производительности и длительным блокировкам. Позже появились продвинутые DML-операторы (например, MERGE), transaction-конструкции, и подходы со staging-таблицами.

Проблема заключается в том, что обновление данных затрагивает множество таблиц с отношениями (например, заказы и подробности заказа), что чревато появлением "голых" ссылок (orphan rows), потерей производительности из-за блокировок и непредсказуемой нагрузкой на СУБД.

Решение основывается на использовании атомарных транзакций, операций UPDATE/DELETE/MERGE с условиями JOIN, а также батчевой обработки данных. Хорошая практика — откладывать агрегированные изменения во временные staging-таблицы, а затем применять их пакетно через транзакцию. Пример для SQL Server с помощью MERGE:

BEGIN TRANSACTION;

-- Пример массового обновления основной и связанной таблицы с помощью MERGE
MERGE INTO orders AS tgt
USING temp_order_updates AS src
  ON tgt.id = src.id
WHEN MATCHED THEN
  UPDATE SET tgt.status = src.status, tgt.updated_at = src.updated_at;

MERGE INTO order_details AS tgt
USING temp_detail_updates AS src
  ON tgt.order_id = src.order_id AND tgt.sku = src.sku
WHEN MATCHED THEN
  UPDATE SET tgt.price = src.price, tgt.qty = src.qty;

COMMIT;

Ключевые особенности:

Изолирование операций в одну транзакцию: нет промежуточных рассогласований.
Использование staging-таблиц для подготовки изменяемых данных.
Применение батчевых операций для снижения блокировок и оптимизации нагрузки.

Вопросы с подвохом.

Можно ли просто выполнить обновление основной таблицы, а потом по отдельности — связанных, без транзакций, если требования по скорости жесткие?

Отдельные UPDATE'ы вне транзакции дают жестокую рассогласованность данных при ошибке на любой из стадий — например, если обновились заказы, но не обновились детали, логика нарушается. В современных СУБД использование транзакций почти не повышает накладные расходы при батчевой обработке.

Упадёт ли производительность, если сделать одно большое UPDATE с подзапросом? Может ли это привести к блокировкам?

Да, монолитные UPDATE на большие таблицы! приводят к эскалации блокировок, табличным lock'ам и простоям других пользователей. Лучше разбить обработку на батчи с ограничением через WHERE ... AND rownum/id/limit.

Пример батча:

UPDATE orders
SET status = 'closed'
WHERE status = 'pending' AND id BETWEEN 100000 AND 199999;

MERGE гарантирует атомарность и правильный порядок обработки связанных таблиц?

Нет, MERGE работает в рамках одной таблицы. Для обновления связанных таблиц требуется отдельный MERGE или UPDATE, и обязательно помещать оба действия внутри одной транзакции.

Типовые ошибки и анти-паттерны

Отсутствие транзакций при массовых изменениях, что ведёт к рассогласованию данных
Большие единичные UPDATE/DELETE по огромным выборкам без LIMIT/BATCH: блокировки и простои
Неправильный порядок операций (например, сначала обновлять подробности, потом основную таблицу)

Пример из жизни

Негативный кейс

Компания обновляла статус ("Завершён") в миллионе заказов отдельными запросами вне транзакции: основной orders, после — детали order_details. Под нагрузкой сервер "падал" — в случае сбоя детали оставались с "открытым" статусом. Плюсы:

Просто реализуется
Минимальный код

Минусы:

Рассогласование данных и неудобство последующей отладки
Сложности при откате

Позитивный кейс

Внедрили staging-таблицы, и групповую обработку внутри транзакции. Сначала все изменения вычислялись и складывались во временные таблицы, затем пакетно обновлялись обе основные таблицы. В случае сбоя — полный откат. Плюсы:

Гарантия согласованности и целостности данных
Удобство контроля и отката

Минусы:

Затраты времени на архитектуру
Временное увеличение нагрузки на I/O