Ответ на вопрос.

История вопроса. До C++20 применение атомарных операций к существующим неатомным объектам требовало сложных обходных путей, поскольку std::atomic требует, чтобы объекты создавались как атомарные с самого начала. Программисты часто пытались использовать опасные операции reinterpret_cast, чтобы рассматривать обычные объекты как атомарные, нарушая строгие правила алиасинга и вызывая неопределенное поведение из-за несоответствий времени жизни объектов. Введение std::atomic_ref в C++20 закрыло этот пробел, предоставив не владеющий вид, который временно наделяет атомарной семантикой существующие объекты, не изменяя их тип хранения или время жизни.

Проблема. std::atomic накладывает конкретные требования к представлению — такими как свободные от блокировок битовые флаги или внутренние мьютексы — которые обычно изменяют размер или выравнивание объекта по сравнению с базовым типом T. Следовательно, объект типа int несовместим по компоновке с std::atomic<int>, что делает невозможным указательное приведение. Более того, std::atomic_ref требует, чтобы объект, на который он ссылается, удовлетворял строгим требованиям по выравниванию; в частности, адрес объекта должен быть выровнен по крайней мере на alignof(std::atomic_ref<T>), что для многих платформ равно alignof(T), но может быть больше для атомарных инструкций, специфичных для аппаратуры. Нарушение этого требования по выравниванию приводит к неопределенному поведению, которое может проявляться в виде поврежденных чтений или аппаратных исключений на строгих архитектурах, таких как ARM.

Решение. std::atomic_ref действует как легковесная обертка, удерживающая указатель на целевой объект, применяя компиляторские встроенные функции или аппаратные инструкции для обеспечения атомарности, не предполагая, что хранилище является экземпляром std::atomic. Он уважает существующее время жизни объекта, обеспечивая те же гарантии упорядочивания памяти, что и std::atomic в течение каждой операции. Чтобы использовать его безопасно, разработчики должны убедиться, что объект должным образом выровнен, зачастую с помощью спецификаторов alignas или путем проверки, что std::atomic_ref<T>::required_alignment соблюден, тем самым обеспечивая свободный от блокировок доступ к устаревшим структурам данных или компоновкам, совместимым с C.

#include <atomic>
#include <cstdint>
#include <iostream>

struct alignas(alignof(std::atomic_ref<std::uint64_t>)) Data {
    std::uint64_t value;
};

int main() {
    Data d{42};
    std::atomic_ref<std::uint64_t> ref(d.value);
    
    ref.fetch_add(8, std::memory_order_relaxed);
    std::cout << d.value << "
"; // Вывод: 50
}

Ситуация из жизни

Описание проблемы. В приложении высокочастотной торговли устаревшая структура C определяла компоновку пакета рыночных данных, содержащего поле double для цены, которое нуждалось в атомарных обновлениях из сетевого потока, в то время как поток стратегии его читал. Биржа требовала точной двоичной совместимости, что запрещало изменение структуры для использования std::atomic<double>, и требования по задержке запрещали использование блокировок мьютексов или копирования памяти. Мы столкнулись с гонкой данных, где частичные записи в double (неатомарное на x86-64 без должного выравнивания) вызывали у потока стратегии чтение поврежденных «призрачных» значений во время всплесков волатильности.

Рассматривавшиеся различные решения. Первый подход включал двойное буферизование с флагами std::atomic<bool>, поддерживающими две копии структуры и атомарно переворачивающими указатель. Хотя это было свободно от блокировок, оно удвоило использование памяти и вызвало постоянный переход кэш-линий между узлами NUMA, ухудшая производительность примерно на 15% в микробенчмарках. Второй подход рассматривал использование std::memcpy для копирования в локальную переменную std::atomic<double>, но это нарушало ограничения реального времени из-за дополнительного копирования и по-прежнему страдало от поврежденных чтений, если memcpy выполнялся в середине обновления. Третье решение использовало std::atomic_ref, чтобы напрямую сослаться на поле цены в структуре C, используя аппаратные инструкции CAS (Compare-And-Swap) без изменения компоновки структуры.

Какое решение было выбрано и почему. Мы выбрали std::atomic_ref, поскольку оно обеспечивало истинную абстракцию с нулевыми накладными расходами: сгенерированный ассемблерный код на x86-64 был идентичен ручным инструкциям lock cmpxchg, без дополнительных аллокаций или косвенных обращений. В отличие от подхода с двойным буферизованием, оно сохраняло резидентность в одной кэш-линии для горячих данных, сохраняя локальность кэша L1, что критично для задержки на уровне микросекунд. Критически важно, что оно уважало ограничения ABI внешней библиотеки C, при этом устраняя гонки данных благодаря аппаратной гарантии атомарности.

Результат. После внедрения система достигла устойчивых обновлений без блокировок с задержкой менее микросекунды, устранив аномалии призрачного значения, которые были проверены с помощью запусков ThreadSanitizer. Проверка выравнивания (alignas) обеспечила портируемость на серверы ARM64 без изменений в коде, а пропускная способность увеличилась на 12% по сравнению с базовым вариантом двойного буферизования благодаря уменьшению давления на кэш.

Что часто упускают кандидаты

Почему приведение неатомного указателя к std::atomic<T>* вызывает неопределенное поведение, когда std::atomic_ref безопасен?

Приведение через reinterpret_cast создает указатель на объект типа std::atomic<T>, но хранилище фактически содержит объект типа T. Это нарушает строгие правила алиасинга модели объектов C++ и требования к времени жизни, поскольку std::atomic<T> может иметь другой размер, выравнивание или внутреннее состояние (например, спин-блокировку), чем T. std::atomic_ref задуман как отдельный референсный тип, который явно ссылается на объект T и применяет атомарные операции к нему через встроенные функции, специфичные для реализации, не притворяясь, что хранилище является другим типом, тем самым сохраняя время жизни и компоновку оригинального объекта.

Синхронизирует ли std::atomic_ref с конструированием объекта, на который он ссылается?

Нет. std::atomic_ref обеспечивает атомарность только для операций, выполненных через него, но не устанавливает отношения happens-before с конструктором ссылочного объекта. Если поток A создает объект, а поток B немедленно создает std::atomic_ref на него, поток B может видеть неинициализированную память, если поток A не выполнил операцию высвобождения (например, запись в std::atomic<bool>) и поток B не выполнил операцию получения перед доступом к atomic_ref. Сам atomic_ref предполагает, что объект уже жив и доступен, но параллельно выполняемые неатомарные записи во время создания остаются гонками данных без внешней синхронизации.

Может ли std::atomic_ref использоваться с const объектами, и каковы ограничения?

Да, std::atomic_ref<const T> допустим и позволяет выполнять атомарные операции чтения (например, load) на объектах, объявленных const, при условии, что объект не был изначально объявлен как const таким образом, что это позволяет оптимизациям компилятора кэшировать значения в регистрах. Однако вы не можете создать std::atomic_ref<T> (не константный) из const T&, так как это нарушает корректность const. Кроме того, даже при использовании atomic_ref<const T>, базовый объект не должен находиться в памяти только для чтения (например, секция .rodata), так как аппаратные атомарные инструкции требуют записываемых кэш-строк даже для операций чтения на большинстве архитектур.