Ответ на вопрос

До C++20 Empty Base Optimization (EBO) позволял пустым базовым классам делить адреса памяти с данными членами производного класса, фактически не потребляя место. Однако данные члены строго требовали иметь уникальные адреса и ненулевой размер, заставляя статeless распределители в контейнерах, таких как std::map, либо увеличивать размеры узлов, либо полагаться на хрупкое частное наследование. Атрибут [[no_unique_address]] явно позволяет члену данных не статического типа занимать ноль байтов, если его тип пуст, тем самым позволяя использовать компоновку вместо наследования для хранения распределителей, сохраняя при этом оптимальную плотность памяти в контейнерах STL.

История вопроса

Модель распределителей C++98 в основном использовала статeless функции, где EBO через наследование была стандартной техникой для избежания накладных расходов по хранению в стандартных контейнерах. Так как C++11 ввел распределители с областью видимости и сложные черты распространения распределителей, сложность наследования от потенциально состояний увеличивалась, рискуя не определенным поведением или неэффективностями в компоновке при переключении между вариантами. C++20 стандартизировал атрибут [[no_unique_address]], чтобы обеспечить первоклассную поддержку языка для компоновки без накладных расходов, соответствуя принципу нулевых накладных расходов без необходимости в хрупких иерархиях наследования, которые усложняли интерфейсы классов.

Проблема

Объектная модель C++ требует, чтобы полные объекты и потенциально перекрывающиеся подсистемы имели разные ненулевые размеры и уникальные адреса, что предотвращает совместное использование двух членов данных одного класса, даже если их типы пусты. Для контейнеров на основе узлов, таких как std::list или std::map, каждый узел обычно хранит экземпляр распределителя; без оптимизации статeless распределитель добавляет как минимум один байт (округленный до выравнивания), значительно увеличивая потребление памяти для миллионов мелких узлов. Традиционные обходные пути использовали частное наследование, что усложняло иерархии классов и препятствовало легкой замене распределителей на состояниевые альтернативы без переработки шаблонного механизма.

Решение

Атрибут [[no_unique_address]] сообщает компилятору, что член данных не требует уникального адреса, позволяя ему располагаться по тому же адресу памяти, что и другой подсистемный объект, если тип члена — пустой тривиально копируемый класс. Это позволяет разработчикам контейнеров объявлять распределители прямыми членами, обеспечивая нулевую стоимость хранения для статeless типов, при этом компилятор автоматически настраивает выравнивание и компоновку. Атрибут сохраняет строгие правила псевдонимирования и семантику времени жизни объектов, всего лишь ослабляя требование к уникальности адреса конкретно для аннотированного члена.

#include <iostream>
#include <memory>
#include <cstdint>

// Пример статeless распределителя
template <typename T>
struct EmptyAllocator {
    using value_type = T;
    EmptyAllocator() = default;
    template <typename U> EmptyAllocator(const EmptyAllocator<U>&) {}
    T* allocate(std::size_t n) { return std::allocator<T>().allocate(n); }
    void deallocate(T* p, std::size_t n) { std::allocator<T>().deallocate(p, n); }
    
    // Пустой тип
    bool operator==(const EmptyAllocator&) const = default;
};

// Узел с [[no_unique_address]]
template <typename T, typename Alloc = EmptyAllocator<T>>
struct NodeOptimized {
    [[no_unique_address]] Alloc allocator; // Ноль байтов, если Alloc пуст
    T value;
    NodeOptimized* next;
    
    explicit NodeOptimized(const T& val) : value(val), next(nullptr) {}
};

// Узел без оптимизации (для сравнения)
template <typename T, typename Alloc = EmptyAllocator<T>>
struct NodeNaive {
    Alloc allocator; // Всегда 1+ байт
    T value;
    NodeNaive* next;
    
    explicit NodeNaive(const T& val) : value(val), next(nullptr) {}
};

int main() {
    std::cout << "Оптимизированный размер узла: " << sizeof(NodeOptimized<int>) << " байт
";
    std::cout << "Наивный размер узла: " << sizeof(NodeNaive<int>) << " байт
";
    // В типичных реализациях оптимизированный будет 16 байт (8+4+4 или аналогично)
    // в то время как наивный будет 24 байт (1, выравненный до 8 + 8 + 4 + выравнивание)
    return 0;
}

Ситуация из жизни

В проекте инфраструктуры для торговли с низкой задержкой команде было необходимо реализовать кастомное интрузивное красно-черное дерево для сопоставления ордеров, где каждый узел представлял лимитный ордер. Система требовала подключаемые стратегии памяти: стековый распределитель для пула фиксированных частей во время рыночных часов и std::allocator для сценариев бек-тестирования.

Первоначальная реализация использовала частное наследование от распределителя для использования Empty Base Optimization, предполагая, что стандартный распределитель не будет занимать места.

// Первоначальный подход: EBO на основе наследования
template <typename T, typename Alloc>
class OrderNode : private Alloc { // Неудобно: Alloc — базовый
    T data;
    OrderNode* left;
    OrderNode* right;
    Color color;
public:
    // Проблема: Неоднозначность, если Alloc имеет методы с именами 'left' или 'color'
    // Проблема: Нельзя легко хранить Alloc как член, если он состоянияевой
};

Этот подход оказался хрупким. Когда команда по управлению рисками потребовала реализации состояний аудиторского распределителя, который отслеживал счетчики использования памяти, переход на переменную-член вызвал немедленную 8-байтовую инфляцию на узел из-за выравнивания, увеличив общий объем памяти на 40% и ухудшив производительность кеша.

Альтернативное решение A: Хранение с использованием std::variant.

Команда рассмотрела возможность хранения либо указателя на распределитель (для состоянияевых), либо ничего (для статeless) с использованием std::variant или ручного стирания типов.

Плюсы: Единый интерфейс для состоянияевых и статeless распределителей без раздувания шаблонов.

Минусы: Накладные расходы на косвенные обращения для состояниеевых распределителей, и сам вариант требовал как минимум одного байта (плюс выравнивание) для хранения дискриминатора, не сумев решить проблему нулевых накладных расходов для критического пути, где преобладали статeless распределители.

Альтернативное решение B: Специализация шаблона с различными классами.

Они оценили специализацию всего класса OrderNode на основе std::is_empty_v<Alloc>, наследуя, когда пустой, и компонуя, когда состояний.

Плюсы: Гарантированно нулевые накладные расходы для пустого случая.

Минусы: Дублирование кода между двумя специализациями, удвоенное время компиляции и кошмары по обслуживанию при добавлении новых полей узла, так как изменения должны были дублироваться в обеих ветвях шаблона.

Выбранное решение и результат:

Команда мигрировала на C++20 и применила [[no_unique_address]] к члену-распределителю.

template <typename T, typename Alloc>
struct OrderNode {
    [[no_unique_address]] Alloc alloc; // Нулевая стоимость, если пуст
    T data;
    OrderNode* left;
    OrderNode* right;
    // ... остальная часть реализации
};

Этот дизайн устранил необходимость в наследовании, сохраняя нулевые байты накладных расходов для производственного стекового распределителя. Когда аудиторский распределитель (находящийся в состоянии) был заменён, член автоматически расширился для размещения его счетчиков без изменений в коде. Бенчмарки показали 15% снижение пропусков кеша по сравнению с версией на основе наследования благодаря лучшим оптимизациям компилятора на более плоской иерархии классов, и кодовая база стала значительно более удобной для обслуживания.

Что кандидаты часто пропускают

Могут ли два члена данных [[no_unique_address]] одного пустого типа занимать один и тот же адрес памяти?

Нет, они не могут. Хотя [[no_unique_address]] устраняет требование к уникальному адресу относительно других подклассов, C++ по-прежнему требует, чтобы разные полные объекты одного типа имели разные адреса. Если два члена m1 и m2 одного и того же пустого типа были аннотированы, компилятор должен выделять отдельное хранилище (обычно по 1 байту каждый, в зависимости от выравнивания), чтобы гарантировать &node.m1 != &node.m2. Атрибут только позволяет перекрытие с членами разных типов или с подклассами базовых классов.

Как [[no_unique_address]] взаимодействует с offsetof и стандартными типами компоновки?

Взаимодействие тонкое и потенциально опасное. Если класс содержит члены с [[no_unique_address]], он все еще может быть стандартно-компоновки, но вызов offsetof на таком члене приносит определяемый реализацией результат, если член пуст и перекрывает другой подкласс. Кроме того, поскольку правила стандартной компоновки предполагают, что нестатические члены данных занимают различные байты в порядке объявления, перекрытие пустого члена с последующим членом технически нарушает строгие предположения о порядке, которые делает некоторый устаревший код. Разработчики должны избегать арифметики указателей на основе offsetof для членов [[no_unique_address]] и вместо этого полагаться на std::addressof.

Почему [[no_unique_address]] избыточен для базовых классов, и какие риски он избегает по сравнению с наследованием?

Базовые классы по сути квалифицируются для Empty Base Optimization без атрибутов, так как пустой базовый подпункт может делить адрес первого нестатического члена данных производного класса. [[no_unique_address]] существует специально для предоставления этой возможности членам данных, позволяя использовать компоновку. Использование членов данных избегает ловушек скрытия имён и неоднозначия множественного наследования частного наследования. Например, если контейнер наследовался от распределителя, который определял вложенный тип pointer, а контейнер также определял свой собственный тип pointer, неквалифицированный поиск разрешался бы к члену базового класса, вызывая неясные ошибки компиляции. Члены данных с [[no_unique_address]] устраняют это загрязнение контекста, сохраняя эффективность компоновки.