Ответ на вопрос

История. ManuallyDrop<T> появился в Rust 1.20 как обертка без затрат, специально предназначенная для предотвращения автоматического вызова деструктора, функционируя как более безопасная и семантически четкая альтернатива mem::forget при работе с частично инициализированными данными или реализации сложных типов контейнеров. В отличие от MaybeUninit<T>, который управляет памятью, которая может еще не содержать допустимый экземпляр T, ManuallyDrop предполагает, что внутреннее значение всегда полностью инициализировано, но откладывает время его уничтожения на усмотрение программиста. Это различие имеет решающее значение при реализации пользовательских трейтов Drop для типов коллекций, так как ManuallyDrop позволяет извлекать значения по полям во время уничтожения, не вызывая ошибок двойного уничтожения и не требуя накладных расходов времени выполнения, связанных с Option<T>.

Проблема. Рассмотрим сценарий, в котором общий контейнер должен извлечь элементы в процессе уничтожения или восстановиться после паники во время создания на месте; стандартные реализации Drop не могут перемещать значения из self, потому что компилятор все равно попытается уничтожить перемещенное из места после завершения реализации Drop. В то время как Option<T> с take() предлагает безопасную альтернативу, она вводит накладные расходы времени выполнения (дискриминантный булев результат) и требует, чтобы T был изначально сконструирован в качестве Option, нарушая принципы абстракции без затрат. ManuallyDrop предоставляет обертку, гарантирующую на этапе компиляции с идентичным размещением памяти для самого T, позволяя прямое извлечение полей через ptr::read без дополнительного выделения памяти или штрафов за разветвление.

Решение. Обертка отключает автоматический вызов деструктора T через свой атрибут #[repr(transparent)], требуя явных небезопасных вызовов ManuallyDrop::drop для выполнения деструкторов. При реализации Drop для структуры, содержащей ресурсы, выделенные в куче, вы оборачиваете чувствительные поля в ManuallyDrop, позволяя извлекать внутреннее значение, а затем вручную очищать его. Доступ к внутреннему значению после вызова drop представляет собой немедленное неопределенное поведение, так как значение становится логически неинициализированным, несмотря на то, что оно остается в памяти, потенциально содержа висячие указатели, если T владела памятью кучи. Эта модель имеет значение для абстракций без затрат, таких как Vec::drop, который должен освобождать память хранилища, предотвращая уничтожение элементов, если извлечение не удалось из-за переполнения ёмкости.

use std::mem::ManuallyDrop;
use std::ptr;

struct Buffer<T> {
    // Сырой указатель на выделение памяти в куче
    ptr: *mut T,
    // ManuallyDrop позволяет нам взять Vec без автоматического уничтожения
    temp_storage: ManuallyDrop<Vec<T>>,
}

impl<T> Drop for Buffer<T> {
    fn drop(&mut self) {
        // Безопасное извлечение Vec из ManuallyDrop
        let vec = unsafe { ptr::read(&*self.temp_storage) };
        
        // Явное уничтожение необходимо, чтобы предотвратить двойное уничтожение Vec
        unsafe { ManuallyDrop::drop(&mut self.temp_storage) };
        
        // Теперь мы можем использовать vec без попытки компилятора снова уничтожить self.temp_storage
        drop(vec);
    }
}

Ситуация из жизни

Описание проблемы. При разработке высокопроизводительной очереди без блокировок для встроенной системы Rust, работающей на микроконтроллере с 128KB ОЗУ, мы столкнулись с критической проблемой во время реализации Drop для очереди. Очередь использовала инвазивный связный список, где узлы содержали указатели Box<Node<T>>, и нам нужно было извлечь 10,000+ узлов, не рекурсируя через стандартные реализации Drop (что вызвало бы переполнение стека в нашей ограниченной среде). Кроме того, некоторые узлы могли находиться в промежуточном состоянии инициализации во время операции push, когда произошла паника, требуя от нас выборочного уничтожения только полностью инициализированных узлов, пока частично сконструированные узлы оставались безопасными.

Решение 1: Использование Option и take. Сначала мы обернули каждый указатель узла в Option<Box<Node<T>>> и использовали while let Some(node) = head.take() для обработки списка. Плюсы: Полностью безопасно, идиоматичный Rust, не требуется небезопасный код, и просто для поддержки. Минусы: Каждый узел нес дополнительный байт для дискриминанта Option, увеличивая объем памяти примерно на 12% в нашем встроенном контексте, и операция take() вводила штраф за предсказание ветвления на горячем пути, что снижало пропускную способность на 8% в бенчмарках.

Решение 2: Использование mem::forget. Мы рассматривали возможность использования std::mem::forget на всей структуре очереди, чтобы предотвратить автоматическое уничтожение, а затем вручную освободить память с помощью alloc::dealloc. Плюсы: Предотвращает рекурсивные уничтожения и избегает накладных расходов Option. Минусы: Чрезвычайно небезопасно, требовало ручного управления памятью, обходя проверки безопасности аллокатора Rust, утечка памяти, если ручное освобождение не удалось, и сделало код непригодным для поддержки будущими разработчиками, незнакомыми с арифметикой сырого указателя.

Решение 3: Поля ManuallyDrop. Мы переработали структуру Node, чтобы хранить указатель на next как ManuallyDrop<Box<Node<T>>>. Во время Drop мы проходили через список, используя манипуляции с сырыми указателями, извлекали каждый Box через ptr::read, перемещали его в локальную переменную и явно вызывали ManuallyDrop::drop на извлеченном месте только после проверки, что узел был полностью инициализирован через атомарный статусный флаг. Плюсы: Нулевая накладная память (ManuallyDrop является #[repr(transparent)]), полный контроль над порядком уничтожения, возможность безопасно обрабатывать частично инициализированные узлы, пропуская ручное уничтожение для неинициализированных узлов. Минусы: Требовались unsafe блоки и тщательный аудит инвариантов старшими инженерами.

Какое решение было выбрано и почему. Мы выбрали Решение 3 (ManuallyDrop), поскольку строгие ограничения по ОЗУ встроенной системы сделали накладные расходы от Option неприемлемыми для нашей пропускной способности в 10,000 узлов, а mem::forget был слишком подвержен ошибкам для производственного кода. ManuallyDrop позволил нам сохранить гарантии безопасности памяти Rust, обеспечивая необходимый контроль для инвазивных структур данных. Мы обернули небезопасные операции в небольшой, тщательно протестированный модуль с debug_assertions, проверяющими инварианты в тестовых сборках, и обширно документировали инварианты безопасности.

Результат. Очередь успешно обрабатывала цепочки максимальной емкости без переполнения стека, сохраняла постоянное использование памяти независимо от длины цепочки и прошла проверку Miri (интерпретатор промежуточного представления среднего уровня), подтверждающую отсутствие неопределенного поведения. Явные вызовы ручного уничтожения сделали логику уничтожения немедленно видимой для рецензентов кода, предотвращая тонкие ошибки двойного уничтожения, которые беспокоили более ранние реализации этой структуры данных на C++ в наследуемых кодовых базах.

Что часто упускают кандидаты

Вопрос: Почему внутреннее значение ManuallyDrop<T> должно считаться логически недоступным после вызова ManuallyDrop::drop, и почему компилятор Rust не может заставить это ограничение на этапе компиляции?

Ответ. Как только вызывается ManuallyDrop::drop, внутреннее значение переходит в логически неинициализированное состояние, аналогичное MaybeUninit до инициализации. Компилятор не может заставить это на этапе компиляции, потому что ManuallyDrop предназначен для использования в контекстах, таких как реализации Drop, где проверка заимствований уже разрешает сложные мутации self через ссылки &mut self. Обертка намеренно сохраняет свою реализацию DerefMut даже после уничтожения, чтобы поддерживать определенные паттерны атомарных операций, что означает, что компилятор не имеет встроенного понятия "уже уничтожено" на уровне типа. Доступ к внутреннему значению после уничтожения представляет собой немедленное неопределенное поведение, поскольку деструктор мог освободить ресурсы (такие как память кучи или дескрипторы файлов), оставляя обертку содержащей висячие указатели или недопустимые битовые шаблоны.

Вопрос: Как ManuallyDrop влияет на автоматическую реализацию трейтов Send и Sync для обернутого типа T, и почему это критично для конкурентных структур данных?

Ответ. ManuallyDrop<T> имеет атрибут #[repr(transparent)], что означает, что он имеет идентичное размещение памяти и ABI для T, и условно реализует Send и Sync только если T сама их реализует. Кандидаты часто ошибочно полагают, что подавление деструктора каким-то образом ослабляет гарантии безопасности потоков или добавляет внутреннюю изменяемость, подобно UnsafeCell. На самом деле, ManuallyDrop сохраняет все автоматические реализации трейтов, поскольку не вводит никаких накладных расходов на синхронизацию или общий изменяемый состояние. Это означает, что обмен &ManuallyDrop<T> между потоками имеет те же требования безопасности, что и обмен &T; небезопасность возникает только при мутации значения или вызове ручного уничтожения, в этот момент стандартные правила владения и строгие требования к эксклюзивному изменяемому доступу применяются строго.