Odpowiedź na pytanie.

Standardowa biblioteka Rust w wersji 1.63 wprowadziła thread::scope, aby rozwiązać ograniczenie, że thread::spawn wymaga zamknięć 'static. Historycznie deweloperzy polegali na pakietach takich jak crossbeam w celu osiągnięcia skoordynowanej współbieżności, co pokazało, że bezpieczne pożyczanie między wątkami jest możliwe bez ograniczeń 'static. Fundamentalnym problemem jest to, że jeśli wątek przetrwa ramkę stosu zawierającą dane, do których się odnosi, dane stają się nieważne, co prowadzi do podatności na błędy użycia po zwolnieniu pamięci.

Rozwiązanie wykorzystuje podtypowanie czasów życia i gwarancje kolejności usuwania, aby upewnić się, że wszystkie uruchomione wątki kończą działanie przed zakończeniem zakresu. Funkcja thread::scope przyjmuje zamknięcie, które otrzymuje uchwyt Scope z czasem życia 'env powiązanym ze środowiskiem pożyczonym; uruchamiane wątki otrzymują czas życia 'scope, który jest ściśle krótszy niż 'env. Implementacja Scope wewnętrznie śledzi wszystkie instancje ScopedJoinHandle i automatycznie je łączy przed zwróceniem funkcji zakresu, zapewniając, że żaden wątek nie może uzyskać dostępu do danych po ich zwolnieniu pamięci.

use std::thread;

fn parallel_sum(data: &[i32]) -> i32 {
    let mut sum = 0;
    thread::scope(|s| {
        let handle = s.spawn(|| {
            data.iter().sum::<i32>()
        });
        sum = handle.join().unwrap();
    });
    sum
}

Sytuacja z życia.

Pipeline do przetwarzania danych musiał wykonać analizę statystyczną na tablicach o rozmiarze gigabajtów, nie kopiując danych do stosu dla każdego wątku roboczego. Zespół inżynierski początkowo próbował użyć rayon do równoległej iteracji, ale specyficzna logika agregacji wymagała ręcznego zarządzania wątkami z drobną kontrolą nad przywiązaniem wątków. Wyzwaniem było to, że wejściowe fragmenty były tymczasowymi widokami zaalokowanymi na stosie do pliku z mapowaniem pamięci, co sprawiało, że zaspokojenie ograniczeń 'static było niemożliwe bez kosztownego klonowania do globalnego alokatora.

Jednym z podejść było podzielenie danych na poszczególne kawałki Vec i przeniesienie ich do uruchamianych wątków, ale to wiązało się z 40% nadmiarem pamięci i znaczną latencją z powodu wstrząsania alokacjami. Inna propozycja wykorzystała przekazywanie wiadomości za pomocą kanałów mpsc do przesyłania danych do długoterminowych wątków roboczych, ale to wprowadziło złożoność synchronizacji i uniemożliwiło kompilatorowi weryfikację, że wszystkie wątki zakończyły działanie przed odmapowaniem bufora źródłowego. Ostatecznie zespół przyjął std::thread::scope, ponieważ zapewniał bezkosztową abstrakcję nad bezpośrednim uruchamianiem wątków, jednocześnie utrzymując gwarancje czasu kompilacji, że żaden wątek nie przetrwałby danych źródłowych.

Implementacja zdefiniowała zamknięcie przetwarzające, które pożyczyło nie-'static fragmenty i uruchomiło cztery wątki lokalne, z których każdy obliczał częściowe wyniki, które były agregowane po implikowanym połączeniu. To podejście wyeliminowało nadmiar alokacji, zmniejszyło latencję o 60% i zapobiegło klasie błędów, gdzie przedwczesne zakończenia zakresu mogłyby powodować błędy segmentacji w poprzednich implementacjach C++. Wynikiem był solidny system, w którym kompilator Rust odrzucał jakiekolwiek próby wycieku uchwytu wątku poza granicę zakresu, wymuszając bezpieczeństwo w czasie kompilacji.

Co kandydaci często przeoczają.

Dlaczego kompilator odrzuca przekazywanie odniesienia o czasie życia 'a bezpośrednio do std::thread::spawn, nawet jeśli wątek główny natychmiast czeka na uchwyt połączenia?

std::thread::spawn wymaga, aby jego zamknięcie było 'static, ponieważ kompilator nie może udowodnić, że wątek nadrzędny przetrwa wątek uruchomiony bez dodatkowych ograniczeń. Nawet jeśli kod wydaje się łączyć natychmiast, system typów musi uwzględniać dynamiczne wykonanie, w którym wyjątki lub wcześniejsze zwroty mogą pominąć wywołanie łączenia, pozostawiając odłączony wątek uzyskujący dostęp do zwolnionej pamięci stosu. Ograniczenie 'static zapewnia, że wszystkie przechwycone dane posiadają swoją pamięć lub korzystają z globalnej alokacji, zapobiegając błędom użycia po zwolnieniu pamięci niezależnie od ścieżek kontrolnych.

Jak struktura Scope<'env, '_> egzekwuje, aby uruchamiane wątki nie przetrwały ramki stosu zakresu bez polegania na zliczaniu odniesień w czasie wykonywania?

Typ Scope wykorzystuje parametry czasów życia invariantne i semantykę kolejności usuwania, aby wymusić bezpieczeństwo; czas życia 'env reprezentuje otaczającą ramkę stosu, podczas gdy 'scope (krótszy niż 'env) jest nadawany każdemu ScopedJoinHandle. Funkcja thread::scope nie zwraca, aż dostarczone zamknięcie zostanie zakończone, a implementacja Scope czeka na zakończenie wszystkich uruchomionych wątków przed zwróceniem zamknięcia. Ten projekt wykorzystuje system typów affine w Rust: ponieważ uchwyty nie mogą opuścić zamknięcia (z powodu czasu życia 'scope), a zamknięcie musi zakończyć działanie przed zwróceniem scope, kompilator statycznie gwarantuje, że wszystkie wątki kończą działanie przed opuszczeniem ramki stosu.

Dlaczego ładunki paniki w wątkach lokalnych muszą implementować 'static, i jak to zapobiega niesprawności podczas propagowania panik za granicę zakresu?

Kiedy wątek lokalny ulega panice, ładunek paniki jest przechwytywany w Box<dyn Any + Send + 'static> przez mechanizm std::panic. To wymaganie 'static zapewnia, że jakiekolwiek dane wewnątrz paniki nie odnoszą się do ramki stosu lokalnego, ponieważ, gdyby tak było, rozpakowanie wyniku paniki po opuszczeniu zakresu uzyskałoby dostęp do zwolnionej pamięci. Metoda ScopedJoinHandle::join zwraca ten opakowany ładunek, a ograniczenie 'static zapewnia, że nawet jeśli panika jest propagowana poza zakres, nie zawiera wiszących wskaźników do pożyczonego środowiska, utrzymując bezpieczeństwo pamięci przez granice wycofywania.

Opisz architektoniczny mechanizm, który umożliwia wątom lokalnym dostępy do danych na stosie przy jednoczesnej prewencji błędów użycia po zwolnieniu pamięci, gdy nadrzędny zakres kończy działanie.