Ответ на вопрос

LinkedHashMap был представлен в Java 1.4 как гибридная структура данных, объединяющая среднее время поиска O(1) от HashMap и двусвязный список, который обеспечивает детерминированный порядок итерации, либо по порядку вставки, либо по порядку доступа. Его дизайн ввел шаблонный метод removeEldestEntry, позволяющий подклассам реализовать политики удаления LRU (least recently used), возвращая true, когда карта превышает желаемый размер. Однако реализация никогда не предназначалась для одновременного использования; она унаследовала небезопасный для потоков характер HashMap и добавляет сложность поддержания двусторонних указателей before и after для всех элементов, включая те, что находятся в преобразованных корзинах.

При одновременном структурном изменении — например, когда один поток добавляет элемент, а другой удаляет или изменяет размер — указатели в связном списке могут обновляться неатомарно, что приводит к повреждению графической структуры, в которой элементы формируют круговые ссылки или становятся сиротами от основной цепи. Например, если поток A обновляет указатель after элемента, чтобы указать на элемент B, но поток B одновременно удаляет элемент B и обновляет его указатель before, список может завершиться тем, что A указывает на B, в то время как B указывает на C, фактически пропуская A или создавая цикл. Это повреждение вызывает бесконечные циклы у итераторов (потребляя 100% ЦП) или молчаливое пропускание действительных элементов, что делает политику removeEldestEntry ненадежной, потому что указатель "старшего" больше не может отражать истинную голову списка.

Чтобы безопасно использовать LinkedHashMap в многопоточных контекстах, необходимо внешне синхронизировать все операции. Для кэшей с accessOrder=true даже get() является структурным изменением (он переставляет элементы в двусвязном списке), поэтому стандартные оптимизации ReadWriteLock для операций только для чтения недействительны; необходимо рассматривать все операции как запись или использовать глобальный мьютекс. Наиболее безопасный подход — Collections.synchronizedMap, хотя вам придется вручную синхронизироваться с картой при итерации. Однако для производственных систем замените LinkedHashMap на Caffeine или весь процессор Guava CacheBuilder, которые предоставляют алгоритмы удаления с полосами блокировки или полностью конкурентные алгоритмы без глобальных конфликтов.

public class SafeLRUCache<K, V> {
    private final Map<K, V> map;
    
    public SafeLRUCache(int maxSize) {
        // LinkedHashMap НЕ является потокобезопасным; синхронизируйте внешне
        this.map = Collections.synchronizedMap(new LinkedHashMap<>(16, 0.75f, true) {
            @Override
            protected boolean removeEldestEntry(Map.Entry<K, V> eldest) {
                return size() > maxSize;
            }
        });
    }
    
    // Все методы должны синхронизироваться по карте
    public V get(K key) {
        synchronized (map) {
            return map.get(key);
        }
    }
    
    public void put(K key, V value) {
        synchronized (map) {
            map.put(key, value);
        }
    }
    
    // Итерация требует явной синхронизации
    public void forEach(BiConsumer<K, V> action) {
        synchronized (map) {
            map.forEach(action);
        }
    }
}

Ситуация из жизни

Сервис backend для платформы электронной коммерции требовал кэша в памяти для данных о ценах на продукты, чтобы снизить нагрузку на базу данных. Первоначальная реализация использовала LinkedHashMap с accessOrder=true и переопределяла removeEldestEntry, чтобы обеспечить предел в 1 000 элементов, предполагая, что карта просто будет автоматически избавляться от старых элементов. Во время тестирования при низкой нагрузке это работало правильно; однако, при производственном трафике с сорока конкурентными потоками, обрабатывающими флеш-распродажи, сервис испытывал периодические всплески ЦП до 100% и в конечном итоге истощение потоков.

Дамп потоков показал, что несколько потоков застряли внутри итераторов LinkedHashMap, проходя по круговым ссылкам в двусвязном списке, вызванным одновременными изменениями. В частности, один поток изменял размер внутренней таблицы, в то время как другой обновлял порядок доступа элемента, из-за чего указатель after узла Entry ссылался на самого себя, создавая бесконечный цикл во время итерации. Кроме того, обратный вызов removeEldestEntry иногда удалял неправильный элемент, потому что указатель "старшего" был поврежден одновременным переупорядочиванием, что приводило к постоянным удалениям, когда недавно доступные элементы удалялись вместо устаревших.

Команда сначала обдумала обернуть карту в Collections.synchronizedMap. Плюсы: Это требует минимальных изменений в коде и обеспечивает атомарность отдельных операций, оборачивая их в методы synchronized. Минусы: Это вводит глобальный монитор, сериализуя все чтения и записи, что снижает пропускную способность с ожидаемых 20 000 операций в секунду до менее 3 000 при конкуренции. Кроме того, итераторы все равно требовали явных блоков synchronized(map), которые разработчики иногда забывали, что приводило к ConcurrentModificationException.

Затем они оценили использование ConcurrentHashMap, в паре с ConcurrentLinkedQueue для отслеживания недавности и потоком очистки в фоновом режиме. Плюсы: Это предлагает высокую степень конкуренции для чтений и записей. Минусы: Правильная реализация LRU является подверженной ошибкам; удаление старейшего элемента не является атомарным с вставкой, что позволяет кэшу временно значительно превышать свой лимит размера при высокой нагрузке. Кроме того, обновление очереди при каждом get() требует записи, создавая аналогичные точки конфликта и сложность в поддержании согласованности между очередью и картой.

В конечном итоге они провели бенчмаркинг Caffeine, высокопроизводительной библиотеки кэширования. Плюсы: Она использует BoundedLocalCache с полосами блокировки и буфером записи для удаления, позволяя конкурентным чтениям без блокировок и высокой производительности записей. Она обрабатывает удаление LRU/W-TinyLFU атомарно без явной синхронизации. Минусы: Она добавляет внешнюю зависимость и требует изучения нового API (например, CacheLoader).

Команда выбрала Caffeine после того, как нагрузочное тестирование показало, что она выдерживает более 80 000 операций в секунду с p99 задержкой менее 1 мс, в то время как синхронизированный LinkedHashMap блокировался на уровне 5k ops/sec с p99 всплесками до 500 мс. Миграция включала замену карты на Caffeine.newBuilder().maximumSize(1000).build() и регистрацию слушателя на удаление для логики очистки.

Мониторинг после развертывания показал стабильное использование ЦП и отсутствие зависания потоков. Уровень попадания в кэш улучшился с 85% до 94% из-за того, что удаление стало детерминированным и свободным от гонок. Этот инцидент подчеркивает, что LinkedHashMap является однопоточной структурой данных, неподходящей для конкурентных кэшей LRU, несмотря на его удобный API.

Что часто упускают кандидаты

Как LinkedHashMap поддерживает порядок LRU для элементов, которые были перемещены в преобразованные корзины (красно-черные деревья) из-за высокой коллизии хешей?

LinkedHashMap использует специализированный внутренний класс Entry, который расширяет HashMap.Node и включает указатели before и after. Когда корзина преобразуется в дерево, LinkedHashMap переопределяет newTreeNode, чтобы создавать экземпляры TreeNode, которые по-прежнему наследуются от LinkedHashMap.Entry (через LinkedHashMap.TreeNode). Следовательно, даже когда элементы хранятся в структуре дерева для разрешения коллизий O(log n), они остаются узлами в глобальном двусвязном списке. Метод afterNodeAccess обновляет эти указатели после каждого доступа, обеспечивая прохождение цепочки LRU через элементы независимо от того, находятся ли они в двусвязных списках или деревьях внутри хеш-таблицы.

Почему вызов get() на LinkedHashMap с accessOrder=true вызывает ConcurrentModificationException, если он выполняется во время итерации, в то время как та же операция в стандартном HashMap этого не делает?

В режиме accessOrder LinkedHashMap рассматривает get() как структурное изменение, поскольку он перемещает доступный элемент в конец двусвязного списка, увеличивая modCount. Итератор с быстрой ошибкой проверяет этот счетчик и выбрасывает ошибку, как только замечает изменение. Напротив, стандартный HashMap увеличивает modCount только при вставках, удалениях и изменениях размера; get() является лишь операцией чтения относительно структуры таблицы. Эта разница означает, что даже "операции только для чтения" могут инвалидировать итераторы в LinkedHashMap, что требует синхронизации для всех операций, включая чтения, при одновременной итерации.

Какое конкретное повреждение указателя происходит во время одновременного изменения размера (rehashing) в LinkedHashMap, что невозможно в стандартном HashMap?

Во время изменения размера HashMap переносит узлы в новый массив таблицы, рискуя получить бесконечные циклы в корзинах при выполнении этого одновременно. LinkedHashMap дополнительно рискует повредить указатели before и after, которые формируют вспомогательный двусвязный список. Если поток A снова связывает элементы, чтобы сохранить порядок в новой таблице, в то время как поток B изменяет список (например, через remove), поток A может связать элемент с последователем, которого поток B уже отвязал, создавая висячую ссылку или цикл. В частности, указатель after заголовочного узла может указывать на элемент, чей указатель before был обнулен другим потоком, что нарушает инвариант списка и заставляет итераторы бесконечно вращаться, когда next() следует за сломанной цепочкой.