Ответ на вопрос.

История вопроса.

Проблема C10K ставила перед архитектурами серверов начала 2000-х годов задачу эффективно обрабатывать десять тысяч одновременных подключений. Традиционные модели с одним потоком на соединение исчерпывали память и ЦП из-за переключений контекста. Создатели Go стремились поддерживать миллионы горутин, сохраняя ясность кода блокирующих операций ввода-вывода, что потребовало механизма отделения ожидания горутины от потребления потоков ОС.

Проблема.

Когда горутин выполняет блокирующий системный вызов — например, read() на сетевом сокете — он рискует привязать подлежащий поток ОС (M). Без вмешательства тысячи одновременных подключений создадут тысячи потоков, что отменит преимущества M:N планирования и исчерпает системные ресурсы.

Решение.

Go runtime использует сетевой поллер (используя epoll на Linux, kqueue на BSD и IOCP на Windows), интегрированный непосредственно в планировщик. Когда горутина инициирует ввод-вывод на опрашиваемом дескрипторе, среда выполнения помещает её в состояние _Gwaiting и регистрирует файл дескриптора у специфичного для ОС поллера. Поток мониторинга ждет готовности; по уведомлению поллер переводит горутину в состояние _Grunnable и планирует её на доступный P (логический процессор). Это преобразует блокирующие операции в эффективные события парковки, позволяя небольшому пулу потоков GOMAXPROCS обслуживать огромную конкуренцию.

// Идиоматический код Go, который действительно паркует, а не блокирует
func handleConn(conn net.Conn) {
    buf := make([]byte, 1024)
    n, err := conn.Read(buf) // Паркует горутину, освобождает поток
    if err != nil {
        log.Println(err)
        return
    }
    process(buf[:n])
}

Ситуация из жизни

Вы строите шлюз высокочастотной торговли, который поддерживает 20 000 постоянных TCP соединений с потоками рыночных данных. Во время резких колебаний задержка должна оставаться ниже 100 микросекунд. Первоначальные испытания с использованием подхода Java NIO достигли пропускной способности, но страдали от сложного обслуживания обратных вызовов. При миграции на Go команда написала простой блокирующий код, используя net.TCPConn. Однако при нагрузочном тестировании с 50 тыс. одновременных соединений процесс создал более 10 000 потоков ОС, что привело к OOM сбоям и уничтожило гарантии задержки.

Решение A: Повторно реализовать паттерн реактора вручную. Обойти стандартную библиотеку и использовать обертки syscall для создания ручного цикла событий epoll с пуллингом буферов. Плюсы: Максимальный контроль над компоновкой памяти и задержкой пробуждения. Минусы: Жертвует последовательной моделью кодирования Go, вводит специфическую для платформы сложность и дублирует протестированный код выполнения, увеличивая вероятность ошибок.

Решение B: Принять накладные расходы потоков с runtime.LockOSThread. Принудительно перенести каждое соединение на выделенный поток, чтобы гарантировать изоляцию планирования. Плюсы: Предсказуемая привязка потоков. Минусы: Нарушает основное экономическое преимущество горутин; использование памяти увеличивается до ~8 МБ на соединение, что делает этот подход непрактичным для целевого масштаба.

Решение C: Аудит для невидимых I/O операций и доверие к нетполлеру. Сохранить идиоматический блокирующий код, но устранить случайные блокирующие системные вызовы (например, ведение журнала файлов или DNS запросы без осведомленности резолвера), которые вынуждают создание потоков. Плюсы: Сохраняет читаемый линейный поток; использует оптимизации времени выполнения для Linux/macOS/Windows; уменьшает память до ~2 КБ на соединение. Минусы: Требует глубокого понимания того, что операции net.Conn паркуют, в то время как операции os.File блокируют потоки.

Команда выбрала Решение C, осознав, что взрыв потоков был вызван синхронным записью рыночных данных в локальные файлы ext4 в горячем пути. Регулярный ввод-вывод файлов не может использовать нетполлер (файлы всегда "готовы" в Unix epoll), поэтому каждая запись в журнал блокировала поток ОС. Они переработали это, используя асинхронный файл писателя горутину с каналом буфера, сохраняя сетевой ввод-вывод (который является опрашиваемым) на главных горутинах.

Шлюз теперь поддерживает 50 000 соединений только с 16 потоками ОС (соответствующими GOMAXPROCS), достигая ~85 мкС P99 задержки. Потребление памяти уменьшилось с 40 ГБ (предполагаемые стек-потоки) до ~180 МБ общего RSS.

Что кандидаты часто упускают

Почему чтение из os.Stdin или обычного файла блокирует поток ОС, несмотря на использование одного и того же метода Read, как и TCP сокет, и как это влияет на параллелизм CLI инструментов?

Хотя TCP сокеты поддерживают асинхронные уведомления готовности с помощью epoll, обычные файлы и каналы в системах Unix всегда сообщают о готовности к вводу-выводу; ядро не предоставляет неблокирующего интерфейса для доступности данных файла. Следовательно, когда горутин вызывает os.File.Read, Go runtime не может его припарковать — он должен выделить реальный поток ОС для блокирующего системного вызова. В CLI инструментах, которые создают горутины для каждого входящего файла (например, обработчики журналов), это вызывает утечку потоков, идентичную традиционным моделям потоков. Решение состоит в ограничении одновременных операций с файлами с использованием семафоров или использовании буферизации с выделенными пулами рабочих.

Как среда выполнения предотвращает "громадный натиск", когда нетполлер одновременно пробуждает тысячи горутин после восстановления сетевого разделения?

Когда нетполлер (через epoll_wait) возвращает тысячи готовых дескрипторов, функция netpoll распределяет горутины по всем P (логическим процессорам), используя глобальную очередь выполнения и алгоритмы кражи работы, вместо того чтобы ставить их все в одну P. Кроме того, планировщик реализует справедливые интервалы: после каждых 10 мс выполнения он проверяет наличие выполнимых I/O горутин, чтобы предотвратить голодание задач с низким приоритетом. Кандидаты часто предполагают FIFO-очередь по подключению, не замечая, что планировщик балансирует пропускную способность, распределяя события пробуждения и обеспечивая точки приостановки.

Какое условие гонки существует между SetReadDeadline и активным вызовом Read, и почему реализация колесика таймеров требует атомарной синхронизации с нетполлером?

Нетполлер использует таймерное колесо или мин-кучу на каждое P для управления сроками выполнения ввод-вывода. Когда горутин A вызывает SetReadDeadline, в то время как горутин B блокируется в Read, A изменяет таймер, от которого зависит состояние парковки B. Без атомарных обновлений (защищенных внутренними мьютексами в net.conn) может произойти гонка, когда поллер наблюдает старый срок, после того как был установлен новый, что приводит к упущенной пробуждению (бессрочной блокировке) или ложному истечению. Атомарность обеспечивает консистентность: либо обновленный срок наблюдается циклом ожидания epoll, либо предыдущий таймер срабатывает, но никогда не возникает неопределенное промежуточное состояние, которое нарушает контракт сроков.