Ответ на вопрос

Исторически продуктовые команды сосредотачивались исключительно на метриках роста и внедрения новых функций, однако с насыщением цифровых продуктов и накоплением технического долга критически важной стала задача обоснованного удаления функционала (feature deprecation). Проблема заключается в том, что пользователи, активно использовавшие удаляемую функцию, систематически отличаются от остальной аудитории по вовлечённости и лояльности, что создаёт смещение самоотбора (selection bias), а поэтапное отключение по когортам искажает временные ряды сезонностью и естественным оттоком.

Для изоляции истинного causal эффекта необходимо применять Difference-in-Differences (DiD) с когортным анализом или CausalImpact на основе Bayesian Structural Time Series, используя незатронутые когорты как синтетический контроль. Ключевым шагом является построение модели propensity score matching (PSM) внутри каждой когорты: для пользователей, лишившихся функции (treatment), подбираются пары из пользователей, которые никогда ею не пользовались (control), но имеют схожий профиль активности, tenure и историю конверсий. При наличии чёткого порога интенсивности использования функции (например, >5 использований в месяц) эффективен Regression Discontinuity Design (RDD), позволяющий сравнить пользователей непосредственно по обе стороны порога отключения.

Важно дополнительно контролировать survivorship bias: если функция удаляется из-за низкого использования, анализ должен включать только активных пользователей на момент принятия решения, исключая тех, кто уже ушёл в отток до начала наблюдения. Для оценки долгосрочного эффекта применяется staggered DiD с динамическими эффектами (event study), позволяющий отследить, как меняется третье- и седьмидневное удержание относительно момента отключения, и проверить Parallel Trends Assumption через плацебо-тесты на предшествующих периодах.

Ситуация из жизни

В крупном edtech-продукте приняли решение об удалении устаревшего текстового чата с ментором в пользу видеоконсультаций, так как чатом пользовались менее 3% аудитории, но его поддержка занимала 20% ресурсов команды. Релиз планировался поэтапно: сначала отключение для новых пользователей, затем для когорт с низкой активностью, и наконец для power users. Бизнес опасался, что удаление вызовет волну негатива и отток высокоценных пользователей, которые исторически интенсивно использовали чат для уточнения заданий.

Первым вариантом рассматривался простой сравнительный анализ retention до и после отключения для каждой когорты. Этот подход отличался быстрой реализуемостью и наглядностью для стейкхолдеров, однако критически страдал от невозможности отделить эффект удаления от естественной деградации когорты (cohort aging) и сезонных колебаний активности студентов в летний период, когда как раз планировался последний этап отключения. Вторым вариантом был классический A/B-тест с фича-флагом, скрывающим чат для 50% пользователей, но он отпал из-за технической сложности поддержки двух версий UI и этических соображений: нельзя было обещать поддержку чата одним пользователям и отказывать другим при наличии багов.

Третьим, выбранным вариантом, стал анализ методом Difference-in-Differences с синтетическим контролем. Для каждой когорты, теряющей доступ к чату, аналитики через Propensity Score Matching находили пару из пользователей предыдущей когорты, которые никогда не открывали чат, но имели идентичный паттерн просмотра уроков, историю сдачи домашних заданий и географию. Это позволило сравнить траектории retention treatment-группы (кто потерял чат) и control-группы (кто никогда им не пользовался), изолируя чистый эффект лишения функции от общих трендов.

Итоговый результат показал, что для power users (топ-10% по частоте использования чата) удаление действительно снизило 30-дневное удержание на 8%, но это было компенсировано ростом конверсии в видеоконсультации на 15% и улучшением метрик производительности приложения (снижение crash rate на 12% за счёт удаления legacy-кода). Для среднего сегмента эффект был статистически незначим, что позволило бизнесу обосновать полное отключение функции с фокусом на миграцию power users в новый канал коммуникации через персонализированные офферы.

Что кандидаты часто упускают

Как отличить эффект удаления функции от эффекта "облегчения" интерфейса (simplification effect), когда сокращение когнитивной нагрузки может маскировать негатив от потери функционала?

Ответ кроется в декомпозиции метрик: необходимо отслеживать не только retention, но и task completion time, error rate и feature discovery rate для оставшегося функционала. Если после удаления чата метрика time-to-homework-submission снижается (пользователи быстрее сдают работы) при стабильном retention, это свидетельствует о положительном simplification effect, компенсирующем потерю коммуникационного канала. Для количественной оценки строится mediation analysis: оценивается прямая причинная связь "удаление → retention" и косвенная через "удаление → упрощение UI → retention", что позволяет разделить чистый негатив от структурного улучшения UX.

Как корректно рассчитать статистическую мощность для теста на "неинфериорность" (non-inferiority testing) при удалении функции, когда цель — доказать, что ущерб не превышает допустимый порог?

Кандидаты часто применяют классический расчёт мощности для superiority testing, что приводит к необоснованным выводам о "безопасности" удаления. При non-inferiority testing нулевая гипотеза формулируется как "эффект хуже порога", а мощность зависит от Margin of Indifference (δ), который должен быть определён бизнесом заранее (например, -2% к retention). Формула мощности требует указания ожидаемого истинного эффекта (обычно 0 или небольшой положительный) и дисперсии, причём приближение к δ требует экспоненциально больших выборок. Необходимо использовать специализированные калькуляторы мощности для paired proportions с коррекцией на кластеризацию по когортам, так как пользователи внутри одной когорты коррелируют по времени отключения.

Как учесть сетевые эффекты (spillover effects), когда удаление функции у одного пользователя влияет на поведение других через разрыв коммуникационных связей?

В социальных продуктах или B2B SaaS удаление функции у одного актора (например, отключение старого API у администратора) влияет на опыт конечных пользователей (сотрудников), создавая interference между treatment и control. Для изоляции этого эффекта применяется cluster-based randomization или анализ через exposure mapping: вместо индивидуального treatment status используется доля пользователей в социальном графе (команде, семье), потерявших функцию. Если correlation между индивидуальным фактом отключения и долей отключившихся в кластере высокая (>0.8), классический OLS даёт смещённые оценки. Решением служит использование IV-регрессии (instrumental variables), где инструментом выступает факт принадлежности к когорте отключения, а фактическая потеря функции — эндогенная переменная, или применение методов causal inference для interference, таких как Fisher's randomization test с коррекцией на размер кластера.