Корреляция и причинно-следственные связи

Корреляция фиксирует совместные изменения переменных. Причинность отвечает на вопрос: что произойдет, если мы вмешаемся? В аналитике, продукте и риск-менеджменте ценность приносит именно причинный эффект: он позволяет оценить инкремент от решения, а не просто ассоциацию.

1) Базовые понятия

Корреляция (ассоциация): статистическая связь без интерпретации «почему». Может быть вызвана общей причиной, обратной причинностью или случайностью.
Причинный эффект (treatment effect): ожидаемая разница между миром «с вмешательством» и «без вмешательства».
Контрфакт: невозможное наблюдение «что было бы с этим же объектом без воздействия».
Конфаундер: переменная, влияющая и на причину, и на результат → создает ложную связь.
Коллайдер: переменная, на которую влияют и причина, и результат; условие на коллайдер искажает ассоциацию.
Парадокс Симпсона: направление эффекта меняется после учета скрытой переменной/сегмента.

2) Когда корреляции достаточно, а когда — нет

Дескриптивная аналитика, мониторинг, EDA: корреляции/ранги/heatmap → обнаружить гипотезы и риски.
Принятие решений и оценка влияния: требуются причинные методы (эксперименты или квазиэксперименты).
Модели прогнозирования: корреляции полезны, но для ROI/политик — переход к каузальным оценкам или uplift-моделям.

3) Эксперименты: золотой стандарт

A/B-тесты (рандомизация): устраняют конфаундинг, делают группы сравнимыми.
Guardrails: длительность ≥ одному циклу поведения, стабильная экспозиция, контроль сезонности и интерференции (spillover).
Метрики: эффект, доверительные интервалы, MDE/power, неоднородность эффекта по сегментам (Heterogeneous Treatment Effect).
Практика: канареечные релизы, поэтапный rollout, CUPED/контроль ковариат для снижения дисперсии.

4) Если эксперимент невозможен: квазиэксперименты

Difference-in-Differences (DiD): разница изменений «до/после» между «тестом» и «контролем». Ключевое допущение — параллельные тренды до вмешательства.
Синтетический контроль: строим «синтетический» контроль как взвешенную смесь донорских групп. Устойчив к разной динамике трендов.
Regression Discontinuity (RDD): пороговое правило назначения воздействия; сравнение по обе стороны порога. Важно: отсутствие «манипуляции» порогом.
Инструментальные переменные (IV): переменная влияет на «лечение», но не влияет напрямую на исход (кроме через лечение). Требуются: релевантность и валидность инструмента.
Сопоставление (PSM/Matching): тест и контроль с похожими ковариатами; полезно как препроцессинг, но не устраняет скрытые конфаундеры.
Interrupted Time Series (ITS): оценка излома тренда в момент политики при отсутствии других шоков.

5) Causal Graphs и критерии «дырок»

DAG (ориентированный ациклический граф): визуальная карта причинных отношений. Помогает выбрать, какие переменные контролировать.
Back-door criterion: блокируем все задние пути (конфаундеры) — получаем несмещенную оценку эффекта.
Front-door criterion: используем посредник, полностью несущий влияние, чтобы обойти скрытые конфаундеры.
Не контролируйте коллайдеры и потомков результата: это создает смещения.
Практика: сначала рисуем DAG с доменными экспертами, затем выбираем минимальный набор ковариат.

6) Потенциальные исходы и оценка эффекта

ATE/ATT/ATC: средний эффект по всем/обработанным/контролю.
CATE/HTE: эффект по сегментам (страна, канал, риск-класс).
Uplift-моделирование: учим модель ранжировать объекты по ожидаемому приросту от интервенции, а не по исходной вероятности события.

7) Частые ловушки

Обратная причинность: «увеличение скидок ↔ падение спроса» — скидки реагируют на падение, а не наоборот.
Пропущенные переменные: неучтенные акции/сезонность/региональные изменения.
Выжившие (survivorship bias): анализ только «оставшихся».
Leakage: использование будущей информации при обучении/оценке.
Смешение метрик: оптимизация прокси-метрик вместо бизнес-эффекта (Goodhart).
Регрессия к среднему: естественные возвраты к тренду маскируют «эффекты».

8) Каузальность в продукте, маркетинге и рисках

Маркетинг/кампании: uplift-таргетинг, дифференцированные частоты контактов, каузальные LTV-оценки, ROMI по DiD/синтетическому контролю.
Ценообразование/промо: RDD (пороговые правила), эксперименты на выборке SKU/регионов.
Рекомендации: off-policy оценка (IPS/DR) и bandits; учет интерференции.
Антифрод/RG-политики: осторожно с каузальностью — блокировки меняют поведение и данные; используйте квазиэксперименты и guardrails по FPR и апелляциям.
Оперуправление: ITS для релизов и инцидентов; каузальные графы для RCA.

9) Процедура анализа: от гипотезы к решению

1. Сформулировать вопрос как причинный: «Каков эффект X на Y в горизонте T?»

2. Нарисовать DAG: согласовать с доменом, отметить конфаундеры/медиаторы/коллайдеры.
3. Выбрать дизайн: RCT/A-B, DiD, RDD, IV, синтетический контроль, matching.
4. Определить метрики: основная (эффект), guardrails (качество/этика/операции), сегменты CATE.
5. Подготовить данные: point-in-time, ковариаты «до» воздействия, календарь и сезонность.
6. Оценить эффект: базовые модели + робаст-проверки (placebo-тесты, чувствительность).
7. Проверить устойчивость: альтернативные спецификации, исключение подозрительных ковариат, leave-one-out.
8. Перевести в действие: политика/rollout, SLO, мониторинг и ретест при дрейфе.

10) Робаст-практики и верификация

Pre-trend checks (для DiD): тренды тест/контроль схожи до интервенции.
Placebo/перестановки: «фиктивные даты» или «фиктивные группы» — эффект должен исчезать.
Sensitivity analysis: насколько скрытый конфаундер исказит результат.
Bounds/пи-интервалы: частично идентифицируемые модели → доверительные границы.
Multiple testing: корректировки (BH/Holm) при множестве сегментов.
External validity: переносимость эффекта на другие рынки/каналы (meta-analysis).

11) Метрики отчетности по эффектам

Абсолютный эффект: Δ в единицах (п.п., у.е., минуты).
Относительный эффект: % к базовой линии.
NNT/NNH: сколько объектов нужно обработать, чтобы достичь одного исхода/вреда.
Cost-Effectiveness: эффект/стоимость; приоритеты бюджетов.
Uplift@k / Qini / AUUC: для таргетированных интервенций.

12) Каузальность в ML-практике

Causal Features: не всегда повышают точность прогноза, но лучше подходят для политик.
Causal Forest / Meta-learners (T/X/S-Learner): оценка CATE и персонального uplift.
Counterfactual fairness: справедливость моделей с учетом каузальных путей; блокировка «несправедливых» путей.
Do-op vs predict: различайте «предсказать» и «что если сделать». Для второго нужны каузальные модели/эмуляторы.

13) Чек-лист причинного анализа

Вопрос сформулирован как эффект интервенции/политики
Построен и согласован DAG; выбран минимальный набор ковариат (back-door)
Выбран дизайн (RCT/квази-эксперимент) и проверены ключевые допущения
Данные point-in-time; исключены лики; календарь/сезонность учтены
Рассчитаны эффект и доверительные интервалы; проведены робаст-проверки
Оценена неоднородность эффекта (CATE) и риски (guardrails)
Оцифрована ценность (ROI, NNT/NNH, стоимость ошибки)
План внедрения и мониторинга; критерии повторного теста

14) Мини-глоссарий

Back-door/Front-door: критерии отбора ковариат для идентификации эффекта.
IV (инструментальная переменная): «рычаг», меняющий лечение, но не исход напрямую.
DiD: разница изменений «до/после» между группами.
RDD: оценка эффекта вблизи порога правила.
Synthetic Control: контроль как взвешенная комбинация доноров.
HTE/CATE: неоднородный/условный эффект по сегментам.
Uplift: ожидаемая прибавка от воздействия, не вероятность события.

Итог

Корреляции помогают находить гипотезы, причинность — принимать решения. Стройте DAG, выбирайте уместный дизайн (эксперимент или квази-эксперимент), проверяйте допущения и устойчивость, измеряйте неоднородные эффекты и переводите выводы в политику с guardrails и мониторингом. Так аналитика перестает быть «про связи» и становится двигателем изменений.

Корреляция и причинно-следственные связи

Корреляция и причинно-следственные связи

Итог

Свяжитесь с нами

Быстрая связь

Видео скоро обновится

Мы сейчас очень загружены проектами