Путь от сигнала к действию

«Сигнал» сам по себе ничего не меняет. Ценность появляется, когда сигнал стандартизован, интерпретирован, приоритизирован, превращен в решение и действие, а затем результат возвращается в систему как обратная связь. Ниже — практический конвейер и минимальный набор артефактов, чтобы этот путь был быстрым, повторяемым и безопасным.

1) Сигналы: источники и стандарты

Источники: продуктовые события, телеметрия/логирование, платежи/KYC, RG/фрод-индикаторы, APM/SLA, внешние фиды (FX, реестры).
Схема события (каноническая): `signal_id`, `type`, `entity_id`, `ts_event`, `ts_ingest`, `severity`, `payload`, `source`, `confidence`.
Качественные требования: идемпотентность (`signal_id`), точное время, UTC + локаль, PII-маски, версия схемы.

Анти-паттерны: «плавающие» поля, локальные форматы времени, отсутствие `source`/`version`.

2) Sense: нормализация, дедуп, обогащение

Нормализация: единые справочники, валюты/таймзоны, схемы имен.
Дедупликация: ключ `(entity_id, type, window)` + хэш полезной нагрузки; храните «причину объединения».
Обогащение (feature-join): RFM, гео/устройство, риск-оценки, когорты, контекст кампаний.
Качество: фильтры шума, доверие `confidence`, проверка инвариантов (например, `amount ≥ 0`).

3) Validate: «это важно и это наш случай?»

Корреляция vs причинность: отметьте сигналы, требующие каузальной проверки (DiD/эксперименты) → не путайте с триггерами инцидентов.
Дубли эффектов: связь с уже активными действиями (чтобы не «штрафовать» дважды).
Политики допустимости: RLS/CLS, RG/комплаенс-правила, лимиты частоты контактов.
Гистерезис: входной порог ≠ выходной; «охлаждение» (cool-off) для флапающих сигналов.

4) Prioritize: как выбрать, что сделать первым

Приоритетная оценка (пример):

[
\textbf{Priority} = \text{Severity}\cdot w_s;+; \text{Propensity}\cdot w_p;+; \text{Value}\cdot w_v;-; \text{Risk}\cdot w_r;-; \text{Cost}\cdot w_c
]

Severity: сила отклонения от нормы/порогов.
Propensity / Probability of success: вероятность успешного исхода (модель/uplift).
Value: ожидаемый экономический эффект (LTV uplift, предотвращенный ущерб).
Risk/Cost: операционные, RG/комплаенс, вероятность вреда пользователю.
SLA: дедлайны по типам сигналов (P1/P2…).

Очередь действий = сортировка по `Priority` с учетом квот и rate-limit на типы интервенций.

5) Decide: как принимать решение

Три уровня автоматизации:

1. Правила (policy-as-code): прозрачно, быстро, базовые кейсы.

2. Модели (score-based): вероятности/ранги + порог/гистерезис.

3. Адаптивные политики (bandits, RL): онлайн-обучение, персонализация.

Дерево решений (decision table, мини-шаблон)

Условие	Контекст	Действие	Guardrails	Уровень автоматизации
`RG_risk ≥ τ` & `night_window`	новички	Пауза + совет RG	FPR≤1%	Авто
`churn_propensity ≥ τ1` & `value_quantile ≥ 0.8`	ретеншн	Персональный оффер	ROMI≥0, cap=1/7д	Авто
`fraud_score ∈ [τ2,τ3]`	платеж	Эскалация на ручную проверку	SLA 2ч	Human-in-the-loop

6) Act: оркестрация и исполнение

Каналы: in-app, e-mail, push, SMS, звонок, лимиты/ограничения, тикеты.
Оркестратор: гарантированная доставка (retry/backoff), идемпотентность действий (`action_id`), транзакционность.
Конфликты: приоритеты и взаимные исключения (напр., промо ≠ RG-интервенция).
Нагрузки: rate-limit на канал/юзер/сегмент, очередь с DLQ.
Аудит: журнал «сигнал → решение → действие → результат» (сквозной `correlation_id`).

7) Learn: эффект и обратная связь

Метрики действия: coverage, take-rate, успех (конверсия/снижение риска), latency, NPS/жалобы.
Каузальная оценка: A/B, DiD, синтетический контроль; uplift@k, Qini/AUUC для таргетинга.
Авто-тюнинг: обновление порогов/политик; бандиты (ε-greedy/TS) в пределах guardrails.
Замыкание цикла: новые фичи/сигналы из результатов; архив правил/версий.

8) Guardrails и безопасность

Качество данных: freshness, completeness, PSI дрейфа; падение качества = «стоп-кран» автоматизации.
Операционные: p95 времени решения, доступность оркестратора, бюджет ошибок (error budget).
Этика/RG/комплаенс: запрет агрессивных офферов при риске, объяснимость решений, прозрачные причины действий для пользователя.
Гистерезис и cooldown: предотвращают мигание мер и «усталость» аудитории.

9) Наблюдаемость и SLO

SLO конвейера: «Signal→Decision p95 ≤ 2 сек; Decision→Action p95 ≤ 5 сек; свежесть данных ≤ 15 мин».
Дашборды: воронка «сигналы→действия», карта приоритетов, guardrails-алерты.
Логи и трассировка: `trace_id/correlation_id`, метрики отказов, ретраи, процент ручных эскалаций.
Рунибуки: сценарии деградации (дроп фида, всплеск сигналов, задержки канала).

10) Схемы данных и контракты (минимум)

Событие-сигнал (JSON)

json
{
"signal_id": "sig_...uuid",
"type": "churn_risk",
"entity_id": "user_123",
"ts_event": "2025-10-31T22:15:00Z",
"ts_ingest": "2025-10-31T22:15:05Z",
"severity": 0. 82,
"confidence": 0. 93,
"source": "model:v4",
"payload": {"rfm":"H1","country":"EE","platform":"ios"},
"version": "1. 2"
}

Решение/действие (таблично)

`action_id`, `correlation_id`, `entity_id`, `policy_version`, `decision` (enum), `channel`, `queued_at`, `sent_at`, `status`, `guardrail_flags[]`.

11) Экономика решений: когда действие выгодно

Ожидаемая ценность:

[
\mathbb{E}[EV] = p_{\text{успех}} \cdot \text{Value} - p_{\text{вред}} \cdot \text{Harm} - \text{Cost}
]

Порог: запускайте действие, если `EV ≥ 0` и guardrails в норме.
Бюджеты: капы по сегментам/каналам, аллокация по маржинальности.
Мульти-цели: каскад — сначала безопасность (RG/фрод), затем экономика, затем UX.

12) Уровни зрелости (матрица)

1. Ad-hoc: ручные реакции, без журналов.
2. Repeatable: шаблоны правил, базовый аудит, ограниченные метрики.
3. Managed: единый оркестратор, приоритизация, A/B-оценка.
4. Optimized: адаптивные политики, бандиты, auto-tuning порогов, сквозной каузальный контроль.
5. Safe-autonomy: автономные действия в пределах жестких guardrails, формальные верификации.

13) Шаблоны артефактов

A. Паспорт сигнала

Код/версия, определение, источник, схема, SLO свежести, правила дедупа, обогащение, владельцы, качество (допуски), риски.

B. Паспорт политики/правила

Идентификатор, условия, данные/фичи, действие, гистерезис/кулдаун, guardrails, объяснение для пользователя, версия/changelog.

C. Runbook инцидента

Симптом (алерт), трейсинг, чек качества данных, отключение/понижение авто-уровня, контактные лица, критерий «возврата в зеленую зону».

14) Чек-лист перед релизом контура

Сигналы стандартизованы; есть дедуп и обогащение
Приоритизация и очереди внедрены; квоты и rate-limit настроены
Политики/порогы задокументированы; гистерезис и cooldown активны
Оркестратор действий идемпотентен; аудит «сквозной»
Guardrails и SLO заданы; алерты и рунибуки готовы
Каузальная оценка эффекта настроена (A/B/DiD или бандиты в песочнице)
Дашборды «Signal→Action→Outcome» и метрики качества в проде
Процесс версионирования и обратной связи (learn) замкнут

Итог

Надежный путь «от сигнала к действию» — это конвейер, а не набор скриптов: стандартизированные события → осмысленная приоритизация → управляемые решения (с правилами/моделями) → безопасная оркестрация действий → каузальная оценка → автоматический learn-контур. Такой контур делает данные операбельными, меры — точными, а эффект — измеримым и воспроизводимым.

Путь от сигнала к действию