Шлях від сигналу до дії

«Сигнал» сам по собі нічого не змінює. Цінність з'являється, коли сигнал стандартизований, інтерпретований, пріоритизований, перетворений у рішення і дію, а потім результат повертається в систему як зворотний зв'язок. Нижче - практичний конвеєр і мінімальний набір артефактів, щоб цей шлях був швидким, повторюваним і безпечним.

1) Сигнали: джерела та стандарти

Джерела: продуктові події, телеметрія/логування, платежі/КУС, RG/фрод-індикатори, APM/SLA, зовнішні фіди (FX, реєстри).
Схема події (канонічна): `signal_id`, `type`, `entity_id`, `ts_event`, `ts_ingest`, `severity`, `payload`, `source`, `confidence`.
Якісні вимоги: ідемпотентність ('signal _ id'), точний час, UTC + локаль, PII-маски, версія схеми.

Анти-патерни: «плаваючі» поля, локальні формати часу, відсутність'source '/' version'.

2) Sense: нормалізація, дедуп, збагачення

Нормалізація: єдині довідники, валюти/таймзони, схеми імен.
Дедуплікація: ключ «(entity_id, type, window)» + хеш корисного навантаження; зберігайте «причину об'єднання».
Збагачення (feature-join): RFM, гео/пристрій, ризик-оцінки, когорти, контекст кампаній.
Якість: фільтри шуму, довіра'confidence', перевірка інваріантів (наприклад,'amount ≥ 0').

3) Validate: «це важливо і це наш випадок?»

Кореляція vs причинність: позначте сигнали, що вимагають каузальної перевірки (DiD/експерименти) → не плутайте з тригерами інцидентів.
Дублі ефектів: зв'язок з уже активними діями (щоб не «штрафувати» двічі).
Політики допустимості: RLS/CLS, RG/комплаєнс-правила, ліміти частоти контактів.
Гістерезис: вхідний поріг ≠ вихідний; «охолодження» (cool-off) для флапаючих сигналів.

4) Prioritize: Як вибрати, що зробити першим

Пріоритетна оцінка (приклад):

[
\textbf{Priority} = \text{Severity}\cdot w_s;+; \text{Propensity}\cdot w_p;+; \text{Value}\cdot w_v; -; \text{Risk}\cdot w_r; -; \text{Cost}\cdot w_c
]

Severity: сила відхилення від норми/порогів.
Propensity / Probability of success: ймовірність успішного результату (модель/uplift).
Value: очікуваний економічний ефект (LTV uplift, попереджений збиток).
Risk/Cost: операційні, RG/комплаєнс, ймовірність шкоди користувачеві.
SLA: дедлайни за типами сигналів (P1/P2...).

Черга дій = сортування по'Priority'з урахуванням квот і rate-limit на типи інтервенцій.

5) Decide: Як приймати рішення

Три рівні автоматизації:

1. Правила (policy-as-code): прозоро, швидко, базові кейси.

2. Моделі (score-based): ймовірності/ранги + поріг/гістерезис.

3. Адаптивні політики (bandits, RL): онлайн-навчання, персоналізація.

Дерево рішень (decision table, міні-шаблон)

Умова	Контекст	Дія	Guardrails	Рівень автоматизації
`RG_risk ≥ τ` & `night_window`	новачки	Пауза + рада RG	FPR≤1%	Авто
`churn_propensity ≥ τ1` & `value_quantile ≥ 0. 8`	ретеншн	Персональний оффер	ROMI≥0, cap=1/7д	Авто
`fraud_score ∈ [τ2,τ3]`	платіж	Ескалація на ручну перевірку	SLA 2ч	Human-in-the-loop

6) Act: Оркестрація та виконання

Канали: in-app, e-mail, push, SMS, дзвінок, ліміти/обмеження, тікети.
Оркестратор: гарантована доставка (retry/backoff), ідемпотентність дій ('action _ id'), транзакційність.
Конфлікти: пріоритети і взаємні винятки (наприклад, промо ≠ RG-інтервенція).
Навантаження: rate-limit на канал/юзер/сегмент, черга з DLQ.
Аудит: журнал «сигнал → рішення → дію → результат» (наскрізний'correlation _ id').

7) Learn: ефект і зворотній зв'язок

Метрики дії: coverage, take-rate, успіх (конверсія/зниження ризику), latency, NPS/скарги.
Каузальна оцінка: A/B, DiD, синтетичний контроль; uplift @k, Qini/AUUC для таргетингу.
Авто-тюнінг: оновлення порогів/політик; бандити (ε -greedy/TS) в межах guardrails.
Замикання циклу: нові фічі/сигнали з результатів; архів правил/версій.

8) Guardrails і безпека

Якість даних: freshness, completeness, PSI дрейфу; падіння якості = «стоп-кран» автоматизації.
Операційні: p95 часу рішення, доступність оркестратора, бюджет помилок (error budget).
Етика/RG/комплаєнс: заборона агресивних офферів при ризику, пояснюваність рішень, прозорі причини дій для користувача.
Гістерезис і cooldown: запобігають миготіння заходів і «втому» аудиторії.

9) Спостережуваність і SLO

SLO конвеєра: "Signal→Decision p95 ≤ 2 сек; Decision→Action p95 ≤ 5 сек; свіжість даних ≤ 15 хв".
Дашборди: воронка «signaly→deystviya», карта пріоритетів, guardrails-альберти.
Логи і трасування: 'trace _ id/correlation _ id', метрики відмов, ретраї, відсоток ручних ескалацій.
Рунібуки: сценарії деградації (дроп фіда, сплеск сигналів, затримки каналу).

10) Схеми даних і контракти (мінімум)

Подія-сигнал (JSON)

json
{
"signal_id": "sig_...uuid",
"type": "churn_risk",
"entity_id": "user_123",
"ts_event": "2025-10-31T22:15:00Z",
"ts_ingest": "2025-10-31T22:15:05Z",
"severity": 0. 82,
"confidence": 0. 93,
"source": "model:v4",
"payload": {"rfm":"H1","country":"EE","platform":"ios"},
"version": "1. 2"
}

Рішення/дія (таблично)

`action_id`, `correlation_id`, `entity_id`, `policy_version`, `decision` (enum), `channel`, `queued_at`, `sent_at`, `status`, `guardrail_flags[]`.

11) Економіка рішень: коли дія вигідна

Очікувана цінність:

[
\mathbb{E}[EV] = p_{\text{успех}} \cdot \text{Value} - p_{\text{вред}} \cdot \text{Harm} - \text{Cost}
]

Поріг: запускайте дію, якщо'EV ≥ 0'і guardrails в нормі.
Бюджети: капи по сегментах/каналах, алокація по маржинальності.
Мульти-цілі: каскад - спочатку безпека (RG/фрод), потім економіка, потім UX.

12) Рівні зрілості (матриця)

1. Ad-hoc: ручні реакції, без журналів.
2. Repeatable: шаблони правил, базовий аудит, обмежені метрики.
3. Managed: єдиний оркестратор, пріоритизація, A/B-оцінка.
4. Optimized: адаптивні політики, бандити, auto-tuning порогів, наскрізний каузальний контроль.
5. Safe-autonomy: автономні дії в межах жорстких guardrails, формальні верифікації.

13) Шаблони артефактів

A. Паспорт сигналу

Код/версія, визначення, джерело, схема, SLO свіжості, правила дедупа, збагачення, власники, якість (допуски), ризики.

B. паспорт політики/правила

Ідентифікатор, умови, дані/фічі, дія, гістерезис/кулдаун, guardrails, пояснення для користувача, версія/changelog.

C. runbook інциденту

Симптом (алерт), трейсинг, чек якості даних, відключення/зниження авто-рівня, контактні особи, критерій «повернення в зелену зону».

14) Чек-лист перед релізом контуру

Сигнали стандартизовані; є дедуп і збагачення
Пріоритизація і черги впроваджені; квоти та rate-limit налаштовані
Політики/пороги задокументовані; гістерезис і cooldown активні
Оркестратор дій ідемпотентний; аудит «наскрізний»
Guardrails і SLO задані; алерти і рунібуки готові
Каузальна оцінка ефекту налаштована (A/B/DiD або бандити в пісочниці)
Дашборди «Signal→Action→Outcome» і метрики якості в проді
Процес версіонування і зворотного зв'язку (learn) замкнутий

Підсумок

Надійний шлях «від сигналу до дії» - це конвеєр, а не набір скриптів: стандартизовані події → осмислена пріоритизація → керовані рішення (з правилами/моделями) → безпечна оркестрація дій → каузальна оцінка → автоматичний learn-контур. Такий контур робить дані операбельними, міри - точними, а ефект - вимірним і відтворюваним.

Шлях від сигналу до дії