Інтелект прийняття рішень

Інтелект прийняття рішень (Decision Intelligence, DI) - дисципліна, яка перетворює дані в керовані рішення і вимірний ефект. DI об'єднує причинність, прогнозування, економіку рішень, дизайн політик і MLOps/операції в одному життєвому циклі.

1) Каркас DI: OODA/SSDL

Observe (Signal): стандартизовані події, якість/свіжість, дедуп і контекст.
Orient (Sense): інтерпретація: когорти, сегменти, причинні графи, ризик-профілі.
Decide: політика (правила/моделі/бандити), облік обмежень і вартості помилок.
Act: оркестрація дій, канали, ідемпотентність, пріоритети.
Learn: каузальна оцінка ефекту, оновлення порогів/політик/моделей.

2) Економіка рішень

Функція цінності: виручка/збережений збиток/утримання/якість сервісу.
Вартість помилки: FP/FN в грошах і ризиках (RG/комплаєнс/репутація).

Очікувана цінність (EV):

[
EV = p_{\text{успех} }\cdot Value - p_{\text{вред} }\cdot Harm - Cost
]

Дія допустима, якщо «EV≥0» і guardrails в нормі.
Ризик-апетит: ліміти на FPR, частоту інтервенцій, бюджет шкоди/скарг, error budget.

3) Причинність і прогнози

Коли достатньо прогнозу: алокації з низьким ризиком, ранжування за ймовірностями.
Коли потрібна причинність: ROMI, політика цін/лімітів, безпека/комплаєнс. Використовуйте A/B, DiD, RDD, IV, синтетичний контроль; при таргетингу - uplift і CATE.
Counterfactual loop: прогноз → дію → ефект → перерахунок uplift/порогів.

4) Типи політик

Правила (policy-as-code): детерміновані, зрозумілі; база і fail-safe.
Score-based: ймовірності/швидкість, гістерезис, cost-sensitive пороги.
Контекстні (бандити): ε -greedy/Thompson для вибору офферів/каналів.
Послідовні (RL): багатошагові стратегії з обмеженнями (safe RL).
Складені: каскад - безпека/комплаєнс → економіка → UX.

5) Архітектура DI

Дані: канонічні події (UTC, версії), фічестор (online/offline parity), каталог.
Моделі: реєстр/версії, калібрування, drift-моніторинг (PSI/KL), PR- AUC/Recall@FPR≤x%.
Семантика і метрики: єдиний словник KPI/guardrails, SLO свіжості.
Policy Engine: decision tables, АВАС/контексти, гістерезис, rate-limits, пріоритети.
Оркестратор дій: гарантована доставка, ретраї, ідемпотентність'action _ id', DLQ.
Спостережуваність: трасування'correlation _ id', воронка «signal→decision→action→outcome».
Безпека: RLS/CLS, маскування PII, журнал доступу та рішень.

6) Метрики DI

Якість рішень

Decision Precision/Recall: за справжніми успіхами дій.
Regret/Opportunity Loss: відставання від оптимальної політики.
Coverage: частка об'єктів, що отримали дію.
Latency p95: Signal→Decision/Decision→Action.
Fairness/Harms: різниця помилок по сегментах, скарги, апеляції.

Бізнес-ефект

ROMI/ROI дії, uplift @k, Qini/AUUC.
Net Benefit: ефект − вартість − шкоду.
Time-to-Impact: час від сигналу до вимірюваного результату.

7) Проектування рішення (decision design)

1. Формулюйте питання як ефект: «Який приріст утримання від X у Y за T?»

2. Намалюйте DAG, визначте confounders/колайдери.
3. Виберіть дизайн: A/B, квазіексперимент або чистий прогноз + ex-post оцінка.
4. Визначте дію та альтернативи, обмеження та guardrails.
5. Задайте функцію цінності і бюджет ризику.
6. Опишіть політику в decision table: умови → дію → канали → кулдаун.
7. Сплануйте оцінку: метрики ефекту, тривалість, сегменти CATE.
8. Визначте runbook інцидентів і fallback-правила.

8) Гістерезис, частота і конфлікти

Гістерезис: пороги «вхід/вихід» різні; запобігає «миготінню» інтервенцій.
Cooldown: паузи між контактами/обмеженнями у того ж об'єкта.
Конфлікти політик: матриця пріоритетів; «Безпека має пріоритет».
Квоти/Rate-limit: на канал, сегмент, користувача; Справедливий розподіл.

9) Рівні автономії

1. Ad-hoc: людина вирішує, даних не вистачає.
2. Assisted: система пропонує рішення + пояснення.
3. Automated: авто-рішення в межах guardrails.
4. Adaptive: авто-тюнінг порогів/вибору офферів (бандити).
5. Safe-Autonomy: автономія під формальними обмеженнями і аудитом.

10) Рішення під невизначеністю

Scenario planning: базовий/стрес/екстремум; діапазони ефекту.
Robustness: стратегія, стійка до параметричних помилок.
POMDP-інтуїція: дійте з неповною інформацією; цінуйте вартість інформації (який експеримент провести).
Bayesian updating: поєднуйте історичні знання та поточні дані.

11) Діалог «моделі ↔ політики»

Модель видає швидкий/розподіл результатів.
Політика враховує вартість помилок, обмеження і fairness.
Лінія розділу - в явному decision threshold policy з журналом версій.
Перегляд порога - по EV, не тільки по ROC/PR.

12) Документи та артефакти

Паспорт політики (template)

Код/версія, мета і KPI ефекту

Умови/фічі/модель, гістерезис/кулдаун

Дії та канали, пріоритети та взаємні винятки

Guardrails (FPR≤x%, latency p95≤y, RG/комплаєнс)

Оцінка: дизайн тесту, метрики, тривалість

Аудит/пояснення для користувача, власники

Decision Table (приклад)

Умова	Контекст	Дія	Кулдаун	Guardrails
`churn_uplift ≥ 0. 08` & `value_q ≥ 0. 8`	ретеншн	оффер L	7д	ROMI≥0, cap=1
`rg_risk ≥ τ` & `night`	RG	пауза + порада	1д	FPR≤1%
`fraud_score∈[τ1,τ2]`	платіж	Ручна перевірка	—	SLA 2ч

Схема логування «наскрізного» рішення

`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).

13) Говернанс і відповідність

Єдиний словник метрик і версійність формул.
Комітет з політики: ризик-офіцер, продукт, дані, комплаєнс.
Аудит рішень: пояснення, причини відмов, канали апеляцій.
Етика і справедливість: моніторинг помилок по групах; виключення protected-ознак з правил, де це вимагається законом.

14) Часті помилки

Оптимізація проксі-метрик замість бізнес-ефекту (Goodhart).
Змішання прогнозів і причинності; ROMI «по кореляції».
Відсутність гістерезису і кулдаунів → спам/« миготіння ».
Неврахована вартість помилок і шкода користувачеві.
Тихі правки порогів/формул без версій і changelog.
Дії без оцінки ефекту і «замикання циклу».

15) Чек-лист перед релізом політики/системи DI

Мета сформульована як причинний ефект, задана функція цінності і бюджет ризику
Намальований DAG; обрано дизайн оцінки (A/B/DiD/SC) та метрики
Політика описана в decision table; є гістерезис/кулдаун/пріоритети
Моделі відкалібровані; пороги виведені з вартості помилок (EV)
Оркестратор дій ідемпотентний; журнал «signal→decision→action→outcome» включено
Guardrails і алерти налаштовані; runbooks і fallback-правила готові
Дашборди: воронка рішень, ефект (uplift/ROI), шкода/скарги, fairness
Версії/власники/права доступу/комплаєнс задокументовані

Підсумок

Інтелект прийняття рішень - це система, а не набір моделей: єдині дані і метрики → причинний і економічний погляд на ефект → явні політики і безпечна оркестрація → сувора оцінка і безперервне навчання. Така система знижує ризик, підвищує ROI і робить рішення відтворюваними, зрозумілими і керованими.

Інтелект прийняття рішень