Інтелект прийняття рішень
Інтелект прийняття рішень
Інтелект прийняття рішень (Decision Intelligence, DI) - дисципліна, яка перетворює дані в керовані рішення і вимірний ефект. DI об'єднує причинність, прогнозування, економіку рішень, дизайн політик і MLOps/операції в одному життєвому циклі.
1) Каркас DI: OODA/SSDL
Observe (Signal): стандартизовані події, якість/свіжість, дедуп і контекст.
Orient (Sense): інтерпретація: когорти, сегменти, причинні графи, ризик-профілі.
Decide: політика (правила/моделі/бандити), облік обмежень і вартості помилок.
Act: оркестрація дій, канали, ідемпотентність, пріоритети.
Learn: каузальна оцінка ефекту, оновлення порогів/політик/моделей.
2) Економіка рішень
Функція цінності: виручка/збережений збиток/утримання/якість сервісу.
Вартість помилки: FP/FN в грошах і ризиках (RG/комплаєнс/репутація).
[
EV = p_{\text{успех} }\cdot Value - p_{\text{вред} }\cdot Harm - Cost
]
Дія допустима, якщо «EV≥0» і guardrails в нормі.
Ризик-апетит: ліміти на FPR, частоту інтервенцій, бюджет шкоди/скарг, error budget.
3) Причинність і прогнози
Коли достатньо прогнозу: алокації з низьким ризиком, ранжування за ймовірностями.
Коли потрібна причинність: ROMI, політика цін/лімітів, безпека/комплаєнс. Використовуйте A/B, DiD, RDD, IV, синтетичний контроль; при таргетингу - uplift і CATE.
Counterfactual loop: прогноз → дію → ефект → перерахунок uplift/порогів.
4) Типи політик
Правила (policy-as-code): детерміновані, зрозумілі; база і fail-safe.
Score-based: ймовірності/швидкість, гістерезис, cost-sensitive пороги.
Контекстні (бандити): ε -greedy/Thompson для вибору офферів/каналів.
Послідовні (RL): багатошагові стратегії з обмеженнями (safe RL).
Складені: каскад - безпека/комплаєнс → економіка → UX.
5) Архітектура DI
Дані: канонічні події (UTC, версії), фічестор (online/offline parity), каталог.
Моделі: реєстр/версії, калібрування, drift-моніторинг (PSI/KL), PR- AUC/Recall@FPR≤x%.
Семантика і метрики: єдиний словник KPI/guardrails, SLO свіжості.
Policy Engine: decision tables, АВАС/контексти, гістерезис, rate-limits, пріоритети.
Оркестратор дій: гарантована доставка, ретраї, ідемпотентність'action _ id', DLQ.
Спостережуваність: трасування'correlation _ id', воронка «signal→decision→action→outcome».
Безпека: RLS/CLS, маскування PII, журнал доступу та рішень.
6) Метрики DI
Якість рішень
Decision Precision/Recall: за справжніми успіхами дій.
Regret/Opportunity Loss: відставання від оптимальної політики.
Coverage: частка об'єктів, що отримали дію.
Latency p95: Signal→Decision/Decision→Action.
Fairness/Harms: різниця помилок по сегментах, скарги, апеляції.
Бізнес-ефект
ROMI/ROI дії, uplift @k, Qini/AUUC.
Net Benefit: ефект − вартість − шкоду.
Time-to-Impact: час від сигналу до вимірюваного результату.
7) Проектування рішення (decision design)
1. Формулюйте питання як ефект: «Який приріст утримання від X у Y за T?»
2. Намалюйте DAG, визначте confounders/колайдери.
3. Виберіть дизайн: A/B, квазіексперимент або чистий прогноз + ex-post оцінка.
4. Визначте дію та альтернативи, обмеження та guardrails.
5. Задайте функцію цінності і бюджет ризику.
6. Опишіть політику в decision table: умови → дію → канали → кулдаун.
7. Сплануйте оцінку: метрики ефекту, тривалість, сегменти CATE.
8. Визначте runbook інцидентів і fallback-правила.
8) Гістерезис, частота і конфлікти
Гістерезис: пороги «вхід/вихід» різні; запобігає «миготінню» інтервенцій.
Cooldown: паузи між контактами/обмеженнями у того ж об'єкта.
Конфлікти політик: матриця пріоритетів; «Безпека має пріоритет».
Квоти/Rate-limit: на канал, сегмент, користувача; Справедливий розподіл.
9) Рівні автономії
1. Ad-hoc: людина вирішує, даних не вистачає.
2. Assisted: система пропонує рішення + пояснення.
3. Automated: авто-рішення в межах guardrails.
4. Adaptive: авто-тюнінг порогів/вибору офферів (бандити).
5. Safe-Autonomy: автономія під формальними обмеженнями і аудитом.
10) Рішення під невизначеністю
Scenario planning: базовий/стрес/екстремум; діапазони ефекту.
Robustness: стратегія, стійка до параметричних помилок.
POMDP-інтуїція: дійте з неповною інформацією; цінуйте вартість інформації (який експеримент провести).
Bayesian updating: поєднуйте історичні знання та поточні дані.
11) Діалог «моделі ↔ політики»
Модель видає швидкий/розподіл результатів.
Політика враховує вартість помилок, обмеження і fairness.
Лінія розділу - в явному decision threshold policy з журналом версій.
Перегляд порога - по EV, не тільки по ROC/PR.
12) Документи та артефакти
Паспорт політики (template)
Код/версія, мета і KPI ефекту
Умови/фічі/модель, гістерезис/кулдаун
Дії та канали, пріоритети та взаємні винятки
Guardrails (FPR≤x%, latency p95≤y, RG/комплаєнс)
Оцінка: дизайн тесту, метрики, тривалість
Аудит/пояснення для користувача, власники
Decision Table (приклад)
Схема логування «наскрізного» рішення
`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).
13) Говернанс і відповідність
Єдиний словник метрик і версійність формул.
Комітет з політики: ризик-офіцер, продукт, дані, комплаєнс.
Аудит рішень: пояснення, причини відмов, канали апеляцій.
Етика і справедливість: моніторинг помилок по групах; виключення protected-ознак з правил, де це вимагається законом.
14) Часті помилки
Оптимізація проксі-метрик замість бізнес-ефекту (Goodhart).
Змішання прогнозів і причинності; ROMI «по кореляції».
Відсутність гістерезису і кулдаунів → спам/« миготіння ».
Неврахована вартість помилок і шкода користувачеві.
Тихі правки порогів/формул без версій і changelog.
Дії без оцінки ефекту і «замикання циклу».
15) Чек-лист перед релізом політики/системи DI
- Мета сформульована як причинний ефект, задана функція цінності і бюджет ризику
- Намальований DAG; обрано дизайн оцінки (A/B/DiD/SC) та метрики
- Політика описана в decision table; є гістерезис/кулдаун/пріоритети
- Моделі відкалібровані; пороги виведені з вартості помилок (EV)
- Оркестратор дій ідемпотентний; журнал «signal→decision→action→outcome» включено
- Guardrails і алерти налаштовані; runbooks і fallback-правила готові
- Дашборди: воронка рішень, ефект (uplift/ROI), шкода/скарги, fairness
- Версії/власники/права доступу/комплаєнс задокументовані
Підсумок
Інтелект прийняття рішень - це система, а не набір моделей: єдині дані і метрики → причинний і економічний погляд на ефект → явні політики і безпечна оркестрація → сувора оцінка і безперервне навчання. Така система знижує ризик, підвищує ROI і робить рішення відтворюваними, зрозумілими і керованими.