Шешім қабылдау интеллекті
Шешім қабылдау интеллекті
Шешім қабылдау интеллекті (Decision Intelligence, DI) - деректерді басқарылатын шешімдерге және өлшенетін әсерге айналдыратын тәртіп. DI себептерді, болжауды, шешімдер экономикасын, саясат дизайнын және MLOps/операцияларды бір өмірлік циклде біріктіреді.
1) DI қаңқасы: OODA/SSDL
Observe (Signal): стандартталған оқиғалар, сапа/жаңалық, дедуп және контекст.
Orient (Sense): интерпретация: когорттар, сегменттер, себептік бағандар, тәуекел профильдері.
Decide: саясат (ережелер/модельдер/бандиттер), шектеулер мен қателердің құнын есепке алу.
Act: әрекеттерді оркестрлеу, арналар, теңсіздік, басымдықтар.
Learn: каузальды бағалау әсері, табалдырықтарды/саясаттарды/модельдерді жаңарту.
2) Шешімдер экономикасы
Құндылық функциясы: түсім/сақталған залал/ұстап қалу/сервис сапасы.
Қате құны: Ақша мен тәуекелдерде FP/FN (RG/комплаенс/бедел).
[
EV = p_{\text{успех} }\cdot Value - p_{\text{вред} }\cdot Harm - Cost
]
Егер 'EV ≥ 0' және guardrails қалыпты болса, әрекет жарамды.
Тәуекел-тәбет: FPR лимиттері, интервенция жиілігі, зиян/шағым бюджеті, error budget.
3) Себептілік және болжамдар
Болжам жеткілікті болғанда: тәуекелі төмен аллокация, ықтималдығы бойынша ранжирлеу.
Себеп қажет болған кезде: ROMI, баға/лимиттер саясаты, қауіпсіздік/комплаенс. A/B, DiD, RDD, IV, синтетикалық бақылауды пайдаланыңыз; таргетинг кезінде - uplift және CATE.
Counterfactual loop: болжам → әрекет → әсер → uplift/шегі қайта есептеу.
4) Саясаткерлердің түрлері
Ережелер (policy-as-code): детерминирленген, түсіндірілетін; база және fail-safe.
Score-based: ықтималдық/жылдамдық, гистерезис, cost-sensitive табалдырықтар.
Контекст (бандиттер): офферлер/арналарды таңдау үшін ε -greedy/Thompson.
Тізбекті (RL): шектеулері бар көп сатылы стратегиялар (safe RL).
Құрамдас: каскад - қауіпсіздік/комплаенс → экономика → UX.
5) DI архитектурасы
Деректер: канонды оқиғалар (UTC, нұсқалар), фичестор (online/offline parity), каталог.
Модельдер: тізілім/нұсқалар, калибрлеу, drift-мониторинг (PSI/KL), PR-AUC/Recall @FPR ≤ x%.
Семантика және метрика: KPI/guardrails бірыңғай сөздігі, SLO жаңалық.
Policy Engine: decision tables, AVAS/контекстер, гистерезис, rate-limits, басымдықтар.
Іс-қимылдар оркестрі: кепілді жеткізу, ретра, идемпотенттілік 'action _ id', DLQ.
Бақылау мүмкіндігі: «correlation _ id» трассасы, «signal → decision → action → outcome» құйғышы.
Қауіпсіздік: RLS/CLS, PII бүркемелеу, қолжетімділік және шешімдер журналы.
6) DI өлшемдері
Шешімдердің сапасы
Decision Precision/Recall: іс-әрекеттердің шынайы табыстары бойынша.
Regret/Opportunity Loss: оңтайлы саясаттан артта қалу.
Coverage: әрекетті алған нысандардың үлесі.
Latency p95: Signal→Decision/Decision→Action.
Fairness/Harms: сегменттер, шағымдар, апелляциялар бойынша қателер айырмашылығы.
Бизнес әсері
ROMI/ROI әрекеттер, uplift @k, Qini/AUUC.
Net Benefit: тиімділігі − құны − зиян.
Time-to-Impact: сигналдан өлшенетін нәтижеге дейінгі уақыт.
7) Шешімді жобалау (decision design)
1. Сұрақты нәтиже ретінде тұжырымдаңыз: «T үшін X Y-ден ұстап қалудың өсімі қандай?»
2. DAG сызыңыз, confounders/коллайдерлерді анықтаңыз.
3. Дизайнын таңдаңыз: A/B, квазиэксперимент немесе таза болжам + ex-post бағалау.
4. Әрекеттер мен баламаларды, шектеулер мен guardrails.
5. Құндылық функциясын және тәуекел бюджетін белгілеңіз.
6. decision table бағдарламасындағы саясатты сипаттаңыз: шарттар → әрекет → арналар → құлдаун.
7. Бағалауды жоспарлаңыз: әсер метрикасы, ұзақтығы, CATE сегменттері.
8. Оқиғалар runbook және fallback ережелерін анықтаңыз.
8) Гистерезис, жиілік және жанжалдар
Гистерезис: «кіру/шығу» табалдырықтары әртүрлі; интервенцияның «жыпылықтауын» болдырмайды.
Cooldown: сол нысандағы контактілер/шектеулер арасындағы үзілістер.
Саясат қақтығыстары: басымдықтар матрицасы; «қауіпсіздіктің басымдығы бар».
Квоталар/Rate-limit: каналға, сегментке, пайдаланушыға; әділ бөлу.
9) Автономия деңгейлері
1. Ad-hoc: адам шешеді, деректер жетіспейді.
2. Assisted: жүйе шешім + түсініктеме ұсынады.
3. Automated: guardrails ішінде авто шешімдер.
4. Adaptive: босағалардың авто-тюнингі/офферлерді таңдау (бандиттер).
5. Safe-Autonomy: формалды шектеулер мен аудиттегі автономия.
10) Белгісіз шешімдер
Scenario planning: базалық/стресс/экстремум; әсер ауқымдары.
Robustness: параметрлік қателерге төзімді стратегия.
POMDP-интуиция: толық емес ақпаратпен әрекет ету; ақпараттың құнын бағалаңыз (қандай эксперимент жүргізу керек).
Bayesian updating: тарихи білімді және ағымдағы деректерді біріктіру.
11) « саясат үлгілері» диалогы
Үлгі нәтижелерді жылдам/бөліп береді.
Саясат қателер, шектеулер және fairness құнын ескереді.
Бөлім сызығы - нұсқалар журналы бар анық decision threshold policy.
Шекті қайта қарау - тек ROC/PR бойынша ғана емес, EV бойынша.
12) Құжаттар мен артефактілер
Саясат төлқұжаты (template)
Код/нұсқа, мақсат және KPI әсері
Шарттар/фичи/модель, гистерезис/кулдаун
Іс-әрекеттер мен арналар, басымдықтар мен өзара ерекшеліктер
Guardrails (FPR ≤ x%, latency p95 ≤ y, RG/комплаенс)
Баға: қамыр дизайны, метрика, ұзақтығы
Пайдаланушыға арналған аудит/түсініктеме, иелері
Decision Table (мысал)
«Өтпелі» шешімді логикалау схемасы
`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).
13) Говернанс және сәйкестік
Метриканың бірыңғай сөздігі және формулалардың нұсқалығы.
Саясат жөніндегі комитет: тәуекел-офицер, өнім, деректер, комплаенс.
Шешімдердің аудиті: түсініктемелер, бас тарту себептері, апелляция арналары.
Әдеп және әділдік: топтар бойынша қателер мониторингі; заңмен талап етілетін ережелерден protected-белгілерін алып тастау.
14) Жиі қателер
Бизнес-әсердің орнына прокси-метриканы оңтайландыру (Goodhart).
Болжамдар мен себептерді араластыру; ROMI «корреляция бойынша».
Гистерезис пен құлдаунның жоқтығы → спам/« жыпылықтау ».
Қателердің есепке алынбаған құны және пайдаланушыға келтірілген зиян.
Нұсқасыз және changelog табалдырықтарын/формулаларын тыныш түзету.
Әсерді және «циклдің тұйықталуын» бағалаусыз әрекеттер.
15) DI саясатын/жүйесін шығару алдындағы чек-парағы
- Мақсат себептік әсер ретінде тұжырымдалған, құндылық функциясы және тәуекел бюджеті берілген
- DAG; бағалау дизайны (A/B/DiD/SC) және метрика таңдалды
- Саясат decision table; гистерезис/кулдаун/басымдықтар бар
- Модельдер калибрленген; қателер құнынан шығарылған шектер (EV)
- Әрекеттер оркестрі іспотентен; «signal → decision → action → outcome» журналы қосылған
- Guardrails және тәуекелдер теңшелген; runbooks және fallback-ережелер дайын
- Дашбордтар: шешімдердің құйғышы, әсер (uplift/ROI), зиян/шағымдар, fairness
- Нұсқалар/иелері/қатынау құқықтары/комплаенс құжатталған
Жиынтығы
Шешім қабылдау интеллект - бұл үлгі емес, жүйе: бірыңғай деректер мен метрика → нәтижеге себептік және экономикалық көзқарас → айқын саясат және қауіпсіз оркестрлеу → қатаң бағалау және үздіксіз оқыту. Мұндай жүйе тәуекелді төмендетеді, ROI-ны арттырады және шешімдерді жаңғыртуға, түсіндіруге және басқаруға болады.