Որոշումների կայացման ինտելեկտը

Որոշումների կայացման ինտելեկտը (Decision Intelligence, DI) կարգապահությունն է, որը տվյալները վերածում է կառավարվող լուծումների և չափված ազդեցության։ DI-ն միավորում է պատճառները, կանխատեսումը, որոշումների տնտեսությունը, քաղաքական դիզայնը և MLOps/վիրահատությունները մեկ կյանքի ցիկլում։

1) Karks DI: OODA/SSDL

Observe (Signal) 'ստանդարտ իրադարձություններ, որակը/թարմությունը, պապուպը և կոնտեքստը։

Orient (Sense): մեկնաբանություն 'կոորդինատներ, հատվածներ, պատճառված գրաֆիկներ, ռիսկի պրոֆիլներ։

Decide: քաղաքականությունը (կանոններ/մոդելներ/ավազակներ), սահմանափակումների և սխալների արժեքի բարձրացում։

Ակտ 'գործողությունների նվագախումբ, ջրանցքներ, գաղափարախոսություն, գերակայություններ։

Learn: ազդեցության քաուզալ գնահատում, շեմերի/քաղաքական/մոդելների նորարարություն։

2) Որոշումների տնտեսությունը

Արժեքի ֆունկցիան 'եկամուտը/պահպանված վնասը/պահել/որակը։

Սխալների արժեքը 'FP/FN փողի և ռիսկերի մեջ (RG/complaens/հեղինակություն)։

Ակնկալվող արժեքը (EV)

[
EV = p _ codice windows հաջողությունը codice cdot Value - p _ _ _ com վնասում է cdot Harm - Cost
]

Գործողությունը թույլատրելի է, եթե «EV 350» և guardrails նորմալ։

Ռիսկի ախորժակը 'FPR-ի սահմանները, միջամտությունների հաճախականությունը, վնասի/բողոքների բյուջեն, error budget-ը։

3) Պատճառն ու կանխատեսումները

Երբ բավականաչափ կանխատեսում է 'ալլոիդներ ցածր հաճախականությամբ, վնասվածքներ հավանականությամբ։

Երբ անհրաժեշտ է պատճառել 'ROMI, գինի/լիմիտների քաղաքականությունը, անվտանգությունը/համադրումը։ Օգտագործեք A/B, DiD, RDD, IV, սինթետիկ վերահսկողություն։ targeting- ում uplift և CATE-ն են։

Counterfact.loop: Կանխատեսումը կանխատեսում է ռուսական էֆեկտը uplift/prom։

4) Քաղաքական տեսակները

Կանոնները (policy-as-code) 'դետերմինացված, բացատրված; բազա և fail-safe։

Score-based: հավանականություն/սկոր, histereae, cost-sultitive շեմն։

Կոնտեքստային (ավազակներ) '108-greedy/Thompson-ը օֆերներ/ջրանցքներ ընտրելու համար։

Հաջորդական (RL) 'բազմաթիվ ռազմավարություններ սահմանափակումներով (safe RL)։

Բաղադրիչները ՝ կասկադը, անվտանգությունը/կոմպլենսը ռուսական տնտեսությունը UX-ն է։

5) DI ճարտարապետությունը

Տվյալները ՝ կանոնական իրադարձություններ (UTC, վարկածներ), ֆիչեստորը (on.ru/wwww.parity), կատալոգը։

Մոդելներ ՝ 108/տարբերակներ, տրամաչափություն, drift-105 (PSI/KL), PR-AUC/Recall @ FPR 24x տոկոսը։

Սեմանտիկան և մետրիկները 'KPI/guardrails, SLO թարմ բառարանը։

Policy Engine: decision tables, AVAS/ենթատեքստեր, histereae, rate-limits, գերակայություններ։

Գործողությունների նվագարկիչ 'երաշխավորված առաքում, ռետրաններ, «գործողություն _ id», DLQ։

Դիտարկումը 'հետք' wwww.relation _ id ', ձագը «signal decision entercope»։

Անվտանգություն ՝ RFC/CLS, PII դիմակավորում, մուտքի և լուծումների ամսագիր։

6) Metriki DI

Որոշումների որակը

Decision Precision/Recall 'գործողության իրական հաջողությունների վրա։

Regret/Opportunity Loss-ը օպտիմալ քաղաքականությունից հրաժարվելն է։

Coverage 'օբյեկտների մի մասը, որոնք ստացել են գործողությունը։

Latency p95: Signal→Decision/Decision→Action.

Fairness/Harts: սեգմենտների, բողոքների, բողոքարկման սխալների տարբերությունը։

Բիզնես ազդեցություն

ROMI/ROI գործողություններ, uplift @ k, Qini/AUUC։

Net Benefit: էֆեկտը վնասակար է։

Time-to-Impact: ժամանակը ազդանշանից մինչև չափված արդյունք։

7) Լուծման նախագծումը (decision design)

1. Ձևակերպեք հարցը որպես արդյունք. <<Որո՞ նք են X-ից T-ի պահպանման աճը>>։

2. Narisway DAG, www.dounders/կոլայդերներ։

3. Ընտրեք դիզայնը 'A/B, quaziexperiment կամ մաքուր կանխատեսում + ex-post գնահատական։

4. Ռուսական գործողությունը և այլընտրանքները, սահմանափակումները և guardrails-ը։

5. Տվեք արժեքը և ռիսկի բյուջեն։

6. Գրեք քաղաքականությունը decision table-ում, պայմանները կարգավորվում են ալիքներով։

7. Շարունակեք գնահատումը 'էֆեկտի չափումները, տևողությունը, CATE հատվածները։

8. Eurunbook-ը և fallback-կանոնները։

8) Հիստերեևիչը, հաճախականությունը և հակամարտությունները

Գիստերեվիչը '«108/ելքի» շեմերը տարբեր են։ կանխում է միջամտությունների «միգրացիան»։

Cooldown: դադար կոնտակտների/սահմանափակումների միջև նույն օբյեկտի մոտ։

Քաղաքական հակամարտությունները 'գերակայությունների մատրիցա; «անվտանգությունը գերակայություն ունի»։

Քվոտա/Rate-limit 'ալիքի, սեգմենտների, օգտագործողի վրա։ արդար բաշխում։

9) Ինքնավարության մակարդակները

1. Ad-hoc: մարդը որոշում է, տվյալները բավարար չեն։

2. Assisted: համակարգը առաջարկում է լուծում + բացատրություն։

3. Automated: ավտո լուծումներ guardrails-ի սահմաններում։

4. Adaptive: Auto-tuning/offers ընտրություն (ավազակներ)։

5. Safe-Autonomy: Ինքնավարություն ֆորմալ սահմանափակումների և աուդիտի տակ։

10) Որոշումները անորոշության տակ են

Scenario planning: հիմնականը/սթրեսը/էքստրեմումը; ազդեցության միջակայքը։

Robustness: ռազմավարություն, դիմադրելով կերամիկական սխալներին։

POMDP ինտուիցիա 'գործեք թերի տեղեկատվության հետ։ գնահատեք տեղեկատվության արժեքը (ինչ փորձ է կատարել)։

Bayesian internating: Միավորեք պատմական գիտելիքները և համապատասխան տվյալները։

11) «Ռուսական քաղաքականության մոդելների» երկխոսությունը

Մոդելը տալիս է ժայռը/արդյունքների բաշխումը։

Քաղաքականությունը հաշվի է առնում սխալների, սահմանափակումների և ֆաիրնեսի արժեքը։

Կոդավորման գիծը ակնհայտ decision threshold policy-ում է տարբերակների ամսագրով։

Ռուսական շեմը 'EV-ով, ոչ միայն ROC/PR-ով։

12) Փաստաթղթեր և արտեֆակտներ

Քաղաքականության անձնագիր (template)

Կոդ/տարբերակը, նպատակը և KPI էֆեկտը

Պայմանները/fichi/մոդել, histereae/kuldaun

Գործողություններ և ջրանցքներ, առաջնահերթություններ և փոխադարձ բացառություններ

Guardrails (FPR 49x%, latency p95 dyy, RG/complaens)

Գնահատում 'թեստի դիզայն, չափումներ, տևողություն

Աուդիտ/բացատրություն օգտագործողի, սեփականատերերի համար

Decision Table (օրինակ)

Պայմանը	Համատեքստը	Գործողություն	Կուլդաուն	Guardrails
`churn_uplift ≥ 0. 08` & `value_q ≥ 0. 8`	retenshn	օֆֆեր L	7d	ROMI≥0, cap=1
`rg_risk ≥ τ` & `night`	RG	դադար + խորհուրդ	1d	FPR≤1%
`fraud_score∈[τ1,τ2]`	ձեռքի ստուգում	—	SLA 2ch

Լոգանքի սխեման «միջով» լուծումների միջոցով

`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).

13) Գովերնանսը և համապատասխանությունը

Մեկ բառարանը և բանաձևերի տարբերությունը։

Քաղաքականության հանձնաժողովը 'ռիսկի սպա, ապրանք, տվյալներ, համադրություններ։

Որոշումների աուդիտը 'բացատրություններ, ձախողումների պատճառներ, միգրացիաների ալիքներ։

Էթիկան և արդարությունը 'խմբերի սխալները։ բացառություն intected նշանները այն կանոններից, որտեղ դա պահանջվում է օրենքով։

14) Հաճախակի սխալներ

Օպտիմիզացումը բիզնեսի ազդեցության փոխարեն (Goodhart)։

Կանխատեսումների և պատճառների խառնուրդ։ ROMI-ը «հարաբերակցության վրա»։

Հիստերեզիսի և կուլդաունների բացակայությունը բացատրվում է սպամ/« միգրացիա »։

Սխալ սխալների և վնասի աննկատ արժեքը։

Շեմերի/բանաձևերի հանգիստ ուղղությունները առանց տարբերակների և չանգելոգի։

Գործողությունները առանց էֆեկտի գնահատման և «ցիկլի միացում»։

15) Chek-Lister-ը նախքան քաղաքականության/DI համակարգի թողարկումը

Նպատակը ձևակերպված է որպես պատճառահետևանքային ազդեցություն, սահմանվում է արժեքի գործառույթը և ռիսկի բյուջեն։
Naretan DAG; Գնահատման դիզայնը (A/B/DiD/SC) և մետրիկները ընտրվել են (A/B/DiD/SC)
Քաղաքականությունը նկարագրված է decision table-ում; կա histerae/kuldoon/գերակայություններ
Մոդելները մեկուսացված են; սխալները հանվել են սխալների արժեքից (EV) (EV)
Ակցիայի նվագարկիչը idempotenten; "signal decision internation entercope" ամսագիրը ներառվել է "signal decision enter
Guardrails և alerts տրամադրված են. runbooks եւ fallback կանոնները պատրաստ են
Dashbords 'ձանձրալի լուծումներ, էֆեկտ (uplift/ROI), վնաս/բողոքներ, fairness, fairness, fairness (uplift/r
Վարկածներ//հասանելիության իրավունքներ/համակցված են մեկնաբանվում

Արդյունքը

Որոշումների կայացման ինտելեկտը համակարգ է, և ոչ թե մոդելների մի շարք 'միասնական տվյալները և չափումները բացատրվում են ակնհայտ քաղաքականության և անվտանգ նվագախմբի ազդեցության վրա։ Այս համակարգը նվազեցնում է ռիսկը, բարձրացնում է ROI-ը և լուծում է դարձնում վերարտադրվող, բացատրված և կառավարվող։

Որոշումների կայացման ինտելեկտը