Որոշումների կայացման ինտելեկտը
Որոշումների կայացման ինտելեկտը
Որոշումների կայացման ինտելեկտը (Decision Intelligence, DI) կարգապահությունն է, որը տվյալները վերածում է կառավարվող լուծումների և չափված ազդեցության։ DI-ն միավորում է պատճառները, կանխատեսումը, որոշումների տնտեսությունը, քաղաքական դիզայնը և MLOps/վիրահատությունները մեկ կյանքի ցիկլում։
1) Karks DI: OODA/SSDL
Observe (Signal) 'ստանդարտ իրադարձություններ, որակը/թարմությունը, պապուպը և կոնտեքստը։
Orient (Sense): մեկնաբանություն 'կոորդինատներ, հատվածներ, պատճառված գրաֆիկներ, ռիսկի պրոֆիլներ։
Decide: քաղաքականությունը (կանոններ/մոդելներ/ավազակներ), սահմանափակումների և սխալների արժեքի բարձրացում։
Ակտ 'գործողությունների նվագախումբ, ջրանցքներ, գաղափարախոսություն, գերակայություններ։
Learn: ազդեցության քաուզալ գնահատում, շեմերի/քաղաքական/մոդելների նորարարություն։
2) Որոշումների տնտեսությունը
Արժեքի ֆունկցիան 'եկամուտը/պահպանված վնասը/պահել/որակը։
Սխալների արժեքը 'FP/FN փողի և ռիսկերի մեջ (RG/complaens/հեղինակություն)։
Ակնկալվող արժեքը (EV)
[
EV = p _ codice windows հաջողությունը codice cdot Value - p _ _ _ com վնասում է cdot Harm - Cost
]
Գործողությունը թույլատրելի է, եթե «EV 350» և guardrails նորմալ։
Ռիսկի ախորժակը 'FPR-ի սահմանները, միջամտությունների հաճախականությունը, վնասի/բողոքների բյուջեն, error budget-ը։
3) Պատճառն ու կանխատեսումները
Երբ բավականաչափ կանխատեսում է 'ալլոիդներ ցածր հաճախականությամբ, վնասվածքներ հավանականությամբ։
Երբ անհրաժեշտ է պատճառել 'ROMI, գինի/լիմիտների քաղաքականությունը, անվտանգությունը/համադրումը։ Օգտագործեք A/B, DiD, RDD, IV, սինթետիկ վերահսկողություն։ targeting- ում uplift և CATE-ն են։
Counterfact.loop: Կանխատեսումը կանխատեսում է ռուսական էֆեկտը uplift/prom։
4) Քաղաքական տեսակները
Կանոնները (policy-as-code) 'դետերմինացված, բացատրված; բազա և fail-safe։
Score-based: հավանականություն/սկոր, histereae, cost-sultitive շեմն։
Կոնտեքստային (ավազակներ) '108-greedy/Thompson-ը օֆերներ/ջրանցքներ ընտրելու համար։
Հաջորդական (RL) 'բազմաթիվ ռազմավարություններ սահմանափակումներով (safe RL)։
Բաղադրիչները ՝ կասկադը, անվտանգությունը/կոմպլենսը ռուսական տնտեսությունը UX-ն է։
5) DI ճարտարապետությունը
Տվյալները ՝ կանոնական իրադարձություններ (UTC, վարկածներ), ֆիչեստորը (on.ru/wwww.parity), կատալոգը։
Մոդելներ ՝ 108/տարբերակներ, տրամաչափություն, drift-105 (PSI/KL), PR-AUC/Recall @ FPR 24x տոկոսը։
Սեմանտիկան և մետրիկները 'KPI/guardrails, SLO թարմ բառարանը։
Policy Engine: decision tables, AVAS/ենթատեքստեր, histereae, rate-limits, գերակայություններ։
Գործողությունների նվագարկիչ 'երաշխավորված առաքում, ռետրաններ, «գործողություն _ id», DLQ։
Դիտարկումը 'հետք' wwww.relation _ id ', ձագը «signal decision entercope»։
Անվտանգություն ՝ RFC/CLS, PII դիմակավորում, մուտքի և լուծումների ամսագիր։
6) Metriki DI
Որոշումների որակը
Decision Precision/Recall 'գործողության իրական հաջողությունների վրա։
Regret/Opportunity Loss-ը օպտիմալ քաղաքականությունից հրաժարվելն է։
Coverage 'օբյեկտների մի մասը, որոնք ստացել են գործողությունը։
Latency p95: Signal→Decision/Decision→Action.
Fairness/Harts: սեգմենտների, բողոքների, բողոքարկման սխալների տարբերությունը։
Բիզնես ազդեցություն
ROMI/ROI գործողություններ, uplift @ k, Qini/AUUC։
Net Benefit: էֆեկտը վնասակար է։
Time-to-Impact: ժամանակը ազդանշանից մինչև չափված արդյունք։
7) Լուծման նախագծումը (decision design)
1. Ձևակերպեք հարցը որպես արդյունք. <<Որո՞ նք են X-ից T-ի պահպանման աճը>>։
2. Narisway DAG, www.dounders/կոլայդերներ։
3. Ընտրեք դիզայնը 'A/B, quaziexperiment կամ մաքուր կանխատեսում + ex-post գնահատական։
4. Ռուսական գործողությունը և այլընտրանքները, սահմանափակումները և guardrails-ը։
5. Տվեք արժեքը և ռիսկի բյուջեն։
6. Գրեք քաղաքականությունը decision table-ում, պայմանները կարգավորվում են ալիքներով։
7. Շարունակեք գնահատումը 'էֆեկտի չափումները, տևողությունը, CATE հատվածները։
8. Eurunbook-ը և fallback-կանոնները։
8) Հիստերեևիչը, հաճախականությունը և հակամարտությունները
Գիստերեվիչը '«108/ելքի» շեմերը տարբեր են։ կանխում է միջամտությունների «միգրացիան»։
Cooldown: դադար կոնտակտների/սահմանափակումների միջև նույն օբյեկտի մոտ։
Քաղաքական հակամարտությունները 'գերակայությունների մատրիցա; «անվտանգությունը գերակայություն ունի»։
Քվոտա/Rate-limit 'ալիքի, սեգմենտների, օգտագործողի վրա։ արդար բաշխում։
9) Ինքնավարության մակարդակները
1. Ad-hoc: մարդը որոշում է, տվյալները բավարար չեն։
2. Assisted: համակարգը առաջարկում է լուծում + բացատրություն։
3. Automated: ավտո լուծումներ guardrails-ի սահմաններում։
4. Adaptive: Auto-tuning/offers ընտրություն (ավազակներ)։
5. Safe-Autonomy: Ինքնավարություն ֆորմալ սահմանափակումների և աուդիտի տակ։
10) Որոշումները անորոշության տակ են
Scenario planning: հիմնականը/սթրեսը/էքստրեմումը; ազդեցության միջակայքը։
Robustness: ռազմավարություն, դիմադրելով կերամիկական սխալներին։
POMDP ինտուիցիա 'գործեք թերի տեղեկատվության հետ։ գնահատեք տեղեկատվության արժեքը (ինչ փորձ է կատարել)։
Bayesian internating: Միավորեք պատմական գիտելիքները և համապատասխան տվյալները։
11) «Ռուսական քաղաքականության մոդելների» երկխոսությունը
Մոդելը տալիս է ժայռը/արդյունքների բաշխումը։
Քաղաքականությունը հաշվի է առնում սխալների, սահմանափակումների և ֆաիրնեսի արժեքը։
Կոդավորման գիծը ակնհայտ decision threshold policy-ում է տարբերակների ամսագրով։
Ռուսական շեմը 'EV-ով, ոչ միայն ROC/PR-ով։
12) Փաստաթղթեր և արտեֆակտներ
Քաղաքականության անձնագիր (template)
Կոդ/տարբերակը, նպատակը և KPI էֆեկտը
Պայմանները/fichi/մոդել, histereae/kuldaun
Գործողություններ և ջրանցքներ, առաջնահերթություններ և փոխադարձ բացառություններ
Guardrails (FPR 49x%, latency p95 dyy, RG/complaens)
Գնահատում 'թեստի դիզայն, չափումներ, տևողություն
Աուդիտ/բացատրություն օգտագործողի, սեփականատերերի համար
Decision Table (օրինակ)
Լոգանքի սխեման «միջով» լուծումների միջոցով
`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).
13) Գովերնանսը և համապատասխանությունը
Մեկ բառարանը և բանաձևերի տարբերությունը։
Քաղաքականության հանձնաժողովը 'ռիսկի սպա, ապրանք, տվյալներ, համադրություններ։
Որոշումների աուդիտը 'բացատրություններ, ձախողումների պատճառներ, միգրացիաների ալիքներ։
Էթիկան և արդարությունը 'խմբերի սխալները։ բացառություն intected նշանները այն կանոններից, որտեղ դա պահանջվում է օրենքով։
14) Հաճախակի սխալներ
Օպտիմիզացումը բիզնեսի ազդեցության փոխարեն (Goodhart)։
Կանխատեսումների և պատճառների խառնուրդ։ ROMI-ը «հարաբերակցության վրա»։
Հիստերեզիսի և կուլդաունների բացակայությունը բացատրվում է սպամ/« միգրացիա »։
Սխալ սխալների և վնասի աննկատ արժեքը։
Շեմերի/բանաձևերի հանգիստ ուղղությունները առանց տարբերակների և չանգելոգի։
Գործողությունները առանց էֆեկտի գնահատման և «ցիկլի միացում»։
15) Chek-Lister-ը նախքան քաղաքականության/DI համակարգի թողարկումը
- Նպատակը ձևակերպված է որպես պատճառահետևանքային ազդեցություն, սահմանվում է արժեքի գործառույթը և ռիսկի բյուջեն։
- Naretan DAG; Գնահատման դիզայնը (A/B/DiD/SC) և մետրիկները ընտրվել են (A/B/DiD/SC)
- Քաղաքականությունը նկարագրված է decision table-ում; կա histerae/kuldoon/գերակայություններ
- Մոդելները մեկուսացված են; սխալները հանվել են սխալների արժեքից (EV) (EV)
- Ակցիայի նվագարկիչը idempotenten; "signal decision internation entercope" ամսագիրը ներառվել է "signal decision enter
- Guardrails և alerts տրամադրված են. runbooks եւ fallback կանոնները պատրաստ են
- Dashbords 'ձանձրալի լուծումներ, էֆեկտ (uplift/ROI), վնաս/բողոքներ, fairness, fairness, fairness (uplift/r
- Վարկածներ//հասանելիության իրավունքներ/համակցված են մեկնաբանվում
Արդյունքը
Որոշումների կայացման ինտելեկտը համակարգ է, և ոչ թե մոդելների մի շարք 'միասնական տվյալները և չափումները բացատրվում են ակնհայտ քաղաքականության և անվտանգ նվագախմբի ազդեցության վրա։ Այս համակարգը նվազեցնում է ռիսկը, բարձրացնում է ROI-ը և լուծում է դարձնում վերարտադրվող, բացատրված և կառավարվող։