Հարաբերակցություն և պատճառահետևանքային կապեր

Հարաբերակցությունը ամրագրում է փոփոխականների համատեղ փոփոխությունները։ Պատճառն այն է, որ ի՞ նչ կլինի, եթե մենք միջամտում ենք։ Վերլուծության, սննդի և ռիսկի կառավարման մեջ արժեքը բերում է հենց պատճառահետևանքային էֆեկտը 'այն թույլ է տալիս գնահատել լուծումից ստացված գրանցումը, ոչ միայն ասոցիացիան։

1) Հիմնական հասկացությունները

Հարաբերակցություն (ասոցիացիա) 'վիճակագրական կապ առանց մեկնաբանության «ինչու»։ Միգուցե պատճառվել է ընդհանուր պատճառի, պատճառի կամ պատահականության։

Պատճառային էֆեկտը (treatroneffect) 'աշխարհի միջև ակնկալելի տարբերությունը «միջամտության հետ» և «առանց միջամտության»։

Դելֆակտը 'անհնար դիտարկումը «ինչ կլիներ նույն օբյեկտի հետ առանց ազդեցության»։

Կոնֆաունդեր 'փոփոխական, ազդող և պատճառի վրա, և արդյունքի վրա ստեղծվում է կեղծ կապ։

Կոլայդեր 'փոփոխական, որի վրա ազդում են և պատճառը, և արդյունքը։ կոլայդերի պայմանը աղավաղում է ասոցիացիան։

Սիմփսոնի պարադոքսը, էֆեկտի ուղղությունը փոխվում է թաքնված փոփոխականի/նատրիումի հաշվելուց հետո։

2) Երբ հարաբերակցությունը բավարար է, իսկ երբ 'ոչ, ոչ։

Դեգրաֆիկ վերլուծաբան, պաշտպանիչ, EDA 'հարաբերակցություններ/ռանգներ/heatmap-ը կարող է հայտնաբերել հիպոթեզներ և ռիսկեր։

Որոշումների ընդունումը և ազդեցության գնահատումը 'անհրաժեշտ են պատճառահետևանքային մեթոդներ (փորձարկումներ կամ քվազիեքսպերիմենտներ)։

Կոդավորման մոդելները ՝ հարաբերակցությունը օգտակար է, բայց ROI/քաղաքական համար 'անցում դեպի քաուզային գնահատականներ կամ uplift մոդելներ։

3) Փորձարկումներ ՝ ոսկու պաշտպանիչ

A/B թեստերը (randomization), վերացնում են կոնֆաունդինգը, խմբերը դարձնում են համեմատելի։

Guardrails: տևողությունը մեկ վարքագծի ցիկլ է, կայուն էքսպոզիցիա, սեզոնային վերահսկողություն և միջամտություն (spillover)։

Մետրիկները 'էֆեկտը, վստահելի ընդմիջումները, MDE/2019, սեգմենտների ազդեցության երկիմաստությունը (Heterogeneous Treatics Effect)։

Պրակտիկա 'կանարեքային ուլտրաձայններ, rollout, CUPED/կովարիատի վերահսկումը ցրման նվազեցման համար։

4) Եթե փորձարկումը անհնար է 'քվազիզեքսպերիմենտներ

Դելֆերենսը-in-Filferences (DiD), փոփոխությունների տարբերությունը "մինչև/հետո" թեստ "և" վերահսկման "միջև։ Հիմնական սխալը զուգահեռ միտումներն են մինչև միջամտությունը։

Սինթետիկ վերահսկումը 'մենք կառուցում ենք «սինթետիկ» վերահսկողություն որպես դոնորական խմբերի հավասարակշռված խառնուրդ։ Տարբեր միտումների դինամիկայի հետ կապված։

Regression Discontinuity (RDD) 'ազդեցության շեմի կանոնը։ համեմատություն շեմի երկու կողմերում։ Կարևոր է '«մանիպուլյացիայի» բացակայությունը շեմն է։

Գործիքային կոմպոզիցիաները (III) 'փոփոխականը ազդում է «բուժման» վրա, բայց ուղղակիորեն չի ազդում արդյունքի վրա (բացառությամբ բուժման միջոցով)։ Անհրաժեշտ է 'ռելեվանտացիան և գործիքի վալիդիությունը։

Համեմատությունը (PSM/Matching) 'թեստ և վերահսկողություն նման կովարիատների հետ։ օգտակար է պրեսեկցիան, բայց չի վերացնում թաքնված կոնֆաունդերները։

Interrupted Time Series (IFC): Քաղաքականության պահին միտման արտահոսքի գնահատումը այլ ցնցումների բացակայության դեպքում։

5) Causal Graphs-ը և «ծխի» չափանիշները։

DAG (կենտրոնացված ացիկլիկ գրաֆիկ) 'պատճառային հարաբերությունների տեսողական քարտեզը։ Օգնում է ընտրել, թե որոնք են վերահսկելու։

Back-door criterion: Մենք արգելափակում ենք բոլոր հետքերը (կոնֆաունդերներ), մենք ստանում ենք ազդեցության անհապաղ գնահատական։

Front-door criterion-ը 'մենք օգտագործում ենք միջնորդ, որն ամբողջովին կարող է ազդել թաքնված կոնֆաունդերի շուրջ։

Մի վերահսկեք կոլայդերներն ու արդյունքի սերունդները, դա ստեղծում է կայունություն։

Պրակտիկա 'նախ նկարում ենք DAG-ը հիբրիդային մասնագետների հետ, ապա ընտրում ենք կովարիատի նվազագույն հավաքածու։

6) Պոտենցիալ արդյունքներ և էֆեկտի գնահատում

ATE/ATT/ATC 'միջին ազդեցություն բոլոր/վերամշակված/վերահսկման վրա։

CATE/HTE 'սեգմենտների ազդեցությունը (երկիր, ջրանցք, ռիսկի դաս)։

Uplift-մոդելավորում 'մենք սովորեցնում ենք մոդելը դասակարգել օբյեկտները միջամտությունից սպասվող աճի և ոչ թե իրադարձության հավանականության պատճառով։

7) Հաճախակի թակարդներ

Հակառակը '«զեղչերի ավելացումը պահանջարկի նվազումն է», զեղչերը արձագանքում են նվազմանը, ոչ հակառակը։

Բաց թողած հայտարարությունները 'չճանաչված բաժնետոմսեր/սեզոնային/տարածաշրջանային փոփոխություններ։

Գոյատևողները (survivorship bias) 'միայն «մնացած» վերլուծություն։

Leakage 'ռուսական տեղեկատվության օգտագործումը ուսուցման/գնահատման ժամանակ։

Մետրիկի խառնուրդը 'օպտիմիզացումը բիզնեսի ազդեցության փոխարեն (Goodhart)։

Ռեգրեսիան միջին 'բնական բարձրացումները տենդենցին քողարկում են «էֆեկտները»։

8) Կաթալությունը սննդի, մարքեթինգի և ռիսկերի մեջ

Մարքեթինգը/քարոզարշավը 'uplift-targeting, տարբերակված կոնտակտների հաճախականություններ, causal LTV գնահատականներ, ROMI DiD/սինթետիկ վերահսկում։

Գնագոյացում/պրոմո ՝ RDD (շոշափելի կանոններ), փորձարկումներ SKU/տարածաշրջանների ընտրության վրա։

Առաջարկություններ ՝ off-policy գնահատական (IPS/DR) և bandits; ինտերֆեյսի լուծումը։

Antifrod/RG քաղաքականությունը 'զգույշ քաուզալունությամբ, արգելափակումները փոխում են վարքագիծը և տվյալները։ օգտագործեք caziexperiments և guardrails FPR-ում և։

Օպերացիան 'IFC առյուծների և կոմպոզիցիաների համար։ kauzal գրաֆիկներ RCA-ի համար։

9) Վերլուծության գործընթացը 'հիպոթեզից մինչև լուծում

1. «Ո՞ րն է X-ի ազդեցությունը Y-ի հորիզոնում T-ի վրա»։

2. Նկարել DAG-ը 'համաձայնեցնել օրինագծի հետ, նշել կոնֆաունդերներ/մեդիա/կոլայդերներ։

3. Ընտրել դիզայնը 'RCT/A-B, DiD, RDD, RF, սինթետիկ վերահսկողություն, matching։

4. Որոշեք մետրերը 'հիմնական (էֆեկտը), guardrails (որակը/էթիկան/վիրահատությունը), CATE հատվածները։

5. Պատրաստել տվյալները 'point-in-time, կովարիատներ «մինչև» ազդեցությունը, օրացույցը և սեզոնայնությունը։

6. Գնահատել էֆեկտը 'հիմնական մոդելները + robast ստուգումներ (placebo թեստեր, զգայունություն)։

7. Փորձարկել կայունությունը 'այլընտրանքային հատկություններ, կասկածելի կովարիատի բացառություն, leave-one-out։

8. Թարգմանել գործողության մեջ 'քաղաքականություն/rollout, SLO, ռուսական և ռետրետ դրաֆթի ժամանակ։

10) Ռոբասթ պրակտիկան և հավատալիքները

Pre-trend diks (DiD-ի համար) 'թեստի/վերահսկման միտումները նման են միջամտությանը։

Placebo/փոխակերպումներ ՝ «ֆիքսված ամսաթվերը» կամ «ֆիքսված խմբերը», էֆեկտը պետք է անհետանա։

Softitivity analysis: Որքա՞ ն թաքնված կոնֆաունդերը աղավաղում է արդյունքը։

Bounds/pi-ընդմիջումները 'մասամբ նույնականացված մոդելները պաշտպանվում են վստահելի սահմաններով։

Multiple testing: 108 (BH/Holm) բազմաթիվ հատվածներում։

External validity: ազդեցության փոխանցումը այլ շուկաների/ալիքների վրա (meta-anensis)։

11) Էֆեկտների հաշվետվությունների չափումները

Բացարձակ ազդեցություն 'Մոսկվան միավորներում (p.p, u.e, րոպե)։

Հարաբերական էֆեկտը 'տոկոսը ռուսական գծին։

NNT/NNH: Քանի՞ օբյեկտ պետք է մշակվի մեկ արդյունքի/վնասի հասնելու համար։

Cost-Effectiveness: ազդեցություն/արժեք; առաջնահերթությունները։

Uplift @ k/Qini/AUUC-ի համար։

12) Քաուզալությունը ML պրակտիկայում

Causal Features: միշտ չէ, որ բարձրացնում են կանխատեսման ճշգրտությունը, բայց ավելի լավ հարմար են քաղաքական գործչի համար։

Causal Forest/Meta-learners (T/X/S-Learner): CATE-ի գնահատումը և անձնական uplift։

Counterfact.fairness: մոդելների արդարությունը հաշվի առնելով քաուզային ճանապարհները։ «անարդար» ճանապարհների արգելափակում։

Do-op vs-dict: Տարբերեք «կանխատեսել» և «ինչ անել»։ Երկրորդի համար անհրաժեշտ են քաուզային մոդելներ/էմուլյատորներ։

13) Պատճառային վերլուծության չեկի ցուցակ

Հարցը ձևակերպված է որպես միջամտության/քաղաքականության ազդեցություն։
Կառուցվել և համաձայնվել է DAG; ընտրվել է կովարիատի նվազագույն հավաքածու (back-door)
Ընտրվել է դիզայն (RCT/Quazi-փորձ) և ստուգվել են հիմնական սխալները։
Point-in-time; բացառված են թռուցիկները; օրացույցը/սեզոնայնությունը հաշվի են առնվում
Հաշվարկված են էֆեկտը և վստահելի ընդմիջումները։ Robast-ստուգումներ են իրականացվել
Գնահատված է ազդեցության երկիմաստությունը (CATE) և ռիսկերը (guardrails)
Թվայնացված արժեքը (ROI, NNT/NNH, սխալի արժեքը)
Ներդրման և մոնիտորինգի պլանը. Կրկնվող թեստի չափանիշները

14) Mini-glossaria

Back-door/Front-door: կովարիատի ընտրության չափանիշները էֆեկտը հայտնաբերելու համար։

III (գործիքային փոփոխական) '«լծակ», որը փոխում է բուժումը, բայց ոչ արդյունքը ուղղակիորեն։

DiD 'խմբերի միջև «մինչև/հետո» փոփոխությունների տարբերությունը։

RDD 'ազդեցության գնահատումը կանոնների շեմին մոտ։

Inthetic Control-ը 'վերահսկողությունը որպես կոդավորման հավասարակշռված համադրություն։

HTE/CATE: երկիմաստ/պայմանական ազդեցություն հատվածների վրա։

Uplift: Ակնկալվող ավելացումը ազդեցությունից, իրադարձության հավանականությունը չէ։

Արդյունքը

Հարաբերությունները օգնում են գտնել հիպոթեզներ, պատճառներ, որոշումներ կայացնել։ Կառուցեք DAG-ը, ընտրեք համապատասխան դիզայն (փորձ կամ քվազ-փորձ), ստուգեք սխալներն ու կայունությունը, չափեք երկիմաստ էֆեկտները և եզրակացություններ փոխանցեք քաղաքականությանը guardrails-ի և մոնիտորինգի հետ։ Այսպիսով, վերլուծությունը դադարում է լինել «կապի մասին» և դառնում է փոփոխության շարժիչ։

Հարաբերակցություն և պատճառահետևանքային կապեր

Հարաբերակցություն և պատճառահետևանքային կապեր

Արդյունքը

Կապ հաստատեք մեզ հետ

Արագ կապ

Տեսանյութը շուտով կթարմացվի

Այս պահին մենք ծանրաբեռնված ենք նախագծերով