Korrelyasiya və səbəb-nəticə əlaqələri
Korrelyasiya və səbəb-nəticə əlaqələri
Korrelyasiya dəyişənlərin birgə dəyişikliklərini qeyd edir. Səbəblilik suala cavab verir: müdaxilə etsək nə olacaq? Analitikada, məhsulda və risk menecmentində dəyər məhz səbəb təsiri gətirir: bu, sadəcə bir assosiasiya deyil, bir həll inklementini qiymətləndirməyə imkan verir.
1) Əsas anlayışlar
Korrelyasiya (assosiasiya): «niyə» şərhi olmadan statistik əlaqə. Ümumi səbəb, əks səbəb və ya qəza səbəb ola bilər.
Səbəb effekti (treatment effect): «müdaxilə ilə» və «müdaxilə olmadan» dünya arasında gözlənilən fərq.
Kontrfakt: qeyri-mümkün müşahidə «təsir etmədən eyni obyekt ilə nə olardı».
Confounder: həm səbəbə, həm də nəticəyə təsir edən dəyişən → yanlış əlaqə yaradır.
Collider: həm səbəb, həm də nəticə təsir edən dəyişən; Kollayder şərti assosiasiyanı təhrif edir.
Simpson paradoksu: effektin istiqaməti gizli dəyişən/seqment nəzərə alındıqdan sonra dəyişir.
2) Korrelyasiya kifayət olduqda və olmadıqda
deskriptiv analitika, monitorinq, EDA: korrelyasiya/dərəcələri/heatmap → hipotez və riskləri aşkar.
Qərarların qəbulu və təsirin qiymətləndirilməsi: səbəb metodları (eksperimentlər və ya kvazi-eksperimentlər) tələb olunur.
Proqnozlaşdırma modelləri: korrelyasiya faydalıdır, lakin ROI/siyasət üçün - kauzal qiymətləndirmələrə və ya uplift modellərinə keçid.
3) Təcrübələr: qızıl standart
A/B testləri (randomizasiya): konfaundinqi aradan qaldırır, qrupları müqayisə edir.
Guardrails: bir davranış dövrü, sabit ekspozisiya, mövsümi nəzarət və interferensiya (spillover) ≥ müddət.
Metriklər: effekt, inam intervalları, MDE/power, seqmentlər üzrə effektin homojenliyi (Heterogeneous Treatment Effect).
Təcrübə: kanarya relizlər, mərhələli rollout, CUPED/dispersiyanı azaltmaq üçün kovariat nəzarət.
4) Əgər təcrübə mümkün deyilsə: kvaziexperiments
Difference-in-Differences (DiD): «test» və «nəzarət» arasında «əvvəl/sonra» dəyişikliklər fərqi. Əsas fərziyyə müdaxilədən əvvəl paralel tendensiyalardır.
Sintetik nəzarət: Donor qruplarının balanslı qarışığı kimi «sintetik» nəzarət qururuq. Müxtəlif tendensiyaların dinamikasına davamlıdır.
Regression Discontinuity (RDD): təsir təyin həddi qaydası; eşiyin hər iki tərəfində müqayisə. Vacib: «manipulyasiyanın» olmaması.
Instrumental dəyişənlər (IV): dəyişən «müalicəyə» təsir edir, lakin nəticəyə birbaşa təsir etmir (müalicə yolu ilə istisna olmaqla). Tələb olunur: alətin müvafiq və etibarlılığı.
Müqayisə (PSM/Matching): oxşar məkrli ilə test və nəzarət; Processing kimi faydalıdır, lakin gizli gizliləri aradan qaldırmır.
Interrupted Time Series (ITS): digər şoklar olmadıqda siyasət anında trend qırılmasının qiymətləndirilməsi.
5) Causal Graphs və «deşik» meyarları
DAG (yönlü asiklik qrafik): səbəb əlaqələrinin vizual xəritəsi. Hansı dəyişənlərin nəzarət ediləcəyini seçməyə kömək edir.
Back-door criterion: Bütün arxa yolları (konfaunder) bloklayırıq - effektin birləşdirilməmiş qiymətləndirilməsini alırıq.
Front-door criterion: Gizli konfaunderləri aşmaq üçün tam təsir göstərən vasitəçi istifadə edin.
Kollayderlər və nəticənin nəsillərinə nəzarət etməyin: bu, yerdəyişmələr yaradır.
Təcrübə: əvvəlcə domen mütəxəssisləri ilə DAG çəkin, sonra minimum kovariat dəsti seçin.
6) Potensial nəticələr və effektin qiymətləndirilməsi
ATE/ATT/ATC: bütün/emal/nəzarət orta effekti.
CATE/HTE: seqmentlərin təsiri (ölkə, kanal, risk sinfi).
Uplift-modelləşdirmə: Obyektləri müdaxilədən gözlənilən artıma görə sıralamağı öyrənmək, hadisənin ilkin ehtimalına görə deyil.
7) Tez-tez tələlər
Əks səbəb: «endirimlərin artması tələbin azalması» - endirimlər əksinə deyil, düşməyə reaksiya verir.
Buraxılmış dəyişənlər: nəzərə alınmayan səhmlər/mövsümilik/regional dəyişikliklər.
Sağ qalanlar (survivorship bias): yalnız «qalanların» təhlili.
Leakage: öyrənmə/qiymətləndirmə zamanı gələcək məlumatların istifadəsi.
Metrik qarışdırma: biznes effekti əvəzinə proxy-metrik optimallaşdırma (Goodhart).
Orta reqressiya: tendensiyaya təbii qayıdışlar «effektləri» gizlədir.
8) Məhsul, marketinq və risklərdə kauzallıq
Marketinq/kampaniyalar: uplift hədəfləmə, diferensial əlaqə tezliyi, cauzal LTV qiymətləndirmələri, DiD/sintetik nəzarət üzrə ROMI.
Qiymət/promo: RDD (eşik qaydaları), SKU/regionların nümunə təcrübələri.
Tövsiyələr: off-policy qiymətləndirilməsi (IPS/DR) və bandits; müdaxilə uçotu.
Antifrod/RG siyasətləri: kauzallığa diqqət yetirin - davranış və məlumatları dəyişdirin; FPR və apelyasiya kvazi-eksperimentlər və guardrails istifadə edin.
Operativ idarəetmə: buraxılışlar və hadisələr üçün ITS; RCA üçün kauzal qraflar.
9) Təhlil proseduru: hipotezdən həll yoluna
1. Sualı səbəb kimi ifadə edin: «T üfüqündə X-in Y-yə təsiri nədir?»
2. DAĞ çəkin: domenlə razılaşın, konfaunderləri/vasitəçiləri/kollayderləri qeyd edin.
3. Dizayn seçin: RCT/A-B, DiD, RDD, IV, sintetik nəzarət, matching.
4. Metrikləri müəyyənləşdirin: əsas (effekt), guardrails (keyfiyyət/etika/əməliyyatlar), CATE seqmentləri.
5. Məlumat hazırlayın: point-in-time, kovariatlar «qədər» təsir, təqvim və mövsümilik.
6. Effektin qiymətləndirilməsi: əsas modellər + robast yoxlamalar (placebo testlər, həssaslıq).
7. Dayanıqlığı yoxlayın: alternativ spesifikasiya, şübhəli kovariatın istisna edilməsi, leave-one-out.
8. Aktivləşdirin: siyasət/rollout, SLO, monitorinq və sürüklənmə zamanı retest.
10) Robast təcrübələri və yoxlama
Pre-trend checks (DiD üçün): test/nəzarət trendləri müdaxilədən əvvəl oxşardır.
Placebo/yerdəyişmələr: «uydurma tarixlər» və ya «uydurma qruplar» - təsir aradan qalxmalıdır.
Sensitivity analysis: nə qədər gizli konfounder nəticəni təhrif edəcək.
Bounds/pi intervalları: qismən müəyyən edilmiş modellər → etibarlı sərhədlər.
Multiple testing: düzəlişlər (BH/Holm) bir çox seqment ilə.
External validity: effektin digər bazarlara/kanallara daşınması (meta-analysis).
11) Effektlər üzrə hesabat metrikası
Mütləq effekt: Δ ədəd (p.p., v.e., dəqiqə).
Nisbi effekt:% baza xəttinə.
NNT/NNH: Bir nəticə/zərər əldə etmək üçün neçə obyekt emal edilməlidir.
Cost-Effectiveness: effekt/dəyəri; büdcələrin prioritetləri.
Uplift @k/Qini/AUUC: hədəflənmiş müdaxilələr üçün.
12) ML praktikasında kauzallıq
Causal Features: həmişə proqnozun dəqiqliyini artırmır, lakin siyasətçilər üçün daha uyğundur.
Causal Forest/Meta-learners (T/X/S-Learner): CATE və fərdi uplift qiymətləndirilməsi.
Counterfactual fairness: kauzal yolları nəzərə alaraq modellər ədalət; «ədalətsiz» yolları bloklamaq.
Do-op vs predict: «proqnozlaşdırmaq» və «nə etmək lazımdır». İkincisi üçün kauzal modellər/emulyatorlar lazımdır.
13) Səbəb analizinin yoxlama siyahısı
- Sual müdaxilə/siyasət təsiri kimi formalaşdırılmışdır
- DAĞ tərəfindən qurulmuş və razılaşdırılmışdır; minimum covariate dəsti seçildi (back-door)
- Dizayn seçildi (RCT/kvazi-eksperiment) və əsas fərziyyələr sınaqdan keçirildi
- Point-in-time məlumatları; simalar istisna edilir; təqvim/mövsümilik nəzərə alınır
- Hesablanmış effekt və etibarlı intervallar; Robast yoxlamalar aparılıb
- Qiymətləndirilən heterojenlik effekti (CATE) və risklər (guardrails)
- Rəqəmsal dəyər (ROI, NNT/NNH, səhv dəyəri)
- Tətbiq və monitorinq planı; təkrar test meyarları
14) Mini sözlük
Back-door/Front-door: təsirin identifikasiyası üçün kovariat seçimi meyarları.
IV (instrumental dəyişən): müalicəni dəyişdirən «qol», lakin birbaşa nəticə deyil.
DiD: qruplar arasında «əvvəl/sonra» dəyişikliklər fərqi.
RDD: qaydaların astanasına yaxın təsiri qiymətləndirmək.
Synthetic Control: balanslı donor birləşməsi kimi nəzarət.
HTE/CATE: seqmentlər üzrə heterojen/şərti effekt.
Uplift: gözlənilən təsir artımı, hadisə ehtimalı deyil.
Yekun
Korrelyasiya fərziyyələr tapmağa kömək edir, səbəb qərar qəbul etməkdir. DAĞ qurun, uyğun dizaynı seçin (eksperiment və ya kvazi-eksperiment), fərziyyələri və sabitliyi yoxlayın, heterojen effektləri ölçün və nəticələri guardrails və monitorinqlə siyasətə keçirin. Beləliklə, analitika «rabitə haqqında» olmağı dayandırır və dəyişikliklərin mühərrikinə çevrilir.