Corelaţie, cauză şi efect
Corelaţie, cauză şi efect
Corelația captează modificările comune ale variabilelor. Cauzalitatea răspunde la întrebarea: ce se întâmplă dacă intervenim? În analiza, managementul produsului și al riscului, valoarea aduce exact efectul cauzal: vă permite să evaluați creșterea dintr-o soluție și nu doar o asociere.
1) Concepte de bază
Corelație (asociere): relație statistică fără interpretare a "de ce. "Poate fi cauzată de cauză comună, cauzalitate inversă sau întâmplare.
Efectul tratamentului: diferența așteptată între lume „cu intervenție” și „fără intervenție”.
Contrafactual: observație imposibilă „ce s-ar întâmpla cu același obiect fără impact”.
Confounder: o variabilă care afectează atât cauza, cât și rezultatul → creează o relație falsă.
Collider: o variabilă care este afectată atât de cauză, cât și de rezultat; condiția de coliziune distorsionează asocierea.
Paradoxul Simpson: direcția efectului se schimbă după luarea în considerare a variabilei/segmentului ascuns.
2) Când corelația este suficientă și când nu este
Analiză descriptivă, monitorizare, EDA: corelații/ranguri/heatmap → detectarea ipotezelor și riscurilor.
Luarea deciziilor și evaluarea impactului: sunt necesare metode cauzale (experimente sau cvasi-experimente).
Modele de predicție: Corelațiile sunt utile, dar pentru ROI/politici - treceți la estimări cauzale sau modele de ridicare.
3) Experimente: Gold Standard
A/B teste (randomizare): elimina confundarea, face grupuri comparabile.
Guardrails: durata ≥ un ciclu de comportament, expunerea stabilă, controlul sezonalității și interferențelor (spillover).
Valori: efect, intervale de încredere, MDE/putere, eterogenitatea efectului pe segment (efect de tratament eterogen).
Practică: eliberări canare, lansare treptată, control CUPED/covariat pentru a reduce varianța.
4) Dacă experimentul nu este posibil: cvasi-experimente
Diferența în diferențe (DiD): diferența între schimbările înainte/după "test" și "control. "Ipoteza principală este tendinţele paralele înainte de intervenţie.
Control sintetic: construim controlul „sintetic” ca un amestec ponderat de grupuri donatoare. Rezistent la diferite tendințe dinamice.
Discontinuitatea regiunii (CDD): regula pragului pentru atribuirea impactului; comparație pe ambele părți ale pragului. Important: nicio „manipulare” a pragului.
Variabile instrumentale (IV): variabila afectează „tratamentul”, dar nu afectează în mod direct rezultatul (cu excepția tratamentului). Necesar: relevanța și valabilitatea instrumentului.
PSM/Potrivire: testare și control cu covariate similare; util ca preprocesare, dar nu elimină confounders ascunse.
Întrerupt Time Series (STI): evaluarea unei tendințe de întrerupere la un punct de politică în absența altor șocuri.
5) Grafice cauzale și criteriile pentru „găuri”
DAG (grafic aciclic orientat): o hartă vizuală a relațiilor cauzale. Vă ajută să alegeți variabilele pe care să le monitorizați.
Criteriul ușii din spate: blocăm toate căile din spate (confounders) - obținem o estimare a efectului imparțial.
Criteriul ușii din față: folosim un intermediar care poartă pe deplin influență pentru a ocoli confounderii ascunse.
Nu controlați colliders și descendenții rezultatului: acest lucru creează deplasări.
Practică: mai întâi desenați un DAG cu experți în domeniu, apoi alegeți setul minim de covariabile.
6) Rezultate potențiale și estimări ale efectelor
ATE/ATT/ATC: efect mediu asupra tuturor/tratamentelor/controalelor.
CATE/HTE: efect pe segmente (țară, canal, clasă de risc).
Modelarea ascendentă: învățăm modelul să clasifice obiectele prin creșterea așteptată de la intervenție și nu prin probabilitatea inițială a evenimentului.
7) Capcane frecvente
Cauzalitate inversă: „o creștere a reducerilor ↔ o scădere a cererii” - reducerile reacționează la o scădere și nu invers.
Variabile lipsă: stocuri nedeclarate/sezonalitate/modificări regionale.
Supraviețuitori părtinire: Analiza „resturilor” numai.
Scurgere: utilizarea informațiilor viitoare în formare/evaluare.
Măsurători de amestecare: optimizarea măsurătorilor proxy în locul efectului de afaceri (Goodhart).
Regresie la medie: Natural revine la tendință masca „efecte”.
8) Cauzalitatea în produs, marketing și risc
Marketing/campanii: targetare ascendentă, frecvențe de contact diferențiate, evaluări cauzale LTV, DiD/ROMI de control sintetic.
Prețuri/promovare: RDD (reguli de prag), experimente de eșantionare SKU/regiune.
Recomandări: evaluarea în afara politicilor (IPS/DR) și bandiți; contabilizarea interferențelor.
Politici antifraudă/RG: atent cu cauzalitatea - blochează comportamentul și datele; utilizați cvasi-experimente și parapete pe FPR și recursuri.
Managementul operațiunii: ITS pentru eliberări și incidente; grafice cauzale pentru RCA.
9) Procedura de analiză: de la ipoteză la soluție
1. Formulați întrebarea ca fiind cauzală: „Care este efectul X asupra Y în orizontul T?”
2. Desenați un DAG: coordonați cu domeniul, marcați confounderi/mediatori/colliders.
3. Selectați design: RCT/A-B, DiD, RDD, IV, control sintetic, potrivire.
4. Definirea metricii: principal (efect), parapete (calitate/etică/operațiuni), segmente CATE.
5. Pregătirea datelor: punct-in-time, covariază impactul „înainte”, calendarul și sezonalitatea.
6. Evaluarea efectului: modele iniţiale + teste robast (teste placebo, sensibilitate).
7. Verificați robustețea: specificații alternative, excluderea covariatelor suspecte, lăsați-o singură.
8. Puneți în acțiune: politică/lansare, SLO, monitorizare și retestare la derivă.
10) Robast practici și verificare
Verificări pre-trend (pentru DiD): tendințele de testare/control sunt similare înainte de intervenție.
Placebo/permutări: „date fictive” sau „grupuri fictive” - efectul trebuie să dispară.
Analiza sensibilității: cât de mult un confounder ascuns va distorsiona rezultatul.
Limite/pi-intervale: modele parțial identificabile → limite de încredere.
Multiple de testare-BH/Holm ajustări pentru mai multe segmente.
Valabilitate externă: portabilitatea efectului pe alte piețe/canale (meta-analiză).
11) Măsurători de raportare a efectelor
Efect absolut: Δ în unități (pp, cu, minute).
Efect relativ:% faţă de valoarea iniţială.
NNT/NNH: Câte obiecte trebuie prelucrate pentru a obține un rezultat/rău.
Cost-eficacitate: efect/cost; prioritățile bugetelor.
Uplift @ k/Qini/AUUC: pentru intervenții punctuale.
12) Cauzalitatea în practica ML
Caracteristici cauzale: Nu îmbunătățiți întotdeauna precizia predicției, dar sunt mai potrivite politicilor.
Cauzal Forest/Meta-learners (T/X/S-Learner): scor CATE și ridicare personală.
Echitatea contrafactuală: corectitudinea modelelor, luând în considerare căile cauzale; blocarea căilor „nedrepte”.
Do-op vs prezice: Distinge între "prezice" și "ce se face dacă. "Al doilea necesită modele/emulatoare cauzale.
13) Lista de verificare cauzală
- Întrebarea este încadrată ca un efect de intervenție/politică
- Construit și convenit de DAG; set minim de covariate (ușa din spate) selectate
- Design selectat (experiment RCT/cvasi) și ipoteze cheie testate
- Date punctuale; fețe excluse; calendar/sezonalitate luate în considerare
- Efect și intervale de încredere calculate; au fost efectuate controale robast
- Efect eterogenitate (CATE) și riscuri (parapete) evaluate
- Valoarea digitizată (ROI, NNT/NNH, costul de eroare)
- Planul de implementare și monitorizare; criterii de retestare
14) Mini glosar
Ușa din spate/ușa din față: criterii pentru selectarea covariatelor pentru identificarea efectelor.
IV (variabilă instrumentală): „pârghie” schimbarea tratamentului, dar nu rezultatul direct.
DiD: diferență în înainte/după modificările între grupuri.
RDD: estimarea efectelor în apropierea pragului de regulă.
Controlul sintetic: controlul ca o combinație ponderată de donatori.
HTE/CATE: efect eterogen/condițional pe segment.
Uplift: creșterea așteptată de la impact, nu probabilitatea unui eveniment.
Rezultat
Corelațiile ajută la găsirea ipotezelor, cauzalitatea ajută la luarea deciziilor. Construiți un DAG, alegeți un design adecvat (experiment sau cvasi-experiment), testați ipotezele și robustețea, măsurați efectele eterogene și traduceți concluziile în politici cu parapete și monitorizare. Deci, analiza încetează să mai fie „despre conexiuni” și devine un motor al schimbării.