Korelasyon ve Sebep ve Sonuç
Korelasyon ve Sebep ve Sonuç
Korelasyon, değişkenlerdeki ortak değişiklikleri yakalar. Nedensellik şu soruyu yanıtlar: Müdahale edersek ne olur? Analitikte, ürün ve risk yönetiminde, değer tam olarak nedensel etkiyi getirir: sadece bir ilişkiden değil, bir çözümden elde edilen artışı değerlendirmenizi sağlar.
1) Temel kavramlar
Korelasyon (ilişki): "Neden'in yorumlanmadan istatistiksel ilişki. Ortak neden, ters nedensellik veya şanstan kaynaklanabilir.
Tedavi etkisi: Dünya arasında "müdahale ile've" müdahale olmadan "beklenen fark.
Karşı olgusal: imkansız gözlem "aynı nesneye etkisi olmadan ne olurdu".
Confounder: hem nedeni hem de sonucu etkileyen bir değişken - yanlış bir ilişki yaratır.
Çarpıştırıcı: Hem neden hem de sonuçtan etkilenen bir değişken; Çarpıştırıcı durumu ilişkiyi bozar.
Simpson paradoksu: etkinin yönü, gizli değişken/segment dikkate alındıktan sonra değişir.
2) Korelasyon yeterli olduğunda ve olmadığında
Tanımlayıcı analitik, izleme, EDA: Korelasyonlar/dereceler/ısı haritası - hipotezleri ve riskleri tespit eder.
Karar verme ve etki değerlendirmesi: Nedensel yöntemler (deneyler veya yarı deneyler) gereklidir.
Tahmin modelleri: Korelasyonlar yararlıdır, ancak YG/politikalar için - nedensel tahminlere veya yükseltme modellerine geçin.
3) Deneyler: Altın Standart
A/B testleri (randomizasyon): karışıklığı ortadan kaldırır, grupları karşılaştırılabilir hale getirir.
Korkuluklar: Süre ≥ bir davranış döngüsü, istikrarlı maruz kalma, mevsimsellik ve girişim (yayılma) kontrolü.
Metrikler: etki, güven aralıkları, MDE/güç, segmente göre etkinin heterojenliği (Heterojen Tedavi Etkisi).
Uygulama: kanarya salımları, aşamalı sunum, varyansı azaltmak için CUPED/kovaryat kontrolü.
4) Deney mümkün değilse: yarı-deneyler
Difference-in-Differences (DiD): "Test've" kontrol "arasındaki önceki/sonraki değişikliklerdeki fark. Anahtar varsayım, müdahale öncesi paralel eğilimlerdir.
Sentetik kontrol: Donör gruplarının ağırlıklı bir karışımı olarak "sentetik" kontrol oluşturuyoruz. Farklı trend dinamiklerine dayanıklıdır.
Bölge Süreksizliği (RDD): Etki atamak için eşik kuralı; eşiğin her iki tarafında karşılaştırma. Önemli: eşiğin "manipülasyonu" yok.
Enstrümantal değişkenler (IV): Değişken "tedaviyi" etkiler, ancak sonucu doğrudan etkilemez (tedavi yoluyla hariç). Gerekli: Aletin geçerliliği ve geçerliliği.
PSM/Eşleştirme: Benzer eş değişkenlerle test ve kontrol; Ön işleme olarak kullanışlıdır, ancak gizli karışıklıkları ortadan kaldırmaz.
Kesintili Zaman Serisi (ITS): Diğer şokların yokluğunda bir politika noktasında bir trend kırılmasının değerlendirilmesi.
5) Nedensel Grafikler ve "delikler" için kriterler
DAG (yönelimli asiklik grafik): Nedensel ilişkilerin görsel bir haritası. Hangi değişkenleri izleyeceğinizi seçmenize yardımcı olur.
Arka kapı kriteri: tüm arka yolları engelleriz (karıştırıcılar) - tarafsız bir etki tahmini alırız.
Ön kapı kriteri: Gizli karışıklıkları atlamak için tam olarak etki taşıyan bir aracı kullanıyoruz.
Çarpıştırıcıları ve sonucun soyundan gelenleri kontrol etmeyin: bu yer değiştirmeler yaratır.
Uygulama: önce alan uzmanlarıyla bir DAG çizin, ardından minimum kovaryans kümesini seçin.
6) Potansiyel sonuçlar ve etki tahminleri
ATE/ATT/ATC: tüm/tedavi edilen/kontrollerde ortalama etki.
CATE/HTE: segmente göre etki (ülke, kanal, risk sınıfı).
Yükseltme modellemesi: Modeli, olayın ilk olasılığına göre değil, müdahaleden beklenen artışla nesneleri sıralamayı öğretiriz.
7) Sık tuzaklar
Ters nedensellik: "indirimlerde bir artış ↔ talepte bir düşüş" - indirimler düşüşe tepki verir, tersi değil.
Eksik değişkenler: bildirilmemiş stoklar/mevsimsellik/bölgesel değişiklikler.
Hayatta kalanların yanlılığı: Sadece "kalanların" analizi.
Sızıntı: Eğitim/değerlendirmede gelecekteki bilgilerin kullanılması.
Metrikleri karıştırma: Iş etkisi yerine proxy metriklerini optimize etme (Goodhart).
Ortalamaya gerileme: Trend maskesine doğal geri dönüşler "etkiler".
8) Ürün, pazarlama ve riskte nedensellik
Pazarlama/kampanyalar: yükseltme hedefleme, farklılaştırılmış iletişim frekansları, nedensel LTV değerlendirmeleri, DiD/sentetik kontrol ROMI'leri.
Fiyatlandırma/promosyon: RDD (eşik kuralları), SKU/bölge örnekleme deneyleri.
Öneriler: Politika dışı değerlendirme (IPS/DR) ve haydutlar; Parazit muhasebesi.
Anti-dolandırıcılık/RG politikaları: nedensellik konusunda dikkatli olun - kilitler davranış ve verileri değiştirir; FPR ve temyizlerde yarı-deneyler ve korkuluklar kullanın.
Operasyon yönetimi: Bültenler ve olaylar için ITS; RCA için nedensel grafikler.
9) Analiz prosedürü: hipotezden çözüme
1. Soruyu nedensel olarak formüle edin: "X'in ufuk T'de Y'ye etkisi nedir?"
2. Bir DAG çizin: etki alanı ile koordine edin, karıştırıcıları/aracıları/çarpıştırıcıları işaretleyin.
3. Tasarım seçin: RCT/A-B, DiD, RDD, IV, sentetik kontrol, eşleştirme.
4. Metrikleri tanımlayın: ana (etki), korkuluklar (kalite/etik/işlemler), CATE segmentleri.
5. Veri hazırlayın: zaman içinde nokta,'önce "etkisi, takvim ve mevsimsellik eşdeğerdir.
6. Etkiyi değerlendirin: temel modeller + robast testleri (plasebo testleri, duyarlılık).
7. Sağlamlığı kontrol edin: alternatif özellikler, şüpheli eş değişkenlerin dışlanması, bir-dışarı çıkma.
8. Harekete geçirin: politika/sunum, SLO, sürüklenirken izleme ve yeniden test etme.
10) Robast uygulamaları ve doğrulama
Trend öncesi kontroller (DiD için): Test/kontrol eğilimleri müdahale öncesi benzerdir.
Plasebo/permütasyonlar: "Hayali tarihler" veya "hayali gruplar" - etki ortadan kalkmalıdır.
Duyarlılık analizi: Gizli bir karıştırıcının sonucu ne kadar bozacağı.
Bounds/pi-aralıkları: kısmen tanımlanabilir modeller - güven sınırları.
Çoklu segmentler için çoklu test-BH/Holm ayarlamaları.
Dış geçerlilik: Etkinin diğer pazarlara/kanallara taşınabilirliği (meta-analiz).
11) Etki Raporlama Metrikleri
Mutlak etki: Birimlerde Δ (pp, cu, dakika).
Bağıl etki: % taban çizgisine.
NNT/NNH: Bir sonuç/zarar elde etmek için kaç nesnenin işlenmesi gerekir.
Maliyet Etkinliği: etki/maliyet; Bütçelerin öncelikleri.
Uplift @ k/Qini/AUUC: hedefli müdahaleler için.
12) ML uygulamasında nedensellik
Nedensel Özellikler: Tahmin doğruluğunu her zaman iyileştirmez, ancak politikalara daha uygundur.
Nedensel Orman/Meta öğrenenler (T/X/S-Learner): CATE puanı ve kişisel yükselme.
Karşı olgusal adalet: nedensel yolları dikkate alan modellerin adaleti; "Adaletsiz" yolları tıkamak.
Do-op vs predict: "Tahmin've'ne yapılırsa" arasında ayrım yapın. İkincisi nedensel modeller/emülatörler gerektirir.
13) Nedensel Kontrol Listesi
- Soru bir müdahale/politika etkisi olarak çerçevelenmiştir
- DAG tarafından inşa edilmiş ve kabul edilmiştir; Seçilen minimum kovaryat kümesi (arka kapı)
- Seçilen tasarım (RCT/yarı deney) ve test edilen temel varsayımlar
- Nokta-in-time verileri; Dışlanan yüzler; takvim/mevsimsellik dikkate alınır
- Hesaplanan etki ve güven aralıkları; Robast kontrolleri yapıldı
- Etki heterojenliği (CATE) ve riskler (korkuluklar) değerlendirildi
- Değer sayısallaştırılmış (ROI, NNT/NNH, hata maliyeti)
- Uygulama ve izleme planı; Retest kriterleri
14) Mini sözlük
Arka kapı/Ön kapı: Etki tanımlaması için eş değişkenleri seçme kriterleri.
IV (enstrümantal değişken): "kol" değişen tedavi ancak doğrudan sonuç değil.
DiD: Gruplar arasındaki değişikliklerden önce/sonra farkı.
RDD: kural eşiğine yakın etki tahmini.
Sentetik Kontrol: Ağırlıklı bir donör kombinasyonu olarak kontrol.
HTE/CATE: Segmente göre heterojen/koşullu etki.
Yükselme: Bir olayın olasılığı değil, etkiden beklenen artış.
Sonuç
Korelasyonlar hipotezleri bulmaya yardımcı olur, nedensellik karar vermeye yardımcı olur. Bir DAG oluşturun, uygun bir tasarım seçin (deney veya yarı deney), varsayımları ve sağlamlığı test edin, heterojen etkileri ölçün ve sonuçları korkuluk ve izleme ile politikaya dönüştürün. Böylece analitik "bağlantılarla ilgili" olmaktan çıkar ve bir değişim motoru haline gelir.