Korelasyon ve Sebep ve Sonuç

Korelasyon, değişkenlerdeki ortak değişiklikleri yakalar. Nedensellik şu soruyu yanıtlar: Müdahale edersek ne olur? Analitikte, ürün ve risk yönetiminde, değer tam olarak nedensel etkiyi getirir: sadece bir ilişkiden değil, bir çözümden elde edilen artışı değerlendirmenizi sağlar.

1) Temel kavramlar

Korelasyon (ilişki): "Neden'in yorumlanmadan istatistiksel ilişki. Ortak neden, ters nedensellik veya şanstan kaynaklanabilir.
Tedavi etkisi: Dünya arasında "müdahale ile've" müdahale olmadan "beklenen fark.
Karşı olgusal: imkansız gözlem "aynı nesneye etkisi olmadan ne olurdu".
Confounder: hem nedeni hem de sonucu etkileyen bir değişken - yanlış bir ilişki yaratır.
Çarpıştırıcı: Hem neden hem de sonuçtan etkilenen bir değişken; Çarpıştırıcı durumu ilişkiyi bozar.
Simpson paradoksu: etkinin yönü, gizli değişken/segment dikkate alındıktan sonra değişir.

2) Korelasyon yeterli olduğunda ve olmadığında

Tanımlayıcı analitik, izleme, EDA: Korelasyonlar/dereceler/ısı haritası - hipotezleri ve riskleri tespit eder.
Karar verme ve etki değerlendirmesi: Nedensel yöntemler (deneyler veya yarı deneyler) gereklidir.
Tahmin modelleri: Korelasyonlar yararlıdır, ancak YG/politikalar için - nedensel tahminlere veya yükseltme modellerine geçin.

3) Deneyler: Altın Standart

A/B testleri (randomizasyon): karışıklığı ortadan kaldırır, grupları karşılaştırılabilir hale getirir.
Korkuluklar: Süre ≥ bir davranış döngüsü, istikrarlı maruz kalma, mevsimsellik ve girişim (yayılma) kontrolü.
Metrikler: etki, güven aralıkları, MDE/güç, segmente göre etkinin heterojenliği (Heterojen Tedavi Etkisi).
Uygulama: kanarya salımları, aşamalı sunum, varyansı azaltmak için CUPED/kovaryat kontrolü.

4) Deney mümkün değilse: yarı-deneyler

Difference-in-Differences (DiD): "Test've" kontrol "arasındaki önceki/sonraki değişikliklerdeki fark. Anahtar varsayım, müdahale öncesi paralel eğilimlerdir.
Sentetik kontrol: Donör gruplarının ağırlıklı bir karışımı olarak "sentetik" kontrol oluşturuyoruz. Farklı trend dinamiklerine dayanıklıdır.
Bölge Süreksizliği (RDD): Etki atamak için eşik kuralı; eşiğin her iki tarafında karşılaştırma. Önemli: eşiğin "manipülasyonu" yok.
Enstrümantal değişkenler (IV): Değişken "tedaviyi" etkiler, ancak sonucu doğrudan etkilemez (tedavi yoluyla hariç). Gerekli: Aletin geçerliliği ve geçerliliği.
PSM/Eşleştirme: Benzer eş değişkenlerle test ve kontrol; Ön işleme olarak kullanışlıdır, ancak gizli karışıklıkları ortadan kaldırmaz.
Kesintili Zaman Serisi (ITS): Diğer şokların yokluğunda bir politika noktasında bir trend kırılmasının değerlendirilmesi.

5) Nedensel Grafikler ve "delikler" için kriterler

DAG (yönelimli asiklik grafik): Nedensel ilişkilerin görsel bir haritası. Hangi değişkenleri izleyeceğinizi seçmenize yardımcı olur.
Arka kapı kriteri: tüm arka yolları engelleriz (karıştırıcılar) - tarafsız bir etki tahmini alırız.
Ön kapı kriteri: Gizli karışıklıkları atlamak için tam olarak etki taşıyan bir aracı kullanıyoruz.
Çarpıştırıcıları ve sonucun soyundan gelenleri kontrol etmeyin: bu yer değiştirmeler yaratır.
Uygulama: önce alan uzmanlarıyla bir DAG çizin, ardından minimum kovaryans kümesini seçin.

6) Potansiyel sonuçlar ve etki tahminleri

ATE/ATT/ATC: tüm/tedavi edilen/kontrollerde ortalama etki.
CATE/HTE: segmente göre etki (ülke, kanal, risk sınıfı).
Yükseltme modellemesi: Modeli, olayın ilk olasılığına göre değil, müdahaleden beklenen artışla nesneleri sıralamayı öğretiriz.

7) Sık tuzaklar

Ters nedensellik: "indirimlerde bir artış ↔ talepte bir düşüş" - indirimler düşüşe tepki verir, tersi değil.
Eksik değişkenler: bildirilmemiş stoklar/mevsimsellik/bölgesel değişiklikler.
Hayatta kalanların yanlılığı: Sadece "kalanların" analizi.
Sızıntı: Eğitim/değerlendirmede gelecekteki bilgilerin kullanılması.
Metrikleri karıştırma: Iş etkisi yerine proxy metriklerini optimize etme (Goodhart).
Ortalamaya gerileme: Trend maskesine doğal geri dönüşler "etkiler".

8) Ürün, pazarlama ve riskte nedensellik

Pazarlama/kampanyalar: yükseltme hedefleme, farklılaştırılmış iletişim frekansları, nedensel LTV değerlendirmeleri, DiD/sentetik kontrol ROMI'leri.
Fiyatlandırma/promosyon: RDD (eşik kuralları), SKU/bölge örnekleme deneyleri.
Öneriler: Politika dışı değerlendirme (IPS/DR) ve haydutlar; Parazit muhasebesi.
Anti-dolandırıcılık/RG politikaları: nedensellik konusunda dikkatli olun - kilitler davranış ve verileri değiştirir; FPR ve temyizlerde yarı-deneyler ve korkuluklar kullanın.
Operasyon yönetimi: Bültenler ve olaylar için ITS; RCA için nedensel grafikler.

9) Analiz prosedürü: hipotezden çözüme

1. Soruyu nedensel olarak formüle edin: "X'in ufuk T'de Y'ye etkisi nedir?"

2. Bir DAG çizin: etki alanı ile koordine edin, karıştırıcıları/aracıları/çarpıştırıcıları işaretleyin.
3. Tasarım seçin: RCT/A-B, DiD, RDD, IV, sentetik kontrol, eşleştirme.
4. Metrikleri tanımlayın: ana (etki), korkuluklar (kalite/etik/işlemler), CATE segmentleri.
5. Veri hazırlayın: zaman içinde nokta,'önce "etkisi, takvim ve mevsimsellik eşdeğerdir.
6. Etkiyi değerlendirin: temel modeller + robast testleri (plasebo testleri, duyarlılık).
7. Sağlamlığı kontrol edin: alternatif özellikler, şüpheli eş değişkenlerin dışlanması, bir-dışarı çıkma.
8. Harekete geçirin: politika/sunum, SLO, sürüklenirken izleme ve yeniden test etme.

10) Robast uygulamaları ve doğrulama

Trend öncesi kontroller (DiD için): Test/kontrol eğilimleri müdahale öncesi benzerdir.
Plasebo/permütasyonlar: "Hayali tarihler" veya "hayali gruplar" - etki ortadan kalkmalıdır.
Duyarlılık analizi: Gizli bir karıştırıcının sonucu ne kadar bozacağı.
Bounds/pi-aralıkları: kısmen tanımlanabilir modeller - güven sınırları.
Çoklu segmentler için çoklu test-BH/Holm ayarlamaları.
Dış geçerlilik: Etkinin diğer pazarlara/kanallara taşınabilirliği (meta-analiz).

11) Etki Raporlama Metrikleri

Mutlak etki: Birimlerde Δ (pp, cu, dakika).
Bağıl etki: % taban çizgisine.
NNT/NNH: Bir sonuç/zarar elde etmek için kaç nesnenin işlenmesi gerekir.
Maliyet Etkinliği: etki/maliyet; Bütçelerin öncelikleri.
Uplift @ k/Qini/AUUC: hedefli müdahaleler için.

12) ML uygulamasında nedensellik

Nedensel Özellikler: Tahmin doğruluğunu her zaman iyileştirmez, ancak politikalara daha uygundur.
Nedensel Orman/Meta öğrenenler (T/X/S-Learner): CATE puanı ve kişisel yükselme.
Karşı olgusal adalet: nedensel yolları dikkate alan modellerin adaleti; "Adaletsiz" yolları tıkamak.
Do-op vs predict: "Tahmin've'ne yapılırsa" arasında ayrım yapın. İkincisi nedensel modeller/emülatörler gerektirir.

13) Nedensel Kontrol Listesi

Soru bir müdahale/politika etkisi olarak çerçevelenmiştir
DAG tarafından inşa edilmiş ve kabul edilmiştir; Seçilen minimum kovaryat kümesi (arka kapı)
Seçilen tasarım (RCT/yarı deney) ve test edilen temel varsayımlar
Nokta-in-time verileri; Dışlanan yüzler; takvim/mevsimsellik dikkate alınır
Hesaplanan etki ve güven aralıkları; Robast kontrolleri yapıldı
Etki heterojenliği (CATE) ve riskler (korkuluklar) değerlendirildi
Değer sayısallaştırılmış (ROI, NNT/NNH, hata maliyeti)
Uygulama ve izleme planı; Retest kriterleri

14) Mini sözlük

Arka kapı/Ön kapı: Etki tanımlaması için eş değişkenleri seçme kriterleri.
IV (enstrümantal değişken): "kol" değişen tedavi ancak doğrudan sonuç değil.
DiD: Gruplar arasındaki değişikliklerden önce/sonra farkı.
RDD: kural eşiğine yakın etki tahmini.
Sentetik Kontrol: Ağırlıklı bir donör kombinasyonu olarak kontrol.
HTE/CATE: Segmente göre heterojen/koşullu etki.
Yükselme: Bir olayın olasılığı değil, etkiden beklenen artış.

Toplam

Korelasyonlar hipotezleri bulmaya yardımcı olur, nedensellik karar vermeye yardımcı olur. Bir DAG oluşturun, uygun bir tasarım seçin (deney veya yarı deney), varsayımları ve sağlamlığı test edin, heterojen etkileri ölçün ve sonuçları korkuluk ve izleme ile politikaya dönüştürün. Böylece analitik "bağlantılarla ilgili" olmaktan çıkar ve bir değişim motoru haline gelir.

Korelasyon ve Sebep ve Sonuç

Korelasyon ve Sebep ve Sonuç

Toplam

Bizimle iletişime geçin

Hızlı iletişim

Video yakında güncellenecek

Şu anda projelerle çok meşgulüz