ارتباط و علت و معلول
ارتباط و علت و معلول
همبستگی تغییرات مشترک در متغیرها را نشان می دهد. علیت به این سوال پاسخ می دهد: اگر ما مداخله کنیم چه اتفاقی می افتد ؟ در تجزیه و تحلیل، محصول و مدیریت ریسک، ارزش به ارمغان می آورد دقیقا اثر علی: آن را اجازه می دهد تا شما را به ارزیابی افزایش از یک راه حل، و نه فقط یک ارتباط است.
1) مفاهیم اساسی
همبستگی (ارتباط): رابطه آماری بدون تفسیر «چرا». "ممکن است ناشی از علت مشترک، علت معکوس یا شانس باشد.
اثر درمان: تفاوت مورد انتظار بین جهان «با مداخله» و «بدون مداخله».
مشاهده خلاف واقع: مشاهده غیر ممکن «چه اتفاقی می افتد به همان شی بدون تاثیر».
Confounder: یک متغیر که بر علت و نتیجه تاثیر می گذارد، یک رابطه نادرست ایجاد می کند.
Collider: یک متغیر است که توسط هر دو علت و نتیجه تحت تاثیر قرار می گیرد ؛ وضعيت برخورد دهنده ارتباط را مختل ميکنه.
پارادوکس سیمپسون: جهت اثر پس از در نظر گرفتن متغیر/بخش پنهان تغییر میکند.
2) هنگامی که همبستگی کافی است و زمانی که نیست
تجزیه و تحلیل توصیفی، نظارت، EDA: همبستگی/رتبه/heatmap → تشخیص فرضیه ها و خطرات.
تصمیم گیری و ارزیابی تاثیر: روش علی (آزمایش یا شبه آزمایش) مورد نیاز است.
مدل های پیش بینی: همبستگی ها مفید هستند، اما برای ROI/سیاست ها - حرکت به برآوردهای علی یا مدل های بالا بردن.
3) آزمایش: استاندارد طلا
آزمون A/B (تصادفی): از بین بردن مخدوش، گروه قابل مقایسه است.
Guardrails: مدت زمان ≥ یک چرخه رفتار، قرار گرفتن در معرض پایدار، کنترل فصلی و دخالت (سرریز).
معیارها: اثر، فواصل اطمینان، MDE/قدرت، ناهمگونی اثر توسط بخش (اثر درمان ناهمگن).
تمرین: انتشار قناری، مرحله بندی مرحله ای، کنترل CUPED/کوواریته برای کاهش واریانس.
4) اگر آزمایش امکان پذیر نیست: شبه آزمایش
تفاوت در تفاوت (DiD): تفاوت در قبل/بعد از تغییرات بین «آزمون» و «کنترل». فرض اصلی روندهای موازی قبل از مداخله است.
کنترل مصنوعی: ما کنترل «مصنوعی» را به عنوان یک مخلوط وزنی از گروه های اهدا کننده ایجاد می کنیم. مقاوم در برابر دینامیک های مختلف روند.
ناپیوستگی منطقه (RDD): قانون آستانه برای تعیین تاثیر ؛ مقایسه در هر دو طرف آستانه. مهم: هیچ «دستکاری» آستانه.
متغیرهای ابزاری (IV): متغیر بر «درمان» تأثیر می گذارد اما به طور مستقیم بر نتیجه تأثیر نمی گذارد (به جز از طریق درمان). مورد نیاز: ارتباط و اعتبار ابزار.
PSM/تطبیق: تست و کنترل با متغیرهای مشابه ؛ به عنوان پیش پردازش مفید است، اما confounders پنهان را از بین نمی برد.
سری زمانی منقطع (ITS): ارزیابی شکست روند در یک نقطه سیاسی در غیاب شوکهای دیگر.
5) نمودارهای علیت و معیارهای «سوراخ»
DAG) oriented acyclic graph): یک نقشه بصری از روابط علی. به شما کمک می کند تا انتخاب کنید کدام متغیرها برای نظارت.
معیار پشت درب: ما تمام مسیرهای عقب را مسدود می کنیم (confounders) - ما یک برآورد اثر بی طرفانه دریافت می کنیم.
معیار جلو درب: ما از یک واسطه استفاده می کنیم که به طور کامل نفوذ را برای دور زدن confounders پنهان می کند.
برخورد دهنده ها و فرزندان نتیجه را کنترل نکنید: این باعث جابجایی می شود.
تمرین: ابتدا یک DAG با کارشناسان دامنه بکشید، سپس حداقل مجموعه ای از کوواریته ها را انتخاب کنید.
6) نتایج بالقوه و برآورد اثر
ATE/ATT/ATC: میانگین اثر در تمام/درمان/کنترل.
CATE/HTE: اثر بر اساس بخش (کشور، کانال، کلاس ریسک).
مدل سازی بالا بردن: ما مدل را برای رتبه بندی اشیاء با افزایش مورد انتظار از مداخله، و نه با احتمال اولیه رویداد، آموزش می دهیم.
7) تله های مکرر
علیت معکوس: «افزایش تخفیف ↔ کاهش تقاضا» - تخفیف ها به سقوط واکنش نشان می دهند و نه برعکس.
متغیرهای گمشده: سهام گزارش نشده/فصلی/تغییرات منطقه ای.
تعصب بازماندگان: تجزیه و تحلیل «باقی مانده» تنها.
نشت: استفاده از اطلاعات آینده در آموزش/ارزیابی.
مخلوط کردن معیارها: بهینه سازی معیارهای پروکسی به جای اثر کسب و کار (Goodhart).
بازگشت به میانگین: بازگشت طبیعی به ماسک روند «اثرات».
8) علیت در محصول، بازاریابی و ریسک
بازاریابی/کمپین ها: هدف قرار دادن بالا، فرکانس تماس متمایز، ارزیابی LTV علی، DiD/کنترل مصنوعی ROMIs.
قیمت گذاری/ارتقاء: RDD (قوانین آستانه)، آزمایش نمونه گیری SKU/منطقه.
توصیه ها: ارزیابی خارج از سیاست (IPS/DR) و راهزنان ؛ حسابداری برای مداخله
سیاست های ضد تقلب/RG: مراقب علیت - قفل تغییر رفتار و داده ها ؛ استفاده از شبه آزمایش و guardrails در FPR و تجدید نظر.
مدیریت عملیات: ITS برای انتشار و حوادث ؛ نمودارهای علی برای RCA.
9) روش تجزیه و تحلیل: از فرضیه تا راه حل
1. سوال را به عنوان علی مطرح کنید: «اثر X بر Y در افق T چیست ؟»
2. قرعه کشی DAG: هماهنگی با دامنه، علامت confounders/mediators/colliders.
3. طراحی را انتخاب کنید: RCT/A-B، DiD، RDD، IV، کنترل مصنوعی، تطبیق.
4. تعریف معیارها: اصلی (اثر)، guardrails (کیفیت/اخلاق/عملیات)، بخش CATE.
5. آماده سازی داده ها: نقطه در زمان، covariates «قبل» تاثیر، تقویم و فصلی.
6. ارزیابی اثر: مدل های پایه + آزمون robast (آزمون پلاسبو، حساسیت).
7. استحکام را بررسی کنید: مشخصات جایگزین، حذف متغیرهای مشکوک، ترک یک طرفه.
8. قرار داده و به عمل: سیاست/برنامه ریزی، SLO، نظارت و تست مجدد زمانی که دست خوش پیشامد میشه.
10) شیوه های Robast و تأیید
چک های قبل از روند (برای DiD): روند آزمون/کنترل قبل از مداخله مشابه است.
پلاسبو/جایگشت: «تاریخ ساختگی» یا «گروه ساختگی» - اثر باید ناپدید می شوند.
تجزیه و تحلیل حساسیت: چقدر یک مخدوش کننده پنهان نتیجه را تحریف می کند.
مرزها/بازههای پی: مدلهای نیمه قابل شناسایی → مرزهای اطمینان
تست های متعدد-BH/تنظیمات هولم برای بخش های مختلف.
اعتبار خارجی: قابلیت انتقال اثر به سایر بازارها/کانال ها (متاآنالیز).
11) معیارهای گزارش اثر
اثر مطلق: Δ در واحد (PP، CU، دقیقه).
اثر نسبی:٪ تا پایه.
NNT/NNH: چگونه بسیاری از اشیاء نیاز به پردازش برای رسیدن به یک نتیجه/آسیب.
هزینه اثربخشی: اثر/هزینه ؛ اولویت های بودجه
Uplift @ k/Qini/AUUC: برای مداخلات هدفمند.
12) علیت در عمل ML
ویژگی های علی: همیشه دقت پیش بینی را بهبود نمی بخشد، اما برای سیاست ها مناسب تر است.
جنگل علی/فرا آموزان (T/X/S-Learner): نمره CATE و ارتقاء شخصی.
انصاف غیرحقیقی: انصاف مدلها با در نظر گرفتن مسیرهای علّی ؛ مسدود کردن مسیرهای «ناعادلانه»
Do-op در مقابل پیش بینی: تمایز بین «پیش بینی» و «چه کاری انجام می شود». "دوم نیاز به مدل های علی/شبیه ساز.
13) چک لیست علی
- این سوال به عنوان یک اثر مداخله/سیاست طراحی شده است
- ساخته شده و توافق شده توسط DAG ؛ حداقل مجموعه ای از covariates (پشت درب) انتخاب شده است
- طراحی انتخاب شده (RCT/شبه آزمایش) و مفروضات کلیدی تست شده
- داده های نقطه در زمان ؛ چهرههای محروم ؛ تقویم/فصلی در نظر گرفته شده است
- اثر و فاصله اطمینان محاسبه; بررسی های دقیق انجام شد
- ناهمگونی اثر (CATE) و خطرات (guardrails) ارزیابی شده است
- ارزش دیجیتالی (ROI، NNT/NNH، هزینه خطا)
- طرح اجرا و نظارت ؛ معیارهای مجدد
14) واژه نامه کوتاه
تفاوت قبل و بعد از تغییرات بین گروه ها
Back-door/Front-door: معیارهای انتخاب متغیرهای کوواریته برای شناسایی اثر.
IV (متغیر ابزاری): «اهرم» تغییر درمان، اما نه نتیجه به طور مستقیم.
RDD: برآورد اثر در نزدیکی آستانه قانون.
کنترل مصنوعی: کنترل به عنوان یک ترکیب وزنی از اهدا کنندگان.
HTE/CATE: اثر ناهمگن/مشروط توسط بخش.
بالا بردن: افزایش مورد انتظار از تاثیر، نه احتمال یک رویداد.
نتیجه گیری
همبستگی به یافتن فرضیه ها کمک می کند، علیت به تصمیم گیری کمک می کند. ساخت یک DAG، انتخاب یک طراحی مناسب (آزمایش یا شبه آزمایش)، تست مفروضات و استحکام، اندازه گیری اثرات ناهمگن، و ترجمه نتیجه گیری به سیاست با guardrails و نظارت. بنابراین تجزیه و تحلیل متوقف می شود «در مورد اتصالات» و موتور تغییر می شود.