اطلاعات تصمیم گیری
هوش تصمیم گیری
هوش تصمیم گیری (DI) یک رشته است که داده ها را به تصمیمات قابل کنترل و اثر قابل اندازه گیری تبدیل می کند. DI ادغام علیت، پیش بینی، اقتصاد تصمیم گیری، طراحی سیاست، و MLOps/عملیات را به یک چرخه عمر.
1) چارچوب DI: OODA/SSL
مشاهده (سیگنال): رویدادهای استاندارد، کیفیت/طراوت، dedup و زمینه.
شرق (حس): تفسیر: گروه ها، بخش ها، نمودارهای علی، پروفایل های ریسک.
تصمیم بگیرید: سیاست (قوانین/مدل ها/راهزنان)، در نظر گرفتن محدودیت ها و هزینه اشتباهات.
عمل: هماهنگ کردن اقدامات، کانال ها، idempointence، اولویت ها.
یادگیری: برآورد اثر علی، آستانه به روز رسانی/سیاست/مدل.
2) اقتصاد راه حل
تابع ارزش: درآمد/حفظ خسارت/حفظ/کیفیت خدمات.
هزینه خطا: FP/FN در پول و ریسک (RG/انطباق/شهرت).
[
EV = p_{\text{uspekh }\cdot ارزش - p_{\text{vred }\cdot آسیب - هزینه
]
اقدام مجاز است اگر «EV≥0» و گاردریل طبیعی است.
اشتهای ریسک: محدودیت در FPR، فرکانس مداخلات، بودجه آسیب/شکایت، بودجه خطا.
3) علیت و پیش آگهی
هنگامی که پیش بینی کافی است: تخصیص کم خطر، رتبه بندی بر اساس احتمالات.
هنگامی که علیت مورد نیاز است: ROMI، سیاست قیمت/محدودیت، ایمنی/انطباق. استفاده از A/B، DiD، RDD، IV، کنترل مصنوعی ؛ هنگامی که هدف قرار دادن - بالا بردن و CATE.
حلقه خلاف واقع: پیش بینی → اثر → اثر → تبدیل بالا بردن/آستانه.
4) انواع سیاست ها
قوانین (سیاست به عنوان کد): قطعی، قابل توضیح ؛ پایه و شکست امن.
مبتنی بر نمره: احتمالات/نرخ، هیسترزیس، آستانه حساس به هزینه.
Contextual (راهزنان): ε -greedy/Thompson برای انتخاب پیشنهادات/کانال ها.
استراتژی های متوالی (RL): استراتژی های چند مرحله ای محدود (RL امن).
اجزاء: آبشار - امنیت/انطباق → اقتصاد → UX.
5) معماری DI
داده ها: رویدادهای متعارف (UTC، نسخه ها)، fichestor (برابری آنلاین/آفلاین)، دایرکتوری.
مدل ها: رجیستری/نسخه ها، کالیبراسیون، نظارت بر رانش (PSI/KL)، PR- AUC/Recall@FPR≤x٪.
معانی و معیارها: یک فرهنگ لغت واحد KPI/guardrails، طراوت SLO.
موتور سیاست: جداول تصمیم گیری، ABAC/زمینه ها، هیسترزیس، محدودیت های نرخ، اولویت ها.
هماهنگ کننده عمل: تحویل تضمین شده، retrai، idempotency 'action _ id'، DLQ.
قابلیت مشاهده: ردیابی «correlation _ id»، قیف «سیگنال → تصمیم → نتیجه».
امنیت: RLS/CLS، PII ماسک، دسترسی و ورود به سیستم تصمیم گیری.
6) معیارهای DI
کیفیت راه حل ها
دقت تصمیم گیری/یادآوری: با موفقیت واقعی اقدامات.
پشیمانی/از دست دادن فرصت: عقب ماندن از سیاست مطلوب.
Coverage: نسبت اشیایی که یک عمل دریافت کرده اند.
Latency p95: سیگنال → تصمیم/تصمیم → عمل.
عدالت/مضرات: تفاوت خطای بخش، شکایات، تجدید نظر.
تاثیر کسب و کار
اقدامات ROMI/ROI، uplift @ k، Qini/AUUC.
سود خالص: اثر − هزینه − آسیب.
زمان به تاثیر: زمان از سیگنال به نتیجه قابل اندازه گیری.
7) طراحی تصمیم گیری
1. سوال را به عنوان یک اثر مطرح کنید: «سود حاصل از X در Y بیش از T چیست ؟»
2. یک DAG رسم کنید، confounders/colliders را تعریف کنید.
3. طراحی را انتخاب کنید: A/B، شبه آزمایش یا پیش بینی خالص + نمره پست سابق.
4. تعریف اقدام و جایگزین، محدودیت ها و guardrails.
5. تابع ارزش و بودجه ریسک را تنظیم کنید.
6. شرح سیاست در جدول تصمیم گیری: شرایط → عمل → کانال → cooldown.
7. برنامه ریزی ارزیابی: معیارهای اثر، مدت زمان، بخش CATE.
8. قوانین runbook و fallback را تعریف کنید.
8) هیسترزیس، فرکانس و برخورد
هیسترزیس: آستانه ورودی/خروجی متفاوت است. از «فلاش زدن» جلوگیری می کند.
Cooldown: مکث بین مخاطبین/محدودیت در همان شی.
درگیری های سیاست: ماتریس اولویت ؛ امنیت اولویت دارد ".
سهمیه/نرخ محدود: در هر کانال، بخش، کاربر ؛ توزیع عادلانه
9) سطح استقلال
1. Ad-hoc: شخص تصمیم می گیرد که داده های کافی وجود ندارد.
2. دستیار: سیستم یک راه حل + توضیح ارائه می دهد.
3. خودکار: راه حل های خودکار در داخل گارد محافظ.
4. تطبیقی: آستانه تنظیم خودکار/انتخاب پیشنهادات (راهزنان).
5. خودمختاری ایمن: خودمختاری تحت محدودیتهای رسمی و حسابرسی.
10) راه حل در شرایط عدم قطعیت
برنامه ریزی سناریو: پایه/استرس/شدید ؛ محدوده اثر.
استحکام: یک استراتژی که در برابر خطاهای پارامتری مقاوم است.
شهود POMDP: با اطلاعات ناقص عمل کنید ؛ ارزش هزینه اطلاعات (چه آزمایش به انجام).
به روز رسانی بیزی: ترکیب دانش تاریخی و داده های فعلی.
11) مدل ↔ سیاست گفتگو
این مدل نرخ/توزیع نتایج را تولید می کند.
این سیاست هزینه اشتباهات، محدودیت ها و عدالت را در نظر می گیرد.
خط پارتیشن در یک سیاست آستانه تصمیم صریح با ورود به سیستم نسخه است.
تجدید نظر آستانه - توسط EV، نه تنها توسط ROC/PR.
12) اسناد و مصنوعات
گذرنامه سیاست (قالب)
کد/نسخه، هدف و KPI اثر
شرایط/ویژگی ها/مدل، هیسترزیس/خنک کننده
اقدامات و کانال ها، اولویت ها و استثنائات متقابل
گاردریل (FPR≤x٪، p95≤y تاخیر، RG/انطباق)
نمره: طراحی آزمون، معیارها، مدت زمان
حسابرسی/توضیح به کاربر، صاحبان
جدول تصمیم گیری (مثال)
طرح ورود به سیستم راه حل «پایان به پایان»
'signal _ id' → 'decision _ id' → 'action _ id' → 'outcome _ id' (+ 'correlation _ id').
13) حکومت و انطباق
Unified Dictionary of Metrics and Formula Versioning (دیکشنری یکپارچه متریک و نسخه بندی فرمول)
کمیته سیاست: افسر ریسک، محصول، داده ها، انطباق.
حسابرسی تصمیمات: توضیحات، دلایل رد، کانال های تجدید نظر.
اخلاق و عدالت: نظارت بر اشتباهات توسط گروه ؛ محرومیت از ویژگی های محافظت شده از قوانین، که در آن توسط قانون مورد نیاز است.
14) خطاهای مکرر
بهینه سازی معیارهای پروکسی به جای اثر کسب و کار (Goodhart).
پیش بینی های غلط و علیت ؛ ROMI «با همبستگی».
عدم وجود هیسترزیس و cooldowns → هرزنامه/» چشمک زدن«
محاسبه نشده برای هزینه اشتباهات و آسیب کاربر.
ویرایش آرام آستانه/فرمول بدون نسخه و changelog.
اقدامات بدون اثر ارزیابی و «بسته شدن چرخه».
15) قبل از انتشار سیاست DI/چک لیست سیستم
- هدف به عنوان اثر علی بیان می شود، تابع ارزش و بودجه ریسک داده می شود
- DAG کشیده شده است ؛ طراحی ارزیابی (A/B/DiD/SC) و معیارهای انتخاب شده
- سیاست در جدول تصمیم گیری شرح داده شده است ؛ هیسترزیس/خنک کننده/اولویت ها
- مدل ها کالیبره می شوند ؛ آستانه های حاصل از هزینه خطا (EV)
- هماهنگ کننده اقدامات idemotent است; سیگنال → تصمیم → عمل → نتیجه ورود فعال
- Guardrails و هشدارها پیکربندی شده اند ؛ قوانین Runbooks و Fallback آماده هستند
- داشبورد: قیف تصمیم گیری، اثر (بالا بردن/ROI)، آسیب/شکایت، عدالت
- نسخه/صاحبان/حقوق دسترسی/انطباق مستند شده است
مجموع
هوش تصمیم گیری یک سیستم است، نه مجموعه ای از مدل ها: داده ها و معیارهای یکنواخت → یک دیدگاه علی و اقتصادی از اثر → سیاست های صریح و ارکستراسیون ایمن → ارزیابی دقیق و یادگیری مداوم. چنین سیستمی ریسک را کاهش می دهد، ROI را افزایش می دهد و تصمیمات را قابل تجدید، قابل توضیح و قابل مدیریت می کند.