استخبارات القرار
استخبارات القرار
Decision Intelligence (DI) هو نظام يحول البيانات إلى قرارات يمكن التحكم فيها وتأثير قابل للقياس. يدمج DI السببية والتنبؤ واقتصاد القرار وتصميم السياسات و MLOps/العمليات في دورة حياة واحدة.
1) إطار عمل DI: OODA/SSDL
مراقبة (إشارة): الأحداث الموحدة، الجودة/النضارة، التخلص والسياق.
Orient (Sense): التفسير: مجموعات، شرائح، رسوم بيانية سببية، ملامح المخاطر.
اتخاذ القرار: السياسة العامة (القواعد/النماذج/قطاع الطرق)، والنظر في القيود وتكلفة الأخطاء.
القانون: تنظيم الأعمال والقنوات والأفكار والأولويات.
تعلم: تقدير الأثر السببي، عتبات/سياسات/نماذج التحديث.
2) اقتصاديات الحلول
وظيفة القيمة: الإيرادات/التعويضات المحتفظ بها/الاحتفاظ/نوعية الخدمة.
تكلفة الخطأ: FP/FN في الأموال والمخاطر (RG/الامتثال/السمعة).
[
EV = p_{\text{uspekh} }\cdot Value - p_{\text{vred} }\cdot Harm - Cost
]
يُسمح باتخاذ إجراء إذا كانت «EV≥0» وحواجز الحماية طبيعية.
الرغبة في المخاطرة: القيود المفروضة على FPR، وتواتر التدخلات، وميزانية الضرر/الشكوى، وميزانية الخطأ.
3) السببية والتشخيص
عندما يكون التنبؤ كافياً: مخصصات منخفضة المخاطر، مرتبة حسب الاحتمالات.
عند الحاجة إلى السببية: ROMI، سياسة السعر/الحد، السلامة/الامتثال. استخدام التحكم الاصطناعي (أ/ب، دي دي، آر دي دي، رابعا) ؛ عند الاستهداف - الارتقاء و CATE.
الحلقة المعاكسة: توقع الأثر → → التأثير → تحويل الارتفاع/العتبات.
4) أنواع السياسات
القواعد (السياسة كرمز): حتمية وقابلة للتفسير ؛ قاعدة وآمنة بالفشل.
على أساس الدرجات: الاحتمالات/المعدل، الهستيريا، العتبات الحساسة من حيث التكلفة.
سياقي (قطاع الطرق): ε-greedy/Thompson لاختيار العروض/القنوات.
التسلسل (RL): استراتيجيات مقيدة متعددة الخطوات (RL آمنة).
المكونات: سلسلة تعاقبية - الأمن/الامتثال → الاقتصاد → UX.
5) بنية DI
Data: canonical events (UTC, versions), fichestor (online/offline parity), directory.
النماذج: السجل/الإصدارات، المعايرة، رصد الانجراف (PSI/KL)، PR- AUC/Recall@FPR≤x٪.
الدلالات والمقاييس: قاموس واحد لـ KPI/guardrails، نضارة SLO.
محرك السياسات: جداول القرارات، ABAC/السياقات، الهستيريا، حدود المعدل، الأولويات.
منسق العمل: تسليم مضمون، retrai، idempotency 'action _ id'، DLQ.
قابلية الرصد: تتبع 'الارتباط _ معرف'، قمع «signal→decision→action→outcome».
الأمان: RLS/CLS، إخفاء PII، الوصول وسجل القرار.
6) مقاييس DI
جودة الحلول
القرار الدقيق/الاستدعاء: بالنجاح الحقيقي للأعمال.
الأسف/فقدان الفرص: التخلف عن السياسة المثلى.
التغطية: نسبة الأشياء التي تلقت دعوى.
Latency p95: Signal→Decision/Decision→Action.
الإنصاف/الأضرار: فرق خطأ القطاع، الشكاوى، الاستئناف.
تأثير الأعمال
إجراءات ROMI/ROI، uplift @ k، Qini/AUUC.
صافي الفائدة: الأثر − التكلفة − الضرر.
الوقت إلى التأثير: الوقت من الإشارة إلى النتيجة القابلة للقياس.
7) تصميم القرار
1. تأطير السؤال على أنه تأثير: «ما هو مكسب الانتظار من X في Y فوق T ؟»
2. ارسم DAG، حدد المربكات/المصادمات.
3. اختر التصميم: A/B، شبه تجربة أو صافي التوقعات + درجة ما بعد.
4. تحديد الإجراءات والبدائل والقيود وحواجز الحماية.
5. تعيين وظيفة القيمة وميزانية المخاطر.
6. وصف السياسة في جدول القرار: شروط العمل → القنوات → → الهدوء.
7. تخطيط التقييم: مقاييس الأثر، والمدة، وأجزاء CATE.
8. حدد دليل الحوادث والقواعد الاحتياطية.
8) الهستيريا والتردد والاصطدامات
الهستيريا: تختلف عتبات المدخلات/المخرجات ؛ يمنع التدخلات من «الوميض».
التهدئة: توقف مؤقت بين جهات الاتصال/القيود على نفس الجسم.
تضارب السياسات: مصفوفة الأولويات ؛ «الأمن له الأسبقية»
الحصص/الحد الأقصى للمعدل: لكل قناة أو قطاع أو مستخدم ؛ التوزيع العادل.
9) مستويات الاستقلال الذاتي
1. مخصص: يقرر الشخص عدم وجود بيانات كافية.
2. المساعدة: يقدم النظام حلاً + شرحًا.
3. آلي: حلول ذاتية داخل حواجز الحماية.
4. التكيف: عتبات الضبط التلقائي/اختيار العروض (قطاع الطرق).
5. الحكم الذاتي الآمن: الحكم الذاتي بموجب القيود الرسمية والتدقيق.
10) الحلول في ظل عدم اليقين
تخطيط السيناريوهات: الأساسي/الإجهاد/المتطرف ؛ نطاقات الأثر.
القوة: استراتيجية قوية للأخطاء المحورية.
حدس برنامج بومدي: العمل بمعلومات غير كاملة ؛ تقدير تكلفة المعلومات (ما هي التجربة التي يتعين القيام بها).
التحديث البايزي: الجمع بين المعرفة التاريخية والبيانات الحالية.
11) الحوار ↔ النموذجي بشأن السياسات
وينتج النموذج معدل/توزيع للنتائج.
تأخذ السياسة في الاعتبار تكلفة الأخطاء والقيود والإنصاف.
خط التقسيم في سياسة عتبة القرار الصريحة مع سجل الإصدار.
مراجعة العتبة - بواسطة EV، وليس فقط بواسطة ROC/PR.
12) الوثائق والتحف
جواز سفر بوليصة (نموذج)
الرمز/النسخة والغرض ومؤشر الأداء الكوري للتأثير
الظروف/الملامح/النموذج، الهستيريا/التبريد
الإجراءات والقنوات والأولويات والاستثناءات المتبادلة
حواجز الحماية (FPR≤x في المائة، p95≤y الكمون، النمو الحقيقي/الامتثال)
النتيجة: تصميم الاختبار والمقاييس والمدة
مراجعة/شرح للمستخدم والمالكين
جدول القرار (مثال)
نظام تسجيل الحلول «من طرف إلى طرف»
'signal _ id' → 'decision _ id' → 'action _ id' → 'content _ id' (+ 'correlation _ id').
13) الحوكمة والامتثال
قاموس موحد للمقاييس وإصدار الصيغة.
لجنة السياسات: موظف المخاطر، المنتج، البيانات، الامتثال.
مراجعة القرارات: التفسيرات، أسباب الرفض، قنوات الاستئناف.
الأخلاقيات والإنصاف: رصد الأخطاء حسب المجموعات ؛ واستبعاد السمات المحمية من القواعد، حيثما يقتضي القانون ذلك.
14) الأخطاء المتكررة
تحسين مقاييس الوكيل بدلاً من تأثير الأعمال (Goodhart).
التنبؤات المربكة والسببية ؛ ROMI «عن طريق الارتباط».
غياب الهستيريا والتبريد → البريد العشوائي/» الوميض«
غير محسوبة تكلفة الأخطاء وضرر المستخدم.
تعديلات هادئة للعتبات/الصيغ بدون إصدارات وتغيير.
إجراءات من دون تقييم الأثر و «إغلاق الدورة».
15) سياسة DI/قائمة مراجعة النظام قبل الإصدار
- يُذكر الهدف باعتباره الأثر السببي ووظيفة القيمة وميزانية المخاطر
- رسم DAG ؛ تصميم التقييم (A/B/DiD/SC) والمقاييس المختارة
- يرد وصف للسياسة في جدول المقرر ؛ هستيريا/تهدئة/أولويات
- معايرة النماذج ؛ العتبات المستمدة من تكلفة الخطأ (EV)
- يكون منظم الأفعال غير اختصاصي ؛ signal→decision→action→outcome تمكين سجل
- تم تشكيل حواجز الحماية والتنبيهات ؛ الدفاتر والقواعد الاحتياطية جاهزة
- لوحات القيادة: توجيه القرارات، التأثير (رفع/عائد الاستثمار)، الضرر/الشكاوى، الإنصاف
- تم توثيق الإصدارات/المالكين/حقوق الوصول/الامتثال
المجموع
ذكاء القرار هو نظام وليس مجموعة من النماذج: بيانات ومقاييس موحدة → نظرة سببية واقتصادية للتأثير → سياسات صريحة وتنسيق آمن → تقييم صارم وتعلم مستمر. يقلل مثل هذا النظام من المخاطر، ويزيد من عائد الاستثمار، ويجعل القرارات قابلة للتكرار، ويمكن تفسيرها، ويمكن التحكم فيها.