استخبارات القرار

Decision Intelligence (DI) هو نظام يحول البيانات إلى قرارات يمكن التحكم فيها وتأثير قابل للقياس. يدمج DI السببية والتنبؤ واقتصاد القرار وتصميم السياسات و MLOps/العمليات في دورة حياة واحدة.

1) إطار عمل DI: OODA/SSDL

مراقبة (إشارة): الأحداث الموحدة، الجودة/النضارة، التخلص والسياق.
Orient (Sense): التفسير: مجموعات، شرائح، رسوم بيانية سببية، ملامح المخاطر.
اتخاذ القرار: السياسة العامة (القواعد/النماذج/قطاع الطرق)، والنظر في القيود وتكلفة الأخطاء.
القانون: تنظيم الأعمال والقنوات والأفكار والأولويات.
تعلم: تقدير الأثر السببي، عتبات/سياسات/نماذج التحديث.

2) اقتصاديات الحلول

وظيفة القيمة: الإيرادات/التعويضات المحتفظ بها/الاحتفاظ/نوعية الخدمة.
تكلفة الخطأ: FP/FN في الأموال والمخاطر (RG/الامتثال/السمعة).

القيمة المتوقعة (EV):

[
EV = p_{\text{uspekh} }\cdot Value - p_{\text{vred} }\cdot Harm - Cost
]

يُسمح باتخاذ إجراء إذا كانت «EV≥0» وحواجز الحماية طبيعية.
الرغبة في المخاطرة: القيود المفروضة على FPR، وتواتر التدخلات، وميزانية الضرر/الشكوى، وميزانية الخطأ.

3) السببية والتشخيص

عندما يكون التنبؤ كافياً: مخصصات منخفضة المخاطر، مرتبة حسب الاحتمالات.
عند الحاجة إلى السببية: ROMI، سياسة السعر/الحد، السلامة/الامتثال. استخدام التحكم الاصطناعي (أ/ب، دي دي، آر دي دي، رابعا) ؛ عند الاستهداف - الارتقاء و CATE.
الحلقة المعاكسة: توقع الأثر → → التأثير → تحويل الارتفاع/العتبات.

4) أنواع السياسات

القواعد (السياسة كرمز): حتمية وقابلة للتفسير ؛ قاعدة وآمنة بالفشل.
على أساس الدرجات: الاحتمالات/المعدل، الهستيريا، العتبات الحساسة من حيث التكلفة.
سياقي (قطاع الطرق): ε-greedy/Thompson لاختيار العروض/القنوات.
التسلسل (RL): استراتيجيات مقيدة متعددة الخطوات (RL آمنة).
المكونات: سلسلة تعاقبية - الأمن/الامتثال → الاقتصاد → UX.

5) بنية DI

Data: canonical events (UTC, versions), fichestor (online/offline parity), directory.
النماذج: السجل/الإصدارات، المعايرة، رصد الانجراف (PSI/KL)، PR- AUC/Recall@FPR≤x٪.
الدلالات والمقاييس: قاموس واحد لـ KPI/guardrails، نضارة SLO.
محرك السياسات: جداول القرارات، ABAC/السياقات، الهستيريا، حدود المعدل، الأولويات.
منسق العمل: تسليم مضمون، retrai، idempotency 'action _ id'، DLQ.
قابلية الرصد: تتبع 'الارتباط _ معرف'، قمع «signal→decision→action→outcome».
الأمان: RLS/CLS، إخفاء PII، الوصول وسجل القرار.

6) مقاييس DI

جودة الحلول

القرار الدقيق/الاستدعاء: بالنجاح الحقيقي للأعمال.
الأسف/فقدان الفرص: التخلف عن السياسة المثلى.
التغطية: نسبة الأشياء التي تلقت دعوى.
Latency p95: Signal→Decision/Decision→Action.
الإنصاف/الأضرار: فرق خطأ القطاع، الشكاوى، الاستئناف.

تأثير الأعمال

إجراءات ROMI/ROI، uplift @ k، Qini/AUUC.
صافي الفائدة: الأثر − التكلفة − الضرر.
الوقت إلى التأثير: الوقت من الإشارة إلى النتيجة القابلة للقياس.

7) تصميم القرار

1. تأطير السؤال على أنه تأثير: «ما هو مكسب الانتظار من X في Y فوق T ؟»

2. ارسم DAG، حدد المربكات/المصادمات.
3. اختر التصميم: A/B، شبه تجربة أو صافي التوقعات + درجة ما بعد.
4. تحديد الإجراءات والبدائل والقيود وحواجز الحماية.
5. تعيين وظيفة القيمة وميزانية المخاطر.
6. وصف السياسة في جدول القرار: شروط العمل → القنوات → → الهدوء.
7. تخطيط التقييم: مقاييس الأثر، والمدة، وأجزاء CATE.
8. حدد دليل الحوادث والقواعد الاحتياطية.

8) الهستيريا والتردد والاصطدامات

الهستيريا: تختلف عتبات المدخلات/المخرجات ؛ يمنع التدخلات من «الوميض».
التهدئة: توقف مؤقت بين جهات الاتصال/القيود على نفس الجسم.

تضارب السياسات: مصفوفة الأولويات ؛ «الأمن له الأسبقية»

الحصص/الحد الأقصى للمعدل: لكل قناة أو قطاع أو مستخدم ؛ التوزيع العادل.

9) مستويات الاستقلال الذاتي

1. مخصص: يقرر الشخص عدم وجود بيانات كافية.
2. المساعدة: يقدم النظام حلاً + شرحًا.
3. آلي: حلول ذاتية داخل حواجز الحماية.
4. التكيف: عتبات الضبط التلقائي/اختيار العروض (قطاع الطرق).
5. الحكم الذاتي الآمن: الحكم الذاتي بموجب القيود الرسمية والتدقيق.

10) الحلول في ظل عدم اليقين

تخطيط السيناريوهات: الأساسي/الإجهاد/المتطرف ؛ نطاقات الأثر.
القوة: استراتيجية قوية للأخطاء المحورية.
حدس برنامج بومدي: العمل بمعلومات غير كاملة ؛ تقدير تكلفة المعلومات (ما هي التجربة التي يتعين القيام بها).
التحديث البايزي: الجمع بين المعرفة التاريخية والبيانات الحالية.

11) الحوار ↔ النموذجي بشأن السياسات

وينتج النموذج معدل/توزيع للنتائج.
تأخذ السياسة في الاعتبار تكلفة الأخطاء والقيود والإنصاف.
خط التقسيم في سياسة عتبة القرار الصريحة مع سجل الإصدار.
مراجعة العتبة - بواسطة EV، وليس فقط بواسطة ROC/PR.

12) الوثائق والتحف

جواز سفر بوليصة (نموذج)

الرمز/النسخة والغرض ومؤشر الأداء الكوري للتأثير

الظروف/الملامح/النموذج، الهستيريا/التبريد

الإجراءات والقنوات والأولويات والاستثناءات المتبادلة

حواجز الحماية (FPR≤x في المائة، p95≤y الكمون، النمو الحقيقي/الامتثال)

النتيجة: تصميم الاختبار والمقاييس والمدة

مراجعة/شرح للمستخدم والمالكين

جدول القرار (مثال)

حالة	السياق	العمل	تهدئة	حواجز الحماية
'churn _ uplift ≥ 0. 08 '&' value _ q ≥ 0. 8`	الاحتفاظ	عرض L	7 د	ROMI≥0، الكاب = 1
'rg _ risk ≥ τ' & 'night'	RG	وقفة + نصيحة	1 د	FPR≤1٪
'fraud_score∈[τ1,τ2]'	الدفع	فحص يدوي	—	SLA 2h

نظام تسجيل الحلول «من طرف إلى طرف»

'signal _ id' → 'decision _ id' → 'action _ id' → 'content _ id' (+ 'correlation _ id').

13) الحوكمة والامتثال

قاموس موحد للمقاييس وإصدار الصيغة.
لجنة السياسات: موظف المخاطر، المنتج، البيانات، الامتثال.
مراجعة القرارات: التفسيرات، أسباب الرفض، قنوات الاستئناف.
الأخلاقيات والإنصاف: رصد الأخطاء حسب المجموعات ؛ واستبعاد السمات المحمية من القواعد، حيثما يقتضي القانون ذلك.

14) الأخطاء المتكررة

تحسين مقاييس الوكيل بدلاً من تأثير الأعمال (Goodhart).
التنبؤات المربكة والسببية ؛ ROMI «عن طريق الارتباط».

غياب الهستيريا والتبريد → البريد العشوائي/» الوميض«

غير محسوبة تكلفة الأخطاء وضرر المستخدم.
تعديلات هادئة للعتبات/الصيغ بدون إصدارات وتغيير.
إجراءات من دون تقييم الأثر و «إغلاق الدورة».

15) سياسة DI/قائمة مراجعة النظام قبل الإصدار

يُذكر الهدف باعتباره الأثر السببي ووظيفة القيمة وميزانية المخاطر
رسم DAG ؛ تصميم التقييم (A/B/DiD/SC) والمقاييس المختارة
يرد وصف للسياسة في جدول المقرر ؛ هستيريا/تهدئة/أولويات
معايرة النماذج ؛ العتبات المستمدة من تكلفة الخطأ (EV)
يكون منظم الأفعال غير اختصاصي ؛ signal→decision→action→outcome تمكين سجل
تم تشكيل حواجز الحماية والتنبيهات ؛ الدفاتر والقواعد الاحتياطية جاهزة
لوحات القيادة: توجيه القرارات، التأثير (رفع/عائد الاستثمار)، الضرر/الشكاوى، الإنصاف
تم توثيق الإصدارات/المالكين/حقوق الوصول/الامتثال

المجموع

ذكاء القرار هو نظام وليس مجموعة من النماذج: بيانات ومقاييس موحدة → نظرة سببية واقتصادية للتأثير → سياسات صريحة وتنسيق آمن → تقييم صارم وتعلم مستمر. يقلل مثل هذا النظام من المخاطر، ويزيد من عائد الاستثمار، ويجعل القرارات قابلة للتكرار، ويمكن تفسيرها، ويمكن التحكم فيها.

استخبارات القرار