الرصد النموذجي
1) لماذا
الهدف هو الحفاظ على جودة وسلامة حلول النموذج في البيع مع الامتثال لـ SLA/SLO و RG/AML/Legal والميزانيات. وينبغي أن يكشف الرصد عن التدهور المبكر (البيانات، والمعايرة، والوقت، والتكلفة)، وأن يقلل إلى أدنى حد من التكلفة المتوقعة للأخطاء، وأن يكفل قابلية التكاثر/مراجعة الحسابات.
2) مناطق الرصد (خريطة)
1. التوافر والأداء: الكمون p95/p99، معدل الخطأ، RPS، المقياس التلقائي.
2. جودة التنبؤ: PR-AUC/KS (على الملصقات الإلكترونية)، المعايرة (ECE)، التكلفة المتوقعة @ threshold.
3. الانجراف والاستقرار: PSI/KL حسب الميزات والسرعة، تغيير التوزيعات/الفئات.
4. التغطية والاكتمال: حصة الطلبات التي تم تقديمها بنجاح، وحصة الميزات «الفارغة»، ومخابئ معدل الضرب.
5. الشريحة/الإنصاف: المقاييس حسب السوق/المزود/الجهاز/عمر الحساب.
6. حواجز الحماية (RG/AML): انتهاكات السياسة، وتواتر التدخل، وإيجابيات/سلبيات كاذبة.
7. التكلفة: التكلفة/الطلب، التكلفة/الميزة، وحدة معالجة الرسومات/وحدة المعالجة المركزية - الساعة، الملفات الصغيرة/مكتب المعلومات (للدفعة/شبه RT).
8. البيانات/العقود: مخطط الميزات، الإصدارات، التعادل عبر الإنترنت/غير متصل بالإنترنت.
3) SLI/SLO (معالم iGaming)
Latency p95: التخصيص ≤ 150 ms، تنبيهات RG/AML ≤ 5 مع e2e.
التوافر: ≥ 99. 9%.
معدل الخطأ 5xx: ≤ 0. 5٪ في 5 دقائق نافذة.
التغطية: حصل ≥ 99٪ من الطلبات على سرعة وحل صحيحين.
نضارة الملصقات للتقييم عبر الإنترنت: D + 1 (يوميًا)، للوكلاء السريعين - ≤ ساعة 1.
Drift PSI: ميزة/معدل <0. 2 (تحذير с 0. 1).
معايرة اللجنة الاقتصادية لأوروبا: ≤ 0. 05.
Expected-cost_live: ليس أعلى من النموذج الأساسي + X٪ (الهدف X يتم اختياره من قبل الشركة).
4) الإشارات والصيغ
4. 1 الانجراف
PSI: تلخيص الاختلاف في التوزيعات (قطار مقابل برود).
KL-divergence: حساس للذيول «الرقيقة» ؛ مراقبة السمات الرئيسية/السرعة.
KS للمعدلات (إذا كانت البطاقات موجودة): فرق CDF للإيجابيات/السلبيات.
4. 2 المعايرة
4. 3 التكلفة المتوقعة
تقليل (C = c_{fp}\cdot FPR + c_{fn}\cdot FNR) إلى الحد الأدنى عند عتبة العمل ؛ العد عبر الإنترنت في نافذة منزلقة مع ملصقات متأخرة.
5) مصادر التسمية
الملصقات عبر الإنترنت (الوكلاء السريعون): حدث إيداع لمدة 7 أيام، نقر/تحويل، حالة RG مكتملة.
الملصقات المتأخرة: رد التكاليف/الاحتيال (45-90 يومًا)، اضطراب طويل الأجل/LTV.
القواعد: الإبقاء على الوقت ؛ لا تستخدم الأحداث «من المستقبل».
6) لوحات القيادة (الحد الأدنى للتكوين)
1. التشغيل: RPS، p50/p95/p99 زمن الوصول، 4xx/5xx، التشبع، الترتيب التلقائي.
2. الجودة: توزيع الدرجات، PR-AUC (على الملصقات بالوكالة)، اللجنة الاقتصادية لأوروبا، التكلفة المتوقعة، KS.
3. الانجراف: PSI/KL حسب أفضل الميزات، وفئات التجديد، والمعدل المفقود، ووقت جلب الميزات.
4. شريحة/عدالة: PR-AUC/ECE/التكلفة المتوقعة حسب السوق/المزود/الجهاز.
5. حواجز الحماية: انتهاكات RG/AML، تدخلات/طلبات 1k، معدل توقف مزيف.
6. التكلفة: التكلفة/الطلب، وقت وحدة المعالجة المركزية/وحدة معالجة الرسومات، معدل إصابة المخبأ، عمليات المراقبة الخارجية.
7) التنبيه (قواعد مثال)
HighP95Latency: p95> 150 ms (5 min) → page SRE/MLOps.
خطأ انفجار: 5xx> 0. 5٪ (5 دقائق) → نص التراجع متاح.
PSI_Drift: PSI (amount_base)> 0. 2 (15 دقيقة) → إعادة تدريب الإحماء.
ECE_Bad: اللجنة الاقتصادية لأوروبا> 0. 07 (30 دقيقة) → إعادة بناء المعايرة/العتبات.
ExpectedCost_Up: + x٪ إلى المعيار (يوم 1) → النظر في التراجع/الحمل الزائد.
Slice_Failure: انخفضت جمهورية أفريقيا الوسطى في سوق R> Y% (يوم 1) → صاحب نطاق التذاكر.
Guardrails_Breach: حصة العروض العدوانية> الحد الأقصى → مفتاح القتل الفوري.
8) قطع الأشجار والتعقب
سجلات الاستفسار (الحد الأدنى): "طلب _ معرف"، "تتبع _ معرف"، "نموذج _ معرف/إصدار"، "ميزة _ إصدار"، "ميزة _ إحصائيات" (مفقودة%، أقصى الحدود)، "درجة"، "قرار"، "عتبة"، "معرف السياسة"، "حارس _ قناع"، "وقت الانتهاء _ ms'،" التكلفة _ تقدير "، (اختياري)) تفسيرات (SHAP top-k).
OTEL- трейсы: спаны 'feature _ betch' → 'preprocess' →' score '→' postprocess' → 'guardrail'.
PII: الأسماء المستعارة/الرموز فقط ؛ إخفاء السياسة، الإقامة الرئيسية.
9) تقييم الجودة عبر الإنترنت
النوافذ المنزلقة لـ PR-AUC/KS حسب الملصقات السريعة (ساعة/يوم).
العلامات المحتفظ بها: D + 7/D + 30/D + 90 تقريرا بأثر رجعي، تعديلات التكلفة المتوقعة.
المعايرة: إعادة تقييم Isotonic/Platt على D + 1، قطعة أثرية لتحديث تلقائي.
10) عتبة القرار والسياسة
نحتفظ بالعتبة كتكوين في السجل ؛ ننظر عبر الإنترنت في التكلفة المتوقعة والتعديل ضمن النطاق المسموح به (محدود السعر).
حدود الأمان: الحدود العليا/الدنيا للإجراءات ؛ التجاوز اليدوي للامتثال.
عتبات الاختبار: محاكاة ليلية لبيانات الأمس.
11) شريحة وإنصاف
القطاعات: السوق/الولاية القضائية، المزود، الجهاز/ASN، عمر الحساب، قوة الإيداع.
المقاييس: العلاقات العامة - مفوضية الاتحاد الأفريقي، اللجنة الاقتصادية لأوروبا، التكلفة المتوقعة، فروق أسعار صرف السلع/تكاليف البرامج المواضيعية (احتمالات معادلة)، أثر متباين.
الإجراءات: معايرة/عتبة الشرائح، وإعادة التدريب بالمقاييس، وتنقيح الميزة.
12) المعادلة عبر الإنترنت/غير متصل بالإنترنت
ميزة اختبار المساواة: MAE/MAPE على عينة التحكم ؛ تنبيه عند التباعد> عتبة.
إصدار: «ميزة _ مواصفات _ إصدار»، «منطق _ إصدار» ؛ أرشيف WORM.
عقود الدوائر: لا يُسمح بكسر التغيير بدون دخول مزدوج (v1/v2).
13) حواجز الحماية (RG/AML)
إجراءات ما قبل/ما بعد الترشيح، حدود التردد، التهدئة، قوائم المحظورات.
Логи '' معرف/ميل/قناع/قرار "؛ الإبلاغ عن الانتهاكات.
مقاييس معدل وقت المقابلة والتدخل الكاذب.
14) الحوادث وكتيب التشغيل
السيناريوهات والخطوات:1. Latency↑/5xx↑: التحقق من موفري المميزات الخارجيين → تمكين المخبأ/المهلات → المقياس → التراجع إذا لزم الأمر.
2. PSI/ECE/تدهورت التكلفة المتوقعة: تجميد حركة المرور (canary↓)، وتمكين العتبات الاحتياطية/النموذج، وإعادة التدريب.
3. فشل الشريحة: عتبة مؤقتة خاصة بالشرائح، تذكرة لمالك المجال.
4. خرق حواجز الحماية: مفتاح القتل، تدقيق القضية، ما بعد البحر.
15) التكلفة والأداء
التنميط: جزء بسيط من الوقت في ميزة الجلب مقابل النتيجة مقابل IO.
استراتيجيات التخزين المؤقت: TTL/الإخلاء، الميزات الساخنة في ذاكرة الوصول العشوائي، الباردة - كسولة.
كمية النموذج/التحسين الأمثل: FP16/INT8 مع الحفاظ على الجودة.
رد التكاليف: التكلفة/الطلب، التكلفة/الميزة حسب الفريق/السوق.
16) أمثلة (شظايا)
عتبة التكلفة المتوقعة (الكود الزائف):python thr_grid = np.linspace(0.01, 0.99, 99)
costs = [expected_cost(y_true, y_prob >= t, c_fp, c_fn) for t in thr_grid]
thr_best = thr_grid[np.argmin(costs)]
بروميثيوس (أفكار مترية):
text model_inference_latency_ms_bucket feature_fetch_latency_ms_bucket model_request_total{code}
model_score_distribution_bucket psi_feature_amount_base ece_calibration expected_cost_live slice_pr_auc{slice="EEA_mobile"}
تنبيه (فكرة):
text
ALERT DriftDetected
IF psi_feature_amount_base > 0.2 FOR 15m
17) العمليات و RACI
R (مسؤول): MLOps (قابلية الرصد/التنبيهات/السجل)، علم البيانات (مقاييس الجودة/المعايرة/العتبة)، Data Eng (السمات/العقود/التكافؤ).
ألف (مسؤول): رئيس قسم البيانات/المدير التنفيذي.
جيم (استشاري): الامتثال/إدارة الشؤون السياسية (PII/RG/AML/DSAR)، الأمن (KMS/Audit)، SRE (SLO/الحوادث)، المالية (التكلفة).
I (معلومات): المنتج/التسويق/العمليات/الدعم.
18) خارطة طريق
أفضل لاعب (2-4 أسابيع):1. SLI/SLO الأساسية (الكمون/5xx/التغطية) + لوحة القيادة.
2. PSI لأفضل 10 ميزات وتوزيع النقاط ؛ اللجنة الاقتصادية لأوروبا والتكلفة المتوقعة على العلامات البديلة.
3. سجلات القرار + مسارات OTEL ؛ اختبار التعادل عبر الإنترنت/خارج الإنترنت.
4. تنبيهات HighP95Latency/PSI_Drift/ECE_Bad + runbook 'و.
المرحلة 2 (4-8 أسابيع):- لوحات شريحة/عدالة، مقاييس تعبئة ليلية على الملصقات المتأخرة.
- إعادة المعايرة التلقائية ومحاكاة العتبة.
- لوحة متابعة التكاليف والحصص/الحدود على الميزات/عمليات إعادة التشغيل.
- الانجراف التلقائي/إعادة التدريب مع التحكم في الكناري.
- محفوظات WORM لتقارير الجودة والتحف.
- اختبارات مراقبة الفوضى وتمارين DR.
19) قائمة التسليم المرجعية
- وافق جيش تحرير السودان/جيش تحرير السودان ورصده في ≥ الظل/الكناري 24 ساعات.
- PSI/KL، ECE، التكلفة المتوقعة و PR-AUC يتم النظر فيها عبر الإنترنت ؛ عتبات وتنبيهات محددة.
- تمكين لوحات الشرائح/الإنصاف ؛ يتم تعيين مالكي القطاعات.
- اكتمال السجلات/المسارات (القرارات والعتبات والأقنعة) وإخفاء PII والإقامة.
- اختبار المعادلة عبر الإنترنت/اللون الأخضر غير المتصل بالإنترنت ؛ رسوم بيانية بموجب العقد.
- اختبار دفتر التشغيل والنقرة الواحدة ؛ مفتاح القتل для حواجز الحماية.
- تتناسب التكاليف مع الميزانيات ؛ المخبأ/الحصص/الحدود نشطة.
- حفظ أرشيف WORM للمقاييس/القطع الأثرية وتقارير الجودة.
20) الأنماط والمخاطر المضادة
عدم وجود علامات على الإنترنت وتقييم بأثر رجعي.
رصد جمهورية الكونغو الديمقراطية - مفوضية الاتحاد الأفريقي فقط دون التكلفة المتوقعة والمعايرة.
تجاهل الشريحة/الإنصاف → الإخفاقات الخفية في المناطق/الأجهزة.
لا توجد ميزة معادلة عبر الإنترنت/غير متصلة بالإنترنت → «الواقع المزدوج».
حواجز الحماية الصفرية: عروض سامة، انتهاكات RG/AML.
لا توجد خطط للتراجع/DR، ولا أرشيف WORM.
21) خلاصة القول
رصد النموذج هو نظام للإنذار المبكر وإدارة المخاطر/التكاليف بدلاً من "انظر مرة واحدة في الأسبوع. "أدخل SLO، وقياس الانجراف/المعايرة/التكلفة المتوقعة، وشرائح التتبع وحواجز الحماية، وأزرار التبديل/القتل، وأتمتة التقارير وإعادة التدريب. لذلك ستظل النماذج مفيدة وأخلاقية ومتوافقة مع أي اضطراب في البيانات وحركة المرور.