SLA/OLA مع مقدمي الخدمات
1) الشروط والحدود
SLI - مؤشر قابل للقياس (التوافر، زمن الوصول p99، خطابات الويب المعالجة بنجاح، RPO/RTO).
SLO - استهداف قيمة SLI لكل نافذة قياس (على سبيل المثال، 99. 9 في المائة/30 يوما).
SLA - وثيقة ملزمة قانونًا (إجراءات SLO++ السداد).
OLA - الأهداف والعمليات الداخلية التي تكفل الامتثال لاتفاقات جنوب أفريقيا.
UC (العقد الأساسي) - «الركيزة» مع أطراف ثالثة (القنوات ومراكز البيانات و CDN، إلخ).
الحدود: يفصل بوضوح منطقة مسؤولية المزود (السحابة/WAF/CDN/بوابة الدفع/مزود KYC) عن منطقتك (الرمز والتهيئة وإعدادات العميل).
2) مصفوفة الحرجية واختيار النموذج
مقدمو الخدمات القطاعية حسب تأثير الأعمال:وتحدد المصفوفة عمق جيش تحرير السودان ونطاق عمليات التحقق ومتطلبات منسق الشؤون القانونية/جامعة كاليفورنيا.
3) المقاييس ونوافذ القياس
النسبة المئوية للوقت الذي تنفذ فيه الخدمة الاستفسارات وفقا للتسامح.
الكمون: p95/p99 للعمليات الرئيسية ؛ «النجاح البطيء» مهم.
موثوقية البيانات: RPO (الحد الأقصى لخسارة البيانات المسموح بها) و RTO (وقت الاسترداد).
عرض النطاق الترددي/الحدود: الحصص المضمونة (RPS/MBps).
جودة عمليات التكامل: حصة الخطابات الشبكية ≤ الدقائق X، حصة الردود 2xx، التكرار والتفريغ.
نافذة القياس: 30 يوما شهريا/متجددة، واستثناءات (الأنشطة المخطط لها) مع حدود.
- 'التوافر _ ext = 1 − (Downtime_confirmed_outages/ Total_minutes_in_window)'
- عندما يكون الانقطاع هو الحالة المؤكدة غير المتاحة من خلال المراقبة الخارجية، وليس فقط من خلال صفحة حالة المزود.
4) محتوى SLA (نموذج القسم)
1. الموضوع والنطاق (الخدمات والمناطق ونسخ واجهة برمجة التطبيقات).
2. التعاريف (SLI/SLO, «incident», «planned work», «force majeure»).
3. أهداف الخدمات حسب فئة الطلب والمنطقة.
4. قاعدة المراقبة والأدلة: بأي طريقة، وأجهزة الاستشعار، وبأي تردد.
5. الحوادث والتصعيد: القنوات، أوقات الاستجابة/التحديث، الأدوار.
6. المبالغ المستردة: الاعتمادات/الغرامات/المكافآت، والعتبات، والصيغ.
7. الأمن والخصوصية: DPA، التشفير، جذوع الأشجار، إخطارات المخالفة.
8. تغييرات الخدمة: النقض، نافذة الإخطار، التوافق.
9. الاستمرارية و DR: RPO/RTO، اختبارات الاسترداد.
10. مراجعة الحسابات والامتثال: الحق في مراجعة الحسابات والإبلاغ والتصديق.
11. خطة الخروج: تصدير البيانات والتواريخ والشكل والمساعدة في مجال الهجرة.
12. الأحكام القانونية: الولاية القضائية، والقوة القاهرة، والسرية، وفترة الصلاحية.
5) أمثلة على الصياغة (الشظايا)
5. 1 التوافر والقياس
"المزود يوفر 99. توافر 95٪ في كل شهر تقويمي. يتم قياس التوافر من خلال المراقبة الاصطناعية الخارجية للعميل من المناطق ≥3 على فترات ≤1 دقيقة. يعتبر عدم التوافر المسجل في ≥2 المناطق في نفس الوقت حادثة من المستوى SEV2 ويتم احتسابه في Downtime. "
5. 2 زمن وصول واجهة برمجة التطبيقات الرئيسي
"p99 وقت الرد" POST/payments/admission "≤ 450 ms في 95٪ من أيام الشهر. ويرد تقرير عن تحليل الأسباب بالنسبة المئوية للطلبات التي تتجاوز العتبة"
5. 3 حوادث وتصعيد
"S1: ack ≤ 15 min, updates كل ≤ 30 min, target recovery ≤ 2 h; S2: ack ≤ 30 دقيقة، تحديثات ≤ 60 دقيقة ؛ S3: يوم العمل التالي. القنوات: هاتف 24 × 7، جسر دردشة، بريد إلكتروني"
5. 4 المبالغ المستردة (الأرصدة الدائنة)
If Availability_ext <99. 95% → credit 10% monthly fee
< 99. 9% → 25%
< 99. 5% → 50%
ولا تستبعد القروض أساليب أخرى للتعويض عن الضرر الناجم عن الإهمال الجسيم.
5. 5 النقض والتوافق
"إشعار 180 يومًا على الأقل للتغييرات التي تكسر التوافق. الدعم المتزامن لـ vN و vN + 1 لمدة 90 يومًا على الأقل"
5. 6 الخروج
"في غضون 30 يومًا بعد الإنهاء، يوفر المزود التصدير الكامل للبيانات بتنسيقات Parquet/JSON + مجانًا ؛ خدمات الهجرة الإضافية - عند التعريفة العاشرة
6) مكتب الشؤون القانونية: الدعم الداخلي لجيش تحرير السودان الخارجي
مثال OLA بين «Platform' و» Payment Team':- الأهداف: بوابة p99 ≤ 200 مللي ثانية، معدل الخطأ ≤ 0. 3٪، DR: RPO 0، RTO 30 دقيقة.
- المسؤولية: SRE-under-cand, 24 × 7; لوحات القيادة والتنبيهات المشتركة.
- العمليات: الفوضى والدخان في الإطلاقات، والدخان على العلاقات العامة، وخصائص التظليل.
- البوابات: كتلة النشر عندما يفشل اختبار SLO/xaoc ؛ تحديث الدليل الإلزامي.
7) الرصد والأدلة
المواد التركيبية: المجسات الخارجية (HTTP/TCP)، مسار المستخدم، «النجاح البطيء».
RUM: مراقبة المستخدم الحقيقية لتأكيد التأثير.
الارتباط: «مقدم»، «منطقة»، «طريقة api _»، «حادث _ معرف».
القطع الأثرية: لقطات شاشة/مسارات/سجلات، تصدير KPI، الجدول الزمني للتصعيد.
rego package policy. sla deny["Release blocked: provider SLO risk"] {
input. release. affects_providers[_] == p input. slo. forecast[p].breach == true
}
8) الحوادث والتفاعلات
كتاب اللعبة:1. تصنيف SEV، فتح غرفة الحرب، غرض IC.
2. إخطار مقدم الخدمة عبر «القناة الساخنة»، إرسال القطع الأثرية.
3. أوضاع التجاوز/أعلام الميزات (قديمة، مظللة، سقف معدل).
4. الجدول الزمني المشترك، التعافي.
5. إجراءات ما بعد الوفاة +: تحديث حدود التكوين والمفاتيح والطرق الاحتياطية.
6. الشروع في تقديم قروض لجيش تحرير السودان، وتحديد الفواتير.
9) الأمن وإدارة الشؤون السياسية
إدارة الشؤون السياسية/الخصوصية: أدوار المراقب/المعالج، وفئات البيانات، وقاعدة الشرعية، والمواعيد النهائية/الأهداف للتجهيز، والمعالجات الفرعية واتفاقات الخدمات الخاصة بها.
التشفير: TLS1. 2 +، PFS ؛ البيانات «في الراحة»، إدارة المفتاح (KMS/HSM)، التناوب.
التدقيق: سجلات الوصول، إخطارات المخالفة ≤ 72 ساعة، تقارير الخمسة عند الطلب.
التوطين: منطقة التخزين، حظر التصدير دون موافقة.
10) سلسلة التوريد وقابلية التشغيل البيني
SBOM/نقاط الضعف: سياسة عتبة CVSS وأوقات الإصلاح (انتقدت ≤ 7 أيام، مرتفعة ≤ 14).
توافق واجهة برمجة التطبيقات: اختبارات العقد وصناديق الرمل والتركيبات المستقرة.
تغييرات المزود: ملاحظات الإصدار المبكر، المعاينات/النوافذ التجريبية، التوافق الخلفي.
11) مورد متعدد و feilover
نشط/نشط: أصعب وأكثر تكلفة، ولكن توفر أعلى (ضع في اعتبارك الاتساق).
نشط/سلبي: محمية باردة/دافئة، د. التدريبات المنتظمة
المجردات/المحولات: عقد واحد، ومسارات الصحة/التكلفة/الكربون (إذا كان ذلك مناسباً).
شروط الترخيص/التجارة: قابلية النقل، والحد من إنتاج البيانات، وتكلفة الخروج.
12) خطة الخروج والتدريب الدوري
فهرس البيانات/الرسوم البيانية والمجلدات.
SDK/API القابلية للنقل (الحد الأدنى - المصدر الثاني).
اختبار الخروج الجاف: التصدير/الاستيراد، الاستعادة، التحقق من الثوابت.
فترات الاحتفاظ/التخلص القانونية بعد الإفراج.
13) اختبارات العقد والمطابقة
عينات واجهة برمجة التطبيقات: إيجابية/سلبية، حدود، أخطاء، و Retrays.
تسليم الأحداث/الخطابات الشبكية: التوقيع/الوقت/الجد/التكرار.
Perf basines: p99, bandwidth; اختبارات الانحدار على ملاحظات الإفراج عن المزود.
عبر المناطق: لا ينبغي لتدهور منطقة ما أن ينتهك منظور البيئة المستدامة على الصعيد العالمي.
14) الأنماط المضادة
SLA «on status page» without external measures.
نفس الأهداف لجميع المناطق/نقاط النهاية.
الافتقار إلى حقوق مراجعة الحسابات والسجلات التفصيلية للحوادث.
لا يوجد OLA/UC → لا يوجد أحد للوفاء بالالتزامات الخارجية في الداخل.
خطة خروج غير محددة → المورد رهينة.
«الغرامات بالقروض فقط» دون الحق في الإنهاء في حالة الانتهاكات المنتظمة.
ينتقد بدون نافذة انتقالية.
15) قائمة مرجعية للمهندس المعماري
1. تحديد SLI/SLO لتدفق المفاتيح والمناطق ؟
2. طريقة رصد خارجية مختارة وقاعدة أدلة ؟
3. هل الحوادث والتصعيد ونوافذ العمل المخطط لها وحدود الاستثناء محددة في جيش تحرير السودان ؟
4. هل لديك جدول ائتماني/عقوبات وحق إنهاء الخدمة لانتهاكات N ؟
5. DPA/security: تشفير، سجلات، إشعارات، معالجات فرعية، توطين ؟
6. اختبارات العقد وصناديق الرمل في خط الأنابيب ؟
7. تمكين منسقي الشؤون القانونية الداخليين/منسقي الشؤون الخارجية الخارجيين ؟
8. DR: أعلن RPO/RTO، التدريب الذي تم إجراؤه، التقارير المتاحة ؟
9. خطة الخروج: تنسيقات التصدير، التوقيت، ممارسة الخروج الجاف ؟
10. هل البوابات في CI/CD تحجب الإصدارات التي تزيد من خطر انتهاك جيش تحرير السودان ؟
16) أمثلة مصغرة (رسومات)
16. 1 سياسة نشر بوابة بشأن مخاطر مقدمي الخدمات
yaml gate: provider-slo-risk checks:
- name: forecasted-slo-breach input: slo_forecast/providers. json deny_if: any(.providers[].breach == true)
action_on_deny: "block-release"
16. 2 تصدير «أدلة الحوادث»
bash curl -s https://probe. example. com/export? from=2025-10-01&to=2025-10-31 \
jq '. {region, endpoint, status, latency_ms, trace_id, ts}' > evidence. jsonl
16. 3 اختبار Webhook للعقد (Pseudocode)
python evt = sign(make_event(id=uuid4(), ts=now()))
res = post(provider_url, evt)
assert res. status in (200, 202)
assert replay(provider_url, evt). status = = 200 # idempotency
استنتاج
ليس جيش تحرير السودان/مكتب الشؤون القانونية «ورقة قانونية» فحسب، بل هو آلية معمارية لإدارة المخاطر والجودة. المقاييس والنوافذ الصحيحة، والمراقبة الخارجية، وإجراءات سداد الحوادث الواضحة، و OLA/UCs الداخلية، والبوابات المرسلة، والمتعددي البائعين، وخطة الخروج الحقيقية تحول اعتماد المزود إلى جزء خاضع للرقابة وقابل للقياس ويمكن التنبؤ به اقتصاديًا من نظامك الأساسي.