GH GambleHub

SOP: <سريع العمل/الهدف>

توحيد إجراءات التشغيل

1) لماذا تحتاجه

SOP هو «نظام التشغيل التشغيلي» للشركة. يزيل التوحيد القياسي الفوضى و «الأنماط الفردية»، ويقلل من MTTR، وينبه الضوضاء ومخاطر الحوادث، ويسرع من الصعود على متن الطائرة، ويجعل النتائج قابلة للتكرار.

الأهداف:
  • الحد من تباين الإجراءات في الحوادث والروتين.
  • تسريع التدريب وتحسين جودة عمليات التسليم.
  • جعل العمليات قابلة للمراجعة: التدقيق والمقاييس وتحسينات البيانات.
  • ضمان الامتثال للمتطلبات التنظيمية والداخلية.

2) مبادئ التوحيد القياسي

1. الشكل الموحد والمصطلحات. ملاحظة واحدة، تعريف واحد (SLO، ETA، المالك).
2. قابل للتنفيذ، وليس موسوعة. فقط الخطوات القابلة للتحقق ومعايير النجاح والتراجع.
3. الحد الأدنى من التفرع. واضح إذا/ثم الحلول بدلاً من الحرية.
4. التحرير والملكية. لكل SOP تاريخ مالك وإصدار ومراجعة.
5. التكامل مع الأدوات. روابط إلى لوحات القيادة والتذاكر وأوامر ficheflags و CLI.
6. التوافر تحت الطلب. ابحث بسرعة، اقرأ، نفذ برابط واحد.
7. التحسين المستمر. ما بعد الوفاة → مهام تحديث SOP.

3) إطار SOP (نموذج)



4) SOP classification

Incident: P1/P2 (critical), P3 (important).
Operational routines: releases, feature flags, database migrations, provider failover.
DR/BCP: disabling the region, restoring from backup, working offline.
Quality control/audit: revisions, readiness questionnaires, access.
Security/compliance: KYC/AML checks, log storage, privacy.

5) RACI: Ownership and Responsibility

Process    R (performer)    A (responsible)    C (consultant)    I (notify)
------------------------      ---------------      -----------------      ---------------      -------------
Create/Update SOP     Domain Owner       Head of Ops         SRE/Compliance      Teams
SLA Revision     Ops Enablement      Head of Ops        Domain leads     All
Use in an incident     On-call          Incident Manager      Domain Owner       Stakeholders

6) SOP lifecycle

1. Initiation: need from post-mortem/incident/audit.
2. Draft: by template, with specific artifacts and commands.
3. Review: Domain Owner + Head of Ops + specialized consultants.
4. Publishing: to portal/repository; annotations on dashboards.
5. Training: short training/screencast, knowledge test.
6. Application: recorded in ticket/incident.
7. Audit: by SLA revision or after a significant event.
8. Archiving: mark 'deprecated', indicate replacement.

7) Documentation as code (minimum standard)

We store SOP in Git (Markdown + YAML metadata), PR review, CI-lint.
Required fields are 'owner', 'version', 'last _ review', 'sla _ review'.
Link checker and structure validator in CI; auto-release portal after merge.
Significant changes - through changelog and notifications in the # ops channel.

8) SOP integrations

Incident Manager: Open SOP button when creating/escalating an incident.
Grafana/Observability: references from panels to relevant SOPs; release annotations.
Feature Flags/Release: canary step templates, SLO gates, rollback.
AI assistant: RAG search by SOP, TL; DR and proposals for action.
BCP/DR: DR-playbook automatically loaded by trigger.

9) SOP quality check (KPI and review)

KPI:
Coverage ≥ 90% of critical scenarios are closed by SOP.
Review SLA ≤ 180 days (share of overdue - 0).
Usage Rate ≥ 70% of overt SOP incidents.
DoD Pass Rate ≥ 90% of steps are closed with success criteria.
Broken Links = 0 (по CI).

Weekly monitoring:
Top 5 used and top 5 obsolete SOPs.
SOP communication ↔ postmortems: whether Preventive Actions have been performed.
Noisy SOPs (frequent rollback returns) are candidates for recycling.

10) Containment standards

Steps → specifics: commands/queries/parameters + expected effect in metric.
Time requirements: ETA for updates/next steps.
Escalation: clear matrix, contacts, backup channels.
Security: warnings, restrictions, PII/secrets - via vault/links.
Localization: in the on-call language (critical for distributed commands).

11) SOP examples (fragments)

SOP: Canary pause in SLO degradation

المشغلات: error_budget_burn> 4x 10 م، api_p99> 1. 3 × خط الأساس 10 م

الخطوات:
  • 1) إيقاف الكناري مؤقتًا في أداة الإطلاق
  • 2) فحص لوحات «Change Safety» و «API p99»
  • 3) إنشاء تذكرة REG- ، حدد خط الأساس/النافذة
  • وزارة الدفاع: ص 99 ≤ 1. 1 × خط الأساس 15 م، <خط الأساس × 1 خطأ. 2
  • التراجع: تعطيل العلم تمامًا، بعد الوفاة ≤72ch

SOP: PSP Provider Feilover

المشغلات: quota_usage>0. 9 أو outbound_error_rate>2×baseline 5 م

الخطوات:
  • 1) تمكين توجيه PSP-Y (تكوين/زر)
  • 2) تحويل الودائع الشيكية و p95 PSP-Y
  • 3) شروح على الرسوم البيانية، تحديث في # قناة الحادث
  • وزارة الدفاع: success_rate ≥ 99. 5٪، p95 ≤ 300 م 10 م
  • التراجع: 20٪ عودة جزئية لحركة المرور في استقرار PSP-X

12) القوائم المرجعية

القائمة المرجعية لاستعداد SOP:
[] الهدف والمحفزات واضحة وقابلة للقياس.
[] هناك خطوات للأوامر/الروابط.
[] DoD/Rollback صيغ.
[] التصعيد والاتصالات ذات صلة.
[] تم ملء البيانات الوصفية (المالك، الإصدار، last_review).
[] مدقق الربط وممر التحقق من صحة CI.

قائمة تطبيق SOP المرجعية (في الحادث):
[] تم فتح SOP من وصلة مدير الحوادث/الفريق.
[] اكتملت الخطوات وسجلت النتائج.
[] تم الوصول إلى وزارة الدفاع/لم يتم التحقق منها.
[] يتم تسجيل الإجراءات/التناقضات في التذكرة.
[] تحديثات/تحسينات SOP الناتجة عن المهام (إذا لزم الأمر).

13) التدريب والاستقبال

دورات مصغرة عن برامج التشغيل الموحدة الرئيسية (المدفوعات/الرهانات/الألعاب/KYC).
واجب الظل مع الاستخدام الإلزامي لـ SOP في التدريب.
«عيادات SOP» الأسبوعية: 30 دقيقة من التحليل/التحسين.
المحاكاة (أيام اللعبة): تطوير DR و SOPs.

14) إدارة التغيير SOP

RFC عبر العلاقات العامة، علامات «ثانوية/رئيسية/كسر».
كسر التغييرات - مع التدريب والإعلان الإلزامي.
إشعارات تلقائية لمالكي النطاق وأثناء الطلب.
«ملاحظات إصدار SOP» منفصلة في نهاية كل أسبوع.

15) الأنماط المضادة

شكل حر «كما اتضح» وأنماط مختلفة حسب الأمر.
SOP بدون تاريخ المالك/التنقيح/التنقيح.
نصوص «موسوعية» بدلاً من الإجراءات خطوة بخطوة.
لا يوجد Rollback/DoD - لا شيء للتحقق من النجاح.
روابط مكسورة، أوامر «يدوية من الدردشة»، خطوات «سرية» خاصة.
تغييرات SOP غير المرئية دون تسجيل أو تدريب.

16) 30/60/90 - خطة التنفيذ

30 يومًا:
الموافقة على نموذج SOP والمعايير الدنيا.
قم بإنشاء مستودع «ops-sop/» (docs-as-code)، وتمكين بطانات CI.
رقمنة 10-15 SOPs (الحوادث/الإطلاقات/مقدمي الخدمات).
قم بتوصيل مدير الحوادث ولوحات الرؤية بروابط SOP.

60 يومًا:
الوصول إلى التغطية ≥ 70٪ للسيناريوهات الحرجة.
إطلاق «عيادات SOP» الأسبوعية والتدريب تحت الطلب.
إضافة بحث عن الذكاء الاصطناعي (RAG) بواسطة SOP و TL ؛ بطاقات DR.
أدخل مراجعة SLA (180 يومًا) وأبلغ عن SOPs المستحقة.

90 يومًا:
التغطية ≥ 90٪، معدل الاستخدام ≥ 70٪ من الحوادث.
ضم DoD/Rollback في جميع SOPs، روابط مكسورة قريبة (0).
اربط SOP KPI بأمر OKR (MTTR، معدل فشل التغيير).
الرجعية وتسجيل تحسينات الربع القادم.

17) الأسئلة الشائعة

س: كيف يختلف SOP عن كتاب التشغيل ؟
ألف: إجراءات التشغيل الموحدة - الإجراء الموحد (لائحة «كيفية»). Runbook - تعليمات مفصلة لحالة/خدمة محددة. في كثير من الأحيان، يشير SOP إلى واحد أو أكثر من كتب التشغيل.

س: كم عدد التفاصيل التي يجب أن تكون في SOP ؟
ج: يكفي فقط للمشغل لأداء الإجراءات دون «الحفر» في الدردشة. كل ما لا يؤثر على الإجراء موجود في مواد مرجعية منفصلة.

س: كيف تحافظ على الصلة ؟
ج: تنقيحات SLA (أيام ≤180)، ورسائل التذكير التلقائية، وصلات CI ومقاييس الاستخدام/وزارة الدفاع. أي حادثة انحراف → مهمة تحديث SOP.
Contact

اتصل بنا

تواصل معنا لأي أسئلة أو دعم.نحن دائمًا جاهزون لمساعدتكم!

بدء التكامل

البريد الإلكتروني — إلزامي. تيليغرام أو واتساب — اختياري.

اسمك اختياري
البريد الإلكتروني اختياري
الموضوع اختياري
الرسالة اختياري
Telegram اختياري
@
إذا ذكرت تيليغرام — سنرد عليك هناك أيضًا بالإضافة إلى البريد الإلكتروني.
WhatsApp اختياري
الصيغة: رمز الدولة + الرقم (مثال: +971XXXXXXXXX).

بالنقر على الزر، فإنك توافق على معالجة بياناتك.