GH GambleHub

مقاييس ومقاييس مراجعة حسابات العمليات وإدارة → واتفاقات الإدارة المستدامة

مقاييس مراجعة الحسابات واتفاقات الخدمات

1) لماذا تحتاجه

إذا كانت المقاييس خاطئة - ستكون القرارات خاطئة، فسيتم انتهاك جيش تحرير السودان «على الورق» أو العكس لإخفاء المشاكل. وتكفل مقاييس مراجعة الحسابات واتفاقات البيئة المستدامة أن تكون الوعود للمستعملين والشركاء قابلة للمقارنة وموثوقة ومضمونة قانونا.

الأهداف:
  • توفير «مصدر واحد للحقيقة» (SSOT) والحسابات القابلة للتكرار.
  • تقليل التناقضات بين لوحات القيادة/التقارير/الفواتير.
  • جعل SLAs قائمة على الأدلة.
  • اكتشاف التحلل في القياسات في وقت مبكر من الخدمات.

2) المفاهيم الأساسية وحدود المسؤولية

المقياس: الكمية المقاسة (RPS، p95، CR، GGR، معدل النجاح).
KPI/OKR: الأهداف التي ترتبط بها المقاييس.
SLO: جودة الخدمة المستهدفة (على سبيل المثال، "p99 ≤ 400 ms 99. 9 في المائة من الوقت").
وجيش تحرير السودان: وعد خارجي ؛ ذات أهمية قانونية، استنادًا إلى SLO.
OLA: اتفاق داخلي بين الفرق/البائعين، يدعم SLA.
SSOT: النظام/التخزين الذي تعتبر بياناته مرجعاً للإبلاغ.

3) تصنيف المقاييس (الطبقات)

1. البنية التحتية: وحدة المعالجة المركزية/الذاكرة/IO/Net، القرون/العقد، HPA/VPA.
2. المنصة: قوائم الانتظار/التدفقات (تأخر، إنتاجية)، DB/المخابئ (اتصالات، إصابة)، API (p95/p99، 5xx).
3. تدفقات الأعمال: الودائع/عمليات السحب، الرهانات، إطلاق الألعاب، التراخيص، KYC.
4. المنتج/التسويق: التحويلات، حملات ARPPU/LTV.
5. جودة العمليات: MTTA/MTTR، معدل فشل التغيير، تغطية قائمة التحقق.

القاعدة: يجب أن يكون لكل مقياس طبقة ومالك وصيغة.

4) مصادر البيانات و «الحقيقية»

القياس عن بعد عبر الإنترنت: Prometheus/OTel، logs (ELK/ClickHouse)، آثار.
الأحداث والمحاسبة: Kafka/Outbox، DWH/data marts (BigQuery/ClickHouse).
القطع الأثرية اليدوية: تشريح الجثة، التذاكر، سجلات الحوادث.
السجلات الخارجية: تقارير مقدمي الخدمات (PSP/KYC/studios)، الفواتير.

حل النزاعات: في حالة التناقضات «عبر الإنترنت مقابل DWH»، تنطبق لائحة الأولوية (على سبيل المثال، SLA - مجاميع من DWH مع إمكانية تتبع المصدر).

5) عملية مراجعة المقاييس (حلقة التحكم)

1. قائمة الجرد: كتالوج المقاييس/SLO/SLA (الاسم، المالك، الطبقة، الصيغة، المصدر، تردد الحساب).
2. التحقق من الصيغة: مطابقة استفسارات SQL/promo مع التعريف (اختبارات الوحدة للحسابات).
3. أخذ العينات وإعادة فحصها: أخذ العينات/خطوط السجل والتسوية اليدوية.
4. رسم خرائط الكنتور: مقارنة لوحات القيادة عبر الإنترنت وتقارير DWH.
5. التحكم في التغيير: استعراض صيغة إصدارات المخطط/المنطق.
6. مراجعة حسابات جيش تحرير السودان: التحقق من صحة التجمعات والاستثناءات (الصيانة المقررة والقوة القاهرة).
7. التقرير والتحسينات: قائمة بالفروق المكتشفة والإصلاحات مع المواعيد النهائية.

6) التعاريف والصيغ (العينات)

معدل النجاح (API):
  • 'success = requests - (5xx + timeouts + circuit_open)'
  • «success _ rate = النجاح/الطلبات»
Latency p95/p99:
  • تسجل SSOT تعريفًا وحيدًا للنافذة (rolling 5m/1h) والتجميع (HDR/TDiest).
SLO (مثال):
  • «SLO _ التوفر _ الشهر = (وقت التشغيل - مسموح به _ الاستثناءات )/المجموع _ الوقت»
SLA (مثال للمزود):
  • 'SLA _ month = 99. 90٪ وقت تشغيل بواسطة نافذة UTC، باستثناء النوافذ المخطط لها (إشعار T-48)، الحوادث التي يمكن إثباتها في مشغلي العبور (المستندات). "

7) جودة البيانات: الفحوصات والتنبيهات

فحوصات الجودة:
  • Полнота (الاكتمال): 'ورد _ الأحداث/ expected_events ≥ 0. 99`.
  • التوقيت: تأخر التحميل ≤ N دقيقة.
  • التفرد: بدون مفاتيح مكررة (مفتاح الخصوصية).
  • الاتساق - المبالغ/العملة/الحروف.
  • Linearity - العدادات ليست «متراجعة».
تنبيهات بشأن جودة القياس (الأفكار):

ALERT MetricsIngestionLagHigh
IF dwh_ingest_lag_minutes > 15 FOR 10m

ALERT EventsCompletenessDrop
IF (events_received / events_expected) < 0. 99 FOR 15m

ALERT DuplicateEventsSpike
IF rate(events_duplicates_total[10m]) > baseline_7d 2

8) مراجعة حسابات SLA/OLA: المنهجية

1. جمع جدول زمني للاستثناءات: النوافذ المخططة، والتدهور المتفق عليه، وتصرفات البائعين.
2. حساب وقت التشغيل: وفقًا لمنطقة زمنية واحدة، بناءً على SSOT.
3. التوفيق مع الحوادث: الجدول الزمني والتذاكر وتشريح الجثة.
4. الإسناد: الإخفاقات الخاصة، المزود، العبور، DDoS، الصيانة الروتينية.
5. محيط SLA: تجربة المستخدم (E2E) مقابل واجهة برمجة تطبيقات محددة واحدة.
6. الإبلاغ: تقرير شهري/ربع سنوي: تدابير تصحيحية فعلية، انحرافات، تعويضات (عند الاقتضاء).

9) التحقق من قابلية تكرار الحساب

إصدار الفورمولا: مستودع Git بمواصفات SQL/PromQL/dock.
اختبارات الوحدة للمقاييس: على البيانات الاصطناعية (حالات الحافة: الثغرات، التكرارات، حدود التاريخ).
نسب البيانات: من لوحة القيادة إلى جداول المصدر والأحداث.
اللقطات: تجميد البيانات من أجل القطع بحيث تكون إعادة الحسابات قابلة للمقارنة.

10) أخذ العينات

يوميًا: 10-20 حدثًا حسب التدفقات الرئيسية (الإيداع/السعر/CCL) - التحقق اليدوي من التعقب ↔ DWH.
أسبوعيًا: عينة 1٪ لمقارنة «عبر الإنترنت مقابل DWH» عبر المجاميع.
شهريا: مجموعة من الحوادث ذات تأثير جيش تحرير السودان - إعادة بناء مفصلة.

نموذج تقرير العينة (موجز):

Date/Window: 2025-10-01.. 2025-10-07
Metric: SLO_api_p99
Source A: Prometheus (rolling 5m)
Source B: DWH snapshot (1h buckets)
Deviation: + 6. 2% (A above B)
Reason: different aggregation windows
Action: align window in both contours to 5m/rolling
Term/Owner: 2025-11-10/squad-observability

11) مراجعة لوحات القيادة والتنبيهات

قاموس موحد للمقاييس: مسرد على لوحة القيادة.
شروح الإصدارات/الأحداث: لمعرفة سبب الانحرافات.
مقارنة ما قبل/بعد الإصدار: لوحات الانحدار التلقائي.
التكرارات/التناقضات: تحديد «اثنين مختلفين p99s» - تحرير الصيغ/النوافذ.
توافر اللوحة: الحقوق، الاحتياطي، التحكم في الوصلة/النسخة.

12) إدارة التغيير المتري

RFC Process - Change Formula/Window/Source - via RFC with SLA/Reporting Impact Assessment

الهجرة «توسع → تهاجر → العقد»: الاحتفاظ مؤقتًا بكلا الإصدارين، والمقارنة، ثم إيقاف تشغيل الإصدار القديم.
الاتصالات: إخطار المنتج/الشركة مسبقًا بالتحولات في القيم «وفقًا للطريقة الجديدة».

13) تفاصيل iGaming/fintech

ذروة الطلب: يجب أن تتحمل المقاييس الأحمال المتفجرة (التجمعات لا «تلتصق»).
مقدمو الخدمة: يعتمد SLA على بائعي OLA → تخزين تقاريرهم وحالات الحوادث والحصص.
التكلفة: «التكلفة _ لكل _ 1k _ المكالمات» و «تكلفة النجاح» هي لوحات إلزامية.
Antifraud/risk: الحساسية للتأخير و «الإيجابيات الخاطئة» للمقاييس.

14) لوحات متابعة مراجعة الحسابات (المجموعة الدنيا)

Metrics Health: compleness/timeliness/duplicates, intest-lag, ошибки ETL.
أدلة SLO/SLA: SLO محسوب، SLA الفعلي، الاستثناءات، الإشارات إلى الحوادث/الأفعال.
عبر الإنترنت مقابل DWH قارن: معدل p95/p99/Success والانحرافات والاتجاهات.
البائع SLA: وقت التشغيل/الحصص/المهلة/التكلفة حسب مقدم الخدمة.
تأثير الإصدار: تراجع المقاييس بعد الحسابات/تضمين الميزات.

15) قائمة مراجعة الحسابات (قيد التشغيل)

  • تم تحديث دليل المقاييس/SLO/SLA مع المالكين والصيغ.
  • تم تعريف SSOT لكل تقرير/فريق.
  • اختبارات الوحدة للصيغ خضراء، ويتم توثيق خطوط أنابيب الحساب.
  • تنبيهات جودة البيانات نشطة (الاكتمال/الجدول الزمني/التكرار).
  • التناقض «عبر الإنترنت مقابل DWH» ≤ العتبة المقبولة (على سبيل المثال ≤2٪).
  • استثناءات جيش تحرير السودان المتفق عليها موثقة ومرفقة بالتقرير.
  • تم أخذ عينات المراقبة ووضع الشهادات.
  • مرت جميع التغييرات في الصيغة RFC والهجرة.

16) أمثلة (شظايا)

PromQL - مقارنة pre-/ما بعد الإصدار p99:

api_p99_ms:release:ratio =
(api_latency_p99_ms{release="after"} / api_latency_p99_ms{release="before"})
SQL - التحكم في اكتمال الحدث:
sql
SELECT event_date,
COUNT() AS received,
SUM(expected_count) AS expected,
COUNT()::decimal / NULLIF(SUM(expected_count),0) AS completeness
FROM events
JOIN expected_events USING (event_date, event_type)
WHERE event_type IN ('deposit','bet_placed','kyc_completed')
AND event_date BETWEEN:from AND:to
GROUP BY 1;
قاعدة Alertmanager - اختلاف الكتور:

ALERT DwhVsOnlineDrift
IF abs(dwh_kpis{metric="api_p99"} - online_kpis{metric="api_p99"}) > 0. 02 online_kpis
FOR 30m
LABELS {severity="warning", team="observability"}

17) الأنماط المضادة

صيغتان متريتان مختلفتان على لوحات مختلفة.
تغيير المقياس دون الهجرة والإخطار - «القفزات» في OKR/SLA.
التقارير في Excel المحلية على أنها «حقيقية» (غير قابلة للتكرار).
خلط المناطق الزمنية والتقويمات في حسابات جيش تحرير السودان.
واستثناءات جيش تحرير السودان غير موثقة.
لا توجد تنبيهات حول جودة القياسات.

18) نضج القياس KPI

Online↔DWH معدل الانجراف (الهدف ≤2 في المائة).
Metrics Health Uptime.
صيغة وقت الإصلاح.
معدل نزاع جيش تحرير السودان.
تغطية جيش تحرير السودان/جيش تحرير السودان (نسبة المسارات الحرجة الموصوفة رسميا بجيش تحرير السودان/جيش تحرير السودان).

19) الأدوار والمسؤوليات

مالك المقياس/الخدمة: الصيغة، المصدر، لوحة القيادة، التنبيهات.
قابلية الملاحظة/SRE: SSOT/المنصة، اختبارات الصيغة، تنبيهات جودة البيانات.
Data/BI: DWH, report reproducibility, lineage.
المحامون/مديرو الشركاء: اتفاقات واستثناءات جيش تحرير السودان.
مدير الحوادث: إسناد وربط حوادث جيش تحرير السودان.

20) البداية السريعة (30 يومًا)

الأسبوع 1: مقاييس الجرد/مقاييس الجرد/جيش تحرير السودان/جيش تحرير السودان والمالكون ؛ تعيين SSOT.
الأسبوع 2: قم بتضمين تنبيهات جودة البيانات ولوحة «Online vs DWH».
الأسبوع 3: إجراء عينات التحكم، محاذاة نافذة p95/p99.
الأسبوع 4: إضفاء الطابع الرسمي على عملية RFC للصيغ، وإعداد تقرير شهري عن SLA مع مرفقات.

21) الأسئلة الشائعة

س: ما هو SSOT لجيش تحرير السودان ؟

ج: التخزين مع حسابات قابلة للتكرار (DWH) والنسب الكامل ؛ - للمراقبة التشغيلية، وليس للأفعال القانونية.

س: كيف تتعامل مع «اثنين p99s» ؟

ج: إصلاح النافذة/طريقة التجميع في دليل المقاييس، وترحيل الألواح، وإضافة تنبيه إلى الانجراف.

س: كيف تنظر في الأعمال المخطط لها ؟

أ: الاحتفاظ بجدول زمني للاستثناءات وخصمها تلقائيا من جيش تحرير السودان وفقا لقواعد العقد ؛ تخزين القطع الأثرية التأكيدية.

Contact

اتصل بنا

تواصل معنا لأي أسئلة أو دعم.نحن دائمًا جاهزون لمساعدتكم!

Telegram
@Gamble_GC
بدء التكامل

البريد الإلكتروني — إلزامي. تيليغرام أو واتساب — اختياري.

اسمك اختياري
البريد الإلكتروني اختياري
الموضوع اختياري
الرسالة اختياري
Telegram اختياري
@
إذا ذكرت تيليغرام — سنرد عليك هناك أيضًا بالإضافة إلى البريد الإلكتروني.
WhatsApp اختياري
الصيغة: رمز الدولة + الرقم (مثال: +971XXXXXXXXX).

بالنقر على الزر، فإنك توافق على معالجة بياناتك.