GH GambleHub

توزيع الإشارات والمقاييس

(القسم: النظام الإيكولوجي والشبكة)

1) الغرض والمنطقة

يعد توزيع الإشارات والمقاييس طريقة متسقة لجمع وتطبيع وتسليم القياس عن بُعد (الأحداث والمقاييس والسجلات والآثار والحالات الصحية) لجميع المشاركين المهتمين: المشغلون ومقدمو المحتوى وخدمات الدفع/CCM والجسور وعقد الشبكة والشركات التابعة وأفرقة الامتثال SRE/BI. الأهداف:
  • عقود موحدة للغات وبيانات القياس عن بُعد.
  • قنوات QoS المدارة: أولوية الإشارات الحرجة.
  • شفافية SLI/SLO وتنبيه يمكن التنبؤ به.
  • مقاييس الخصوصية والعزلة ومدخرات الميزانية.

2) تصنيف الإشارة

1. أحداث الأعمال: الاستقبال، الودائع/المدفوعات، أحداث الألعاب، الإسناد.
2. المقاييس التقنية: الكمون/الإنتاجية/رمز الخطأ، قائمة الانتظار، استخدام وحدة المعالجة المركزية/ذاكرة الوصول العشوائي/IO.
3. السجلات: إدخالات منظمة حول العمليات والأخطاء.
4. الآثار: استعلام/امتدادات الموضوع، ارتباط القفز بالقفزة.
5. الحالات الصحية: المجسات الاصطناعية، الاستعداد/الحيوية، عقد نبضات القلب.
6. إشارات المخاطر/الامتثال: ضربات KYC/KYB/AML، أحداث الجزاءات.

لكل فئة مستوى حرجي خاص بها وسياسة التخزين/التسليم.

3) بنية التوزيع (مرجع)

هواة جمع الحواف (SDK/الوكلاء) الدخول (HTTP/OTLP/gRPC/QUIC) حافلة (كافكا/بولسار) معالجات (وظائف التيار) تخزين (TSDB للمقاييس، كائن/عمود - لـ logs/events, tracer) Showcases/dashboards/allerts.
متعدد الإيجارات: مساحة الاسم/معرف المستأجر في المفاتيح، حصة/حدود فردية/الرباط الصليبي الأمامي.
تقسيم QoS: حرج (P0)، مهم (P1)، خلفية (P2).
Ext: المشتركون (Ops/BI/Third-party) من خلال الاشتراك في الموضوعات والآراء المجسدة.

4) العقود والمخططات (الأحداث/المقاييس/المسارات)

4. 1 أحداث (مبسطة، YAML)

yaml event:
id: uuid kind: business    ops    risk ts: timestamp    # ISO8601 tenant: string    # org_id/namespace source: string    # service/peer-id trace_id: string type: string     # deposit. created    payout. failed    probe. ok...
attrs: object # semantic fields (no PII)
severity: info    warn    error    critical qos: P0    P1    P2

4. 2 مقاييس (OpenMetrics/OTLP)

مقياس/عداد/مخطط نسيجي مع ملصقات ثابتة (كاردينالية محدودة).
المعرفات: «metric _ name {service, region, region, version, route}».
Histograms لكمون/أبعاد بدلاً من p99 في الكود.

4. 3 مسارات

الحقول المطلوبة هي 'trace _ id' و 'span _ id' و 'parent _ id' و 'service' و 'peer' و 'route' و 'qos'.
الروابط بين المجالات (المستهلك/المنتج) والقفزات الشبكية (الترحيل/الجسر).

5) QoS وتحديد الأولويات

P0 (حرج): مدفوعات/مدفوعات SLI، أوضاع الجسور/العقدة، SLO بمعدل الحرق → التسليم الصارم (الكسارات، الإعادات، الخمول)، الحد الأدنى من المهلات.
P1 (مهم): أحداث المنتج/المقاييس الرئيسية → التسليم المضمون داخل SLO.
P2 (الخلفية): سجلات مفصلة، تصحيح → أفضل جهد، يمكنك إسقاطها عند التحميل الزائد.

السياسيون: طوابير مختلفة، حصة للمنتجين، الضغط الخلفي، حدود الأسعار، الجد بـ «الخصوصية _ المفتاح».

6) ميزانية الكرادلة والمقاييس

تسميات القاعدة 6: لا تزيد عن 6 مفاتيح لكل مقياس، قواميس ثابتة للقيم.
Cardinality ≤ 10k time series/metric/tenant.
أخذ العينات: الرأس/الذيل للآثار ؛ تقليل 10s→1m→5m→1h المقاييس.
الحصص: حدود النقاط/الثانية والبايت/ثانية لكل خيمة وفئة QoS.
مخططات التحديد: ترفض المقاييس مع ملصقات «الانفجار» (الهوية، البريد الإلكتروني، ip، إلخ).

7) جمع وتسليم: دفع مقابل سحب

الدفع (OTLP/StatsD/HTTP): المرونة، عملاء الهاتف المحمول/الحافة، قنوات P0.
سحب (بروميثيوس): بنية تحتية داخلية، أهداف يمكن التنبؤ بها.
هجين: exporters→gateway→TSDB ؛ الخدوش الاتحادية للمناطق.
النقل: QUIC/HTTP/2، الضغط، الجزر، TLS/mTLS، retrai مع النفاخ.

8) SLI/SLO وتنبيه

8. 1 SLIs الأساسية

توافر% نقاط النهاية/البوابات،

Latency p50/p95/p99 على الطرق الحرجة،

معدل الخطأ (5xx/المهلة/الإجهاض)،

تأخر التسليم بالحافلة، عمق قائمة الانتظار،

نضارة نوافذ المتاجر (ingest→serve تأخير).

8. 2 مثال SLO

P0 خطوط الأنابيب: التوافر ≥ 99. 95%, p99 latency ≤ 400 мс, Delivery lag p95 ≤ 2 с.
P1: توافر ≥ 99. 9٪، النضارة 95 ≤ 3 دقائق.
P2: النضارة p95 ≤ 15 мин، بدون صفحة.

8. 3 تنبيهات بمعدل الحرق (مثال)

نافذة لمدة ساعتين: «خطأ _ ميزانية _ حرق ≥ 2 ×» صفحة →.
6 ساعات نافذة: 'خطأ _ ميزانية _ حرق ≥ 1 ×' → صفحة/تصعيد.
اجمع مع «قائمة الانتظار _ lag» و «drop _ rate» P0.

9) الأقبية والاحتفاظ

مقاييس TSDB: عالية التردد - 7-14 يومًا ؛ المجموع - 6-12 شهرًا

الأحداث/السجلات: تخزين ساخن من 7 إلى 30 يومًا، بارد (كائن) من 6 إلى 24 شهرًا.
المسارات: أخذ العينات 1-10٪ ؛ توفير الامتدادات «البطيئة/الخاطئة» (القائمة على الذيل).
سياسات الحذف/التنقيح فيما يتعلق بطلبات تحديد هوية الموظفين وموضوعات البيانات.

10) الخصوصية والأمن والعزلة

تقليل مؤشر الاستثمار الدولي: ترميز/تسمية مستعارة للحقول، وحظر المعرفات «الخام» في المقاييس.
mTLS/توقيعات الأحداث، تثبيت مفتاح المنتج.
ACL/ABAC بشأن المواضيع/الخدمات/المستأجرين، مفاتيح منفصلة للكتابة/القراءة.
صندوق الرمل المستأجر: الفصل المنطقي/المادي، والحدود وحد السعر لكل مستأجر.
مسار التدقيق: عدم تغيير سجلات الوصول/التغييرات في التكوينات.

11) تدفقات المعالجة (وظائف التيار)

إثراء: تطبيع، geo/version/traffic class.
المجموع: نوافذ 10 ث/1 م/5 م، مخطط نسيجي، رسومات كمية.
اكتشف: حالات شاذة (EWMA/ESD)، وانجراف التوزيعات، واندفاعات من قوائم الانتظار.
الطريق: مروحة لعرض/تنبيه/شركاء خطابات الويب.
الحارس: «الزر الأحمر» - الخنق/تبديل القتل حسب المصدر/الموضوع.

12) لوحات القيادة (تخطيطات مرجعية)

Ops Core (ساعة/في الوقت الفعلي): زمن الوصول p95، معدل الخطأ، تأخر التسليم، عمق قائمة الانتظار، تناول معدل النجاح.
صحة خطوط الأنابيب: النضارة لكل خط أنابيب، معدل الانخفاض، الضغط الخلفي، معدل الحرق SLO.
استخدام المستأجر: صفوف/ثانية، بايت/ثانية، كاردينالية، أعلى الملصقات.
الأمان/الامتثال: أوضاع نظام الرصد والتقييم والإبلاغ، ومفاتيح انتهاء الصلاحية، والوصول، وتنقيحات مؤشر الاستثمار الدولي.
عدسة الأعمال: التحويل/الدفع/جسر SLIs بجوار المقاييس التقنية.

13) أمثلة التكوين

فئات وحدود QoS (YAML)

yaml telemetry:
qos:
P0:
topics: [payout. sli, bridge. finality, gateway. availability]
delivery: guaranteed retry:
attempts: 3 backoff_ms: [100, 400, 800]
max_queue_lag_ms: 2000
P1:
topics: [product. events, api. metrics]
delivery: at-least-once sampling: 1. 0
P2:
topics: [debug. logs, verbose. traces]
delivery: best-effort sampling: 0. 1 quotas:
tenant_default:
metrics_points_per_sec: 50_000 logs_mb_per_hour: 500 traces_spans_sampled_pct: 5

الملصقات المترية (السياسة)

yaml metrics_policy:
allowed_labels: [service, route, code, region, tenant, version]
forbidden_labels: [user_id, email, ip, session_id]
max_label_value_count: 1000

معدل حرق التنبيهات

yaml alerts:
- name: "p0_error_burn_2h"
expr: burn_rate_p0_2h > 2 action: [page_oncall, open_incident]
- name: "queue_lag_p0"
expr: queue_lag_ms_p95 > 2000 action: [page_oncall]

14) مخططات البيانات والاستفسارات

سجل متري (دليل)

sql
CREATE TABLE metric_catalog(
name TEXT PRIMARY KEY,
unit TEXT, description TEXT,
labels JSONB, owner TEXT, qos TEXT, sla JSONB
);

قوائم الانتظار والتأخر

sql
SELECT topic,
PERCENTILE_CONT(0. 95) WITHIN GROUP (ORDER BY lag_ms) AS lag_p95,
SUM(dropped) AS drops
FROM queue_metrics
WHERE ts >= now() - INTERVAL '24 hours'
GROUP BY topic;

كاردينالية الخيمة

sql
SELECT tenant, metric_name, COUNT(DISTINCT series_id) AS series
FROM tsdb_series
WHERE day = current_date
GROUP BY tenant, metric_name
ORDER BY series DESC
LIMIT 50;

15) العمليات والأدوار

مالك القياس عن بعد - مخططات/سياسات/حصص، مراقبة الكاردينالية.
SRE/Ops - SLO، التنبيهات، الحوادث، التوسع.
الأمن/الامتثال - المفاتيح، والوصول، و PII، وعمليات التدقيق.
Product/BI - KPI showcases, analytics, A/B metrics.
المستأجرون (الشركاء) - تكامل SDK الصحيح، الامتثال للعقد.

16) حوادث قواعد اللعبة

ألف - انفجار الكرازة

1. منتج/مقاييس الكتلة التلقائية، 2) قطع الملصقات «السيئة»، 3) التجميع الرجعي، 4) قواعد ما بعد الوفاة والبطانة.

ب. ارتفاع قائمة الانتظار P0

1. تشمل الأولوية، 2) توسيع نطاق الأطراف/المستهلكين، 3) تقليل أخذ العينات P2 مؤقتًا، 4) تحليل عنق الزجاجة.

جيم - سقوط واجهات متاجر النضارة

1. قم بالتبديل إلى الموصل الاحتياطي، 2) قم بتشغيل وضع التحلل («آخر نهائي»)، 3) قم بإخطار مالكي المصدر.

دال - تسرب المبادرة في المقاييس

1. منع التدفق الفوري، 2) تنقيح الطبقة الساخنة، 3) إخطار DPO/الامتثال، 4) تحديث lenter/SDK.

هاء - أخطاء فادحة تبلغ 5xx/ضئيلة

1. الصفحة، 2) أخذ العينات على أساس الذيل ↑ للأخطاء، 3) تشخيصات تتبع المسار الحرجة، 4) التراجع/علم الميزة.

17) قائمة التنفيذ المرجعية

1. الموافقة على عقود الأحداث/المقاييس/التتبع وقائمة بالعلامات المقبولة.
2. إنشاء فصول QoS والمواضيع/قوائم الانتظار وميزانية الحصص والمقاييس.
3. إعداد intest (دفع/سحب)، TLS/mTLS، retrai و idempotency.
4. تضمين المقاييس/أدلة الأحداث ومخططات المخطط.
5. حدد SLI/SLO، التنبيهات والتصعيدات بمعدل الحرق.
6. بناء لوحات القيادة العمليات/خطوط الأنابيب/المستأجر/الأمن.
7. إجراء اختبارات فوضى القياس عن بعد (فقدان/نفث/التصاقات).
8. إعادة النظر بانتظام في تكاليف الكاردينالية والاحتفاظ بها والتخزين.

18) مسرد

QoS - جودة التسليم/فئة الأولوية.
النضارة - تأخير ظهور البيانات في العرض.
معدل الحرق - معدل استهلاك الميزانية عن طريق الخطأ مقارنة بمعدل استهلاك الميزانية.
الكاردينالية - عدد الصفوف الفريدة من المقاييس (مجموعات الملصقات).
أخذ العينات القائمة على الذيل - مجموعة مختارة من الآثار «البطيئة/الخاطئة».
مفتاح الفراغ - مفتاح تكرار الحدث.

خلاصة القول: إن توزيع الإشارات والمقاييس ليس مجرد «جمع وعرض الرسوم البيانية»، بل هو انضباط العقود وقنوات QoS والميزانيات. من خلال اتباع هذا الإطار، يكتسب النظام الإيكولوجي إمكانية الرصد التي يمكن التنبؤ بها، ومقاومة الطفرة، والبيانات الخاصة، ومفيدة للقرارات في كل من الملامح التشغيلية والتجارية.

Contact

اتصل بنا

تواصل معنا لأي أسئلة أو دعم.نحن دائمًا جاهزون لمساعدتكم!

Telegram
@Gamble_GC
بدء التكامل

البريد الإلكتروني — إلزامي. تيليغرام أو واتساب — اختياري.

اسمك اختياري
البريد الإلكتروني اختياري
الموضوع اختياري
الرسالة اختياري
Telegram اختياري
@
إذا ذكرت تيليغرام — سنرد عليك هناك أيضًا بالإضافة إلى البريد الإلكتروني.
WhatsApp اختياري
الصيغة: رمز الدولة + الرقم (مثال: +971XXXXXXXXX).

بالنقر على الزر، فإنك توافق على معالجة بياناتك.