رؤية الدوائر والتجمعات
1) جسم المهمة والمراقبة
رؤية الدوائر والعقد هي قدرة النظام البيئي على رؤية وقياس وشرح سلوك التدفقات بين الدوائر (حركة المرور/الأحداث/المدفوعات/CCM/المحتوى) والعقد (المشغلون، الاستوديوهات/RGS، PSP/APM، KYC/مزودي AML، الشركات التابعة، المجمعين، عقد التيار). الأهداف:- والسببية من طرف إلى طرف (انقر على الفاتورة) ؛
- والمنظمات غير الحكومية التي يمكن التنبؤ بها والمخاطر المدارة ؛
- سريع RCA ومنخفض MTTR ؛
- قابلية الإثبات (الموجزات الموقعة، مراجعة WORM) بأقل تكلفة للقياس عن بعد.
2) أنطولوجيا القابلية للرصد
الكيانات:- 'chainId'، 'nodeId'، 'role' (المشغل/الاستوديو/psp/kyc/الانتساب/التيار)، 'الولاية القضائية'، 'env' (prod/stage/sbx)، 'traceId'، 'spanId'،' routeId'، 'جدول معرف، "apmRouteId'.
- «عقد»، «جلسة _ بدء»، «تسجيل»، «kyc _ status'،» إيداع/سحب «،» رهان/دوران «،» مكافأة _ منح «،» postback _ أرسل/استلم «،» الجائزة الكبرى _ مساهمة/زناد «،» stream _ sli «،» rg _ guardrail _ hit'.
- المقاييس (RED/USE/Golden Signals)، الآثار (W3C traceparent)، السجلات (الهيكلية)، الأحداث (الأعمال)، RUM/Synthetic (العميل/القنوات)، التدقيق/WORM (غير قابل للتغيير).
وجميع المخططات محفوظة في سجل المخططات ؛ الأوقات UTC/ISO-8601.
3) النقل والارتباط
OpenTelemetry: شكل واحد للمقاييس/السجلات/الامتدادات ؛ المصدرين إلى معالجي المصارف/المصارف.
سياق تتبع W3C: يتم إلقاء «traceparent »/« tracestate» من خلال إعادة التوجيه وواجهات برمجة التطبيقات وخطافات الويب والحافلة.
الخصوصية: «مفتاح الخصوصية» على المسارات الحرجة (المدفوعات/البريد).
مرة واحدة بالضبط في المعنى: هاش جد/مؤشر التاريخ، سجل إعادة تشغيل الويب.
النماذج: ربط مخططات الكمون مع «معرف التتبع» المحدد لـ RCAs السريع.
4) نموذج SLI/SLO وميزانيات الأخطاء
الإشارات الذهبية: زمن الوصول، حركة المرور، الأخطاء، التشبع.
RED: معدل، أخطاء، مدة.
الاستخدام (البنية التحتية): الاستخدام والتشبع والأخطاء.
- خطوط الويب: التسليم ≥ 99. 9٪، p95 ≤ 1-2 ث.
- واجهة برمجة التطبيقات الشريكة: p95 ≤ 150-300 مللي ثانية، معدل الخطأ ≤ 0. 3–0. 5%.
- حافلة الأحداث: متأخرة p95 ≤ 200-500 ms ؛ التسليم ≥ 99. 9%.
- المدفوعات/AWS: CR في ممر الموجز ؛ الترخيص e2e ≤ x s.
- KYC: معدل النجاح ومراحل SLA حسب الوصف القضائي.
- Live/SFU/CDN: e2e 2-3 s، خسارة الحزمة ≤ 1٪، وقت التشغيل ≥ 99. 9%.
- لوحات القياس: نضارة ≤ 1-5 ثانية ؛ p95 ≤ 1. 5–2. 0 s.
ميزانية الخطأ: فترات الإصلاح (على سبيل المثال، 30 يومًا)، أنواع الأخطاء (5xx، المهلات، انتهاكات SLO)، قواعد المكافأة التلقائية/المالوس وأزرار الإيقاف.
5) لوحات القيادة: طبقات وقطع أثرية
1. الرسم البياني للخدمة (tsepi↔uzly): الطوبولوجيا، rps/eps، p95/p99، معدل الخطأ، التشبع، تيارات خريطة الحرارة حسب الولاية القضائية.
2. تدفق الأعمال التجارية: klik→registratsiya→KYC→depozit→FTD→stavka/raund→vyplata; قمع التحويل ونوافذ الإسناد.
3. المدفوعات/KYC: CR × جهاز × الجغرافية، رموز الفشل، مراحل الكمون، القطع التلقائي مع التعليقات التوضيحية.
4. المحتوى/RGS/Live: رحلة ذهابًا وإيابًا، معدل الخطأ، SFU/CDN SLI، لوحات الصدارة والجائزة الكبرى.
5. التراجع/الإسناد: التوقيت، الجدل، التخلص، تأخر المؤشر.
6. الثقة والمخاطر: بطاقات أداء العقدة (SLO/ATTR/RG/SEC)، «الوقت لكل حزمة ضئيلة»، توقعات المستوى.
تحتوي كل لوحة على إصدارات صيغة وروابط إلى سجل التغيير.
6) التنبيه والتصعيد
تنبيهات SLO متعددة المستويات: التحذير (معدل الحرق 2 ×)، النقد (معدل الحرق 10 ×)، الإجراءات اللاحقة (طرق/حدود التبريد).
محفزات التركيب: «latency↑ + CR↓ + postback lag↑» → الشك في تدهور PSP.
قنوات الأدوار: SRE/Payments/KYC/RGS/Marketing/Finance/Legal/RG ؛ يتيح على الفور «التعقب »/« دليل التشغيل »/زر التوقف.
سياسات الغفوة/التمزيق للمقاييس الصاخبة، ولكن لا يوجد تشويش P1.
7) RCA и غرفة الحرب
SLA لكل حزمة: 60-90 s (P1/P2).
نمط RCA «لا لوم»: حقيقة → فرضية → تجربة → وضع → المتابعة → حيز التنفيذ.
الإصدار diff (الفقرة 2 الأحداث): التحقق التلقائي من الاصطدامات/الصيغ/التكوينات في نافذة الحادث.
SLO بعد الوفاة: وقت الكشف، والتوقف، والتراجع، والاستقرار، ونشر الملاحظات.
8) جودة البيانات ونسبها
جودة البيانات SLI: الاكتمال والنضارة والتفرد («معرف الحدث») واتساق العملات/المواقع.
النسب: من واجهات المحلات/اللوحات إلى المصادر (المخططات/الإصدارات/المالكون).
Oracles: المجاميع الموقعة (GGR/NetRev/SLO/RG)، "FormulaVersion"، "hash (المدخلات)"، "kid'، الفترة.
مراجعة WORM: صيغة ثابتة/مفتاح/استثناء/سجلات فاتورة.
9) الخصوصية والولايات القضائية والأمن
Zero Trust: mTLS، الرموز القصيرة الأجل، ext-encret-list، التناوب الرئيسي/JWKS.
تقليل PII إلى أدنى حد: ترميز «معرف اللاعب»، وإزالة الدماغ فقط في المناطق الآمنة ؛ حظر PD في جذوع الأشجار/المقاييس.
ABAC/ReBAC/SoD: «انظر وصولهم واتفق» ؛ «قياس ≠ التأثير ≠ التغيير»
تحديد مواقع البيانات وإدارة الشؤون السياسية/إدارة الشؤون السياسية بالنسبة للأسواق ؛ سياسات التطهير و TTL.
10) تكلفة القياس عن بعد وإدارة الكاردينالات
ميزانية الكاردينالية: حدود البطاقة التعريفية (محظورة ؛ routeId/campaignId - مسموح به).
مخطط نسيجي بدلاً من المئوية أثناء الطيران ؛ نماذج للتفصيل الانتقائي.
أخذ عينات تكيفية من الآثار: النسبة المئوية الأساسية + الأولوية للأخطاء/المسارات البطيئة/الإصدارات الجديدة.
التقليل من الحجم/عمليات التشميل حسب العمر (1s→1m→5m) ؛ تخزين مسارات RAW قصير، الركام أطول.
SLO-first: جمع فقط ما يدعم الحلول (SLO/finance/compliance).
11) التكامل مع الإدارة (SRE ↔ business)
ترتبط إصدارات حواجز الحماية والحملات بميزانيات SLO/الأخطاء.
قطع طرق APM/KYC تلقائيًا عندما تتجاوز المقاييس الممرات.
RevShare/Limits: يؤثر مضاعف الجودة 'Q' (من SLO/ATTR/RG/SEC) على الأسعار والحصص.
بطاقات أداء العقد → تحديد أولويات حركة المرور والوصول إلى الطيارين.
12) الأنماط المضادة
«العديد من الحقائق» بمقاييس الصيغة والنوافذ المختلفة.
عوض ترقيم التاريخ تحت التحميل (استخدم المؤشرات).
مؤشر استثمار الاستثمار في السجلات/الألواح ؛ تصدير PD إلى BI.
حديقة حيوان ما بعد العودة وخطافات الويب غير الموقعة → تأخذ/ثقوب/نزاعات.
الرسم البياني بدون "traceId': اللوحة جميلة، ولا توجد سببية.
عاصفة تنبيه بدون معدل حرق وطرق لعب الأدوار.
مجمع القياس عن بعد SPOF بدون N + 1/DR.
الاستثناءات بدون TTL/التدقيق هي تجاوزات صارمة.
13) القوائم المرجعية
تصميم
- أنطولوجيا الإشارات والدوائر ؛ الإصدارات والمالكين.
- W3C traceparent في كل مكان ؛ المفتاح على المسارات الحرجة.
- ميزانيات الأرصدة السمكية المنخفضة السرعة/الأرصدة السمكية المنخفضة السرعة والأخطاء ؛ أزرار التوقف ؛ حواجز الحماية.
- سياسات الكاردينالية وأخذ العينات والاحتفاظ بها/نشرها.
- الخصوصية/PII: الترميز، DPA/DPIA، التوطين.
- التنبيهات والدفاتر القائمة على الأدوار.
ابدأ
- المطابقة للآثار/المقاييس/السجلات ؛ المسارات الاصطناعية.
- القياس عن بعد للكناري للإطلاقات ؛ قبل/بعد.
- كتب اللعب في غرف الحرب ؛ SLA لكل طرد أثر.
عملية
- بطاقات أداء العقدة الأسبوعية ؛ تقارير معدل الحرق.
- تغييرات الصيغة الشهرية وتنقيحات SLO/الحد.
- تمارين DR/xaoc للمجمعات/الإطارات/واجهات المحلات.
14) خارطة طريق النضج
v1 (Foundation): المقاييس الأساسية + الجذوع، وحيدة التعرف، و RCAs اليدوية، و SLOs الأولية.
v2 (التكامل): OpenTelemetry في كل مكان، رسم بياني للخدمة، حواجز حماية، خط أنابيب أوراكل، تنبيهات لعب الأدوار.
v3 (الأتمتة): التدهور التنبؤي، القطع التلقائي APM/KYC/RGS، التسوية الذكية، الحد من الديناميكيات بواسطة 'Q'.
v4 (الحوكمة الشبكية): الإشارات المشتركة بين السلاسل وتبادل الأوراكل، الصيغة/قواعد إدارة الشؤون الإدارية، سندات الخزانة الشفافة.
15) مقاييس النجاح
الجودة/المخاطر: MTTR↓، MTTD↓، قابلية الخلاف <X٪، حصة التوقف التلقائي/التراجع، تغطية المسار ≥ 95٪.
الأعمال: رفع القدرة على التنبؤ CR/FTD/ARPU/LTV، دقة وتوقيت عمليات العودة البريدية، الاستقرار NetRev.
التقنية: p95 API/webhooks/tires/showcases في الممرات ؛ وقت تشغيل العقدة/CDN/SFU ≥ 99. 9%.
الاقتصاد: التكلفة إلى المراقبة (CTO) لكل rps/event، نسبة مئوية مجاميع مع نماذج، تخزين RAW في حدود.
الامتثال: 0 تسريبات PD، عمليات تدقيق ناجحة لـ DPIA/DPA، توافر 100٪ من سجلات WORM.
موجز
الرؤية هي حلقة ثقة في الإنتاج: أنطولوجيا واحدة، وآثار من طرف إلى طرف، وشريعة للمقاييس والأحداث، وحدائق SLO وأوراكل البيانات، والخصوصية الافتراضية وانضباط تكلفة القياس عن بعد. هذا الإطار يجعل السلاسل والعقد شفافة ويمكن التنبؤ بها ويمكن إثباتها، والنظام البيئي سريع الاستجابة ومقاوم للمخاطر.