GH GambleHub

دليل الحوادث في المدفوعات

TL; د

حادثة الدفع هي عملية خاضعة للرقابة: تصنيف → استقرار UX (feiler/deladation) بسرعة → توفير المال (قواعد الخصوصية/الكتلة) → التواصل بشفافية → استعادة → إصلاح RCA. SLOs الرئيسية: MTTA، MTTR، TtW/TtR، AR، Webhook p95، عدم التسامح مع الشحن المزدوج/الاسترداد.

1) مصفوفة الشدة والتأثير

سيفتعريفأمثلةالأغراض
P0التأثير الجماعي والخسارة النقدية/عدم القدرة على الدفعAuth <− 20 pp، رسوم مزدوجة، ملف دفع تعويضات جماعية، توقف التسويةMTTA ≤ 15 دقيقة، MTTR ≤ 2 ساعة
ف 1تدهور كبير في القطاعاتWebhook p95> 30 c, payout TtW p95> SLO, AR by BIN/country − 8 pp MTTA ≤ 30 min, MTTR ≤ 4 h
ف 2القطاع/الميزة المقيدةارتفاع خطأ استرداد الأموال إلى 0. 5٪، تقارير PSP متأخرةMTTA ≤ 4h، MTTR ≤ 2p
ف 3الصغرى/الورقارتداد سجل، انجراف مخطط صغيروفقا للخطة

المحفزات: تنبيهات جيش تحرير السودان/الخزانة/التسوية، وقمم الدعم، ورصد الكمون/الخطابات الشبكية.

2) الأدوار وقناة الاتصال

قائد الحادث (IC) هو صاحب الجدول الزمني والحلول.
Payments Tech Lead - التوجيه، الغباء، يتميز بالأعلام.
قيادة الخزانة - السيولة والتمويل الأولي واحتياطيات الإجهاد.
المخاطر/AML - العقوبات، قواعد الحظر، SoF/SoW.
مدير الاتصالات - نماذج للدعم/الشركاء، تحديثات الحالة.
Recon/Finance - تسوية، عكس/يوميات، تقديرات الخسائر.

المقر: # payments-incident-warroom (دردشة)، Zoom-bridge + live timeline document (UTC).

3) حلقة عالمية (لأي حادث)

1. اكتشاف & الفرز → تأكيد المقاييس/التغطية، تعيين Sev.
2. استقر UX → التوجيه، وتحلل الميزات، وتجميد الإجراءات التلقائية الخطرة.
3. → السلامة المالية تمكين الخصوصية/الكتل (استرداد/دفع)، إصلاح السجلات.
4. إبلاغ → التحديث الداخلي (15/30/60 دقيقة)، والرسائل الخارجية (الحالة/اتفاق إيتا/الحلول البديلة).
5. استرداد → التراجع التدريجي/فتح، التحقق من SLO.
6. تسوية → مقارنة دفتر الأستاذ/PSP/البنك، وحساب الأثر المالي.
7. RCA (وحدات الأعمال ≤5) → الجذور والإجراءات والمنع والمهام.

4) السيناريوهات النموذجية و Runbook 'و

4. 1 Auth Drop/Latency Spike (Cards/A2A)

الأعراض: AR↓، declines↑ ناعمة، p95 auth> 1-2 s.

الإجراءات:
  • التوجيه الذكي: PSP_A→PSP_B، زيادة 3DS-challenge على BINs الضعيفة.
  • حد retrays (backoff + jitter)، حماية الخصوصية «auth _ key».
  • تبديل القطع: عالي الخطورة إلى نص «صارم» ؛ تقليل حدود التذاكر العالية.
  • البلاغات: «ملاحظة التحلل»، توصي بطريقة بديلة.
  • الاستعادة: العودة التدريجية لحصة حركة المرور، ومراقبة AR في سياق BIN × GEO.

4. 2 خطافات الويب تأخير/تكرار

الأعراض: p95> 3-5 c، ثغرات التقاط/استرداد/دفع تعويضات، مكررة.

الإجراءات:
  • التحول إلى الاقتراع ؛ تعزيز الخصوصية في TTL.
  • تجميد عمليات التجديد التلقائي والمدفوعات التلقائية المحفوفة بالمخاطر.
  • مضاد مزدوج: متجر مرة واحدة بواسطة "idempotency _ key/provider _ txid'.
  • إجراء عمليات اللحاق بالركب ؛ مع سجلات PSP.
  • الاسترداد: تمكين الاتصالات الشبكية ومقارنة الاتساق مع التقارير.

4. 3 فشل الدفع/تدهور TtW

الأعراض: Success%↓، p95↑ TtW، العودة/المهلة.

الإجراءات:
  • Feilover إلى السكك الحديدية الاحتياطية (RTP/SEPA/PSP الأخرى).
  • الخزانة: مجموعة المدفوعات المسبقة، تنشيط StressRes.
  • قفل المدفوعات لتحديد أولويات كبار الشخصيات عالية المخاطر.
  • الاتصالات: ETA والبدائل، شفافية الأوضاع في الحساب الشخصي.

4. 4 أخطاء استرداد الأموال/مخاطر الاسترداد المزدوج

الأعراض: استرداد rate↑ الخطأ، عوائد متنازع عليها/مكررة.

الإجراءات:
  • تجميد عالمي لاسترداد الأموال على الطريق التلقائي، يدوي فقط مع الحقوق.
  • «الدفع - معرف + مبلغ + سبب» ؛ قفل الصف على التوازن.
  • إعادة المعايرة وفقًا لتقرير PSP ؛ عكس النسخ المكررة في دفتر الأستاذ، الحالات في DLQ.
  • Kommunikatsii:模板 للبطاقات (T + 1-T + 5 bp)، فورية - تصل إلى 60 ثانية.

4. 5 تأخير التسوية/عدم تطابق دفعة PSP

الأعراض: D + N غير مسجل، diff في المبالغ/الرسوم.

الإجراءات:
  • الخزانة: قم بتشغيل StressRes، وحد من المدفوعات الفورية.
  • ريكون: حدد الدفعة «SUPENSE»، ارفع تذكرة PSP، واطلب بيانًا.
  • FX/الرسوم: قبول «الحقيقة» المؤقتة (السياسة) أو انتظار التصحيح.
  • الاتصالات: أسئلة وأجوبة للدعم (أمن الأموال، توقيت التسوية).

4. 6 تحلل التشفير داخل/خارج المنحدر

الأعراض: TtH↑، slippage↑، نقص السيولة في الموقع.

الإجراءات:
  • SOR→alternativnyy CEX/OTC، خفض حجم القرعة (TWAP).
  • نقل أولئك الذين يدخلون الحد الأقصى للتعرض المستقر/الفيات.
  • اقتل التبديل إذا اختلف oracle> bps حد.

4. 7 قسيمة/محفظة شاذة

الأعراض: ارتفاع رقم التعريف الشخصي غير صالح، السرعة، وعاء جغرافي.

الإجراءات:
  • حدود/تهدئة، استرداد ملزم للجهاز، payout-lock + durnover.
  • فحص الطلب/SoF، تجديد قوائم الكتلة (البريد الإلكتروني/الجهاز/ASN/بائع التجزئة).

5) قوائم الإجراءات المرجعية

5. 1 الدقائق الخمس الأولى (P0/P1)

  • تعيين IC، غرفة حرب مفتوحة.
  • سجل Sev، التغطية، بدء الجدول الزمني (UTC).
  • تمكين أعلام الميزات الآمنة (الخصوصية، تجميد العمليات الآلية اللازمة).
  • بدء ميزة الفشل/التدهور.
  • أول تحديث داخلي (السياق، التدابير، ETA التالي).

5. 2 قبل إغلاق الحادث

  • استعادة SLO (AR/latency/webhooks/TtW/TtR).
  • المصالحة (internal↔PSP↔bank)، لا ثقوب سوداء.
  • تقييم الأثر المالي، التراجعات/المجلات الصادرة.
  • تحديث خارجي/بريد قناة الحالة.
  • يتم تكليف مالك RCA ومهمة المنع.

6) الرصد والتنبيهات ولوحات القيادة

التنبيهات الرئيسية:
  • 'AR_gross↓> 3 pp (إلى p7 متوسط)' → P1/P0 في التغطية.
  • "Auth p95> 1. 5 s/Webhook p95> 5 s/Capture Success <98٪ → P1.
  • «Payout TtW p95> SLO» или «النجاح% <99%» → P1.
  • خطأ استرداد> 0. 3٪ 'или' استرداد مزدوج> 0 '→ P0.
  • «تسوية في الوقت المحدد <99٪ »/« الإبلاغ عن خرق جيش تحرير السودان» → P1.
حوادث لوحة القيادة:

1. Attempt→Auth→Capture الفانيل (مقارنة بخط الأساس).

2. Heatmap AR по BIN × GEO × PSP.

3. Webhook p50/p95، مكرر، ارتداد.

4. Payout/Refund Health (Success٪، TtW/TtR).

5. الخزانة: رصيد L0، ما قبل، StressRes.

6. ريكون: معدل عدم التطابق، الشيخوخة DLQ.

7) الاتصالات (النماذج)

داخلي (15 دقيقة):
💡 'P1 Payments | Auth drown on PSP_A GEO-DE, AR −9pp vs baseline. فشل PSP_B في التقدم، تم تشديد سياسة 3DS لـ BIN 4250. توقفت المبالغ المستردة تلقائيًا مؤقتًا. التحديث التالي 30 دقيقة.
اللاعبون (صفحة الحالة/الأسئلة الشائعة):
💡 "هناك حاليًا تأخيرات في تأكيد المدفوعات والسحب لبعض المستخدمين. يتم الحفاظ على المدفوعات آمنة. نوصي بالطريقة البديلة X. تحديث في 30 دقيقة"
الشركاء/التجار (باختصار):
💡 "تدهور الأذونات لدى المزود ألف في مناطق DACH. يتم تنشيط Feilover على المزود B. وسنرسل تقرير جيش تحرير السودان وتدابير الوقاية استنادا إلى نتائج"

8) المصالحة والمال (بعد الاستقرار)

تشغيل التسوية التلقائية: provider_txid/idem_key/amount/time-bucket.
حدد DLQ: يتيم/مكرر/عدم تطابق المبلغ/انجراف الرسوم.
قم بعكس/تصحيح في دفتر الأستاذ، وإعادة حساب التكلفة/GGR وخسارة الاحتيال.
الخزانة: تدابير مؤقتة قريبة (StressRes، payout-lock)، مجمعات إعادة التوازن.

9) نموذج RCA (تحليل سبب الجذر)

السياق: التاريخ/الوقت (UTC)، Sev، التغطية، المقاييس.
الأعراض: ما رأيته (الرسوم البيانية/لقطات الشاشة).
السبب: الجذر (تلك/العمليات/الطرف المقابل).
ما نجح/لم ينجح: feilover، أعلام مميزة، اتصالات.
الأثر المالي: قروض الشطب/عدم الدفع/العمولات/جيش تحرير السودان.

الوقاية:
  • تلك: حدود، غباء، تراجعات، اختبارات.
  • العمليات: دليل التحديث، QBR مع PSP، تغييرات SLA.
  • المواعيد النهائية وأصحاب المهام.

10) الأتمتة والتكامل

منصة علم الميزة: التوجيه الفوري/التدهور حسب البلد/BIN/الطريقة.
Runbook-bot: أوامر '/فشل PSP_A→B'، '/تجميد العائدات '، '/تمكين الاقتراع'.
كاشف الشذوذ: انحراف إحصائي للواقع المعزز/الكمون مع معرفة الموسمية.
ماكرو ما بعد الحادث: فتح تلقائي لنموذج RCA، ومجموعة من السجلات/الرسوم البيانية، وقائمة مرجعية للمطابقة.

11) تقويم الحفر و UAT

شهريًا: تمرين «Auth drop» (15 دقيقة من detecta إلى feilover).
ربع سنوي: «انقطاع Webhook» + «استرداد الضربة المزدوجة» (الغباء).
نصف سنوي: «تأخير التسوية + إجهاد الخزانة» (StressRes).
حزمة UAT: اختبار حالات الخصوصية، الخداع، المصالحة، الاتصالات.

12) مقاييس نجاح كتاب اللعب (مؤشرات الأداء الرئيسية التشغيلية)

MTTA/MTTR: المتوسط/p95 حسب P0/P1.
النسبة المئوية للفشل التلقائي في غضون 10 دقائق.
الحوادث التي تمنع الرسوم المزدوجة/استرداد الأموال (= 100٪).
يكتمل استطلاع ما بعد الحادث ≤ D + 1.
أرصدة الخدمات المستردة/الشهر (по جيش تحرير السودان).
دقائق تأثير المستخدم.

13) الأخطاء المتكررة وكيفية تجنبها

التنشيط المتأخر للفيلوفر (لا توجد عتبات تلقائية).
عدم وجود «تجميد» في عمليات التشغيل التلقائي عند ارتداد الخطابات الشبكية.
لا يوجد قفل صف/إصدار → استرداد جزئي> الباقي.
الاتصال بدون حقائق/ETA → تصعيد للدعم.
لا يوجد ارتباط مع وزارة الخزانة → خروج TtP/TtW SLO.
تخطي المصالحة → «الثقوب السوداء» في الإيرادات.

14) التطبيقات (كتل مرجعية داخل ويكي الخاص بك)

SLAs مع موفري الدفع - عتبات وقروض التنبيه.
تسوية مدفوعات وتقارير PSP - إجراءات recon/DLQ.
الخزانة: السيولة والاحتياطيات - StressRes/Prefunding.
حلقة الدفع KPI - AR/TtW/TtR/Refund Health formulas.
التطبيقات الجزئية والكاملة هي التطهير والسياسة.

موجز

دليل العمل هو كتاب تشغيل سيناريو و + أتمتة + انضباط ما بعد الوفاة. إنه يقلل من MTTR، ويحمي الأموال (الخصوصية/التسوية/الخزانة)، ويقلل من الضرر الذي يلحق بالمستخدم، ويحسن بشكل منهجي العلاقات مع PSPs على SLAs. النتيجة - الواقع المعزز أعلاه، TtW/TtR في الممرات، صفر يأخذ، تدفق أموال يمكن التنبؤ به.

Contact

اتصل بنا

تواصل معنا لأي أسئلة أو دعم.نحن دائمًا جاهزون لمساعدتكم!

Telegram
@Gamble_GC
بدء التكامل

البريد الإلكتروني — إلزامي. تيليغرام أو واتساب — اختياري.

اسمك اختياري
البريد الإلكتروني اختياري
الموضوع اختياري
الرسالة اختياري
Telegram اختياري
@
إذا ذكرت تيليغرام — سنرد عليك هناك أيضًا بالإضافة إلى البريد الإلكتروني.
WhatsApp اختياري
الصيغة: رمز الدولة + الرقم (مثال: +971XXXXXXXXX).

بالنقر على الزر، فإنك توافق على معالجة بياناتك.