GH GambleHub

הודעה ומערכת התראה

(סעיף: מבצעים וניהול)

1) מטרה ועקרונות

המטרה היא לספק מעט, אך במדויק: רק אותות רלוונטיים, באופן בזמן ובאדם אחראי/רובוט

עקרונות:
  • ניתן לפעול כברירת מחדל: לכל התראה יש בעלים, עדיפות, זמן תגובה וכפתור פעולה.
  • התראות בנויות סביב SLI/SLO, לא מדדים שרירותיים.
  • בקרת רעש: מוות, התאמות, דיכוי סערה.
  • עשיר בהקשר: metadata (אזור, דייר, גרסה, trace_id) וקישור לאלבום.
  • כל ההתראות והתגובות מוכרות ונשמרות ביומן הבלתי משתנה.

2) מקורות אותות

אלה. טלמטריה: זמינות, p95/p99, שיעור שגיאות, תור לג, גבולות משאבים.
אירועים עסקיים: Prissmatch, WebhalLag, RTP Drift, אותות הונאה.
הפרות סולד, גישה למח "ש, פקיעת מפתח/תעודה.
לוח זמנים: משימות SLA שפג תוקפן, מפולות DLQ, סופות מחדש.

3) סיווג וסדרי עדיפויות

עדיפותתגובהדוגמאות
P1 (SEV-0)באופן מיידי, 24 × 7קופה לא זמינה, דליפת מח "ש, כשל ב-PSP באזור הראשי
P2 (SEV-1)קליטה 30-60 דקותגידול p95, webhook lag, השפלה חלקית של הספק
P3 (SEV-2)שעות עבודהמגמת עלות היציאה, גידול מגש מחדש, קרבה למכסות
מידעלא זימוןשחרור מלא, 80% מכסה, סרט. פג תוקף בימים N

מעקות בטיחות: נוסחו התראות בנוגע לתקציב SLO/שגיאה (קצב צריבה).

4) ניתוב והסלמה 24 × 7

ניתוב לפי ההקשר: ”אזור/דייר/מוצר/ספק/חומרה”.
סולם Explator: on-Call Engineering # Legal (עבור PII/Finance).
חובה: סיבוב אחר תפקיד (SRE, App, Data, Security, Piples), קשר גיבוי (צ 'אט/קול/SMS).
חלונות דממה: לילה, שחרור, שיווק; יוצאים מן הכלל עבור P1.

5) הפחתת רעש וקורלציות

Dauplication: by '(טביעת אצבע, אזור, דייר, מסלול) ו-trace _ id.
דיכוי סערה: דיכוי זמני של שכפולים עם P1 פעיל.
התאמות: התקבצות אותות סביב הגורם השורשי (שחרור/תכונה/ספק).
היסטריה: כניסה/יציאה מהסף - שונה כדי להימנע מ ”מסור”.

6) תוכן ערני (תבנית)

כותרת: תמציתית ומהותית - ”EU/Checkout: p95> 250ms (פרצת SLO)”.
שדות מפתח: עדיפות, זמן, אזור, דייר, גרסה, trace_id, מושפע%, הגיון.
מה לעשות עכשיו: 1-3 השלבים הראשונים + קישור לאלבום הריצה/כפתורים (מסלול מחדש, Rollback, Pause Promo).
תקשורת הבאה: בעוד N דקות, בעלים (IC/on-call).

7) ערוצי משלוח

צ 'אט/שליח: הערוץ הראשי של מיון (כרטיסי בוט עם כפתורים).
זימונית/קול/SMS: עבור P1.
דואר: דוחות ולא דחופים (P3/Info).
חוברות אינטרנט: אינטגרציה עם תיקונים/תזמורות.
דף מצב: הודעה חיצונית של לקוחות ושותפים.

8) אינטגרציה וכפתורי פעולה

בוט תקרית: יוצר כרטיס, מקצה IC, פותח גשר וידאו, מתחיל טיימרים.
Ree-Rollback, Raise Limit, Flush Cache, Disable Webhooks, אפשר מצב בטוח.
זכויות: Runes להשיק מוגבל לתפקידים; כל הפעולות חתומות ומחוברות.

9) רב-אזורי ורב-דייר

SLOs/depholds עצמאיים לפי אזור; תקריות מקומיות לא מציירות את כל העולם.
מסנני ראות: שותפים/דיירים רואים רק את שלהם.
דרישות שיפוט: הודעות טקסטים, שפות, אזורי זמן.

10) מדיניות, לוחות זמנים, חלונות שתיקה

מדיניות התראה: בעלים, סף, ערוצים, הסלמה, תבניות.
לוחות שנה: שעות עבודה/שעות עבודה, חלונות שחרור/שיווק.
שינוי קיפאון: הקלת סף או דיכוי ”non-P1” במניות גדולות.

11) ביקורת חשבונות וקיבעון משפטי

קבלות: עבור התראות קריטיות - ”קבלה _ חשיש” וחתימת DSSE.
יומני תולעת: אחסון בלתי משתנה של אירועים ותגובות (שאישרו את מעשיהם).
שרשרת משמורת: איתור הסלמה והחלטות.

12) Metrics System and SLO

MTTA (מכיר): P1 lother 5-10 min; P2 מנוקד 30 דקות.
עומס קצב/קריאה: אותות לכל שינוי - בטווח המטרה.
% False Positive: Target Defloor (בדרך כלל <10-15%).
יעילות המתאם: פרופורציה של אותות מקובצים ב-80%.
משלוח SLO: שיחה 99. 9%, SMS/Voice 99. 5%.
זמן לפעולה: p95 לרוץ רונות מכוננות.

13) לוחות מחוונים ודיווחים

תקריות פעילות, קצב שריפה, מפת אזור/דייר, תור התראה.
איכות התראה: רעש, FP, מבחני סף, אזורים שקטים.
עומס בכוננות: תדר קריאה, זמן תגובה, ”מחוץ לשעות”.
לאחר תקרית: יעילות מנות, לגרום לחזרה.

14) מפרט של iGaming/fintech

תשלומים/PSP: כשל בהספק P1, עלייה בכשלי האישור; מסלול אוטומטי לגיבוי PSP.
RTP & Limits: התראות לצפייה בסחיפת RTP, מעבר לגבולות, דפוסי ניצחון חשודים.
משלוח פיגור, גידול כפול, ירידה בקבלות מאושרות.
מחיר/FX/מס: אי התאמה vitrina↔checkout, מתוך גרסאות פריט סינכרון.
משחק אחראי: RG מפעיל והסלמה בזמן שלהם בתמיכה/ציות.

15) ראסי

אזורRACאני
ארכיטקטורה וסףSRE/פלטפורמהראש Engמוצר, נתוניםכל
הסלמה/חובהצוות IRCOOמשאבי אנוש, אבטחהניהול
הודעות ותבניותתקשורת/תמיכהCOOחוקי/ציותשותפים
ביקורת חשבונות/קבלותציותCCOאבטחה, נתוניםביקורת חשבונות
ספרי שעשועים/רונותבעלים של SRECTOמוצר, אינטגרציותכל

16) רשימת מימושים

[ ] מגדיר את נורת 'סטאר ו ־ SLI/SLO; התראות עמיתים עם קצב צריבה.
[ ] הזן ספריית מדיניות: סף, ערוצים, הסלמה, חלונות דוממים.
[ ] יישום קיפאון, התאמות, היסטרציה, דיכוי סערה.
[ ] הגדרת ריבוי אזורים וכללי ראות רב-דיירים.
[ ] חבר ”כפתורי פעולה” וספרי הפעלה; להגביל את זכויות השיגור.
[ ] לאפשר תולעת/ביל, trace_id עקבות וביקורת זמן הרצה.
[ ] לבנות לוחות מחוונים איכותיים (רעש, FP, MTA, קצב דף).
[ ] Mismatch, RTP Drift.
[ ] סקירה קבועה של סף; סף A/B על מדדים ”מטומטמים”.
[ ] בטעינה ושיפור דו "ח חודשי.

17) ספרי משחק (התייחסות)

PSP Outage (P1): מסלול אוטומטי לרזרבה, הורדת פסקי זמן ללקוחות, הסגר על עסקאות ”אפורות”, עדכון מצב תוך 15 דקות.
WebhalLag (P2): הגדלת עובדים/אצווה, עדיפות תור, הפסקת זמן של נקודות קצה אופציונליות.
PriceMatch (P1/P2): נכות בכוח המטמון, 'fx _ version/mess _ rule _ version' pysilation, rollback, פיצויים.
דריפט RTP (P2): הפוגה בונוס/פרומו, ביקורת פרופיל, ניטור הארכת חלון.
אבטחה: SoD/MFA נכשל (P1/P2): חסימת פעולה, בדיקת JIT מחדש, זיהוי פלילי ומשפטי במקרה הצורך.

18) FAQ

איך להפחית חיוביות כוזבות?
כללים מונחי SLO, קורלציות, היסטרזיס, חלונות אימונים ותיקוני סף קבועים.

מה חשוב יותר - סיקור או דיוק?
עבור P1 - דיוק ומהירות (עדיף פחות, אבל קריטיים). עבור P3 - מגמה וכיסוי עלויות.

האם אני צריך זימון טלפון?
כן, עבור P1; צ 'אט לא יכול להיות זמין או ”שקט”.

איך לא ”לשרוף” את פקודת התורן?
מגבלות קצב הדף, חלוקה מחדש טעינה, המשך השמש, ביקורות רעש חודשיות.

הודעה ומערכת התראה היא צינור מבוקר מאיתות לפעולה. לבנות אותו על SLO, רעש רך, מסלול אחר הקשר, לתת כפתורי פעולה ולתקן הכל באופן חוקי. בדרך זו אתם מפחיתים את MTTA, מסירים את העומס מהתורנות ומגבירים את העמידות העסקית אפילו עם קוצים חדים וכשלונות מספקים.

Contact

צרו קשר

פנו אלינו בכל שאלה או צורך בתמיכה.אנחנו תמיד כאן כדי לעזור.

Telegram
@Gamble_GC
התחלת אינטגרציה

Email הוא חובה. Telegram או WhatsApp — אופציונליים.

השם שלכם לא חובה
Email לא חובה
נושא לא חובה
הודעה לא חובה
Telegram לא חובה
@
אם תציינו Telegram — נענה גם שם, בנוסף ל-Email.
WhatsApp לא חובה
פורמט: קידומת מדינה ומספר (לדוגמה, +972XXXXXXXXX).

בלחיצה על הכפתור אתם מסכימים לעיבוד הנתונים שלכם.