अधिसूचना और चेतावनी तंत्र
(धारा: संचालन और प्रबंधन)
1) उद्देश्य और सिद्धांत
लक्ष्य थोड़ा, लेकिन सटीक रूप से वितरित करना है: केवल प्रासंगिक संकेत, समय पर और एक जिम्मेदार व्यक्ति/रोबोट को एक समझने योग्य अगले चरण के साथ।
सिद्धांत:- डिफ़ॉल्ट रूप से क्रियाशील: प्रत्येक अलर्ट में एक मालिक, प्राथमिकता, प्रतिक्रिया समय और एक एक्शन बटन होता है।
- SLO-first: SLI/SLO के आसपास अलर्ट बनाए गए हैं, मनमाने ढंग से मैट्रिक्स नहीं।
- शोर-नियंत्रण: डेडअप, सहसंबंध, तूफान दमन।
- संदर्भ-समृद्ध: मेटाडेटा (क्षेत्र, किरायेदार, संस्करण, trace_id) और रनबुक से लिंक।
- ऑडिट-रेडी: सभी अलर्ट और प्रतिक्रियाओं को स्वीकार किया जाता है और अपरिवर्तित लॉग में बचाया जाता है।
2) सिग्नल स्रोत
वे। टेलीमेट्री: उपलब्धता, p95/p99, त्रुटि-दर, कतार लैग, संसाधन सीमा।
व्यावसायिक कार्यक्रम: PriceMismatch, WebhookLag, RTP बहाव, धोखाधड़ी के संकेत।
सुरक्षा/अनुपालन: SoD उल्लंघन, PII एक्सेस, कुंजी/प्रमाणपत्र समाप्ति।
शेड्यूलर: एक्सपायर्ड एसएलए कार्य, डीएलक्यू हिमस्खलन, रीट्री-स्टॉर्म।
3) वर्गीकरण और प्राथमिकताएं
गार्ड: SLO/त्रुटि बजट (बर्न दर) के बारे में अलर्ट तैयार किए जाते हैं।
4) रूटिंग और एस्केलेशन 24 × 7
संदर्भ द्वारा रूटिंग: 'क्षेत्र/किरायेदार/उत्पाद/प्रदाता/गंभीरता'।
एस्केलेटर सीढ़ी: ऑन-कॉल इंजीनियर → कमांड लीड → ड्यूटी मैनेजर → एक्सेक/लीगल (पीआईआई/फाइनेंस के लिए)।
ड्यूटी: रोल द्वारा रोटेशन (एसआरई, ऐप, डेटा, सुरक्षा, भुगतान), बैकअप संपर्क (चैट/वॉयस/एसएमएस)।
मौन खिड़कियां: रात, रिलीज, विपणन; P1 के लिए अपवाद।
5) शोर में कमी और सहसंबंध
Deduplication: '(फिंगरप्रिंट, क्षेत्र, किरायेदार, मार्ग)' और 'ट्रेस _ id' द्वारा।
तूफान दमन: सक्रिय पी 1 के साथ डुप्लिकेट का अस्थायी दमन।
सहसंबंध: मूल कारण (रिलीज/फीचर/प्रदाता) के आसपास संकेतों को समूहीकृत करना।
हिस्टेरिसिस: दहलीज से प्रवेश/निकास - "देखा" से बचने के लिए अलग।
6) अलर्ट सामग्री (टेम्पलेट)
शीर्षक: संक्षिप्त और ठोस - "ईयू/चेकआउट: p95> 250 मीटर (एसएलओ उल्लंघन)"।
प्रमुख क्षेत्र: प्राथमिकता, समय, क्षेत्र, किरायेदार, संस्करण, , प्रभावि कारण।
अब क्या करें: पहले 1-3 चरण + रनबुक/बटन (री-रूट, रोलबैक, पॉज़प्रोमो) का लिंक।
अगला संचार: एन मिनट में, मालिक (आईसी/ऑन-कॉल)।
7) डिलीवरी चैनल
चैट/मैसेंजर: ट्राइएज का मुख्य चैनल (बटन के साथ बॉट कार्ड)।
पेजर/वॉयस/एसएमएस: P1 के लिए।
मेल: रिपोर्ट और गैर-तत्काल (P3/जानकारी)।
वेबहूक: टिकटिंग/ऑर्केस्ट्रेटर के साथ एकीकरण।
स्थिति पृष्ठ: ग्राहकों और भागीदारों की बाहरी अधिसूचना।
8) एकीकरण और एक्शन बटन
हादसा बॉट: एक कार्ड बनाता है, एक आईसी असाइन करता है, एक वीडियो ब्रिज खोलता है, टाइमर शुरू करता है।
Руны (ऑटो-एक्शन): री-रूट, रोलबैक, राइज़लिमिट, फ्लश कैश, अक्षम वेबहूक, सुरक्षित मोड सक्षम करें।
अधिकार: रून्स लॉन्च भूमिकाओं तक सीमित; सभी कार्यों पर हस्ताक्षर और लॉग इन हैं।
9) बहु-क्षेत्र और बहु-किरायेदार
क्षेत्र द्वारा स्वतंत्र एसएलओ/थ्रेसहोल्ड; स्थानीय घटनाएं पूरी दुनिया को "पेंट" नहीं करती हैं।
दृश्यता फिल्टर: भागीदार/किरायेदार केवल अपने स्वयं के देखते हैं।
क्षेत्राधिकार आवश्यकताएं: अधिसूचना ग्रंथ, भाषा, समय क्षेत्र।
10) नीतियां, अनुसूची, मौन खिड़कियां
अलर्ट नीति: मालिक, थ्रेसहोल्ड, चैनल, वृद्धि, टेम्पलेट।
कैलेंडर: वर्किंग/नॉन-वर्किंग घंटे, रिलीज ़/मार्केटिंग विंडो।
फ्रीज बदलें: बड़े शेयरों के दौरान थ्रेसहोल्ड को आसान बनाना या "non-P1" दबाना।
11) लेखा परीक्षा और कानूनी निर्धारण
प्राप्तियाँ: महत्वपूर्ण अलर्ट के लिए - 'रसीद _ हैश' और डीएसएसई हस्ताक्षर।
WORM लॉग: घटनाओं और प्रतिक्रियाओं का अपरिवर्तनीय भंडारण (जिन्होंने पुष्टि की कि उन्होंने क्या किया)।
चेन-ऑफ-हिरासत: वृद्धि और निर्णय का पता लगाना।
12) अधिसूचना प्रणाली मेट्रिक्स और एसएलओ
MTTA (स्वीकार करें): P1 ≤ 5-10 मिनट; P2 ≤ 30 मिनट।
पृष्ठ दर/ऑन-कॉल लोड: लक्ष्य सीमा में प्रति शिफ्ट संकेत।
गलत पॉजिटिव%: लक्ष्य दहलीज ≤ (आमतौर पर <10-15%)।
सहसंबंध दक्षता: समूहीकृत संकेतों का अनुपात ≥ 80%।
डिलीवरी एसएलओ: चैट ≥ 99। 9%, एसएमएस/आवाज ≥ 99। 5%.
टाइम-टू-एक्शन: अलर्ट से रन चलाने के लिए p95।
13) डैशबोर्ड और रिपोर्ट
परिचालन: सक्रिय घटनाएं, बर्न-रेट, क्षेत्र/किरायेदार मानचित्र, सतर्क कतार।
अलर्ट गुणवत्ता: शोर, एफपी, दहलीज रिटेस्ट, मूक क्षेत्र।
ऑन-कॉल लोड: पेजिंग फ्रीक्वेंसी, रिस्पांस टाइम, "आउट ऑफ घंटे।"
पोस्ट-घटना: दक्षता चलाता है, पुनरावृत्ति का कारण बनता है।
14) iGaming/fintech की विशिष्टता
भुगतान/पीएसपी: पी 1 - प्रदाता विफलता, प्राधिकरण विफलताओं में वृद्धि; बैकअप पीएसपी के लिए ऑटो-रूट।
RTP & Limes: आरटीपी बहाव, सीमा से अधिक, संदिग्ध जीत पैटर्न देखने के लिए अलर्ट।
सहयोगी/वेबहूक: डिलीवरी लैग, डबल ग्रोथ, पुष्टि प्राप्तियों में गिरावट।
मूल्य/एफएक्स/कर: vitrina↔checkout बेमेल, सिंक कलाकृति संस्करणों से बाहर।
जिम्मेदार नाटक: आरजी ट्रिगर और समर्थन/अनुपालन में उनकी समय पर वृद्धि।
15) RACI
16) कार्यान्वयन चेकलिस्ट
- नॉर्थ-स्टार और एसएलआई/एसएलओ को परिभाषित करें; बर्न-रेट के साथ सहयोगी अलर्ट।
- नीति निर्देशिका दर्ज करें: थ्रेसहोल्ड, चैनल, वृद्धि, मौन विंडो।
- गतिरोध, सहसंबंध, हिस्टेरिसिस, तूफान दमन को लागू करें।
- बहु-क्षेत्र और बहु-किरायेदार दृश्यता नियमों को कॉन्फ़िगर करें।
- "एक्शन बटन" और रनबुक को कनेक्ट करें; लॉन्च अधिकारों को प्रतिबंधि
- WORM/Bill, trace_id ट्रेस और रनटाइम ऑडिट सक्षम करें।
- गुणवत्ता डैशबोर्ड (शोर, एफपी, एमटीटीए, पृष्ठ दर) का निर्माण करें।
- Провести गेमडे: पीएसपी आउटेज, वेबहुकलाग, प्राइसमिसमैच, आरटीपी बहाव।
- नियमित रूप से थ्रेसहोल्ड की समीक्षा करें; ए/बी थ्रेसहोल्ड "गूंगा" मेट्रिक्स पर।
- ऑन-कॉल लोड और सुधार रिपोर्ट मासिक।
17) प्लेबुक (संदर्भ)
PSP आउटेज (P1): रिजर्व करने के लिए ऑटो-रूट, क्लाइंट टाइमआउट को कम करना, संगरोध "ग्रे" लेनदेन, 15 मिनट में स्थिति अपडेट।
WebhookLag (P2): श्रमिकों/बैच में वृद्धि, कतार प्राथमिकता, वैकल्पिक समापन बिंदुओं का समय ठहराव।
PriceMismacch (P1/P2): कैश फोर्स विकलांगता, 'fx _ varsion/tax _ rule _ version' सामंजस्य, कलाकृति रोलबैक, क्षतिपूर्ति।
RTP बहाव (P2): बोनस/प्रोमो ठहराव, प्रोफ़ाइल ऑडिट, निगरानी विंडो एक्सटेंशन।
सुरक्षा: SoD/MFA विफल (P1/P2): यदि आवश्यक हो तो ऑपरेशन अवरुद्ध, JIT रिचेक, फोरेंसिक और कानूनी।
18) एफएक्यू
झूठी सकारात्मकता को कैसे कम करें?
एसएलओ-उन्मुख नियम, सहसंबंध, हिस्टेरिसिस, प्रशिक्षण खिड़कियां और नियमित दहलीज संशोधन।
अधिक महत्वपूर्ण क्या है - कवरेज या सटीकता?
पी 1 के लिए - सटीकता और गति (अधिमानतः कम, लेकिन महत्वपूर्ण)। पी 3 - प्रवृत्ति और लागत कवरेज के लिए।
क्या मुझे फोन पेजिंग की जरूरत है?
हां, P1 के लिए; चैट उपलब्ध नहीं हो सकता है या "हशेड" नहीं हो सकता है।
ऑन-कॉल कमांड को "बर्न" कैसे नहीं करें?
पृष्ठ दर सीमा, लोड पुनर्वितरण, अनुवर्ती सूर्य, मासिक शोर समीक्षा।
सारांश: अधिसूचना और चेतावनी प्रणाली सिग्नल से कार्रवाई तक एक नियंत्रित पाइपलाइन है। इसे एसएलओ पर बनाएं, शोर को कम करें, संदर्भ से मार्ग करें, एक्शन बटन दें और कानूनी रूप से सब कुछ ठीक करें। इस तरह आप MTTA को कम करते हैं, ऑन-कॉल से लोड को हटा देते हैं और तेज स्पाइक्स और प्रदाता विफलताओं के साथ भी व्यापार लचीलापन बढ़ाते हैं।