सर्किट और असेंबली की दृश्यता
1) कार्य और अवलोकन वस्तु
सर्किट और नोड्स की दृश्यता एक पारिस्थितिकी तंत्र की अंतर-सर्किट प्रवाह (ट्रैफिक/इवेंट/पेमेंट/सीसीएम/कंटेंट) और नोड्स (ऑपरेटर, स्टूडियो/आरजीएस, पीएसपी/एपीएम, केवाईसी/एएमएल प्रोवाइडर्स, एग्रीगेटर, एग्रीगेटर्स्रेजेटर्स्स्स नोड्स)। उद्देश्य:- एंड-टू-एंड कारण (चालान पर क्लिक करें);
- अनुमानित एसएलओ और प्रबंधित जोखिम;
- तेजी से आरसीए और कम एमटीटीआर;
- न्यूनतम टेलीमेट्री लागत पर प्रोविबिलिटी (हस्ताक्षरित सारांश, WORM ऑडिट)।
2) ऑब्जर्वेबिलिटी ऑन्कोलॉजी
इकाइयाँ:- 'चेनआईडी', 'नोड आईडी', 'रोल' (ऑपरेटर/स्टूडियो/psp/kyc/afficiate/stream), 'क्षेत्राधिकार', 'env' (prod/stage/sbx), 'traceId', 'spanId', 'अभियान', 'apm Id'।
- 'क्लिक', 'सत्र _ स्टार्ट', 'केआईसी _ स्टेटस', 'डिपॉजिट/विदड्रॉअल', 'फीट/स्पिन', 'रिवार्ड _ सेट/प्राप्त', 'जैकपॉट _ कंट्रीब्यूशन/ट्रिगर', 'rg _ gardrail _ हिट'।
- मेट्रिक्स (RED/USE/गोल्डन सिग्नल), ट्रेसेस (W3C ट्रेसपेरेंट), लॉग्स (संरचनात्मक), इवेंट्स (बिजनेस), RUM/सिंथेटिक (क्लाइंट/चैनल), ऑडिट/वर्म (अनचेंजेबल)।
सभी योजनाएं स्कीमा रजिस्ट्री में मौखिक हैं; समय हैं UTC/ISO-8601।
3) परिवहन और सहसंबंध
OpenTelemetry: metrics/logs/spans के लिए एक एकल प्रारूप; टीएसडीबी/हैंडलर को निर्यातक।
W3C ट्रेस संदर्भ: 'ट्रेसपेरेंट '/' ट्रैसेस्टेट' को रीडायरेक्ट, एपीआई, वेबहुक, बस के माध्यम से फेंका जाता है।
पहचान: महत्वपूर्ण रास्तों (भुगतान/पोस्टबैक) पर 'आइडेम्पोटेंसी-की'।
बिल्कुल एक बार अर्थ में: हैश दादा/कर्सर इतिहास, वेबहुक रीप्ले रजिस्टर।
उदाहरण: तेजी से आरसीए के लिए विशिष्ट 'traceId' के साथ सहयोगी विलंबता हिस्टोग्राम।
4) SLI/SLO मॉडल और त्रुटि बजट
गोल्डन सिग्नल: विलंबता, यातायात, त्रुटियां, संतृप्ति।
लाल: दर, त्रुटियाँ, अवधि।
उपयोग (बुनियादी ढांचा): उपयोग, संतृप्ति, त्रुटियां।
SLI/SLO (स्थलों) के उदाहरण:- वेबहूक: डिलीवरी ≥ 99। 9%, p95 ≤ 1-2 s।
- पार्टनर एपीआई: p95 ≤ 150-300 एमएस, त्रुटि दर ≤ 0। 3–0. 5%.
- घटना बस: लैग p95 ≤ 200-500 एमएस; डिलीवरी ≥ 99। 9%.
- भुगतान/AWS: प्रोफाइल कॉरिडोर में सीआर; e2e प्राधिकरण ≤ X s।
- KYC: क्षेत्राधिकार प्रोफ़ाइल द्वारा पास-रेट और SLA चरणों।
- लाइव/SFU/CDN: e2e 2-3 s, पैकेट हानि ≤ 1%, अपटाइम ≥ 99। 9%.
- डैशबोर्ड: ताजगी ≤ 1-5 एस; p95 रेंडर ≤ 1। 5–2. 0 s।
त्रुटि बजट: अवधि तय करें (उदाहरण के लिए, 30 दिन), त्रुटि प्रकार (5xx, टाइमआउट, SLO उल्लंघन), ऑटो बोनस/मालस नियम और स्टॉप बटन।
5) डैशबोर्ड: परतें और कलाकृतियाँ
1. सेवा ग्राफ (tsepi↔uzly): टोपोलॉजी, आरपीएस/ईपीएस, p95/p99, त्रुटि-दर, संतृप्ति, हीटमैप धाराएँ अधिकार क्षेत्र द्वारा।
2. व्यापार प्रवाह: klik→registratsiya→KYC→depozit→FTD→stavka/raund→vyplata; रूपांतरण फ़नल और एट्रिब्यूशन विंडो।
3. भुगतान/केवाईसी: सीआर × जियो × डिवाइस, विफलता कोड, विलंबता चरण, एनोटेशन के साथ ऑटो कट-ओवर।
4. सामग्री/आरजीएस/लाइव: राउंड-ट्रिप, त्रुटि-दर, एसएफयू/सीडीएन एसएलआई, लीडरबोर्ड और जैकपॉट।
5. पोस्टबैक/एट्रिब्यूशन: समयबद्धता, विवाद, डीडप, कर्सर लैग्स।
6. ट्रस्ट और जोखिम: नोड स्कोरकार्ड (SLO/RG/SEC), "प्रति ट्रेस पैकेट समय", टियर पूर्वानुमान।
प्रत्येक पैनल में एक चेंजलॉग के सूत्र संस्करण और लिंक होते हैं।
6) सतर्कता और वृद्धि
मल्टी-लेवल एसएलओ अलर्ट: चेतावनी (बर्न-रेट 2 ×), आलोचना (बर्न-रेट 10 ×), बाद की क्रियाएं (कूलिंग रूट/लिमिट)।
संरचनात्मक ट्रिगर: "latency↑ + CR↓ + पोस्टबैक lag↑" → PSP गिरावट का संदेह।
भूमिका चैनल: एसआरई/भुगतान/केवाईसी/आरजीएस/विपणन/वित्त/कानूनी/आरजी; संदर्भ तुरंत 'traceId '/' runbook '/stop बटन सक्षम करता है।
शोर मैट्रिक्स के लिए स्नूज ़/म्यूटिंग नीतियां, लेकिन कोई पी 1 जाम नहीं।
7) आरसीए и युद्ध-कक्ष
एसएलए प्रति ट्रेस पैकेट: 60-90 एस (पी 1/पी 2)।
आरसीए पैटर्न "कोई दोष नहीं": तथ्य - परिकल्पना प्रयोग - अनुवर्ती कार्रवाई में डालना।
रिलीज़ डिफ़ ( 2 इवेंट्स): घटना विंडो में टकराव/सूत्रों/कॉन्फ़िग की स्वचालित जांच।
पोस्टमार्टम एसएलओ: नोटों के प्रकाशन के लिए पता लगाने, रोलबैक करने, स्थिरीकरण करने का समय।
8) डेटा गुणवत्ता और वंश
डेटा गुणवत्ता SLI: पूर्णता, ताजगी, विशिष्टता ('EventId'), मुद्राओं/स्थानों की स्थिरता।
वंश: स्टोरफ्रंट/पैनल से स्रोतों (स्कीमैटिक्स/संस्करण/मालिक) तक।
Oracles: हस्ताक्षरित समुच्चय (GGR/NetRev/SLO/RG), 'संस्करण', 'हैश (इनपुट)', 'बच्चा', अवधि।
WORM ऑडिट: अपरिवर्तनीय सूत्र/कुंजी/अपवाद/चालान लॉग।
9) गोपनीयता, न्यायालय और सुरक्षा
जीरो ट्रस्ट: एमटीएलएस, अल्पकालिक टोकन, एग्रेस-अनुमति-सूची, कुंजी रोटेशन/जेडब्ल्यूकेएस।
पीआईआई कम से कम: 'प्लेयर आईडी' का टोकन, केवल सुरक्षित क्षेत्रों में डिटोकेनाइजेशन; लॉग/मैट्रिक्स में पीडी निषेध।
ABAC/ReBAC/SoD: "उनकी देखें और सहमत हों" पहुंच; "माप ≠ प्रभाव ≠ परिवर्तन"।
बाजारों के लिए डेटा स्थानीयकरण और डीपीआईए/डीपीए; शुद्ध नीतियां और टीटीएल।
10) टेलीमेट्री और कार्डिनैलिटी प्रबंधन की लागत
कार्डिनैलिटी बजट: लेबल लिमिट (UserId/URL/UA - निषिद्ध; आईडी/अभियान आईडी - स्वीकृत)।
मक्खी पर प्रतिशत के बजाय हिस्टोग्राम; चयनात्मक विवरण के लिए अनुकरणीय।
निशान का अनुकूली नमूना: त्रुटियों/धीमे पथ/नए संस्करणों के लिए आधार प्रतिशत + प्राथमिकता।
आयु (1s→1m→5m) द्वारा डाउनसैम्पलिंग/रोल-अप; रॉ ट्रेल्स का भंडारण छोटा है, कुल लंबा है।
SLO-first: केवल वही इकट्ठा करें जो समाधान (SLO/वित्त/अनुपालन) का समर्थन करता है।
11) प्रबंधन के साथ एकीकरण (SRE ↔ व्यवसाय)
गार्ड रिलीज और अभियान SLO/बग बजट से बंधे हैं।
जब मैट्रिक्स गलियारों से परे जाते हैं तो ऑटो कट-ओवर एपीएम/केवाईसी मार्ग।
RevShare/Lames: 'Q' गुणवत्ता गुणक (SLO/ /RG/SEC से) दरों और कोटा को प्रभावित करता है।
नोड्स के स्कोरकार्ड - ट्रैफिक प्राथमिकता और पायलटों तक पहुंच।
12) एंटी-पैटर्न
सूत्र मैट्रिक्स और विभिन्न खिड़कियों द्वारा "कई सत्य"।
लोड के तहत इतिहास की ऑफसेट पृष्ठभूमि (कर्सर का उपयोग करें)।
लॉग/पैनल में पीआईआई; पीडी निर्यात BI को।
पोस्टबैक चिड़ियाघर और अहस्ताक्षरित वेबहूक - लेता/छेद/विवाद।
'TraceId' के बिना ग्राफ: पैनल सुंदर है, कोई कारण नहीं है।
बर्न-रेट और रोल-प्लेइंग मार्गों के बिना अलर्ट तूफान।
N + 1/DR के बिना SPOF टेलीमेट्री एग्रीगेटर।
टीटीएल/ऑडिट के बिना अपवाद चिपचिपे ओवरराइड हैं।
13) चेकलिस्ट
डिजाइन
- सिग्नल और सर्किट की ऑन्कोलॉजी; संस्करण और मालिक।
- W3C ट्रेसपेरेंट हर जगह; महत्वपूर्ण रास्तों पर पहचान-कुंजी।
- SLI/SLO और त्रुटि बजट; बटन बंद करो; रेलिंग।
- कार्डिनैलिटी, नमूना, प्रतिधारण/रोल-अप नीतियां।
- गोपनीयता/पीआईआई: टोकन, डीपीए/डीपीआईए, स्थानीयकरण।
- रोल-आधारित अलर्ट और रनबुक।
प्रारंभ क
- निशान/मेट्रिक्स/लॉग के लिए अनुरूपता; सिंथेटिक रन।
- रिलीज के लिए कैनरी टेलीमेट्री; पहले/बाद में तुलना पैनल।
- युद्ध-कमरे की प्लेबुक; एसएलए प्रति ट्रेस पैकेज।
ऑपरेशन
- साप्ताहिक नोड स्कोरकार्ड; बर्न-रेट रिपोर्ट।
- मासिक सूत्र चेंजलॉग और एसएलओ/सीमा संशोधन।
- एग्रीगेटर्स/टायर/स्टोरफ्रंट के DR/xaoc अभ्यास।
14) परिपक्वता रोडमैप
v1 (फाउंडेशन): बेसिक मैट्रिक्स + लॉग, सिंगल ट्रेसआईडी, मैनुअल आरसीए, प्राथमिक एसएलओ।
v2 (एकीकरण): ओपन टेलीमेट्री हर जगह, सर्विस ग्राफ, रेलिंग, ओरेकल पाइपलाइन, रोल-प्लेइंग अलर्ट।
v3 (स्वचालन): पूर्वानुमानित गिरावट, ऑटो कट-ओवर APM/KYC/RGS, स्मार्ट-सामंजस्य, 'Q' द्वारा गतिशीलता को सीमित करना।
v4 (नेटवर्क शासन): अंतर-श्रृंखला सिग्नल और ओरेकल एक्सचेंज, फॉर्मूला/एसएलओ डीएओ नियम, पारदर्शी खजाने।
15) सफलता मेट्रिक्स
गुणवत्ता/जोखिम: MTTR↓, MTTD↓, विवाद व्यवसाय: उत्थान पूर्वानुमान सीआर/एफटीडी/एआरपीयू/एलटीवी, पोस्टबैक की सटीकता और समयबद्धता, स्थिरता नेटरेव। तकनीक: गलियारों में p95 एपीआई/वेबहूक/टायर/शोकेस; नोड अपटाइम/सीडीएन/एसएफयू ≥ 99। 9%. अर्थव्यवस्था: कॉस्ट-टू-ऑब्जर्व (सीटीओ) प्रति आरपीएस/इवेंट,% अनुकरणों के साथ समुच्चय, सीमा में रॉ भंडारण। अनुपालन: 0 पीडी लीक, सफल डीपीआईए/डीपीए ऑडिट, वर्म लॉग की 100% उपलब्धता। दृश्यता एक उत्पादन ट्रस्ट लूप है: एक ऑन्कोलॉजी, एंड-टू-एंड निशान, मेट्रिक्स और इवेंट्स का एक कैनन, एसएलओ गार्डरेल और डेटा oracles, डिफ़ॉल्ट गोपनीयता और टेलीमेट्री लागत अनुशासन। इस तरह का ढांचा जंजीरों और नोड्स को पारदर्शी, पूर्वानुमानित और सिद्ध करने योग्य बनाता है, और पारिस्थितिकी तंत्र उत्तरदायी और जोखिम प्रतिरोधी है।
संक्षिप्त सारांश