टेलीमेट्री थ्रेड्स
1) उद्देश्य और संदर्भ
टेलीमेट्री प्रवाह मंच के प्रदर्शन के बारे में अवलोकन डेटा की एक निरंतर आमद प्रदान करता है: क्या हो रहा है, क्यों और इसकी लागत कितनी है। IGaming में, यह जमा/शर्त गिरावट, बाहरी प्रदाताओं की दृश्यता (PSP/KYC/गेम स्टूडियो), और प्रोवेबल SLO/अनुपालन अनुपालन का शुरुआती पता लगाने के लिए महत्वपूर्ण है।
2) टेलीमेट्री स्रोत मानचित्र
मेट्रिक्स (TSDB): RED/USE, बिजनेस SLI (प्राधिकरणों की सफलता, सफल दांव का%)।
OTel: फ्रंट → API → ब्रोकर्स → डेटाबेस/PSP के माध्यम से अनुरोधों की श्रृंखलाएं।
लॉग (संरचित): घटनाएँ, लेखा परीक्षा संचालन, त्रुटियाँ।
RUM: TTFB/LCP, JS त्रुटियाँ, भू/उपकरण.
सिंथेटिक्स: विभिन्न जियो से बाहरी परीक्षण लेनदेन (लॉगिन/जमा/रेत दर)।
निम्न-स्तरीय टेलीमेट्री: eBPF/CPU प्रोफाइलिंग/IO/alloc, नेटवर्क p95/p99।
बाहरी स्थिति: वेबहूक/पीएसपी/केवाईसी/सीडीएन/डब्ल्यूएएफ पूल।
3) मानक और योजनाएं
लिंगुआ फ्रेंका के रूप में OpenTelemetry: विशेषता शब्दार्थ का एकीकरण (सेवा)। नाम, तैनाती। पर्यावरण, एंड्यूसर। id - नकाबपोश, ट्रेस/SpanID, PSP कोड)।
स्कीमा सम्मेलन: लॉग/ट्रेल्स के लिए संस्करण, स्कीमा रजिस्ट्री, केवल द्विआधारी ध्वज और अनुग्रह अवधि के माध्यम से "ब्रेकिंग-चेंज"।
सहसंबंध-आईडी: सभी परतों + मीट्रिक प्रतिशत में उदाहरण के माध्यम से भुगतान/शर्त के लिए एकल 'सहसंबंध _ आईडी'।
4) इंजेक्शन कन्वेयर (उच्च-स्तरीय)
1. निर्माता: एसडीके/एजेंट/कलेक्टर (नोड्स पर ओटेल कलेक्टर)।
2. किनारा बफरिंग: सीमाओं के साथ स्थानीय कतारें (मेमोरी/डिस्क)।
3. परिवहन: gRPC/HTTP OTLP → संदेश ब्रोकर (काफ्का/पल्सर) पहचान कुंजियों के साथ।
4. प्रोसेसर: सामान्यीकरण, संवर्धन (GEO/किरायेदार/चैनल), PII फिल्टर, पतला नमूना।
5. फैन-आउट: टीएसडीबी (मैट्रिक्स) में, ट्रेस स्टोरेज में, लॉग सिस्टम में, लेक/डीडब्ल्यूएच में, अलर्ट/नियमों में।
6. उपभोक्ता: डैशबोर्ड, एसएलओ अलर्ट (बर्न-रेट), जांच, स्थिति पृष्ठ, ऑटो-गेट जारी करें।
5) QoS और प्रवाह वर्ग
क्लास ए (वास्तविक समय, पी 1): एसएलआई/एसएलओ, सिंथेटिक्स, प्रमुख प्रदाता (पीएसपी/केवाईसी)। डिलीवरी एसएलए: <5-10c, ≥99। 9%.
कक्षा बी (ऑपरेटिंग रूम): आरसीए, एसएलए के लिए ट्रेल्स/लॉग: <1-2 मिनट।
कक्षा सी (विश्लेषणात्मक): झील/DWH, SLA: घंटे/दिन में समुच्चय और बैच।
क्लास रूटिंग - प्राथमिकता, विभिन्न अनुरोध, व्यक्तिगत कतारें/विषय।
6) नमूना, एकत्रीकरण, प्रतिधारण
मेट्रिक्स: ऐतिहासिक श्रृंखला (1s→10s→1m), प्रतिशत समुच्चय, अनुकरणीय।
ट्रेल्स: टेल-आधारित नमूना (विसंगतियों, पीएसपी त्रुटियों, p99- "फटने" के लिए हिस्सा बढ़ाएं)।
लॉग: प्रोफ़ाइल स्तर, संपीड़न, शोर अस्वीकृति (स्वास्थ्य-पिंग, बिक्री पर DEBUG - निषिद्ध)।
प्रतिधारण: "गर्म" (7-14 दिनों का विस्तार), "ठंड" (इकाइयाँ/संग्रह)। प्रति श्रेणी डेटा और लागत नीतियां।
7) गोपनीयता और अनुपालन
पीआईआई स्वच्छता: पहचानकर्ताओं का मास्किंग/टोकन; टेलीमेट्री में सीसीएम दस्तावेजों/कार्ड टोकन का निषेध।
भू-स्थानीयकरण: अधिकार क्षेत्र द्वारा भंडारण; निर्यात - केवल अनुमोदित वर्कफ़्लो (एन्क्रिप्शन, टीटीएल, ऑडिट) के माध्यम से।
एक्सेस कंट्रोल: RBAC/ABAC से टेलीमेट्री स्टोरेज, अपलोड के लिए SoD।
8) प्रवाह विश्वसनीयता
पहचान: घटना कुंजी, प्रोसेसर में डीडप।
Backpressure: प्रति किरायेदार/सेवा इंजेक्शन सीमा; कम-प्राथमिकता वाले ओवरलोड क्षेत्रों के लिए नीतियां
रिप्ले - पुनर्संसाधन के लिए दलाल ≥72 h में स्टोर करें।
डेड-लेटर: अलर्ट के साथ डीएलक्यू को सुरक्षित करने के लिए रूटिंग त्रुटियां (योजना, आकार, पीआईआई उल्लंघन)।
वर्शनिंग: सर्किट (v1 + v2) और उपभोक्ता प्रवास को बदलते समय "दोहरे प्रवाह"।
9) बहु-किरायेदार और अलगाव
प्रत्येक घटना में टैग 'किरायेदार _ आईडी/ब्रांड/क्षेत्र'; सीमांत कोटा और बजट।
विषय द्वारा ए/बी धाराओं का अलगाव; इंजेक्शन और भंडारण पर शोबैक/चार्जबैक।
निर्यात के दौरान किरायेदार सीमा पर मास्किंग/एकत्रीकरण।
10) स्ट्रीम निर्देशिका (उदाहरण क्षेत्र)
पहचानकर्ता: 'टेलीमेट्री। भुगतान। लेखक। सफलता। दर। 'यूयू'
श्रेणी: ए (वास्तविक समय)
Схема: '{timestamp, किरायेदार, क्षेत्र, psp, bank_bin_group, success_rate, विंडो}'
स्रोत: ओटेल कलेक्टर + पीएसपी-राउटर मेट्रिक्स
उपभोक्ता: एसएलओ अलर्ट, एक्सेक डैशबोर्ड, स्थिति पृष्ठ
प्रतिधारण: 30 दिनों के लिए गर्म, 12 महीने के लिए कुल
मालिक: भुगतान एसआरई, डीपीओ-मालिक (गोपनीयता)
प्रवाह SLO: देरी <10 c p95, हानि <0। 1 %/दिन
11) अलर्ट और रिलीज के साथ एकीकरण
एसएलओ जमा/दरों के लिए बर्न-रेट (फास्ट/स्लो विंडो) द्वारा अलर्ट करता है।
रिलीज-गेट्स: SLI कैनरी विश्लेषण; गिरावट के दौरान ऑटो-स्टॉप/रोलबैक।
स्थिति पृष्ठ: घटना कार्ड + SLI इकाइयों से अद्यतन फ़ीड
12) प्रमुख डैशबोर्ड का एक सेट
Exec: अपटाइम, बर्न-रेट, प्राधिकरण/दरों की सफलता (GEO/PSP द्वारा), प्रदाता की स्थिति, $/RPS टेलीमेट्री।
SRE/Platform: सेवा द्वारा RED/USE, लैग कतारें, बाहरी पहचान, eBPF प्रोफाइल।
भुगतान/जोखिम: बैंक रूपांतरण/पीएसपी, नरम/कठिन गिरावट, केवाईसी एसएलए, शुरुआती चार्जबैक संकेत।
लागत-ऑब्स: स्रोत द्वारा इंजेक्शन की मात्रा, कार्डिनैलिटी के शीर्ष लेबल, धारा द्वारा लागत।
13) अवलोकन वित्त (FinOps)
केपीआई लागत: $/जीबी निगेस्ट, $/ट्रेस, $/एसएलआई-डैशबोर्ड; "भारी" मेट्रिक्स और लेबल पर रिपोर्ट करें।
अनुकूलन: एकत्रीकरण और डाउनसैम्पलिंग, गतिशील नमूना, सफाई चैटी लॉग, महत्व का भंडारण वर्ग।
राजनेता: उच्च-कार्डिनैलिटी के लिए कोटा, मुद्दे की आवृत्ति पर सीमा, एक तिमाही में एक बार योजनाओं की समीक्षा।
14) प्रक्रियाएं और भूमिकाएँ
डेटा/अवलोकन स्वामी (भुगतान, खेल, कोर एपीआई, इंफ्रा)।
सर्किट के लिए परिवर्तन-नियंत्रण: पीआर-समीक्षा, परीक्षण बेंच, उपभोक्ताओं में संगतता।
टेबलटॉप/कैओस-दिन: प्रदाताओं के डिस्कनेक्शन, ब्रोकर ओवरलोड, बैकप्रेशर/आइडेम्पोटेंसी चेक।
पोस्टमार्टम: टेलीमेट्री विश्लेषण (संकेतों की पर्याप्तता, झूठे अलार्म, लागत) शामिल हैं।
15) कार्यान्वयन रोडमैप (8-12 सप्ताह)
नेड। 1-2: वर्तमान प्रवाह, स्रोत मानचित्र, टेलीमेट्री एसएलओ लक्ष्यों, मानकों का चयन (ओटीएल, टीएसडीबी, ट्रेल्स, लॉग) का ऑडिट।
नेड। 3-4: ओटेल कलेक्टर, एकल सहसंबंध-आईडी, जमा/शर्त के लिए मूल RED/USE + व्यवसाय SLI, प्रवाह निर्देशिका v0।
नेड। 5-6: टेल-आधारित नमूना, GEO सिंथेटिक्स, DLQ/idempotency, गोपनीयता फिल्टर।
नेड। 7-8: FinOps पैनल (निगेस्ट/रिटेंशन), डाउनसैम्पलिंग, कार्डिनैलिटी कोटा, SLO अलर्ट (बर्न-रेट)।
नेड। 9-10: ईबीपीएफ/निम्न-स्तरीय संकेत, स्थिति पृष्ठ फ़ीड, रिलीज ़-गेट्स।
नेड। 11-12: अराजकता परीक्षण, लागत अनुकूलन, औपचारिक एसएलए प्रवाह, योजनाओं की तिमाही समीक्षा का शुभारंभ।
16) कलाकृतियाँ पैटर्न
टेलीमेट्री स्ट्रीम स्पेक: आईडी, मालिक, योजना, QoS वर्ग, स्रोत, उपभोक्ता, प्रतिधारण, SLO/अलर्ट, गोपनीयता नीति।
स्कीमा पीआर टेम्पलेट: परिवर्तन/प्रवासन, संगतता, परीक्षण, रोलबैक योजना।
नमूना नीति: विसंगतियों के मामले में नमूना उठाने के नियम; लक्ष्य बजट।
लागत समीक्षा पैक: $/मूल्य, टीटीएल/एकत्रीकरण ऑफ़ र द्वारा शीर्ष स्रोत।
हादसा टेलीमेट्री चेकलिस्ट: आरसीए के लिए आवश्यक चार्ट/ट्रेल्स/लॉग की एक सूची।
17) टेलीमेट्री धाराओं के केपीआई/केआरआई
डिलीवरी: वर्ग द्वारा p95 देरी,% खोए हुए संदेश/दिन।
कवरेज: ट्रेसिंग> 90% के साथ महत्वपूर्ण रास्तों का अनुपात, मैट्रिक्स द्वारा बंद एसएलआई का अनुपात।
सिग्नल की गुणवत्ता: शिकायतों से पहले SLI पर पकड़ी गई घटनाओं में से%, झूठे/छूटे अलर्ट।
लागत: टेलीमेट्री के लिए $/आरपीएस, $/ट्रेस, इंजेक्शन में "शोर" का हिस्सा।
विश्वसनीयता: ब्रोकर गिरावट के बाद वसूली का समय, रीप्ले वॉल्यूम।
18) एंटीपैटर्न
TSDB में हाई-कार्डिनैलिटी मेट्रिक्स (UserId, SurmId)।
संरचना और योजनाओं के बिना लॉग का एक एकल "ब्लैक बॉक्स"।
कोई DLQ/idempotency → डुप्लिकेट और चरम नुकसान नहीं।
FinOps के बिना "अंतहीन" प्रतिधारण - घातीय बिल वृद्धि।
व्यावसायिक संदर्भ के बिना ट्रेल्स (PSP/बैंक/GEO) → खराब निदान।
कमांड के बीच असंगत योजनाएं - उपभोक्ता टूटते हैं।
कुल
टेलीमेट्री धाराएं एक नियंत्रित, बहु-स्तरित प्रणाली हैं: ओटीएल मानक और योजनाएं - QoS और बैकप्रेशर के साथ विश्वसनीय इंजेक्शन लागत गोपनीयता और बहु-किरायेदार अलगाव एसएलओ अलर्ट, डैशबोर्ड और रिल गेट। इस तरह का सर्किट पीक मोड में आईगेमिंग प्लेटफॉर्म की शुरुआती संकेत, तेज आरसीए, अनुमानित लागत और स्थिरता देता है।