टेलीमेट्री और इवेंट कलेक्शन
1) उद्देश्य और सिद्धांत
उद्देश्य:- एनालिटिक्स, एंटी-फ्रॉड, आरजी, अनुपालन और एमएल के लिए एकल और अनुमानित घटना प्रवाह।
- एंड-टू-एंड ट्रेसिंग (उपयोगकर्ता/सत्र/अनुरोध/ट्रेस) और प्रजनन योग्यता।
- पीआईआई न्यूनतम और गोपनीयता अनुपालन।
Принципы: स्कीमा-फर्स्ट, प्राइवेसी-बाय-डिज़ाइन, आइडेम्पोटेंसी-बाय-डिफ़ॉल्ट, ऑब्जर्वेबिलिटी-बाय-डिफ़ॉल्ट, कॉस्ट-अवेयर।
2) घटनाओं का वर्गीकरण
भुगतान: 'भुगतान। जमा ',' भुगतान। वापसी ',' भुगतान। चार्जबैक '।
गेमिंग: 'खेल। session_start/stop', 'खेल। शर्त ',' खेल। भुगतान ',' बोनस। लागू '।
मनपसंद: 'auth.login', 'प्रोफ़ाइल। अद्यतन ',' kyc। status_changed', 'rg। limit_set'।
ऑपरेटिंग रूम: 'एपी। निवेदन ',' त्रुटि। अपवाद ',' रिलीज़। तैनात करें ',' सुविधा। flag_changed'।
अनुपालन: 'aml। alert_opened', 'प्रतिबंध। स्क्रीनिंग ',' dsar। अनुरोध किया '।
प्रत्येक प्रकार में एक डोमेन मालिक, एक स्कीमा और एक ताजगी एसएलओ होता है।
3) योजनाएं और अनुबंध
आवश्यक क्षेत्र (न्यूनतम):- 'event _ time' (UTC), 'event _ type', 'schema _ version', 'event _ id' (UUID/ULID),
- 'ट्रेस _ आईडी '/' स्पैन _ आईडी', 'अनुरोध _ आईडी', 'उपयोगकर्ता। pseudo_id', 'सत्र _ आईडी',
json
{
"event_id": "01HFY1S93R8X",
"event_time": "2025-11-01T18:45:12. 387Z",
"event_type": "game. bet",
"schema_version": "1. 4. 0",
"user": {"pseudo_id": "p-7a2e", "age_band": "25-34", "country": "EE"},
"session": {"id": "s-2233", "device_id": "d-9af0"},
"game": {"id": "G-BookOfX", "provider": "StudioA", "stake": {"value": 2. 00, "currency": "EUR"}},
"ctx": {"ip": "198. 51. 100. 10", "trace_id": "f4c2...", "request_id": "req-7f91"},
"labels": {"market": "EE", "affiliate": "A-77"}
}
योजनाओं का विकास: शब्दार्थ संस्करण; पिछड़े-संगत - शून्य क्षेत्र जोड़ें; ब्रेकिंग - केवल एक डबल रिकॉर्डिंग अवधि के साथ नए संस्करण ('/v2 ') में।
4) इंस्ट्रूमेंटेशन: कहां और कैसे
4. 1 क्लाइंट (वेब/मोबाइल/डेस्कटॉप)
स्थानीय बफर टेलीमेट्री एसडीके, बैच सबमिशन, घातीय पुनरावृत्ति।
ऑटो-इवेंट: विजिट, क्लिक, ब्लॉक की दृश्यता, वेब-विटल्स (TTFB, LCP, CLS), JS त्रुटियां।
पहचानकर्ता: 'युक्ति _ आईडी' (स्थिर, लेकिन निजी), 'सत्र _ आईडी' (अद्यतन), 'उपयोगकर्ता। pseudo_id'।
"शोर" के खिलाफ सुरक्षा: 'इवेंट _ आईडी', थ्रॉटलिंग, क्लाइंट-साइड सैंपलिंग द्वारा डीडअप।
4. 2 सर्वर/बैकएण्ड
लॉगर/ट्रेसर रैपर (OpenTelemetry) → डोमेन इवेंट उत्सर्जन।
किनारे/गेटवे से सभी डाउनस्ट्रीम सेवाओं में 'ट्रेस _ आईडी' फेंकना अनिवार्य है।
डोमेन घटनाओं के लेन-देन प्रकाशन के लिए आउटबॉक्स पैटर्न।
4. 3 प्रदाता/तीसरे पक्ष
मेजबान सर्किट को सामान्यीकरण के साथ कनेक्टर (पीएसपी/केवाईसी/स्टूडियो); संस्करण अनुकूलक।
हस्ताक्षर/पेलोड अखंडता जांच, परिधि लॉगिंग (इनगेस्ट ऑडिट)।
5) ओपनटेलीमेट्री (ओटेल)
निशान: प्रत्येक अनुरोध एक 'trace _ id' प्राप्त करता है; हम 'ट्रेस _ आईडी '/' स्पैन _ आईडी' के माध्यम से लॉग/इवेंट्स को जोड़ ते हैं।
लॉग: ओटेल लॉग/कन्वर्टर्स का उपयोग करें; पर्यावरण लेबल की सेवा। नाम ',' तैनाती। env '।
मेट्रिक्स: आरपीएस/विलंबता/सेवा द्वारा त्रुटि-दर, व्यवसाय मैट्रिक्स (जीजीआर, रूपांतरण)।
कलेक्टर: काफ्का/एचटीटीपी/ग्राफिक को रसीद/बफर/निर्यात का एकल बिंदु। ढेर।
6) पहचानकर्ता और सहसंबंध
'event _ id' - विशिष्टता और अज्ञानता।
'user। pseudo_id' - स्थिर अलियासिंग (मानचित्रण अलग और सीमित)।
एंड-टू-एंड विश्लेषण के लिए 'सेशन _ आईडी', 'रिक्वेस्ट _ आईडी', 'डिवाइस _ आईडी' की आवश्यकता होती है।
एपीआई गेटवे और एसडीके स्तर पर आईडी स्थिरता।
7) नमूना और वॉल्यूम नियंत्रण
नियम: प्रति-घटना-प्रकार, प्रति-बाजार, गतिशील (अनुकूली) लोड द्वारा।
सटीक रूप से कब्जा की गई घटनाएं: भुगतान/अनुपालन/घटनाएं - नमूना नहीं।
विश्लेषणात्मक घटनाएं: प्रदर्शन मामलों में सुधारात्मक वजन के साथ 10-50% की अनुमति है।
सर्वर-साइड डाउनसैम्पलिंग: उच्च आवृत्ति मेट्रिक्स के लिए मान्य।
8) गोपनीयता और अनुपालन
PII को न्यूनतम करें: पैन/IBAN/ईमेल को टोकेनाइज़करें; IP → geo कोड/ASN जब निगलना।
क्षेत्रीयकरण: क्षेत्रीय निगरानी समापन बिंदुओं (ईईए/यूके/बीआर) को भेजें।
DSAR/RTBF: चयनात्मक प्रक्षेपण छिपाने के लिए समर्थन; कानूनी लेनदेन लॉग।
प्रतिधारण नीतियां: प्रकार द्वारा समय (एनालिटिक्स कम, लंबे समय तक नियामक); कानूनी पकड़।
9) परिवहन और बफरिंग
→ एज क्लाइंट: HTTPS (HTTP/2/3), 'POST/telemetry/batch' (100 इवेंट तक)।
एज → टायर: काफ्का/रेडपांडा का विभाजन 'यूसर द्वारा किया गया। pseudo_id'/'tenant_id'।
प्रारूप: JSON (निगरानी), Avro/Protobuf (बस में), Parquet (झील में)।
विश्वसनीयता: जिटर, डीएलक्यू, जहर-गोली अलगाव के साथ रेट्राई।
बैच विनिर्देश (सरलीकृत):json
{
"sdk": {"name":"igsdk-js","version":"2. 7. 1"},
"sent_at": "2025-11-01T18:45:12. 500Z",
"events": [ {... }, {... } ]
}
10) विश्वसनीयता और पहचान
क्लाइंट जनित 'ईवेंट _ आईडी' + सर्वर दादाजी द्वारा '(event_id, source)'.
सेवाओं पर आउटबॉक्स, थ्रेड्स में बिल्कुल-वन्स-सेमेंटिक्स (कीड स्टेट + डेड्यूप)।
कुंजी के भीतर क्रम: 'उपयोक्ता/सत्र' द्वारा विभाजित।
समय नियंत्रण: NTP/PTP, अनुमत बहाव (उदाहरण के लिए, ≤ 200 ms), सर्वर पर 'प्राप्त'।
11) टेलीमेट्री क्वालिटी (TQ) और SLO
पूर्णता: ≥ 99। प्रति टी।
ताजगी: सिल्वर ≤ 15 मिनट में p95 डिलीवरी देरी।
शुद्धता: वैध योजनाएँ ≥ 99। 9%, ड्रॉप-रेट <0। 1%.
ट्रेस कवरेज: 'ट्रेस _ आईडी' ≥ 98% के साथ अनुरोधों का प्रतिशत।
लागत/जीबी: डोमेन द्वारा निगलना/भंडारण के लिए लक्ष्य बजट।
12) अवलोकन और डैशबोर्ड
न्यूनतम विजेट:- स्रोत और क्षेत्र द्वारा लैग इनगेस्ट (p50/p95)।
- घटना प्रकार और बाजार द्वारा पूर्णता।
- ओवरसाइज़-पेलोड योजनाओं की मान्यता त्रुटियाँ।
- एसडीके संस्करण मानचित्र और विरासत ग्राहकों का प्रतिशत।
- वेब-विटल्स का सहसंबंध - रूपांतरण/विफलताएं।
13) क्लाइंट एसडीके आवश्यकताएं
लाइट फुटप्रिंट, ऑफ़ लाइन बफर, आस्थगित इनिशिएलाइजेशन।
सेटिंग्स: नमूना, अधिकतम बैच आकार, अधिकतम कतार आयु, गोपनीयता फैशन (नो-पीआईआई)।
संरक्षण: पैकेज हस्ताक्षर/एंटी-टैम्पर, कुंजी obfuscation।
अद्यतन: शोर घटनाओं को निष्क्रिय करने के लिए फीचर-फ्लैग।
14) किनारे की परत और सुरक्षा
दर सीमा, WAF, स्कीमा सत्यापन, संपीड़न (gzip/br)।
प्रति ग्राहक टोकन बाल्टी; एंटी-रीप्ले ('requess _ id', TTL)।
आईपी और यूए हटाने "कच्चे" पेलोड के बाहर → सामान्यीकरण/संवर्धन।
15) डेटा पाइपलाइन के साथ एकीकरण
कांस्य: अपरिवर्तनीय रूप से कच्चा पेलोड (फोरेंसिक के लिए) जोड़ा गया।
रजत: कमी/संवर्धन के साथ सामान्यीकृत तालिकाएं।
गोल्ड: BI/AML/RG/उत्पाद के लिए प्रदर्शन मामले।
घटनाओं और रिपोर्टों के बीच संबंध; परिवर्तनों के संस्करण।
16) ग्राहक गुणवत्ता एनालिटिक्स
शांत ग्राहक अनुपात (एन घंटों में कोई घटना नहीं)।
"तूफान" (बड़ेपैमाने पर डुप्लिकेट/फट) की विसंगतियाँ।
संस्करण और मंच द्वारा "विरासत एसडीके" का हिस्सा।
17) प्रक्रियाएं और आरएसीआई
आर: डेटा प्लेटफ़ॉर्म (इनगेस्ट/बस/वेलिडेटर्स), ऐप टीमें (एसडीके इंस्ट्रूमेंटेशन)।
A: डेटा/वास्तुकला के प्रमुख।
सी: अनुपालन/डीपीओ (पीआईआई/प्रतिधारण), एसआरई (एसएलओ/घटनाएं)।
I: द्वि/विपणन/जोखिम/उत्पाद।
18) कार्यान्वयन रोडमैप
एमवीपी (2-4 सप्ताह):1. 6-8 प्रकारों के लिए इवेंट टैक्सोनॉमी v1 + JSON स्कीमा।
2. एसडीके (वेब/एंड्रॉइड/आईओएस) с बैच и नमूना; किनारा '/टेलीमेट्री/बैच '।
3. काफ्का + कांस्य परत; बुनियादी सत्यापन और dedup।
4. डैशबोर्ड सबसे अंतराल/पूर्णता, ड्रॉप/वेलिडेटर के लिए अलर्ट।
चरण 2 (4-8 सप्ताह):- ओटेल कलेक्टर, सहसंबंध का पता लगाएं; रजत सामान्यीकरण और डीक्यू नियम।
- क्षेत्रीय समापन बिंदु (ईईए/यूके), गोपनीयता-फैशन, डीएसएआर/आरटीबीएफ प्रक्रियाएं।
- एसडीके संस्करण मानचित्र, रिंग द्वारा ऑटो-रोलआउट अपडेट।
- बिल्कुल एक बार धाराओं में, फीचर स्टोर कनेक्शन, एंटी-फ्रॉड ऑनलाइन फीड।
- योजनाओं और मान्यताओं के लिए नियम-ए-कोड, प्रभाव विश्लेषण।
- मूल्य अनुकूलन: अनुकूली नमूना, झील में जेड-क्रम/क्लस्टरिंग।
19) रिलीज से पहले क्वालिटी चेकलिस्ट
- आवश्यक स्कीमा फ़ील्ड और सही प्रकार में भरे जाते हैं।
- 'trace _ id '/' requess _ id '/' session _ id' मौजूद हैं।
- एसडीके बैच, पुनः प्रयास, नमूना का समर्थन करता है।
- एज योजना को मान्य करता है और पेलोड आकार को सीमित करता है।
- गोपनीयता फिल्टर और संवेदनशील क्षेत्रों का टोकन सक्षम हैं।
- कॉन्फ़िगर एसएलओ/अलर्ट और डैशबोर्ड।
- डोमेन के लिए प्रलेखन (उदाहरण घटना, स्वामी, एसएलए)।
20) बार-बार गलतियाँ और उनसे कैसे बचें
बिना योजना के कच्चे कार्यक्रम: रजिस्ट्री और सीआई सत्यापन दर्ज करें।
कोई पहचान नहीं: 'घटना _ आईडी' की आवश्यकता है और डीडुप्लिकेशन विंडो भंडारित करें.
पीआईआई और एनालिटिक्स मिश्रण: अलग मैपिंग, मास्क फील्ड।
कोई ट्रेसिंग नहीं: गेटवे → सर्विसेज → इवेंट्स के माध्यम से 'ट्रेस _ आईडी' मार्ग।
अप्रबंधित वॉल्यूम - नमूना/ट्रॉटलिंग और बजट कोटा का उपयोग करें।
क्षेत्रों के बिना वैश्विक समापन बिंदु - क्षेत्रीयकरण और डेटा निवास का उपयोग करें।
21) शब्दावली (संक्षिप्त)
OpenTelemetry (Otel) ट्रेल्स/मेट्रिक्स/लॉग के लिए एक खुला मानक है।
डोमेन घटनाओं का आउटबॉक्स - ट्रांजेक्शनल प्रकाशन।
DLQ - "टूटे हुए" संदेशों की कतार।
मात्रा में कमी के लिए घटनाओं के एक हिस्से का नमूना - चयन।
डेटा रेजीडेंसी - वांछित क्षेत्राधिकार में डाटा भंडारण।
22) नीचे की रेखा
अच्छी तरह से डिज़ाइन की गई टेलीमेट्री व्यवस्था के बारे में है, न कि केवल "लॉग भेजने": सख्त योजनाएं, सहमत पहचानकर्ता, डिफ़ॉल्ट गोपनीयता, विश्वसनीय परिवहन, अवलोकन और लागत-बचत। इस लेख का अनुसरण करके, आपको पूर्वानुमानित एसएलओ के साथ एनालिटिक्स, अनुपालन और मशीन लर्निंग के लिए तैयार घटनाओं की एक स्थिर धारा मिलती है।