GH GambleHub

डेटा ऑडिटिंग और वर्शनिंग

1) आपको इसकी आवश्यकता क्यों है

ऑडिटिंग और वर्शनिंग प्रजनन क्षमता बनाते हैं: आप किसी भी आंकड़े को समझा सकते हैं, गणना को दोहरा सकते हैं और सुरक्षित रूप से मॉडल/शोकेस विकसित कर सकते हैं। IGaming में, यह वित्त (GGR/NET), भुगतान, KYC/AML, जिम्मेदार गेमिंग और नियामक रिपोर्टिंग के लिए महत्वपूर्ण है।

उद्देश्य:
  • ट्रेसिंग: जिसने डेटा/स्कीमा/तर्क और क्यों बदल दिया।
  • प्रजनन योग्यता: डेटा/कोड/मॉडल के कौन से संस्करण ने रिपोर्ट तैयार की।
  • रिलीज सुरक्षा: रोलबैक और परिवर्तनों की पूर्वानुमेयता।
  • अनुपालन: नियामकों और आंतरिक ऑडिट के लिए सिद्ध लॉग।

2) अवधारणाएं और संस्करण स्तर

1. स्कीमा संस्करण - क्षेत्र/प्रकार/सिमेंटिक एवोल्यूशन (SEMVER)।

2. रिपोर्ट/प्रशिक्षण के लिए डेटासेट संस्करण-स्नैपशॉट/स्लाइस एक समय में "सही"।

3. डेटा उत्पाद संस्करण: सूत्र, फिल्टर, एकत्रीकरण।

4. एमएल फीचर/मॉडल संस्करण: दिनांक/कोड/हाइपरपैरामीटर/फ़ीचर/डेटा (एंड-टू-एंड)।

5. पाइपलाइन संस्करण: परिवर्तन कोड, कॉन्फ़िग, निर्भरता।

6. डेटा अनुबंध संस्करण: उत्पादक/उपभोक्ता आवश्यकताएं (योजना, एसएलए, गुणवत्ता)।


3) ऑडिट: लॉग करना क्या है

कौन: विषय (उपयोगकर्ता/सेवा), भूमिका/विशेषताएं (RBAC/ABAC)।

क्या: तालिका/शोकेस/मॉडल/योजना/संविदा।

कब: सटीक समय, tz, सहसंबंध आईडी।

क्यों: कार्य/टिकट/रिलीज नोट, कारण से लिंक करें।

से: कोड/मॉडल संस्करण, कमिट हैश, कंटेनर छवि।

यह कैसे बदल गया है: पहले/बाद (diff), पंक्ति वॉल्यूम (पंक्ति प्रभावित), अखंडता नियंत्रण (हैश/हस्ताक्षर)।

संदर्भ: पर्यावरण (प्रोड/स्टेज), डोमेन, डेटा संवेदनशीलता (क्लास)।

ऑडिट लॉग एपेंड-ओनली/WORM, हस्ताक्षरित और SIEM में उपलब्ध हैं।


4) वर्शनिंग नीति (सिफारिशें)

SEMVER: 'मेजर। माइनर। PATCHE '

मेजर - असंगत स्कीमा/शब्दार्थ परिवर्तन।

MINTER - प्रतिवर्ती रूप से संगत परिवर्धन (nullable, नए vNext शोकेस के साथ नए क्षेत्र/स्तंभ)।

PATCH - अनुबंध (गुणवत्ता-फिक्स, बैकफिल) को बदले बिना फिक्स करता है।

विचलन प्रक्रिया: अप्रचलन विंडो ,/सीआई निर्देशिका में चेतावनी, डिस्कनेक्शन की तारीख.

रिलीज नोट्स: प्रति रिलीज एक पृष्ठ: क्या, क्यों, जोखिम, रोलबैक योजना।


5) भंडारण और धाराओं में तकनीक

टाइम-ट्रैवल/स्नैपशॉट्स: स्टोरिंग टेबल संस्करण; क्वेरी को निष्पादित करने की क्षमता "जैसा कि यह T-0. पर था"

एससीडी (धीरे-धीरे बदलते आयाम): आयामों के लिए प्रकार 1/2/3 (खेल, प्रदाता, खिलाड़ी)।

सीडीसी/सीडीएफ (डेटा/कैप्चर एंड फीड बदलें): तथ्यों के लिए वृद्धिशील परिवर्तन (दरें, भुगतान, केवाईसी)।

लेखा परीक्षा तथ्य- एक अलग तथ्य तालिका संपादित/जोड ़/घटनाओं को हटाने के साथ।

अखंडता नियंत्रण: बैच/फ़ाइल हैश, पैकेज हस्ताक्षर, कुल सामंजस्य।


6) सर्किट और डेटा संविदाओं का विकास

कोड के रूप में अनुबंध: स्कीमा, प्रकार, अनिवार्य क्षेत्र, अनुमत मूल्य, एसएलए ताजगी, डीक्यू नियम।

संगतता: जोड़ा → MINTER क्षेत्र; माइग्रेशन और डुअल-राइट के साथ प्रकार/शब्दार्थ → मेजर को बदल दिया।

सीआई गेट: पीआर बदलने की योजना अवरुद्ध है यदि संगतता टूटी है या कोई रिलीज नोट नहीं है।

निर्देशिका/रजिस्ट्री: सक्रिय/अप्रचलित संस्करणों और मालिकों को संग्रहीत करता है


7) बीआई और मैट्रिक्स में वर्शनिंग

प्रमाणित "गोल्ड" शोकेस: फिक्स्ड केपीआई शब्दार्थ (जीजीआर, एआरपीयू, प्रतिधारण)।

दोहरी दौड़: शोकेस का एक नया संस्करण समानांतर (v2) में बनाया गया है, जो मेट्रिक्स (सहिष्णुता बैंड) की तुलना में है।

रिपोर्ट कमिट करें - प्रत्येक निर्यात/डैशबोर्ड एक 'dataset _ version' और 'definition _ version' का संदर्भ देता है।

कैलेंडर अनुभाग: "डे-कैट", "महीने-दर-तारीख" - डेटा संस्करण पर तय किए गए हैं।


8) ML/MLOps में Versioning

मॉडल रजिस्ट्री: मॉडल, तिथि, गुणवत्ता मैट्रिक्स, प्रशिक्षण डेटा (dataset_version), फीचर संस्करण (feature_set_version)।

फ़ीचर स्टोर: वर्शन फीचर समूह; एक स्पष्ट संस्करण के बिना "गर्म" क्षेत्रों का निषेध।

रेप्रो सेट: प्रशिक्षण कोड (कमिट), पर्यावरण (डॉकर/कोंडा लॉक), सिड।

चैंपियन-चैलेंजर: बिक्री में समानांतर संस्करण, गुणवत्ता, निष्पक्षता और गोपनीयता पर रिपोर्ट।

रोलबैक: पिछले स्थिर मॉडल और फीचर सेट के लिए त्वरित रोलबैक।


9) रोलबैक, बैकफिल और फिक्स

रोलबैक योजना: प्रत्येक मेजर/माइनर संस्करण के लिए - स्पष्ट वापसी कदम।

बैकफिल प्लेबुक: सत्य का स्रोत, तिथि सीमा, पुनर्गणना का क्रम, चेकसम, लेबल "पुनर्निर्मित = सही"।

दृश्यता संपादित करें: v2 तुलना के बाद ही v1 की जगह लेता है; सभी "ऐतिहासिक" रिपोर्ट उनके संस्करणों का संदर्भ दे


10) ऑडिट में सुरक्षा और अनुपालन

घटना/पैकेज हस्ताक्षर: निर्माता संकेत, उपभोक्ता सत्यापित कर

पीआईआई स्वच्छता: ऑडिट स्टोर टोकन जो कच्चे पीआईआई नहीं हैं।

कानूनी पकड़: जांच की अवधि के लिए संस्करण/लॉग का कोई विलोपन नहीं।

DSAR: संस्करण टोकन द्वारा विषय रिकॉर्ड खोजते और अपलोड करते हैं; ऐतिहासिक स्नैपशॉट को ध्यान में रखा जाता है।


11) मेट्रिक्स और एसएलओ

रेप्रो दर डेटा संस्करण/कोड - लक्ष्य सीमा से खेली जाने वाली रिपोर्टों का प्रतिशत है।

कवरेज: टाइम-ट्रैवल/ऑडिट लॉग सक्षम के साथ% टेबल।

स्कीमा संगतता पास: सीआई में सफल संगतता जांच की दर।

दोहरे संचालित डेल्टा: सहिष्णुता के भीतर विचरण v1/v2।

रोलबैक एमटीटीआर: औसत संस्करण रोलबैक समय।

लेखा परीक्षा अखंडता - हस्ताक्षरित और सत्यापित घटनाओं का प्रतिशत।

बैकफिल सफलता - पुनर्गणना का प्रतिशत सही ढंग से पूरा हुआ।


12) आईगेमिंग पैटर्न (मामले)

GGR सुधार पूर्वव्यापी: आपूर्तिकर्ता ने RTP को फिर से संगठित किया है - हम अवधि के लिए तथ्यों का बैकफिल बनाते हैं, 'recomputed _ at' को फिक्स करते हैं, रिलीज नोट्स प्रकाशित करते हैं, v1/v2 की तुलना; हम पिछले महीनों की रिपोर्टों को फिर से नहीं लिखते हैं, लेकिन "सही संस्करण उपलब्ध है।"

धोखाधड़ी विरोधी नियम: हम सुविधाओं के अर्धशास्त्र को बदलते हैं - मेजर, दोहरे संचालित मॉडल और शोकेस, रिग्रेसिंग करते समय चैंपियन को रोलबैक।

KYC/AML: नए प्रदाता स्टेटस जोड़े गए - शून्य के साथ MINTER; अनुबंध में संगतता परीक्षण शामिल करें।

आरजी सिग्नल: "नुकसान की श्रृंखला" के तर्क को स्पष्ट किया - माइनर + रिलीज नोट्स और प्रभाव निगरानी।


13) उपकरण और कलाकृतियाँ (श्रेणियां)

कैटलॉग/वंश/रजिस्ट्री: सेट/योजनाबद्ध/स्टोरफ्रंट संस्करण, मालिक, कनेक्शन, अनुबंध।

ऑर्केस्ट्रेटर और सीआई/सीडी: संगतता द्वार, दोहरे रन, रिलीज नोट्स प्रकाशन।

समय-यात्रा के साथ भंडारण: स्नैपशॉट/लॉग का भंडारण।

हस्ताक्षर चेकसम: बैच हस्ताक्षर, बैच चेकसम।

मॉडल/फीचर रजिस्ट्री: फीचर/मॉडल संस्करण, चैंपियन-चैलेंजर रिपोर्ट।


14) साँचा (उपयोग के लिए तैयार)

14. 1 रिलीज नोट्स

संस्करण: 'भुगतान _ गोल्ड v2। 1. 0`

प्रकार: MINTER (नया क्षेत्र 'psp _ command', 'methy _ group')

कारण: पीएसपी/देश रिपोर्टिंग एकीकरण

जोखिम: प्रदर्शन मामले 'रिस्क _ सिग्नल' पर प्रभाव

सत्यापन: दोहरे रन 14 दिन, डेल्टा ≤ 0। 2% जीजीआर

रोलबैक: 'v2 पर स्विच करें। 0. ऑर्केस्ट्रा के माध्यम से 3 '

तिथि/मालिक/टिकट तैनात करें

14. 2 किट संस्करण पासपोर्ट

डेटासेट: 'game _ rounds _ silver'

संस्करण: '2025-11-01T00: 00: 00Z' (स्नैपशॉट आईडी)

स्कीमा: 'स्कीमा @ 1। 7. 0 '(अनुबंध संदर्भ)

स्रोत: प्रदाता फ़ीड ए/बी (प्रतिबद्ध...)

इंटीग्रिटी चेकसम मेनिफेस्ट पर हस्ताक्षर

डीक्यू: पूर्णता 99। 9%, ताजगी ≤ 15 मिनट

उपयोग: 'games _ perf _ gold v3। x ',' rg _ signals v1। x 'x'

14. 3 बदलें ऑडिट रिपोर्ट

घटना: स्कीमा 'kyc _ state' → 'kyc _ stage, v2' अद्यतन करें

उपयोगकर्ता/सेवा, 'डेटा-इंजीनियर' भूमिका

कब: '2025-11-01 09:32:10 + 02'

क्यों: टिकट # 3421 (नया प्रदाता स्टेटस)

डिफ: + 'स्थिति _ कारण' (nullable), enum विस्तारित

जाँच: सीआई सेवर पास, माइनर अनुबंध

कैप्शन: 'सिग =...', हैश डिफ: 'sha256 =...'

14. 4 संस्करण नीति (टुकड़ा)

मेजर: संगतता को तोड़ ता है; डुअल-राइट ≥ 30 दिन; अनिवार्य रोलबैक योजना।

माइनर: प्रतिवर्ती रूप से संगत; निर्देशिका ए/बी स्टोरफ्रंट में चेतावनी 7-14 दिन।

PATCH: गुणवत्ता सुधार/पुनर्गणना; रिलीज नोट्स आवश्यक।

संग्रह: हम विनियमन ≥ N महीनों के लिए स्नैपशॉट संग्रहीत करते हैं; ऑडिट के लिए WORM।


15) प्रक्रियाएं (एंड-टू-एंड)

1. पहल: टिकट बदलें + लाइनेज प्रभाव स्कोर।

2. इंजीनियरिंग अनुबंध/स्कीमा अद्यतन + रिलीज नोट्स।

3. सत्यापन: सीआई संगतता जांच, डीक्यू परीक्षण, दोहरे रन।

4. तैनाती: ध्वज, कैनरी द्वारा; सूची में संस्करण प्रकाशित करें।

5. निगरानी: डेल्टा v1/v2, केपीआई, शिकायतें।

6. बैकफिल: रिग्रेशन प्लेबुक द्वारा।

7. पोस्टमार्टम: यदि घटना, नीति/परीक्षण अपडेट करें।


16) RACI (उदाहरण)

नीतियां और मानक: सीडीओ (ए), डेटा गवर्नेंस काउंसिल (आर/ए), डीपीओ/सेक (सी)।

अनुबंध/योजनाएं: डोमेन मालिक (ए), डेटा स्टीवर्ड्स (आर), प्लेटफ़ॉर्म/इंजी (सी)।

ऑर्केस्ट्रेशन/स्टोरेज: प्लेटफ़ॉर्म/Eng (R), SRE (C)।

BI/metrics: एनालिटिक्स लीड (R), उत्पाद/वित्त (C)।

एमएल संस्करण: एमएल लीड (ए), डीएस (आर), प्लेटफ़ॉर्म (सी)।

ऑडिट/लॉग: SecOps (R), आंतरिक लेखा परीक्षा (C)।


17) कार्यान्वयन रोडमैप

0-30 दिन (एमवीपी)

महत्वपूर्ण तालिकाओं (भुगतान, game_rounds, kyc) के लिए समय-यात्रा/स्नैपशॉट सक्षम करें।

अपरिवर्तनीय लेखा परीक्षा लॉग चलाएँ और अंतर्ग्रहण पैकेजों पर हस्ताक्षर करें।

SEMVER नीति और रिलीज नोट्स टैम्पलेट स्वीकारें।

कैटलॉग: शीर्ष शोकेस में 'मालिक', 'स्कीमा _ संस्करण', 'डेटासेट _ संस्करण' जोड़ें।

30-90 दिन

सभी MINTER/MEGER के लिए दोहरे रन दर्ज करें; स्वचालित v1/v2 तुलना।

संगतता और डीक्यू सीआई गेट्स के साथ अनुबंध।

बैकफिल/रोलबैक विनियमन; ट्रेन टीमों।

मॉडल/फीचर रजिस्ट्री के साथ dannyye→fichi→model→inferens लिंक का पूरा सेट।

3-6 महीने

पूर्ण ऑडिट लॉग कवरेज, WORM भंडारण, नियामकों के लिए रिपोर्ट।

डिफ + वंश से स्वचालित रिलीज नोट्स।

डैशबोर्ड में रेप्रो रेट/स्कीमा कम्पैटिबिलिटी/रोलबैक एमटीटीआर रिपोर्ट।

केपीआई संस्करणों की त्रैमासिक समीक्षा और परिभाषाओं की "ठंड"।


18) एंटी-पैटर्न

नए संस्करण/रिलीज नोट के बिना केपीआई शब्दार्थ बदलना।

बैकफिल योजना और 'पुनर्संरचित' निशान के बिना "चुपचाप" पुनर्गणना।

ऑडिट लॉग में कच्चे पीआईआई का भंडारण।

डुअल-रन और इंस्टेंट विंडो रिप्लेसमेंट की कमी।

संस्करण और स्रोतों को निर्दिष्ट किए बिना "अनन्त" मॉडल/शोकेस।


19) संबंधित अनुभाग

डेटा प्रबंधन, डेटा मूल और पथ, पहुंच नियंत्रण, टोकन, सुरक्षा और एन्क्रिप्शन, मॉडल निगरानी, नैतिकता और डीएसएआर, फेडरेटेड लर्निंग, गोपनीय एमएल।


परिणाम

ऑडिटिंग और वर्शनिंग डेटा और मॉडल को एक विश्वसनीय उत्पाद में बदल देते हैं: प्रत्येक परिवर्तन पारदर्शी, प्रजनन योग्य और प्रतिवर्ती है। आईगेमिंग के लिए, यह केपीआई में विश्वास की नींव, अनुपालन की स्थिरता और सुरक्षित रिलीज की गति है।

Contact

हमसे संपर्क करें

किसी भी प्रश्न या सहायता के लिए हमसे संपर्क करें।हम हमेशा मदद के लिए तैयार हैं!

इंटीग्रेशन शुरू करें

Email — अनिवार्य है। Telegram या WhatsApp — वैकल्पिक हैं।

आपका नाम वैकल्पिक
Email वैकल्पिक
विषय वैकल्पिक
संदेश वैकल्पिक
Telegram वैकल्पिक
@
अगर आप Telegram डालते हैं — तो हम Email के साथ-साथ वहीं भी जवाब देंगे।
WhatsApp वैकल्पिक
फॉर्मैट: देश कोड और नंबर (उदा. +91XXXXXXXXXX)।

बटन दबाकर आप अपने डेटा की प्रोसेसिंग के लिए सहमति देते हैं।