आईगेमिंग में मशीन लर्निंग

1) व्यावसायिक मामले और मूल्य

उत्पाद/राजस्व: LTV पूर्वानुमान, मंथन (बहिर्वाह), जमा/खरीद, गतिशील मिशन/quests, अगला-सर्वश्रेष्ठ-कार्रवाई/प्रस्ताव।

विपणन/सीआरएम: देखो-समान, विभाजन, वास्तविक समय ट्रिगर, बोनस अनुकूलन (एबीओ - दुरुपयोग-प्रतिरोधी बोनस अनुकूलन)।

जोखिम/अनुपालन: एंटी-फ्रॉड/एएमएल (वेग, संरचना, ग्राफ विशेषताएं), जिम्मेदार गेमिंग (आरजी) - जोखिम दर, हस्तक्षेप ट्रिगर।

संचालन/एसआरई: घटना की भविष्यवाणी, क्षमता/यातायात पूर्वानुमान, प्रदाता विसंगतियाँ।

वित्त: जीजीआर/एनजीआर पूर्वानुमान, एफएक्स संवेदनशीलता, समकक्ष हेरफेर का पता लगाना।

प्रभाव दिशानिर्देश: निजीकरण के कारण शुद्ध राजस्व के लिए + 3-7%, धोखाधड़ी-हानि के लिए − 20-40%, मंथन के लिए − 10-25%, ऑनलाइन होने पर एसएलए प्रतिक्रिया आरजी <5 एस।

2) फीचर इंजीनियरिंग

स्रोत: गेमप्ले, भुगतान/पीएसपी, प्रमाणीकरण, उपकरण/एएसएन/जियो, आरजी/केवाईसी/केवाईबी, विपणन यूटीएम, प्रदाता लॉग, समर्थन/ग्रंथ।

बुनियादी विशेषताएं:

व्यवहार संबंधी खिड़कियां: एन दरें/जमा और मात्रा प्रति 10 मिनट/घंटे/दिन, पुनरावृत्ति/आवृत्ति/मौद्रिक।
अनुक्रम: खेलों की श्रृंखला, अंतिम गतिविधि के साथ समय, सत्र विशेषताएं।
भू/युक्ति: देश/बाजार, एएसएन, उपकरण/ब्राउज़र प्रकार।
ग्राफ: प्लेयर-कार्ड-डिवाइस-आईपी कनेक्शन, घटक/केंद्रीयता (धोखाधड़ीके छल्ले)।
प्रासंगिक: सप्ताह के दिन/दिन का समय/बाजार की छुट्टियां, प्रदाता/शैली/खेल अस्थिरता।
आरजी/एएमएल: सीमाएं, आत्म-बहिष्करण, स्क्रीनिंग झंडे, पीईपी/प्रतिबंध (कैश/एसिंक्रॉन के माध्यम से)।

सिफारिशें:

मुद्राओं और समय (UTC + बाजार स्थान) को सामान्य बनाएं।
ऐतिहासिक आयाम (SCD II)।
ऑनलाइन/ऑफ़लाइन परिवर्तन (सिंगल फ़ीचर स्टोर कोड) पर सहमत हों।

3) वास्तुकला: ऑफलाइन ↔ ऑनलाइन

3. 1 ऑफ़ लाइन लूप

लेकहाउस: Bronze→Silver (सामान्यीकरण/संवर्धन) →Gold (डेटासेट)।

फीचर स्टोर (ऑफ़लाइन): फॉर्मूला रजिस्टर, पॉइंट-इन-टाइम ज्वाइन, ट्रेनिंग सेट का भौतिककरण।

प्रशिक्षण: निश्चित निर्भरता वाले कंटेनर; ट्रैकिंग प्रयोग (मैट्रिक्स/कलाकृतियां/डेटा)।

सत्यापन: के-गुना/लौकिक विभाजन, बैकटेस्ट, ऑफ-पॉलिसी मूल्यांकन।

3. 2 ऑनलाइन सर्किट

Ingest स्ट्रीम प्रोसेसिंग: फ्लिंक/स्पार्क/बीम विंडो/वॉटरमार्क के साथ, पहचान।

फ़ीचर स्टोर (ऑनलाइन): लो-पेटेंट कैश (Redis/Scylla) + ऑफ़ लाइन कास्ट।

सेवारत: REST/gRPC समापन बिंदु, स्कोरिंग ग्राफ, AB रूटिंग, कैनरी रिलीज।

रियल-टाइम स्टोरफ्रंट: पैनल/नियमों के लिए क्लिकहाउस/पिनोट।

4) मॉडल मॉडल और दृष्टिकोण

वर्गीकरण/स्कोरिंग: मंथन/जमा/धोखाधड़ी/आरजी (LogReg, XGBoost/LightGBM, TabNet, CatBoust)।

रैंकिंग/सिफारिशें: फैक्टराइजेशन/लिस्ट-रैंकिंग (LambdaMART), seq2rec (RNN/ट्रांसफॉर्मर), प्रासंगिक डाकू।

विसंगतियाँ: समय श्रृंखला के लिए अलगाव वन, वन-क्लास एसवीएम, ऑटोएनकोडर, पैगंबर/टीएसफ्रेश।

ग्राफ: धोखाधड़ी के छल्ले के लिए।

कारण: उत्थान मॉडल, टी-लर्नर/एक्स-लर्नर, DoWhe/CousalML।

एनएलपी/एएसआर: टिकट/चैट, शिकायतों का वर्गीकरण, भावना, विषय।

5) गुणवत्ता मैट्रिक्स

वर्गीकरण: ROC-AUC/PR-AUC, परिचालन सीमा पर F1, जोखिम स्कोरिंग के लिए अपेक्षित लागत (भारित FP/FN), KS।

सिफारिशें: NDCG @ K, MAP @ K, कवरेज/विविधता, CTR/CVR ऑनलाइन।

टीएस/पूर्वानुमान: MAPE/SMAPE, WAPE, P50/P90 त्रुटि, PI कवरेज।

आरजी/एएमएल: एसएलए में सटीक/रिकॉल, समय-से-अंतराल का मतलब है।

अर्थव्यवस्था: नेट रेवेन्यू में उत्थान, धोखाधड़ी से बचाया, आरओआई अभियान,% बोनस दुरुपयोग।

6) मूल्यांकन और प्रयोग

ऑफ़ लाइन: लौकिक विभाजन, सप्ताह/बाजार/किरायेदार द्वारा सबसे पीछे।

ऑनलाइन: A/B/n, CUPED/diff-in-diff, अनुक्रमिक परीक्षण।

ऑफ-पॉलिसी: निजीकरण नीतियों के लिए IPS/DR।

स्थिति। शक्ति: विचरण और एमडीई पर विचार करते हुए नमूना आकार की गणना।

मूल्य सीमा गणना का उदाहरण (छद्म कोड):

python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)

7) गोपनीयता, नैतिकता, अनुपालन

पीआईआई कम से कम: उपनाम, मानचित्रण अलगाव, सीएलएस/आरएलएस।

रेजीडेंसी: अलग ईईए/यूके/बीआर आकृति; नींव के बिना क्रॉस-क्षेत्रीय शामिल नहीं

DSAR/RTBF: सुविधाओं और लॉग में विलोपन/संपादन; मामलों/रिपोर्टिंग के लिए कानूनी पकड़।

निष्पक्षता/पूर्वाग्रह: सुविधाओं का ऑडिट, असमान प्रभाव, प्रॉक्सी चर का नियंत्रण।

व्याख्यात्मकता: SHAP/फीचर महत्व, मॉडल कार्ड (मालिक, तिथि, डेटा, मैट्रिक्स, जोखिम)।

सुरक्षा: KMS/CMK, लॉग के बाहर रहस्य, रिलीज के WORM अभिलेखागार।

8) MLOps: जीवन चक्र

1. डेटा और विशेषताएं: योजनाएं/अनुबंध, डीक्यू नियम (पूर्णता/विशिष्टता/सीमा/लौकिक), वंश।

2. प्रशिक्षण: कंटेनर, ऑटोटुनिंग, ट्रैकिंग प्रयोग।

3. सत्यापन: सर्किट संगतता परीक्षण, पूर्वाग्रह/निष्पक्षता, प्रदर्शन परीक्षण।

4. रिलीज (सीआई/सीडी/सीटी): कैनरी/चरणबद्ध रोलआउट, फीचर फ्लैग, "डार्क लॉन्च"।

5. सेवारत: ऑटोस्कलिंग, कैशिंग, gRPC/REST, टाइमआउट/रिट्रेज़।

6. निगरानी: डेटा/भविष्यवाणी बहाव (PSI/KL), विलंबता p95, त्रुटि-दर, कवरेज, "मूक मैट्रिक्स"।

7. री-ट्रेन: शेड्यूल/ट्रिगर ऑन ड्रिफ्ट/मेट्रिक्स का क्षरण।

8. घटनाएं: रनबुक, मॉडल रोलबैक, फॉलबैक (नियम/सरल मॉडल)।

9) फीचर स्टोर (स्थिरता कर्नेल)

ऑफ़ लाइन: पॉइंट-इन-टाइम गणना, एंटी-लीकेज, फॉर्मूला संस्करण सुविधा।

ऑनलाइन: कम विलंबता (≤ 10-30 एमएस), टीटीएल, ऑफ़ लाइन के साथ स्थिरता।

अनुबंध: नाम/विवरण, मालिक, एसएलए, सूत्र, ऑनलाइन/ऑफ़लाइन अनुपालन परीक्षण।

एक सुविधा विनिर्देश (YAML) का उदाहरण:

yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5

10) ऑनलाइन स्कोरिंग और नियम

हाइब्रिड एमएल + नियम: मॉडल → गति + स्पष्टीकरण; नियम - हार्ड-गार्ड/नैतिकता/कानून।

सिलाई: सीईपी पैटर्न (संरचना/वेग/डिवाइस स्विच) + एमएल स्कोरिंग।

SLA: निजीकरण के लिए p95 एंड-टू-एंड 50-150 मीटर, RG/AML अलर्ट के लिए ≤ 2-5s।

रूटिंग छद्म कोड:

python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))

11) प्रशिक्षण डेटा: नमूने और लेबल

घटना विंडो: t0 - संदर्भ, t0 + - लेबल (जमा/काला/धोखाधड़ी)।

रिसाव-नियंत्रण: पॉइंट-इन-टाइम ज्वाइन, भविष्य की घटनाओं का बहिष्कार।

संतुलन: स्तरीकरण/वर्ग वजन, दुर्लभ वर्गों के लिए फोकल नुकसान।

नैतिकता: संवेदनशील विशेषताओं/प्रॉक्सी को बाहर करें, नियंत्रण प्रभाव।

12) अर्थशास्त्र और उत्पादकता

लागत सुविधाएँ: लागत/सुविधा और लागत/अनुरोध की गणना करें, भारी ऑनलाइन-जुड़ने से बचें।

नकदी: रैम में गर्म विशेषताएं, ठंड - आलसी।

भौतिककरण: ऑफ़ लाइन एकत्रीकरण; ऑनलाइन केवल महत्वपूर्ण

कोटा: रिप्ले पर सीमा, समय खिड़कियों पर बैकटेस्ट; टीम द्वारा चार्जबैक।

13) SQL/छद्म कोड उदाहरण

मंथन के लिए प्वाइंट-इन-टाइम नमूना (30 दिन की चुप्पी):

sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;

ऑनलाइन जमा विंडो (फ्लिंक एसक्यूएल, 10 मिनट):

sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);

14) कार्यान्वयन रोडमैप

एमवीपी (4-6 सप्ताह):

1. सिग्नल और फीचर स्टोर v1 (भुगतान/गेमप्ले के लिए 5-10 सुविधाएँ) की सूची।

2. ट्रैफिक के 10-20% के लिए बेसिक मंथन/डिपॉजिट मॉडल (XGBoost) + A/B।

3. कैश (p95 <150 ms) और कैनरी रिलीज के साथ ऑनलाइन सर्फिंग।

4. बहाव/गुणवत्ता निगरानी, मॉडल कार्ड, रोलबैक रनबुक।

चरण 2 (6-12 सप्ताह):

आरजी/एएमएल स्कोरिंग, ग्राफ सुविधाएँ, वास्तविक समय ट्रिगर।
बोनस, प्रासंगिक डाकुओं, ऑफ-पॉलिसी मूल्यांकन के लिए उत्थान मॉडल।
बहाव/कैलेंडर, प्रलेखन स्वचालन द्वारा ऑटो-री-ट्रेन।

चरण 3 (12-20 सप्ताह):

खेलों की सूची का निजीकरण (seq2rec), बहु-उद्देश्यीय अनुकूलन (आय/जिम्मेदारी)।
बहु-क्षेत्रीय सर्फिंग, एसएलए/कोटा, सुविधाओं/अनुमान पर चार्जबैक।
निष्पक्षता ऑडिट और तनाव परीक्षण, डीआर अभ्यास और WORM रिपॉजिटरी जारी करते हैं।

15) RACI

R (जिम्मेदार): MLOps (प्लेटफ़ॉर्म/सेवारत), डेटा साइंस (मॉडल/प्रयोग), डेटा Eng (सुविधाएँ/पाइपलाइन)।

ए (जवाबदेह): डेटा के प्रमुख/सीडीओ।

सी (परामर्श): अनुपालन/डीपीओ (पीआईआई/आरजी/एएमएल/डीएसएआर), सुरक्षा (केएमएस/रहस्य), एसआरई (एसएलओ/मूल्य), वित्त (प्रभाव/आरओआई), कानूनी।

I (सूचित): उत्पाद/विपणन/संचालन/सहायता।

16) प्री-सेल चेकलिस्ट

फीचर्स ऑनलाइन/ऑफ़लाइन, ट्रांजिट टेस्ट पास हुए।
मॉडल कार्ड (मालिक, डेटा, मैट्रिक्स, जोखिम, निष्पक्षता) में भरा हुआ है।
कैनरी रिलीज/फिचफ्लैग; एसएलए और विलंबता/त्रुटि/बहाव अलर्ट।
PII/DSAR/RTBF/कानूनी पकड़ नीतियों को लागू किया गया; लॉग अवैयक्तिक हैं।
हादसा/रोलबैक रनबुक; फॉलबैक रणनीति।
प्रयोगों को औपचारिक रूप दिया जाता है (परिकल्पना, मैट्रिक्स, अवधि, एमडीई)।
अनुमान और सुविधा की लागत बजट में शामिल है; कोटा और सीमाएं शामिल हैं।

17) एंटी-पैटर्न

विसंगति ऑनलाइन/ऑफ़लाइन सुविधा → दुर्गम।

कैश और टाइमआउट के बिना "हॉट पाथ" में तुल्यकालिक बाहरी एपीआई।

अपारदर्शी मीट्रिक सूत्र/कोई मॉडल कार्ड नहीं।

निगरानी और ओवरट्रेनिंग के बिना पुनर्प्राप्ति/बहाव।

सीएलएस/आरएलएस/न्यूनतम के बिना एनालिटिक्स और प्रशिक्षण में पीआईआई।

डोमेन अपघटन के बिना "सब कुछ के लिए एक बड़ा मॉडल"।

18) नीचे की रेखा

आईगेमिंग में एमएल "जादू" मॉडल का एक सेट नहीं है, लेकिन एक अनुशासन: सुसंगत डेटा और सुविधाएं, प्रजनन योग्य ऑफ़ लाइन प्रशिक्षण, विश्वसनीय ऑनलाइन सर्फिंग, सख्त एमएलओपी, पारदर्शी मैट्रिक्स और नैतिकता/अनुपालन। इस गाइड का अनुसरण करके, आप एक ऐसी प्रणाली का निर्माण करेंगे जो लगातार राजस्व और प्रतिधारण को बढ़ाती है, जोखिम को कम करती है, और नियामक आवश्यकताओं का अनुपालन करती है - पैमाने पर, जल्दी और अनुमानित रूप से।

आईगेमिंग में मशीन लर्निंग

हमसे संपर्क करें

त्वरित संपर्क

वीडियो जल्द ही अपडेट किया जाएगा

हम इस समय परियोजनाओं में बहुत व्यस्त हैं