शिक्षक के साथ और बिना पढ़ाना
1) क्यों और कब
पर्यवेक्षित: एक लेबल है - हम संभावना/वर्ग/मूल्य की भविष्यवाणी करते हैं। हम इसका उपयोग तब करते हैं जब "सही उत्तर" स्पष्ट होता है और एक कहानी होती है: मंथन, 7 दिनों का जमा, आरजी/एएमएल जोखिम, एक प्रस्ताव की प्रतिक्रिया की संभावना, एलटीवी पूर्वानुमान।
अप्रकाशित: कोई निशान नहीं हैं - हम संरचनाओं/समूहों/विसंगतियों/विसंगतियों/अव्यक्त कारकों को पाते हैं: खिलाड़ियों का विभाजन, धोखाधड़ी के छल्ले, खेल के विषयगत प्रोफाइल, प्रदाता विफलताओं का पता का पता।
चयन नियम: यदि व्यावसायिक निर्णय एक विशिष्ट संभाव्य पूर्वानुमान पर निर्भर करता है - पर्यवे यदि लक्ष्य अज्ञात पैटर्न/संकेतों को खोलना है या डेटा के आयाम को कम करना है → असुरक्षित। व्यवहार में, वे संयुक्त हैं।
2) विशिष्ट आईगेमिंग मामले
पर्यवेक्षित
चुरन/पुनर्सक्रियन: द्विआधारी वर्गीकरण (जाओ/नहीं जाओ), प्रभाव के लिए उत्थान मॉडल।
जमा/खरीद की प्रवृत्ति: क्षितिज टी में घटना की संभावना
आरजी/एएमएल: जोखिम दर, संरचना संभावना, संदिग्ध सत्र।
बोनस विरोधी दुरुपयोग: प्रोमो के धोखाधड़ी के उपयोग की संभावना।
सिफारिशें (रैंकिंग): खेल पर क्लिक/शर्त की संभावना (सूची की दृष्टि से/बिंदुवार)।
अप्रयुक्त
खिलाड़ी विभाजन: के-साधन, जीएमएम, आरएफएम/व्यवहार/शैली द्वारा एचडीबीएससीएएन।
विसंगतियाँ: भुगतान/खेल पैटर्न पर अलगाव वन, एलओएफ, ऑटोएनकोडर।
ग्राफ विश्लेषण: "प्लेयर-डिवाइस-कार्ड-आईपी" कॉलम में क्लस्टरिंग।
डाउनसाइज़: दृश्य और फीचर इंजीनियरिंग के लिए पीसीए/यूएमएपी।
विषयगत मॉडल: खेल विवरण/समर्थन चैट के लिए NMF/LDL।
3) डेटा और सुविधाएँ
डेटा लीकेज को बाहर करने के लिए प्वाइंट-इन-टाइम कनेक्शन।
विशेषता खिड़कियां: 10 मिनट/1 एच/1 दिन/7 दिन/30 दिन (पुनरावृत्ति, आवृत्ति, मौद्रिक)।
संदर्भ: बाजार/अधिकार क्षेत्र/डीएसटी/छुट्टियां, प्रदाता/शैली, उपकरण/एएसएन।
ग्राफ सुविधाएँ: अद्वितीय कार्ड/आईपी/उपकरणों की संख्या, केंद्रीयता।
मुद्रा/समय क्षेत्र सामान्यीकरण, उपयोगकर्ताओं/खेल/प्रदाताओं के लिए एससीडी II।
4) एल्गोरिदम और मैट्रिक्स
शिक्षक के साथ
एल्गोरिदम: LogReg, XGBoost/LightGBM/CatBoust, TabNet; रैंकिंग के लिए - LambdaMART/GBDT; समय श्रृंखला - पैगंबर/ईटीएस/ग्रेडिएंट बूस्टेड टीएस।
मेट्रिक्स: आरओसी-एयूसी/पीआर-एयूसी, एफ 1 @ ऑपरेशनल थ्रेशोल्ड, केएस (जोखिम), एनडीसीजी/एमएपी @ के (सिफारिशें), एमएपी/डब्ल्यूएपी (अनुमान), एफपी/एफएन वेट के साथ अपेक्षित लागत।
शिक्षक के बिना
क्लस्टरिंग: के-मीन्स/जीएमएम (समूहों की संख्या - कोहनी/सिल्हूट), एचडीबीएससीएएन (घनत्व)।
विसंगतियाँ: अलगाव वन/LOF/AutoEncoder; मेट्रिक्स - विशेषज्ञ मार्कअप पर सटीक @ k, सिंथेटिक विसंगतियों पर AUCPR।
आयाम: फीचर डिजाइन और दृश्य के लिए पीसीए/यूएमएपी।
5) संयुक्त दृष्टिकोण
अर्ध-पर्यवेक्षित: अनियोजित डेटा (स्व-प्रशिक्षण), स्थिरता विनियमन के हिस्से के लिए छद्म-बुलबुले।
स्व-पर्यवेक्षित: विपरीत/नकाबपोश कार्य (सत्र/खेल एम्बेडिंग) → पर्यवेक्षित में डाउनस्ट्रीम का उपयोग करें।
सक्रिय शिक्षण: प्रणाली उम्मीदवारों (अधिकतम अनिश्चितता/विविधता) को चिह्नित करती है → एएमएल/आरजी विशेषज्ञों के काम को बचाती है।
कमजोर पर्यवेक्षण: heuristics/नियम/दूर मार्कअप फॉर्म "कमजोर" लेबल, फिर कैलिब्रेट करें।
6) प्रक्रिया: ऑफ़ लाइन से ऑनलाइन सर्फिंग तक
1. ऑफ़ लाइन: समय/बाजारों द्वारा विभाजित/संग्रहित करना/तैयार करना प्रशिक्षण/सत्यापन बैकटेस्ट।
2. मेट्रिक्स शब्दार्थ: समान सूत्र (उदाहरण के लिए, churn_30d) और निश्चित समय खिड़कियां।
3. सुविधा स्टोर: समान सुविधा सूत्र ऑनलाइन/ऑफ़लाइन; अनुपालन परीक्षण।
4. ऑनलाइन सर्फिंग: gRPC/REST एंडपॉइंट, विलंबता से SLA, AB रूटिंग/कैनरी रिलीज़।
5. निगरानी: डेटा/भविष्यवाणी बहाव (PSI/KL), विलंबता p95, व्यापार मेट्रिक्स त्रुटि, अलर्ट।
7) गोपनीयता और अनुपालन
पीआईआई कम से कम: छद्म नामकरण, मानचित्रण अलगाव, सीएलएस/आरएलएस।
रेजीडेंसी: क्षेत्र द्वारा व्यक्तिगत पाइपलाइन/एन्क्रिप्शन कुंजियाँ (ईईए/यूके/बीआर)।
DSAR/RTBF: हटाएँ/संपादित करें सुविधाएँ और लॉग; अपवादों के लिए कानूनी आधार रखें।
कानूनी पकड़: ठंड जांच/रिपोर्टिंग कलाकृतियाँ।
निष्पक्षता: ऑडिट प्रॉक्सी फीचर, इम्पैक्ट रिपोर्ट (SHAP), आरजी इंटरवेंशन पॉलिसी।
8) अर्थशास्त्र और उत्पादकता
सुविधा (लागत/सुविधा) और निष्कर्ष (लागत/अनुरोध) की गणना करने की लागत।
ऑफ़ लाइन समुच्चय का भौतिकीकरण; ऑनलाइन - केवल महत्वपूर्ण खिड़
छोटे टीटीएल के लिए अनुमतियों/स्कोरिंग परिणामों का कैश, टाइमआउट के साथ अतुल्यकालिक लुकअप।
रिप्ले/बैकटेस्ट के लिए कोटा और बजट; कमांड/मॉडल द्वारा चार्जबैक।
9) उदाहरण (टुकड़े)
9. churn_30d के लिए 1 प्वाइंट-इन-टाइम चयन
sql
WITH base AS (
SELECT user_pseudo_id, DATE(event_time) AS asof
FROM silver. fact_events
GROUP BY user_pseudo_id, DATE(event_time)
),
feat AS (
SELECT b. user_pseudo_id, b. asof,
SUM(CASE WHEN e. type='deposit' AND e. event_time>=b. asof - INTERVAL '30' DAY
AND e. event_time<b. asof THEN amount_base ELSE 0 END) AS dep_30d,
COUNT(CASE WHEN e. type='bet' AND e. event_time>=b. asof - INTERVAL '7' DAY
AND e. event_time<b. asof THEN 1 END) AS bets_7d
FROM base b
JOIN silver. fact_events e USING (user_pseudo_id)
GROUP BY b. user_pseudo_id, b. asof
),
label AS (
SELECT f. user_pseudo_id, f. asof,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events x
WHERE x.user_pseudo_id=f. user_pseudo_id
AND x.event_time>f. asof AND x.event_time<=f. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS churn_30d
FROM feat f
)
SELECT FROM feat JOIN label USING (user_pseudo_id, asof);
9. 2 भुगतान विसंगतियाँ (स्यूडोकोड, अलगाव वन)
python
X = build_features (payments_last_7d) # sum/frequency/novelty/BIN/ASN/time model = IsolationForest (contamination = 0. 01). fit(X_train)
scores = -model. decision_function(X_test)
alerts = where (scores> THRESHOLD) # AML case candidates
9. के-साधनों का 3 विभाजन (RFM + शैलियों)
python
X = scale(np. c_[R, F, M, share_slots, share_live, share_sports])
km = KMeans(n_clusters=8, n_init=20, random_state=42). fit(X)
segments = km. labels_
9. 4 बाइनरी मॉडल के लिए लागत सीमा
python threshold = pick_by_expected_cost(scores, labels, cost_fp=5. 0, cost_fn=50. 0)
10) मूल्यांकन, मान्यता और प्रयोग
ऑफ़ लाइन: टेम्पोरल स्प्लिट (ट्रेन/वैल/टाइम/मार्केट द्वारा परीक्षण), बैकटेस्टिंग, बूटस्ट्रैप ट्रस्ट।
ऑनलाइन: A/B/n, अनुक्रमिक परीक्षण, CUPED/diff-in-diff।
ऑफ-पॉलिसी: निजीकरण नीतियों के लिए IPS/DR।
अंशांकन: सही संभावनाओं के लिए प्लाट/आइसोटोनिक।
गिरावट नियंत्रण: व्यापार मैट्रिक्स और पीआर-एयूसी/केएस द्वारा अलर्ट।
11) RACI
आर (जिम्मेदार): डेटा साइंस (मॉडल/प्रयोग), एमएलओपी (प्लेटफ़ॉर्म/सेवारत), डेटा एंग (सुविधाएँ/पाइपलाइन)।
ए (जवाबदेह): डेटा के प्रमुख/सीडीओ।
सी (परामर्श): अनुपालन/डीपीओ (पीआईआई/आरजी/एएमएल), सुरक्षा (केएमएस/रहस्य), एसआरई (एसएलओ/मूल्य), वित्त (आरओआई)।
I (सूचित): उत्पाद/विपणन/संचालन/सहायता।
12) कार्यान्वयन रोडमैप
एमवीपी (4-6 सप्ताह):1. लक्ष्य/लेबल और संकेतों की सूची (churn_30d, propensity_7d, risk_rg)।
2. फीचर स्टोर v1 (5-10 फीचर्स), बेसिक XGBoost मॉडल, ऑफ़ लाइन मेट्रिक्स डैशबोर्ड।
3. के-साधनों का विभाजन (8 समूह) + खंडों का विवरण; भुगतान के लिए अलगाव वन।
4. कैश के साथ ऑनलाइन सर्फिंग, p95 <150 ms; 10-20% यातायात के लिए ए/बी।
चरण 2 (6-12 सप्ताह):- लेबल स्कार्सिटी (एएमएल/आरजी), स्व-पर्यवेक्षित गेम/सत्र एम्बेडिंग के लिए सक्रिय/सेमी-पर्यवेक्षित।
- कैनरी रिलीज, बहाव निगरानी, ऑटो रिट्रेनिंग।
- मेट्रिक्स और ऑनलाइन/ऑफ़लाइन मिलान सुविधा की एक एकल शब्दार्थ परत।
- ग्राफ संकेत और धोखाधड़ी के छल्ले; बोनस मॉडल का उत्थान।
- मल्टी-रीजनल सर्विंग, कोटा/चार्जबैक; रिलीज का WORM संग्रह।
- निष्पक्षता ऑडिट, तनाव परीक्षण, रनबुक की घटनाएं।
13) प्री-सेल चेकलिस्ट
- प्वाइंट-इन-टाइम सैंपलिंग और एंटी-लीकेज परीक्षण।
- प्रायिकता अंशांकन; अपेक्षित लागत सीमा चुनें।
- मॉडल कार्ड (मालिक, डेटा, मैट्रिक्स, जोखिम, निष्पक्षता)।
- फीचर स्टोर ऑनलाइन/ऑफ़लाइन अनुपालन परीक्षण।
- बहाव/विलंबता/त्रुटि निगरानी, अलर्ट और ऑटो-रोलबैक।
- PII/DSAR/RTBF/कानूनी पकड़ नीतियां; लॉगिंग अवैयक्तिक है।
- योजना ए/बी और सांख्यिकीय शक्ति की गणना; रोलबैक रनबुक तैयार है।
14) एंटी-पैटर्न
लेबल (रिसाव) और पॉइंट-इन-टाइम की अनुपस्थिति में नई घटनाओं को मिलाना।
डोमेन अपघटन के बजाय "सभी के लिए एक मॉडल"।
कुछ लाइब्रेटेड संभावनाएं - गलत व्यापार सीमा।
अंधी उड़ान: कोई ऑनलाइन बहाव/गुणवत्ता निगरानी नहीं।
ऑनलाइन ओवरकॉम्प्लीकेशन (कैश और टाइमआउट के बिना भारी बाहरी जुड़ ता है)।
व्यावसायिक व्याख्या और स्वामी के बिना खं
15) नीचे की रेखा
पर्यवेक्षित शिक्षण औसत दर्जे का पूर्वानुमान और जोखिम/आय प्रबंधन प्रदान एक शिक्षक - संरचना और संकेतों के बिना जहां कोई निशान नहीं हैं। डेटा अनुशासन (प्वाइंट-इन-टाइम, फीचर स्टोर), अनुपालन और एमएलओपी में उनका संयोजन (अर्ध/स्व-पर्यवेक्षित, सक्रिय सीखना) नेट राजस्व में लगातार वृद्धि, धोखाधड़ी और समय पर आरजी हस्तक्षेप के साथ।