iGaming maşyn okuwy
1) Işewürlik ýagdaýlary we gymmaty
Önüm/girdeji: LTV çaklamasy, churn (akym), depozit/satyn almak üçin propensiti, dinamiki missiýalar/gözlegler, next-best-action/offer.
Marketing/CRM: look-alike, segmentasiýa, real-time triggers, bonuslary optimizirlemek (ABO - Abuse-resistant Bonus Optimization).
Töwekgelçilik/Utgaşma: antifrod/AML (velocity, gurluşlaşdyryş, grafiki alamatlar), Responsible Gaming (RG) - töwekgelçilik-skor, gatyşma triggerleri.
Amallar/SRE: hadysalary çaklamak, capacity/traffic forecasting, üpjün edijileriň anomaliýalary.
Maliýe: GGR/NGR çaklamasy, Fx-duýgurlyk, kontragentleriň manipulýasiýalarynyň detekasiýasy.
Täsiriň görkezijileri: şahsylaşdyrmak arkaly Net Revenue-a + 3-7%, fraud-loss-a 20-40%, çurn-a 10-25% , RG <5 s onlaýn jogap SLA.
2) Maglumatlar we alamatlar (Feature Engineering)
Çeşmeler: gameplay, tölegler/PSP, autentifikasiýa, enjamlar/ASN/geo, RG/KYC/KYB, marketing UTM, provayder ýazgylary, sapport/tekstler.
Esasy çyzgylar:- Özüňi alyp baryş penjireleri: 10 minut/sagat/gün üçin nyrhlaryň/goýumlaryň we mukdaryň N, recency/frequency/monetary.
- Yzygiderlilik: oýunlaryň zynjyrlary, iň soňky işjeňlik bilen wagt, sessiýa alamatlary.
- Geo/enjam: ýurt/bazar, ASN, enjamyň/brauzeriň görnüşi.
- Grafiki: oýunçy-kart-enjam-IP baglanyşyklary, komponentleri/merkezliligi (fraud rings).
- Kontekst: günüň wagty/hepdäniň güni/bazar baýramçylygy, üpjün ediji/reanr/oýnuň üýtgewsizligi.
- RG/AML: çäklendirmeler, öz-özüni aýyrmalar, skriningiň baýdaklary, PP/sanksiýalar (kesh/asinhron arkaly).
- Walýutalary we wagty kadalaşdyryň (UTC + ýerli bazar).
- Ölçegi taryhy (SCD II).
- Onlaýn/awtonom üýtgeşmelere razy boluň (Feature Store-daky ýeke-täk kod).
3) Binagärlik: onlaýn
3. 1 Awtonom kontury
Lakehouse: Bronze → Kümüş (kadalaşmak/baýlaşdyrmak) → Altyn (datasetler).
Feature Store (offline): formula registrleri fich, point-in-time join, öwrediji saýlawlaryň materializasiýasy.
Okuw: kesgitlenen garaşlylygy bolan gaplar; synaglary yzarlamak (metrikler/artefaktlar/maglumatlar).
Tassyklama: k-fold/temporal split, backtest, off-policy baha.
3. 2 Onlaýn kontury
Ingest → Stream Processing: Flink/Spark/Beam bilen penjireler/watermarks, idempotentlik.
Feature Store (online): pes patentli nagt pul (Redis/Scylla) + oflayn möhür.
Serving: REST/gRPC endpointleri, skoring grafasy, AB-routing, kanareýa goýberişleri.
Hakyky wagt penjireleri: Paneller/düzgünler üçin ClickHouse/Pinot.
4) Nusgawy modeller we çemeleşmeler
Klassifikasiýa/skoring: churn/depozit/frod/RG (LogReg, XGBoost/LightGBM, TabNet, CatBoost).
Reýting/teklipler: faktorizasiýa/listing-ranging (LambdaMART), seq2rec (RNN/Transformers), kontekstli garakçylar.
Anomaliýalar: Izolation Forest, One-Class SVM, AutoEncoder, Prophet/TSfresh.
Grafiki: galplyk halkalary üçin Node2Vec/GraphSAGE/GNN.
Sebäpler (causal): uplift-modeller, T-learner/X-learner, DoWhy/CausalML.
NLP/ASR: biletler/söhbetdeşlikler, şikaýatlaryň klassifikasiýasy, sentiment, mowzuklar.
5) Hil ölçegleri
Klassifikasiýa: ROC-AUC/PR-AUC, F1 amal bosagalarynda, ekspected cost (deňagramly FP/FN), KS töwekgelçilik-skoring üçin.
Teklipler: NDCG @K, MAP @K, coverage/diversity, CTR/CVR onlaýn.
TS/Forecast: MAPE/SMAPE, WAPE, P50/P90 ýalňyşlyk, PI örtügi.
RG/AML: SLA-da precision/recall, ortaça wagt-to-intervene.
Ykdysadyýet: Net Revenue-de uplift, fraud saved, ROI kampaniýalary,% bonus-hyýanat.
6) Baha bermek we synaglar
Oflayn: temporal split, hepdeler/bazarlar/tenantlar boýunça backtest.
Onlaýn: A/B/n, CUPED/diff-in-diff, sequential tests.
Off-policy: Şahsylaşdyrma syýasaty üçin IPS/DR.
Status. kuwwaty: dispersiýany we MDE-ni göz öňünde tutup, nusganyň ululygyny hasaplamak.
python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)
7) Gizlinlik, ahlak, laýyklyk
PII-minimalizasiýa: lakamlary, mappingleri izolirlemek, CLS/RLS.
Rezidentlik: EEA/UK/BR aýratyn konturlary; esassyz sebitleýin join 'olarsyz.
DSAR/RTBF: fiçlerde we ýazgylarda aýyrmak/redaktirlemek; Kazyýet/hasabat üçin "Legal Hold".
Fairness/Ikitaraplaýyn: fich auditi, disparate impact, proxy-üýtgeýjilere gözegçilik.
Explainability: SHAP/feature importance, model kartoçkalary (owner, senesi, maglumatlary, metrikleri, töwekgelçilikleri).
Howpsuzlyk: KMS/CMK, ýazgylaryň daşyndaky syrlar, WORM-relizleriň arhiwleri.
8) MLOps: durmuş sikli
1. Data & Features: shemalar/şertnamalar, DQ-düzgünler (completeness/uniqueness/range/temporal), lineage.
2. Okuw: konteýnerler, awtotüning, treking synaglary.
3. Tassyklama: shemalaryň laýyklyk synaglary, bias/fairness, performance-testler.
4. Release (CI/CD/CT): kanareýa/tapgyrlaýyn çykmalar, fiça-baýdaklar, "garaňky uçuryş".
5. Hyzmat: Awtoskeýling, keş, gRPC/REST, timeouts/retrailer.
6. Gözegçilik: Maglumatlaryň/çaklamalaryň süýşmegi (PSI/KL), latency p95, error-rate, coverage, "silent metrics".
7. Re-train: Metrleriň süýşmegi/zaýalanmagy boýunça meýilnama/triggerler.
8. Hadysalar: runbook, modeliň yza çekilmegi, fallback (düzgün/ýönekeý model).
9) Feature Store (ylalaşygyň özeni)
Oflayn: nokat-in-time hasaplamalar, anti-leakage, formulanyň wersiýasy fich.
Onlaýn: pes gizlinlik (≤ 10-30 ms), TTL, oflayn laýyklyk.
Şertnamalar: ady/beýany, eýesi, SLA, formula, laýyklyk synaglary online/offline.
yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5
10) Onlaýn skoring we düzgünler
Gibrid ML + Rules: model → çalt + düşündiriş; düzgünler - hard-guard/etika/kanun.
Tikiş: CEP-patternleri (structuring/velocity/device switch) + ML-skoring.
SLA: p95 end-tu-end 50-150 ms şahsylaşdyrmak üçin, ≤ 2-5 s RG/AML alertleri üçin.
python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))
11) Okuw üçin maglumatlar: nusgalar we bellikler
Waka penjireleri: t0 - salgylanma, t0 + Δ - bellik (depozit/gara/frod).
Leakage-control: point-in-time join, geljekdäki wakalary aýyrmak.
Deňagramlylyk: seýrek synplar üçin synplaryň gatlaklaşmagy/agramy, focal loss.
Etika: duýgur häsiýetleri/proxy aýyrmak, täsirine gözegçilik etmek.
12) Ykdysadyýet we öndürijilik
Bahasy: cost/feature we cost/request hasaplaň, agyr onlaýn join 'olardan gaça duruň.
Nagt pul: RAM-da gyzgyn çüýşeler, sowuk - lazy.
Materializasiýa: oflayn agregasiýa; onlaýn diňe möhüm.
Kwotalar: wagt penjireleri boýunça repleýlere, bektestlere çäklendirmeler; buýruklar boýunça chargeback.
13) SQL/psevdokodyň mysallary
Nokat-in-time churn üçin nusga (30 gün dymmak):sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;
Onlaýn depozit penjiresi (Flink SQL, 10 min):
sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);
14) Durmuşa geçirmegiň ýol kartasy
MVP (4-6 hepde):1. Signallar we Feature Store v1 katalogy (Payments/Gameplay üçin 5-10 surat).
2. Esasy model churn/depozit (XGBoost) + A/B traffigiň 10-20%.
3. Keş (p95 <150 ms) we kanareýanyň çykarylyşy bilen onlaýn hyzmat.
4. Drift/hil gözegçiligi, model kartoçkasy, yzyna gaýtaryş runbook.
2-nji faza (6-12 hepde):- RG/AML-skoringler, grafiki alamatlar, real-time triggerler.
- Bonuslar üçin Uplift modelleri, kontekstli garakçylar, syýasatdan daşary baha bermek.
- Awto-re-treýn dreýf/senenama boýunça, resminamalary awtomatlaşdyrmak.
- Oýunlaryň katalogyny şahsylaşdyrmak (seq2rec), köp obýektiw optimizasiýa (girdeji/jogapkärçilik).
- Köp sebitleýin hyzmat, SLAs/kwotalar, fiçalar/inferens boýunça chargeback.
- Fairness-audit we stres-synaglar, DR-maşklar we WORM-goýberiş ammarlary.
15) RACI
R (Responsible): MLOps (platforma/serwing), Data Science (modeller/synaglar), Data Eng (fich/payplayns).
A (Accountable): Head of Data / CDO.
C (Consulted): Compliance/DPO (PII/RG/AML/DSAR), Security (KMS/syrlar), SRE (SLO/bahasy), Finance (effekt/ROI), Legal.
I (Informed): Önüm/Marketing/Amallar/Goldaw.
16) Azyk önüminden öň çek-sanawy
- Fiçler onlaýn/awtonom ylalaşyldy, geçiş synaglary geçirildi.
- Model kartoçkasy (owner, maglumatlar, metrikler, töwekgelçilikler, fairness) dolduryldy.
- Kanar çykyşy/fiçflag; SLA we latency/hatalar/drift alertleri.
- PII/DSAR/RTBF/Legal Hold syýasaty berjaý edilýär; loglar şahsylaşdyrylmady.
- Runbook hadysalar/yza gaýdyp gelmek; fallback strategiýasy.
- Synaglar düzüldi (gipotezalar, metrikler, dowamlylyk, MDE).
- Infersiň we fiçiň bahasy býudjetine ýazylýar; kwotalar we çäkler girizildi.
17) Anti-patternler
Gapma-garşylyk onlaýn/oflayn → geçirilmezlik.
"Gyzgyn ýolda" keshsiz we wagtsyz sinhron daşarky API.
Metrikleriň aç-açan däl formulalary/modelleriň kartoçkalarynyň ýoklugy.
Gözegçiliksiz we gaýtadan işlemezden gaýtadan taýýarlamak/süýşmek.
CLS/RLS/minimallaşdyrmazdan analitikada we okuwda PII.
Domen dekompozisiýasy bolmazdan "Hemme zat üçin bir uly model".
18) Jemleýji
iGaming-de ML "jadyly" modelleriň toplumy däl-de, düzgün-nyzam: utgaşdyrylan maglumatlar we fiçler, oýnalýan oflayn okuw, ygtybarly onlaýn hyzmat, berk MLOps, aç-açan metrika we etika/gabat gelmek. Bu gollanmany ýerine ýetirip, siz girdejini we saklamagy yzygiderli ýokarlandyrýan, töwekgelçilikleri azaldýan we kadalaşdyryjy talaplary - masştabda, çalt we öňünden aýdyp boljak derejede berjaý edýän ulgam gurarsyňyz.