iGaming-də maşın öyrənmə
1) Biznes halları və dəyəri
Məhsul/gəlir: LTV proqnozu, churn (çıxış), depozit/alış propensiti, dinamik missiyalar/kvestlər, next-best-action/offer.
Marketinq/CRM: look-alike, seqmentasiya, real-time triggers, bonus optimizasiyası (ABO - Abuse-resistant Bonus Optimization).
Risk/Komplayens: antifrod/AML (velocity, strukturlaşdırma, qrafik əlamətlər), Responsible Gaming (RG) - risk-skor, müdaxilə tetikleyiciləri.
Əməliyyatlar/SRE: hadisələrin proqnozlaşdırılması, capacity/traffic forecasting, provayderlərin anomaliyaları.
Maliyyə: GGR/NGR proqnozu, Fx-həssaslıq, kontragentlərin manipulyasiyasının detekasiyası.
Effektin göstəriciləri: + 3-7% -dən Net Revenue-ə fərdiləşdirmə yolu ilə, 20-40% -dən fraud-loss-a −, 10-25% -dən churn-a −, SLA reaksiya RG <5 s online.
2) Məlumatlar və əlamətlər (Feature Engineering)
Mənbələr: gameplay, ödənişlər/PSP, identifikasiya, cihazlar/ASN/geo, RG/KYC/KYB, marketinq UTM, provayder qeydləri, sapport/mətnlər.
Əsas fiqurlar:- Davranış pəncərələri: N dərəcələri/depozitlər və 10 dəq/saat/gün üçün məbləğlər, recency/frequency/monetary.
- Ardıcıllıqlar: oyun zəncirləri, son aktivliyi ilə vaxt, sessiya əlamətləri.
- Geo/cihaz: ölkə/bazar, ASN, cihaz/brauzer növü.
- Qrafik: əlaqə oyunçu-kart-cihaz-IP, komponentlər/mərkəzlər (fraud rings).
- Kontekst: gün/gün həftə/bazar tətil, provayder/janr/oyun dəyişkənliyi.
- RG/AML: limitlər, özünü istisna etmələr, ekran bayraqları, RER/sanksiyalar (cash/asinxron vasitəsilə).
- Valyutaları və vaxtı normallaşdırın (UTC + yerli bazar).
- Ölçmələri tarixləşdirin (SCD II).
- Online/offline transformasiya (Feature Store-da vahid kod).
3) Memarlıq: Online oflayn
3. 1 Oflayn kontur
Lakehouse: Bronze → Silver (normallaşma/zənginləşdirmə) → Gold (dataset).
Feature Store (offline): formula registr fich, point-in-time join, tədris seçimlərinin materiallaşdırılması.
Təlim: sabit asılılıqları olan konteynerlər; trekinq təcrübələri (metriklər/artefaktlar/məlumatlar).
Validasiya: k-fold/temporal split, backtest, off-policy qiymətləndirmə.
3. 2 Onlayn kontur
Ingest → Stream Processing: Flink/Spark/Beam pəncərələri ilə/watermarks, idempotentlik.
Feature Store (online): aşağı patentli cache (Redis/Scylla) + oflayn cast.
Serving: REST/gRPC end-pointlər, skoring qrafiki, AB-routing, kanarya buraxılışları.
Real-time vitrinlər: panellər/qaydalar üçün ClickHouse/Pinot.
4) Model və yanaşmalar
Təsnifat/skorinq: churn/depozit/frod/RG (LogReg, XGBoost/LightGBM, TabNet, CatBoost).
Sıralama/tövsiyələr: faktorizasiya/siyahı sıralama (LambdaMART), seq2rec (RNN/Transformers), kontekstli quldurlar.
Anomaliyalar: Isolation Forest, One-Class SVM, AutoEncoder, Müvəqqəti sıralar üçün Prophet/TSfresh.
Qrafik: fırıldaqçılıq üzükləri üçün Node2Vec/GraphSAGE/GNN.
Səbəblər (causal): uplift modelləri, T-learner/X-learner, DoWhy/CausalML.
NLP/ASR: biletlər/söhbətlər, şikayətlərin təsnifatı, sentiment, mövzular.
5) Keyfiyyət metrikası
Təsnifat: ROC-AUC/PR-AUC, əməliyyat astanalarında F1, expected cost (balanslı FP/FN), risk-skor üçün KS.
Tövsiyələr: NDCG @K, MAP @K, coverage/diversity, CTR/CVR online.
TS/Forecast: MAPE/SMAPE, WAPE, P50/P90 səhv, PI əhatə edir.
RG/AML: SLA-da precision/recall, orta vaxt-to-intervene.
İqtisadiyyat: Net Revenue uplift, fraud saved, ROI kampaniyalar,% bonus sui-istifadə.
6) Qiymətləndirmə və təcrübələr
Offline: temporal split, həftələr/bazarlar/tenantlar üzrə backtest.
Online: A/B/n, CUPED/diff-in-diff, sequential tests.
Off-policy: fərdi siyasətlər üçün IPS/DR.
Stat. güc: dispersiya və MDE nəzərə alaraq nümunə ölçüsü hesablanması.
python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)
7) Gizlilik, etika, uyğunluq
PII-minimallaşdırma: təxəllüslər, mappinq izolyasiyası, CLS/RLS.
Rezidentlik: ayrı-ayrı EEA/UK/BR konturları; heç bir əsas olmadan cross-regional join 'oları.
DSAR/RTBF: Fich və log silmə/redaktə; Cases/hesabat üçün Legal Hold.
Fairness/qərəzlilik: audit fich, disparate impact, proxy-dəyişənlər nəzarət.
Explainability: SHAP/feature importance, model kartları (owner, tarix, məlumatlar, metriklər, risklər).
Təhlükəsizlik: KMS/CMK, log xaricində sirləri, WORM-relizlər arxivləri.
8) MLOps: həyat dövrü
1. Data & Features: sxemlər/müqavilələr, DQ qaydaları (completeness/uniqueness/range/temporal), lineage.
2. Təlim: konteynerlər, avtotüninq, trekinq təcrübələri.
3. Validasiya: sxem uyğunluq testləri, bias/fairness, performance testləri.
4. Release (CI/CD/CT): Kanarya/mərhələli çıxışlar, Ficha bayraqları, «qaranlıq başlanğıc».
5. Xidmət: avtoskeylinq, caching, gRPC/REST, timeouts/retray.
6. Monitorinq: məlumat/proqnozlar sürüklənməsi (PSI/KL), latency p95, error-rate, coverage, «silent metrics».
7. Re-train: sürüklənmə/deqradasiya metrik cədvəli/triggers.
8. Hadisələr: runbook, geri model, fallback (qayda/sadə model).
9) Feature Store (koordinasiya nüvəsi)
Offline: point-in-time hesablama, anti-leakage, formula versiyası fich.
Online: aşağı gecikmə (≤ 10-30 ms), TTL, oflayn uyğunluq.
Müqavilələr: adı/təsviri, sahibi, SLA, formula, uyğunluq testləri online/offline.
yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5
10) Onlayn hesab və qaydalar
hibrid ML + Rules: model → sürətli + izahat; qaydalar - hard-guard/etika/qanun.
Tikiş: CEP-patterns (structuring/velocity/device switch) + ML-skoring.
SLA: p95 end-tu-end 50-150 ms personalizasiya üçün, ≤ 2-5 s RG/AML alertləri üçün.
python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))
11) Təlim məlumatları: nümunələr və etiketlər
Hadisə pəncərələri: t0 - istinad, t0 + Δ - etiket (depozit/qara/frod).
Leakage-control: point-in-time join, gələcək hadisələr istisna.
Balans: nadir siniflər üçün təbəqələşmə/sinif çəkisi, focal loss.
Etika: həssas xüsusiyyətləri/proxy istisna, təsiri nəzarət.
12) İqtisadiyyat və performans
Fich dəyəri: cost/feature və cost/request hesab, ağır online-join 's qaçın.
Cache: RAM isti fiches, soyuq - lazy.
Materiallaşdırma: oflayn aqreqasiya; online yalnız kritik.
Kvotalar: vaxt pəncərələrinə görə repleylər, backtestlər üçün limitlər; komanda chargeback.
13) SQL/psevdokod nümunələri
Point-in-time churn üçün nümunə (30 gün sükut):sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;
Online depozit pəncərəsi (Flink SQL, 10 dəq):
sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);
14) Tətbiqi yol xəritəsi
MVP (4-6 həftə):1. Siqnallar kataloqu və Feature Store v1 (Payments/Gameplay üçün 5-10 fit).
2. Əsas model churn/depozit (XGBoost) + A/B 10-20% trafik.
3. Cache (p95 <150 ms) və kanarya buraxılışları ilə onlayn xidmət.
4. Drift/keyfiyyət monitorinqi, kart model, runbook geri.
Faza 2 (6-12 həftə):- RG/AML-skorinqlər, qrafik əlamətlər, real-time tetikləyicilər.
- Bonuslar üçün Uplift modelləri, kontekstli quldurlar, qeyri-siyasi qiymətləndirmə.
- Avto-re-train dreyf/təqvim, sənədlərin avtomatlaşdırılması.
- Oyun kataloqu (seq2rec), multi-obyektiv optimallaşdırma (gəlir/məsuliyyət).
- Multi-regional servinq, SLAs/kvotalar, fich/inferens üzrə chargeback.
- Fairness audit və stress testləri, DR təlimləri və WORM buraxılış anbarları.
15) RACI
R (Responsible): MLOps (platforma/servinq), Data Science (modellər/eksperimentlər), Data Eng (fiçalar/payplaynlar).
A (Accountable): Head of Data / CDO.
C (Consulted): Compliance/DPO (PII/RG/AML/DSAR), Security (KMS/sirləri), SRE (SLO/dəyəri), Finance (effekt/ROI), Legal.
I (Informed): Məhsul/Marketinq/Əməliyyatlar/Dəstək.
16) Satış öncəsi yoxlama siyahısı
- Online/offline razılaşdırılmış Fiches, keçid testləri keçdi.
- Model kartı (owner, data, metrika, risk, fairness) doldurulur.
- Kanarya Release/Fichflag; SLA və alertlər latency/səhvlər/drift.
- PII/DSAR/RTBF/Legal Hold siyasətlərinə əməl olunur; Logi anonim.
- Runbook hadisələr/geri; fallback strategiyası.
- Təcrübələr rəsmiləşdirilmişdir (hipotezlər, metriklər, müddət, MDE).
- Infense və phic dəyəri büdcəyə daxil edilmişdir; kvotalar və limitlər daxildir.
17) Anti-nümunələr
Uyğunsuzluq online/offline → pozulma.
Cache və zaman olmadan «isti yolda» sinxron xarici API.
Qeyri-şəffaf metrik düsturlar/model kartlarının olmaması.
Monitorinq və yenidən təlim olmadan yenidən təlim/sürüklənmə.
CLS/RLS/minimumlaşdırma olmadan analitik və təlim PII.
Domain dekompozisiyası olmadan «hamısı üçün bir böyük model».
18) Yekun
iGaming-də ML - «sehrli» modellər dəsti deyil, nizam-intizam: razılaşdırılmış məlumatlar və fiş, oynaya bilən oflayn təlim, etibarlı onlayn xidmət, ciddi MLOps, şəffaf metriklər və etika/komplayens. Bu təlimata əməl edərək, gəlir və qənaəti davamlı olaraq artıran, riskləri azaldan və tənzimləmə tələblərinə uyğun bir sistem quracaqsınız - miqyasda, tez və proqnozlaşdırıla bilən.