IGaming'de makine öğrenimi
1) İş durumları ve değeri
Ürün/gelir: LTV tahmini, kayıp (çıkış), mevduat/satın alma eğilimleri, dinamik görevler/görevler, bir sonraki en iyi eylem/teklif.
Pazarlama/CRM: benzer, segmentasyon, gerçek zamanlı tetikleyiciler, bonus optimizasyonu (ABO - Kötüye Kullanıma Dayanıklı Bonus Optimizasyonu).
Risk/Uyum: Anti-dolandırıcılık/AML (hız, yapılandırma, grafik özellikleri), Sorumlu Oyun (RG) - risk oranı, müdahale tetikleyicileri.
Operasyonlar/SRE: olay tahmini, kapasite/trafik tahmini, sağlayıcı anomalileri.
Finans: GGR/NGR tahmini, Fx duyarlılığı, karşı taraf manipülasyon tespiti.
Etki yönergeleri: Kişiselleştirme nedeniyle Net Gelire + %3-7, dolandırıcılık-kayba − %20-40, çalkalanmaya − %10-25, çevrimiçi olduğunda SLA yanıtı RG <5 s.
2) Özellik Mühendisliği
Kaynaklar: oyun, ödemeler/PSP, kimlik doğrulama, cihazlar/ASN/geo, RG/KYC/KYB, pazarlama UTM, sağlayıcı günlükleri, destek/metinler.
Temel özellikler:- Davranışsal pencereler: N oranları/mevduat ve 10 dakika/saat/gün başına miktarlar, sonluk/frekans/parasal.
- Diziler: Oyun zincirleri, son aktivite ile zaman, oturum özellikleri.
- Geo/cihaz: ülke/pazar, ASN, cihaz/tarayıcı tipi.
- Grafik: oyuncu-kart-cihaz-IP bağlantıları, bileşenler/merkeziyetler (dolandırıcılık halkaları).
- Bağlamsal: günün saati/haftanın günü/pazar tatilleri, sağlayıcı/tür/oyun oynaklığı.
- RG/AML: limitler, kendini dışlama, tarama bayrakları, PEP/yaptırımlar (önbellek/asynchron aracılığıyla).
- Para birimlerini ve zamanı normalleştirin (UTC + piyasa yerel ayarı).
- Boyutları Tarihselleştir (SCD II).
- Çevrimiçi/çevrimdışı dönüşüm konusunda hemfikir olun (tek Feature Store kodu).
3) Mimari: çevrimdışı ↔ çevrimiçi
3. 1 Çevrimdışı döngü
Lakehouse: Bronz - Gümüş (normalizasyon/zenginleştirme) - Altın (veri setleri).
Feature Store (çevrimdışı): formül kaydı, zaman içinde birleşme, eğitim kümelerinin gerçekleştirilmesi.
Eğitim: sabit bağımlılıkları olan konteynerler; İzleme deneyleri (metrikler/eserler/veriler).
Doğrulama: k-fold/temporal split, backtest, off-policy değerlendirme.
3. 2 Çevrimiçi devre
Ingest> Akış İşleme: Windows/filigranlı Flink/Spark/Beam, idempotency.
Özellik Mağazası (çevrimiçi): Düşük patentli önbellek (Redis/Scylla) + çevrimdışı dökümler.
Servis: REST/gRPC uç noktaları, puanlama grafiği, AB yönlendirme, kanarya sürümleri.
Gerçek zamanlı vitrinler: Paneller/kurallar için ClickHouse/Pinot.
4) Model modelleri ve yaklaşımları
Sınıflandırma/puanlama: çalkalama/para yatırma/dolandırıcılık/RG (LogReg, XGBoost/LightGBM, TabNet, CatBoost).
Sıralama/öneriler: faktörizasyon/liste sıralaması (LambdaMART), seq2rec (RNN/Transformers), bağlamsal haydutlar.
Anomaliler: Zaman serisi için İzolasyon Ormanı, Tek Sınıf SVM, AutoEncoder, Prophet/TSfresh.
Grafik: Dolandırıcılık halkaları için Node2Vec/GraphSAGE/GNN.
Nedensellik: yükseltme modelleri, T-öğrenen/X-öğrenen, DoWhy/NedenselML.
NLP/ASR: biletler/sohbetler, şikayetlerin sınıflandırılması, duygular, konular.
5) Kalite metrikleri
Sınıflandırma: ROC-AUC/PR-AUC, operasyonel eşiklerde F1, beklenen maliyet (ağırlıklı FP/FN), risk puanlaması için KS.
Öneriler: NDCG @ K, MAP @ K, kapsama/çeşitlilik, CTR/CVR çevrimiçi.
TS/Tahmin: MAPE/SMAPE, WAPE, P50/P90 hatası, PI kapsamı.
RG/AML: SLA'da hassasiyet/hatırlama, ortalama zaman aralığı.
Ekonomi: Net Gelir artışı, dolandırıcılık tasarrufu, ROI kampanyaları, % bonus kötüye kullanımı.
6) Değerlendirme ve deneyler
Çevrimdışı: zamansal bölünme, haftaya/pazara/kiracıya göre geri test.
Çevrimiçi: A/B/n, CUPED/diff-in-diff, sıralı testler.
Politika dışı: Kişiselleştirme politikaları için IPS/DR.
Durum gücü: varyans ve MDE dikkate alınarak örneklem büyüklüğünün hesaplanması.
python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)
7) Gizlilik, etik, uyum
PII küçültme: takma adlar, eşleme yalıtımı, CLS/RLS.
İkamet: ayrı EEA/İngiltere/BR konturları; Temelsiz bölgeler arası birleşmeler olmadan.
DSAR/RTBF: Özelliklerde ve günlüklerde silme/düzenleme; Davalar/raporlar için Yasal Bekletme.
Adalet/önyargı: özelliklerin denetimi, farklı etki, proxy değişkenlerinin kontrolü.
Açıklanabilirlik: SHAP/özellik önemi, model kartlar (sahip, tarih, veri, metrikler, riskler).
Güvenlik: KMS/CMK, günlüklerin dışındaki sırlar, sürümlerin WORM arşivleri.
8) MLOps: yaşam döngüsü
1. Veri ve Özellikler: şemalar/sözleşmeler, DQ kuralları (bütünlük/benzersizlik/aralık/zamansal), soy.
2. Eğitim: konteynerler, ototunma, izleme deneyleri.
3. Doğrulama: devre uyumluluk testleri, önyargı/adalet, performans testleri.
4. Yayın (CI/CD/CT): Kanarya/aşamalı sunumlar, özellik bayrakları, "karanlık başlatma".
5. Servis: Otomatik ölçeklendirme, önbelleğe alma, gRPC/REST, zaman aşımı/geri ödeme.
6. İzleme: veri/tahmin sürüklenmesi (PSI/KL), gecikme süresi p95, hata oranı, kapsama alanı, "sessiz metrikler".
7. Yeniden eğitme: metriklerin sürüklenmesi/bozulması üzerine zamanlama/tetikleyiciler.
8. Olaylar: runbook, model geri dönüşü, geri dönüş (kural/basit model).
9) Özellik Deposu (tutarlılık çekirdeği)
Çevrimdışı: nokta-in-time hesaplama, anti-sızıntı, formül sürümü özelliği.
Çevrimiçi: düşük gecikme süresi (≤ 10-30 ms), TTL, çevrimdışı ile tutarlılık.
Sözleşmeler: isim/açıklama, sahip, SLA, formül, çevrimiçi/çevrimdışı uyumluluk testleri.
yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5
10) Online puanlama ve kurallar
Hibrit ML + Kuralları: Model - hız + açıklamalar; Kurallar - sıkı koruma/etik/hukuk.
Dikiş: CEP desenleri (yapılandırma/hız/cihaz anahtarı) + ML skorlama.
SLA: p95 uçtan uca kişiselleştirme için 50-150ms ≤ RG/AML uyarıları için 2-5s.
python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))
11) Eğitim verileri: örnekler ve etiketler
Etkinlik pencereleri: T0 - reference, t0 + Δ - label (deposit/black/fraud).
Sızıntı kontrolü: Zamanında katılma, gelecekteki olayların dışlanması.
Dengeleme: tabakalaşma/sınıf ağırlıkları, nadir sınıflar için odak kaybı.
Etik: hassas nitelikleri/proxy'leri dışlar, etkiyi kontrol eder.
12) Ekonomi ve verimlilik
Maliyet özellikleri: Maliyeti/özelliği ve maliyeti/isteği sayın, yoğun çevrimiçi katılımlardan kaçının.
Nakit: RAM'de sıcak özellikler, soğuk - tembel.
Materyalizasyon: çevrimdışı toplama; Online sadece kritik.
Kotalar: tekrarlardaki sınırlar, zaman pencerelerinde arka testler; Takıma göre ters ibraz.
13) SQL/Pseudo Kod Örnekleri
Churn için zaman içinde örnek (30 günlük sessizlik):sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;
Çevrimiçi Para Yatırma Penceresi (Flink SQL, 10 dk):
sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);
14) Uygulama Yol Haritası
MVP (4-6 hafta):1. Sinyallerin kataloğu ve Feature Store v1 (Ödemeler/Oynanış için 5-10 özellik).
2. Temel çalkalama/para yatırma modeli (XGBoost) + trafiğin %10-20'si için A/B.
3. Önbellek (p95 <150 ms) ve kanarya sürümleri ile çevrimiçi sörf.
4. Sürüklenme/kalite izleme, model kart, geri dönüş runbook.
Faz 2 (6-12 hafta):- RG/AML puanlama, grafik özellikleri, gerçek zamanlı tetikleyiciler.
- Bonuslar, bağlamsal haydutlar, politika dışı değerlendirme için yükseltme modelleri.
- Sürüklenme/takvim, dokümantasyon otomasyonu ile otomatik yeniden eğitim.
- Oyun kataloğunun kişiselleştirilmesi (seq2rec), çok amaçlı optimizasyon (gelir/sorumluluk).
- Çok bölgeli sörf, SLA'lar/kotalar, özellikler/çıkarım üzerinde ters ibraz.
- Adalet denetimleri ve stres testleri, DR matkapları ve WORM serbest bırakma depoları.
15) RACI
R (Sorumlu): MLOps (platform/hizmet), Veri Bilimi (modeller/deneyler), Veri Müh (özellikler/boru hatları).
A (Sorumlu): Veri/CDO Başkanı.
C (Consulted): Uyumluluk/DPO (PII/RG/AML/DSAR), Güvenlik (KMS/sırlar), SRE (SLO/değer), Finans (etki/ROI), Yasal.
I (Bilgilendirilmiş): Ürün/Pazarlama/Operasyon/Destek.
16) Satış öncesi kontrol listesi
- Çevrimiçi/çevrimdışı kabul edilen özellikler, geçiş testleri geçti.
- Model kart (sahip, veri, metrikler, riskler, adalet) doldurulur.
- Kanarya serbest bırakma/fichflag; SLA ve gecikme/hata/sürüklenme uyarıları.
- PII/DSAR/RTBF/Yasal Tutma politikaları uygulanır; Kayıtlar kişisel değil.
- Olay/geri alma runbook; Geri dönüş stratejisi.
- Deneyler resmileştirilmiştir (hipotezler, metrikler, süre, MDE).
- Çıkarım ve özellik maliyeti bütçeye dahildir; kotalar ve limitler dahildir.
17) Anti-desenler
Tutarsızlık çevrimiçi/çevrimdışı özellik - erişilemezlik.
Önbellek ve zaman aşımı olmadan "etkin yol'da eşzamanlı harici API'ler.
Opak metrik formüller/model kart yok.
İzleme ve aşırı eğitim olmadan yeniden eğitim/sürüklenme.
Analitikte PII ve CLS/RLS/minimizasyon olmadan eğitim.
Etki alanı ayrışması olmadan'her şey için büyük bir model ".
18) Alt satır
IGaming'deki ML bir dizi "sihirli" model değil, bir disiplindir: tutarlı veriler ve özellikler, tekrarlanabilir çevrimdışı eğitim, güvenilir çevrimiçi sörf, sıkı MLOps, şeffaf metrikler ve etik/uyumluluk. Bu kılavuzu izleyerek, geliri ve elde tutmayı sürekli olarak artıran, riski azaltan ve düzenleyici gerekliliklere uygun, ölçek, hızlı ve öngörülebilir bir sistem oluşturacaksınız.