GH GambleHub

IGaming'de makine öğrenimi

1) İş durumları ve değeri

Ürün/gelir: LTV tahmini, kayıp (çıkış), mevduat/satın alma eğilimleri, dinamik görevler/görevler, bir sonraki en iyi eylem/teklif.
Pazarlama/CRM: benzer, segmentasyon, gerçek zamanlı tetikleyiciler, bonus optimizasyonu (ABO - Kötüye Kullanıma Dayanıklı Bonus Optimizasyonu).
Risk/Uyum: Anti-dolandırıcılık/AML (hız, yapılandırma, grafik özellikleri), Sorumlu Oyun (RG) - risk oranı, müdahale tetikleyicileri.
Operasyonlar/SRE: olay tahmini, kapasite/trafik tahmini, sağlayıcı anomalileri.
Finans: GGR/NGR tahmini, Fx duyarlılığı, karşı taraf manipülasyon tespiti.

Etki yönergeleri: Kişiselleştirme nedeniyle Net Gelire + %3-7, dolandırıcılık-kayba − %20-40, çalkalanmaya − %10-25, çevrimiçi olduğunda SLA yanıtı RG <5 s.

2) Özellik Mühendisliği

Kaynaklar: oyun, ödemeler/PSP, kimlik doğrulama, cihazlar/ASN/geo, RG/KYC/KYB, pazarlama UTM, sağlayıcı günlükleri, destek/metinler.

Temel özellikler:
  • Davranışsal pencereler: N oranları/mevduat ve 10 dakika/saat/gün başına miktarlar, sonluk/frekans/parasal.
  • Diziler: Oyun zincirleri, son aktivite ile zaman, oturum özellikleri.
  • Geo/cihaz: ülke/pazar, ASN, cihaz/tarayıcı tipi.
  • Grafik: oyuncu-kart-cihaz-IP bağlantıları, bileşenler/merkeziyetler (dolandırıcılık halkaları).
  • Bağlamsal: günün saati/haftanın günü/pazar tatilleri, sağlayıcı/tür/oyun oynaklığı.
  • RG/AML: limitler, kendini dışlama, tarama bayrakları, PEP/yaptırımlar (önbellek/asynchron aracılığıyla).
Öneriler:
  • Para birimlerini ve zamanı normalleştirin (UTC + piyasa yerel ayarı).
  • Boyutları Tarihselleştir (SCD II).
  • Çevrimiçi/çevrimdışı dönüşüm konusunda hemfikir olun (tek Feature Store kodu).

3) Mimari: çevrimdışı ↔ çevrimiçi

3. 1 Çevrimdışı döngü

Lakehouse: Bronz - Gümüş (normalizasyon/zenginleştirme) - Altın (veri setleri).
Feature Store (çevrimdışı): formül kaydı, zaman içinde birleşme, eğitim kümelerinin gerçekleştirilmesi.
Eğitim: sabit bağımlılıkları olan konteynerler; İzleme deneyleri (metrikler/eserler/veriler).
Doğrulama: k-fold/temporal split, backtest, off-policy değerlendirme.

3. 2 Çevrimiçi devre

Ingest> Akış İşleme: Windows/filigranlı Flink/Spark/Beam, idempotency.
Özellik Mağazası (çevrimiçi): Düşük patentli önbellek (Redis/Scylla) + çevrimdışı dökümler.
Servis: REST/gRPC uç noktaları, puanlama grafiği, AB yönlendirme, kanarya sürümleri.
Gerçek zamanlı vitrinler: Paneller/kurallar için ClickHouse/Pinot.

4) Model modelleri ve yaklaşımları

Sınıflandırma/puanlama: çalkalama/para yatırma/dolandırıcılık/RG (LogReg, XGBoost/LightGBM, TabNet, CatBoost).
Sıralama/öneriler: faktörizasyon/liste sıralaması (LambdaMART), seq2rec (RNN/Transformers), bağlamsal haydutlar.
Anomaliler: Zaman serisi için İzolasyon Ormanı, Tek Sınıf SVM, AutoEncoder, Prophet/TSfresh.
Grafik: Dolandırıcılık halkaları için Node2Vec/GraphSAGE/GNN.
Nedensellik: yükseltme modelleri, T-öğrenen/X-öğrenen, DoWhy/NedenselML.
NLP/ASR: biletler/sohbetler, şikayetlerin sınıflandırılması, duygular, konular.

5) Kalite metrikleri

Sınıflandırma: ROC-AUC/PR-AUC, operasyonel eşiklerde F1, beklenen maliyet (ağırlıklı FP/FN), risk puanlaması için KS.
Öneriler: NDCG @ K, MAP @ K, kapsama/çeşitlilik, CTR/CVR çevrimiçi.
TS/Tahmin: MAPE/SMAPE, WAPE, P50/P90 hatası, PI kapsamı.
RG/AML: SLA'da hassasiyet/hatırlama, ortalama zaman aralığı.
Ekonomi: Net Gelir artışı, dolandırıcılık tasarrufu, ROI kampanyaları, % bonus kötüye kullanımı.

6) Değerlendirme ve deneyler

Çevrimdışı: zamansal bölünme, haftaya/pazara/kiracıya göre geri test.
Çevrimiçi: A/B/n, CUPED/diff-in-diff, sıralı testler.
Politika dışı: Kişiselleştirme politikaları için IPS/DR.
Durum gücü: varyans ve MDE dikkate alınarak örneklem büyüklüğünün hesaplanması.

Değer eşiği hesaplama örneği (sözde kod):
python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)

7) Gizlilik, etik, uyum

PII küçültme: takma adlar, eşleme yalıtımı, CLS/RLS.
İkamet: ayrı EEA/İngiltere/BR konturları; Temelsiz bölgeler arası birleşmeler olmadan.
DSAR/RTBF: Özelliklerde ve günlüklerde silme/düzenleme; Davalar/raporlar için Yasal Bekletme.
Adalet/önyargı: özelliklerin denetimi, farklı etki, proxy değişkenlerinin kontrolü.
Açıklanabilirlik: SHAP/özellik önemi, model kartlar (sahip, tarih, veri, metrikler, riskler).
Güvenlik: KMS/CMK, günlüklerin dışındaki sırlar, sürümlerin WORM arşivleri.

8) MLOps: yaşam döngüsü

1. Veri ve Özellikler: şemalar/sözleşmeler, DQ kuralları (bütünlük/benzersizlik/aralık/zamansal), soy.
2. Eğitim: konteynerler, ototunma, izleme deneyleri.
3. Doğrulama: devre uyumluluk testleri, önyargı/adalet, performans testleri.
4. Yayın (CI/CD/CT): Kanarya/aşamalı sunumlar, özellik bayrakları, "karanlık başlatma".
5. Servis: Otomatik ölçeklendirme, önbelleğe alma, gRPC/REST, zaman aşımı/geri ödeme.
6. İzleme: veri/tahmin sürüklenmesi (PSI/KL), gecikme süresi p95, hata oranı, kapsama alanı, "sessiz metrikler".
7. Yeniden eğitme: metriklerin sürüklenmesi/bozulması üzerine zamanlama/tetikleyiciler.
8. Olaylar: runbook, model geri dönüşü, geri dönüş (kural/basit model).

9) Özellik Deposu (tutarlılık çekirdeği)

Çevrimdışı: nokta-in-time hesaplama, anti-sızıntı, formül sürümü özelliği.
Çevrimiçi: düşük gecikme süresi (≤ 10-30 ms), TTL, çevrimdışı ile tutarlılık.
Sözleşmeler: isim/açıklama, sahip, SLA, formül, çevrimiçi/çevrimdışı uyumluluk testleri.

Bir özellik belirtimi örneği (YAML):
yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5

10) Online puanlama ve kurallar

Hibrit ML + Kuralları: Model - hız + açıklamalar; Kurallar - sıkı koruma/etik/hukuk.
Dikiş: CEP desenleri (yapılandırma/hız/cihaz anahtarı) + ML skorlama.
SLA: p95 uçtan uca kişiselleştirme için 50-150ms ≤ RG/AML uyarıları için 2-5s.

Sözde kod yönlendirme:
python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))

11) Eğitim verileri: örnekler ve etiketler

Etkinlik pencereleri: T0 - reference, t0 + Δ - label (deposit/black/fraud).
Sızıntı kontrolü: Zamanında katılma, gelecekteki olayların dışlanması.
Dengeleme: tabakalaşma/sınıf ağırlıkları, nadir sınıflar için odak kaybı.
Etik: hassas nitelikleri/proxy'leri dışlar, etkiyi kontrol eder.

12) Ekonomi ve verimlilik

Maliyet özellikleri: Maliyeti/özelliği ve maliyeti/isteği sayın, yoğun çevrimiçi katılımlardan kaçının.
Nakit: RAM'de sıcak özellikler, soğuk - tembel.
Materyalizasyon: çevrimdışı toplama; Online sadece kritik.
Kotalar: tekrarlardaki sınırlar, zaman pencerelerinde arka testler; Takıma göre ters ibraz.

13) SQL/Pseudo Kod Örnekleri

Churn için zaman içinde örnek (30 günlük sessizlik):
sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;
Çevrimiçi Para Yatırma Penceresi (Flink SQL, 10 dk):
sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);

14) Uygulama Yol Haritası

MVP (4-6 hafta):

1. Sinyallerin kataloğu ve Feature Store v1 (Ödemeler/Oynanış için 5-10 özellik).

2. Temel çalkalama/para yatırma modeli (XGBoost) + trafiğin %10-20'si için A/B.

3. Önbellek (p95 <150 ms) ve kanarya sürümleri ile çevrimiçi sörf.

4. Sürüklenme/kalite izleme, model kart, geri dönüş runbook.

Faz 2 (6-12 hafta):
  • RG/AML puanlama, grafik özellikleri, gerçek zamanlı tetikleyiciler.
  • Bonuslar, bağlamsal haydutlar, politika dışı değerlendirme için yükseltme modelleri.
  • Sürüklenme/takvim, dokümantasyon otomasyonu ile otomatik yeniden eğitim.
Faz 3 (12-20 hafta):
  • Oyun kataloğunun kişiselleştirilmesi (seq2rec), çok amaçlı optimizasyon (gelir/sorumluluk).
  • Çok bölgeli sörf, SLA'lar/kotalar, özellikler/çıkarım üzerinde ters ibraz.
  • Adalet denetimleri ve stres testleri, DR matkapları ve WORM serbest bırakma depoları.

15) RACI

R (Sorumlu): MLOps (platform/hizmet), Veri Bilimi (modeller/deneyler), Veri Müh (özellikler/boru hatları).
A (Sorumlu): Veri/CDO Başkanı.
C (Consulted): Uyumluluk/DPO (PII/RG/AML/DSAR), Güvenlik (KMS/sırlar), SRE (SLO/değer), Finans (etki/ROI), Yasal.
I (Bilgilendirilmiş): Ürün/Pazarlama/Operasyon/Destek.

16) Satış öncesi kontrol listesi

  • Çevrimiçi/çevrimdışı kabul edilen özellikler, geçiş testleri geçti.
  • Model kart (sahip, veri, metrikler, riskler, adalet) doldurulur.
  • Kanarya serbest bırakma/fichflag; SLA ve gecikme/hata/sürüklenme uyarıları.
  • PII/DSAR/RTBF/Yasal Tutma politikaları uygulanır; Kayıtlar kişisel değil.
  • Olay/geri alma runbook; Geri dönüş stratejisi.
  • Deneyler resmileştirilmiştir (hipotezler, metrikler, süre, MDE).
  • Çıkarım ve özellik maliyeti bütçeye dahildir; kotalar ve limitler dahildir.

17) Anti-desenler

Tutarsızlık çevrimiçi/çevrimdışı özellik - erişilemezlik.
Önbellek ve zaman aşımı olmadan "etkin yol'da eşzamanlı harici API'ler.
Opak metrik formüller/model kart yok.
İzleme ve aşırı eğitim olmadan yeniden eğitim/sürüklenme.
Analitikte PII ve CLS/RLS/minimizasyon olmadan eğitim.
Etki alanı ayrışması olmadan'her şey için büyük bir model ".

18) Alt satır

IGaming'deki ML bir dizi "sihirli" model değil, bir disiplindir: tutarlı veriler ve özellikler, tekrarlanabilir çevrimdışı eğitim, güvenilir çevrimiçi sörf, sıkı MLOps, şeffaf metrikler ve etik/uyumluluk. Bu kılavuzu izleyerek, geliri ve elde tutmayı sürekli olarak artıran, riski azaltan ve düzenleyici gerekliliklere uygun, ölçek, hızlı ve öngörülebilir bir sistem oluşturacaksınız.

Contact

Bizimle iletişime geçin

Her türlü soru veya destek için bize ulaşın.Size yardımcı olmaya her zaman hazırız!

Entegrasyona başla

Email — zorunlu. Telegram veya WhatsApp — isteğe bağlı.

Adınız zorunlu değil
Email zorunlu değil
Konu zorunlu değil
Mesaj zorunlu değil
Telegram zorunlu değil
@
Telegram belirtirseniz, Email’e ek olarak oradan da yanıt veririz.
WhatsApp zorunlu değil
Format: +ülke kodu ve numara (örneğin, +90XXXXXXXXX).

Butona tıklayarak veri işlemenize onay vermiş olursunuz.