GH GambleHub

Öğretmenli ve öğretmensiz öğretim

1) Neden ve ne zaman

Denetlenen: bir etiket var - olasılık/sınıf/değeri tahmin ediyoruz. "Doğru cevap" açık olduğunda ve bir hikaye olduğunda kullanıyoruz: çalkalama, 7 günlük depozito, RG/AML riski, bir teklife yanıt verme olasılığı, LTV tahmini.
Denetimsiz: Hiçbir işaret yok - yapılar/kümeler/anomaliler/gizli faktörler buluyoruz: oyuncuların bölümlendirilmesi, dolandırıcılık halkaları, oyunların tematik profilleri, sağlayıcı arızalarının tespiti, işaretlerin sıkıştırılması.

Seçim kuralı: iş kararı belirli bir olasılıksal tahmine bağlıysa - denetlenir; Amaç bilinmeyen kalıpları/sinyalleri açmak veya verilerin boyutunu azaltmaksa - denetlenmez. Pratikte bunlar birleştirilir.

2) Tipik iGaming durumları

Denetlenen

Çalkalama/yeniden etkinleştirme: ikili sınıflandırma (git/gitme), etki için yükseltme modelleri.
Para yatırma/satın alma eğilimi: ufukta olay olasılığı T.
RG/AML: risk oranı, yapılandırma olasılığı, şüpheli oturum.
Bonus anti-kötüye kullanım: Promosyon hileli kullanım olasılığı.
Öneriler (sıralama): oyunda tıklama/bahis olasılığı (listwise/pointwise).

Denetimsiz

Oyuncu segmentasyonu: K-means, GMM, HDBSCAN RFM/davranış/türe göre.
Anomaliler: Ödemeler/oyun kalıpları üzerine İzolasyon Ormanı, LOF, AutoEncoder.
Grafik analizi: "player-device-card-IP" sütununda kümeleme.
Küçültme: Görselleştirme ve özellik mühendisliği için PCA/UMAP.
Tematik modeller: Oyun açıklamaları/destek sohbetleri için NMF/LDL.

3) Veriler ve özellikler

Veri sızıntısını dışlamak için zaman içinde bağlantı.
Karakteristik pencereler: 10 dakika/1 saat/1 gün/7 gün/30 gün (sonluk, sıklık, parasal).
Bağlam: pazar/yargı/DST/tatiller, sağlayıcı/tür, cihaz/ASN.
Grafik özellikleri: benzersiz kartların/IP/cihazların sayısı, merkeziyet.
Para birimi/saat dilimi normalleştirme, kullanıcılar/oyunlar/sağlayıcılar için SCD II.

4) Algoritmalar ve metrikler

Öğretmenle birlikte

Algoritmalar: LogReg, XGBoost/LightGBM/CatBoost, TabNet; Sıralama için - LambdaMART/GBDT; Zaman serisi - Prophet/ETS/Gradyan Artırılmış TS.
Metrikler: ROC-AUC/PR-AUC, F1 @ operasyonel eşik, KS (risk), NDCG/MAP @ K (öneriler), MAPE/WAPE (projeksiyonlar), FP/FN ağırlıkları ile beklenen maliyet.

Öğretmen olmadan

Kümeleme: K-means/GMM (küme sayısı - dirsek/siluet), HDBSCAN (yoğunluk).
Anomaliler: İzolasyon Ormanı/LOF/AutoEncoder; Metrikler - uzman işaretlemede precision @ k, sentetik anomalilerde AUCPR.
Boyut: Özellik tasarımı ve görselleştirmeler için PCA/UMAP.

5) Kombine yaklaşımlar

Yarı Denetimli: Ayrılmamış verilerin parçası için sözde kabarcıklar (kendi kendine eğitim), tutarlılık düzenlemesi.
Kendinden Denetimli: Kontrast/maskelenmiş görevler (oturum/oyun gömme) - denetimli olarak aşağı yönde kullanın.
Aktif Öğrenme: Sistem işaretleme adayları (maksimum belirsizlik/çeşitlilik) sunar - AML/RG uzmanlarının çalışmalarını kaydeder.
Zayıf Denetim: Sezgisel/kurallar/uzak işaretleme "zayıf" etiketler oluşturur, sonra kalibre eder.

6) Süreç: çevrimdışından çevrimiçi sörfe

1. Çevrimdışı: toplama/hazırlama - zamana/pazarlara göre bölünme - eğitim/doğrulama - geri test.
2. Metrik semantiği: tekdüze formüller (örneğin, churn_30d) ve sabit zaman pencereleri.
3. Özellik Mağazası: tek tip özellik formülleri çevrimiçi/çevrimdışı; uyum testleri.
4. Çevrimiçi sörf: gRPC/REST uç noktaları, gecikmeyle SLA, AB yönlendirme/kanarya sürümleri.
5. İzleme: veri/tahmin kayması (PSI/KL), gecikme p95, iş metrikleri hatası, uyarılar.

7) Gizlilik ve uyumluluk

PII minimizasyonu: takma ad, eşleme yalıtımı, CLS/RLS.
İkamet: bölgeye göre bireysel boru hatları/şifreleme anahtarları (EEA/UK/BR).
DSAR/RTBF: Özellikleri ve günlükleri sil/düzenle; İstisnalar için yasal zemin tutun.
Yasal Bekletme: Soruşturma/Raporlama Eserlerinin Dondurulması.
Adalet: Denetim Proxy Özelliği, Etki Raporları (SHAP), RG Müdahale Politikası.

8) Ekonomi ve verimlilik

Özelliği (maliyet/özellik) ve çıkarım (maliyet/istek) hesaplama maliyeti.
Çevrimdışı agregaların maddeleştirilmesi; Çevrimiçi - sadece kritik pencereler.
Kısa TTL için izinlerin/puanlama sonuçlarının önbelleği, zaman aşımları ile eşzamansız aramalar.
Tekrarlar/arka testler için kotalar ve bütçeler; Komut/modele göre ters ibraz.

9) Örnekler (parçalar)

9. 1 churn_30d için zaman içinde nokta seçimi

sql
WITH base AS (
SELECT user_pseudo_id, DATE(event_time) AS asof
FROM silver. fact_events
GROUP BY user_pseudo_id, DATE(event_time)
),
feat AS (
SELECT b. user_pseudo_id, b. asof,
SUM(CASE WHEN e. type='deposit' AND e. event_time>=b. asof - INTERVAL '30' DAY
AND e. event_time<b. asof THEN amount_base ELSE 0 END) AS dep_30d,
COUNT(CASE WHEN e. type='bet' AND e. event_time>=b. asof - INTERVAL '7' DAY
AND e. event_time<b. asof THEN 1 END) AS bets_7d
FROM base b
JOIN silver. fact_events e USING (user_pseudo_id)
GROUP BY b. user_pseudo_id, b. asof
),
label AS (
SELECT f. user_pseudo_id, f. asof,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events x
WHERE x.user_pseudo_id=f. user_pseudo_id
AND x.event_time>f. asof AND x.event_time<=f. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS churn_30d
FROM feat f
)
SELECT FROM feat JOIN label USING (user_pseudo_id, asof);

9. 2 Ödeme anomalileri (pseudocode, İzolasyon Ormanı)

python
X = build_features (payments_last_7d) # sum/frequency/novelty/BIN/ASN/time model = IsolationForest (contamination = 0. 01). fit(X_train)
scores = -model. decision_function(X_test)
alerts = where (scores> THRESHOLD) # AML case candidates

9. 3 k-araçlarının segmentasyonu (RFM + türleri)

python
X = scale(np. c_[R, F, M, share_slots, share_live, share_sports])
km = KMeans(n_clusters=8, n_init=20, random_state=42). fit(X)
segments = km. labels_

9. 4 İkili model için maliyet eşiği

python threshold = pick_by_expected_cost(scores, labels, cost_fp=5. 0, cost_fn=50. 0)

10) Değerlendirme, doğrulama ve deneyler

Çevrimdışı: Zamansal bölünme (zamana/pazarlara göre tren/val/test), backtesting, bootstrap trust.
Çevrimiçi: A/B/n, sıralı testler, CUPED/diff-in-diff.
Politika dışı: Kişiselleştirme politikaları için IPS/DR.
Kalibrasyon: Doğru olasılıklar için Platt/İzotonik.
Bozunma kontrolü: iş metriklerine ve PR-AUC/KS'ye göre uyarılar.

11) RACI

R (Sorumlu): Veri Bilimi (modeller/deneyler), MLOps (platform/hizmet), Veri Eng (özellikler/boru hatları).
A (Sorumlu): Veri/CDO Başkanı.
C (Consulted): Uyumluluk/DPO (PII/RG/AML), Güvenlik (KMS/sırlar), SRE (SLO/değer), Finans (ROI).
I (Bilgilendirilmiş): Ürün/Pazarlama/Operasyon/Destek.

12) Uygulama Yol Haritası

MVP (4-6 hafta):

1. Hedefler/etiketler ve sinyaller kataloğu (churn_30d, propensity_7d, risk_rg).

2. Özellik Mağazası v1 (5-10 özellik), temel XGBoost modelleri, çevrimdışı metrikler panoları.

3. K-araçlarının segmentasyonu (8 küme) + segmentlerin tanımı; Ödemeler için İzolasyon Ormanı.

4. Önbellek ile çevrimiçi sörf, p95 <150 ms; Trafiğin %10-20'si için A/B.

Faz 2 (6-12 hafta):
  • Etiket Kıtlığı için Aktif/Yarı Denetimli (AML/RG), kendi kendini denetleyen oyun/oturum gömmeleri.
  • Kanarya salınımları, sürüklenme izleme, otomatik yeniden eğitim.
  • Tek bir semantik metrik katmanı ve çevrimiçi/çevrimdışı eşleştirme özelliği.
Faz 3 (12-20 hafta):
  • Grafik işaretleri ve dolandırıcılık halkaları; Yükseltme bonus modelleri.
  • Çok bölgeli hizmet, kotalar/ters ibraz; WORM sürüm arşivi.
  • Adalet denetimi, stres testleri, runbook olayları.

13) Satış öncesi kontrol listesi

  • Nokta-in-time örnekleme ve anti-kaçak testleri.
  • Olasılık kalibrasyonu; Beklenen maliyet eşiğini seçin.
  • Model kartlar (sahip, veri, metrikler, riskler, adalet).
  • Feature Store Çevrimiçi/Çevrimdışı Uyumluluk Testi.
  • Sürüklenme/gecikme/hata izleme, uyarılar ve otomatik geri alma.
  • PII/DSAR/RTBF/Yasal Tutma politikaları; Günlüğe kaydetme kişisel değildir.
  • Plan A/B ve hesaplanan istatistiksel güç; Rollback runbook hazır.

14) Anti-desenler

Yeni olayların etiketlere karıştırılması (sızıntı) ve zaman içinde noktanın olmaması.
Etki alanı bozunması yerine'herkes için tek model ".
Bazı librated olasılıklar - yanlış iş eşikleri.
Kör uçuş: çevrimiçi sürüklenme/kalite izleme yok.
Online overcomplication (önbellek ve zaman aşımı olmadan ağır harici birleşimler).
İşletme yorumu ve sahibi olmayan segmentler.

15) Alt satır

Denetimli öğrenme ölçülebilir prognoz ve risk/gelir yönetimi sağlar; Öğretmen olmadan - işaretlerin olmadığı yapı ve sinyaller. Veri disiplini (point-in-time, Feature Store), uyumluluk ve MLOps içindeki kombinasyonları (yarı/kendi kendini denetleyen, aktif öğrenme), iGaming platformuna Net Gelirde istikrarlı bir artış, sahtekarlıkta azalma ve zamanında RG müdahaleleri sağlar - tekrarlanabilirlik, maliyet kontrolü ve denetime hazır olma.

Contact

Bizimle iletişime geçin

Her türlü soru veya destek için bize ulaşın.Size yardımcı olmaya her zaman hazırız!

Entegrasyona başla

Email — zorunlu. Telegram veya WhatsApp — isteğe bağlı.

Adınız zorunlu değil
Email zorunlu değil
Konu zorunlu değil
Mesaj zorunlu değil
Telegram zorunlu değil
@
Telegram belirtirseniz, Email’e ek olarak oradan da yanıt veririz.
WhatsApp zorunlu değil
Format: +ülke kodu ve numara (örneğin, +90XXXXXXXXX).

Butona tıklayarak veri işlemenize onay vermiş olursunuz.