Uczenie maszynowe w iGaming
1) Przypadki działalności gospodarczej i wartość
Produkt/przychody: prognoza LTV, churn (odpływ), skłonności do depozytu/zakupu, dynamiczne misje/zadania, next-best-action/oferta.
Marketing/CRM: podobne do wyglądu, segmentacja, wyzwalacze w czasie rzeczywistym, optymalizacja premii (ABO - optymalizacja bonusu odpornego na nadużycia).
Ryzyko/Zgodność: zwalczanie nadużyć finansowych/AML (prędkość, strukturyzacja, charakterystyka wykresu), Odpowiedzialne gry (RG) - wskaźnik ryzyka, wyzwalacze interwencji.
Operacje/SRE: przewidywanie incydentów, prognozowanie przepustowości/ruchu, nieprawidłowości dostawców.
Finanse: prognoza GGR/NGR, czułość Fx, wykrywanie manipulacji kontrahenta.
Wytyczne dotyczące efektu: + 3-7% do przychodu netto z powodu personalizacji, − 20-40% do oszustwa-utraty, − 10-25% do churn, odpowiedź SLA RG <5 s w Internecie.
2) Inżynieria funkcji
Źródła: gameplay, payments/PSP, authentication, devices/ASN/geo, RG/KYC/KYB, marketing UTM, logi dostawców, support/texts.
Podstawowe cechy:- Okna behawioralne: N stawki/depozyty i kwoty na 10 min/godzinę/dzień, rekordowość/częstotliwość/waluta.
- Sekwencje: łańcuchy gier, czas z ostatnią aktywnością, charakterystyka sesji.
- Geo/urządzenie: kraj/rynek, ASN, typ urządzenia/przeglądarki.
- Wykres: połączenia player-card-device-IP, komponenty/centralności (pierścienie oszustwa).
- Kontekst: godzina dnia/dnia tygodnia/dni wolne od pracy, dostawca/gatunek/zmienność gry.
- RG/AML: limity, samodzielne wyłączenia, flagi przesiewowe, PEP/sankcje (za pośrednictwem pamięci podręcznej/asynchronu).
- Normalizacja walut i czasu (UTC + lokalizacja rynku).
- Historyzuj wymiary (SCD II).
- Uzgodnij transformację online/offline (pojedynczy kod sklepu funkcyjnego).
3) Architektura: offline
3. 1 pętla offline
Lakehouse: Brąz → Srebro (normalizacja/wzbogacenie) → Złoto (zbiory danych).
Sklep funkcyjny (offline): rejestr formuły, łączenie się w czasie, materializacja zestawów treningowych.
Szkolenie: kontenery o stałej zależności; eksperymenty śledzenia (mierniki/artefakty/dane).
Walidacja: k-fold/temporal split, backtest, off-policy evaluation.
3. 2 Obwód online
Ingest → Przetwarzanie strumienia: Kołnierz/iskra/wiązka z oknami/znakami wodnymi, idempotencja.
Funkcja Sklep (online): low-patent cache (Redis/Scylla) + offline casts.
Obsługa: punkty końcowe REST/gRPC, wykres punktacji, routing AB, wydania kanarkowe.
Sklepy w czasie rzeczywistym: ClickHouse/Pinot dla paneli/zasad.
4) Modele i podejścia
Klasyfikacja/punktacja: churn/deposit/fraud/RG (LogReg, XGBoost/اGBM, TabNet, CatBoost).
Ranking/zalecenia: factorization/list-ranking (LambdaMART), seq2rec (RNN/Transformers), bandytów kontekstowych.
Anomalie: izolacja lasu, jednoklasowy SVM, AutoEncoder, Prorok/TSfresh dla serii czasowych.
Wykres: Node2Vec/GraphSAGE/GNN dla pierścieni nadużyć finansowych.
Przyczynowość: modele podwyższenia, T-learner/X-learner, DoWhy/CausalML.
NLP/ASR: bilety/czaty, klasyfikacja skarg, sentyment, tematy.
5) Wskaźniki jakości
Klasyfikacja: ROC-AUC/PR-AUC, F1 przy progach operacyjnych, oczekiwany koszt (ważony FP/FN), KS dla punktacji ryzyka.
Zalecenia: NDCG @ K, MAP @ K, zakres/różnorodność, CTR/CVR online.
TS/Forecast: MAPE/SMAPE, WAPE, błąd P50/P90, pokrycie PI.
RG/AML: precyzja/wycofanie w SLA, średni czas do przerwy.
Gospodarka: zwiększenie dochodów netto, oszustwa zaoszczędzone, kampanie ROI,% premii nadużycia.
6) Ocena i eksperymenty
Offline: temporal split, backtest by week/market/najemca.
Online: A/B/n, CUPED/diff-in-diff, sekwencyjne testy.
Poza polityką: IPS/DR dla polityki personalizacji.
Moc Stat.: obliczanie wielkości próbki z uwzględnieniem wariancji i MDE.
python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)
7) Prywatność, etyka, zgodność
Minimalizacja PII: aliasy, izolacja mapowania, CLS/RLS.
Miejsce zamieszkania: oddzielne kontury EOG/UK/BR; bez połączenia międzyregionalnego bez fundamentu.
DSAR/RTBF: usuwanie/edycja w funkcjach i dziennikach; Prawna blokada dla spraw/raportowania.
Uczciwość/stronniczość: audyt cech, rozbieżny wpływ, kontrola zmiennych proxy.
Możliwość wyjaśnienia: SHAP/funkcja znaczenie, karty modelowe (właściciel, data, dane, metryka, ryzyko).
Bezpieczeństwo: KMS/CMK, sekrety poza dziennikami, archiwum WORM wydań.
8) MLOp: cykl życia
1. Dane i cechy: schematy/umowy, zasady DQ (kompletność/wyjątkowość/zakres/czas), rodowód.
2. Szkolenie: kontenery, autotuning, eksperymenty śledzenia.
3. Walidacja: testy kompatybilności obwodu, stronniczość/uczciwość, badania wydajności.
4. Zwolnienie (CI/CD/CT): kanaryjskie/stopniowe rollouts, flagi funkcyjne, „dark launch”.
5. Obsługa: autoskalowanie, buforowanie, gRPC/REST, timeouts/retrays.
6. Monitorowanie: dryf danych/prognozowania (PSI/KL), opóźnienie p95, wskaźnik błędów, zasięg, „ciche mierniki”.
7. Ponowny pociąg: rozkład/wyzwalacze przy dryfowaniu/degradacji mierników.
8. Incydenty: runbook, model rollback, fallback (zasada/prosty model).
9) Sklep z funkcjami (jądro konsystencji)
Offline: obliczenia punktowe w czasie, anty-wyciek, funkcja wersji formuły.
Online: niskie opóźnienia (≤ 10-30 ms), TTL, spójność z offline.
Umowy: nazwa/opis, właściciel, SLA, formuła, testy zgodności online/offline.
yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5
10) Ocena online i zasady
Hybrid ML + Zasady: model → prędkość + wyjaśnienia; zasady - hard-guard/etyka/prawo.
Szwy: wzory CEP (strukturyzacja/prędkość/przełącznik urządzenia) + punktacja ML.
SLA: p95 end-to-end 50-150ms do personalizacji, ≤ 2-5s dla wpisów RG/AML.
python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))
11) Dane szkoleniowe: próbki i etykiety
Okna zdarzeń: t0 - odniesienie, t0 + Α - etykieta (depozyt/czarny/oszustwo).
Kontrola wycieków: łączenie się w czasie, wyłączenie przyszłych wydarzeń.
Równoważenie: wagi stratyfikacyjne/klasowe, utrata ogniskowa dla rzadkich klas.
Etyka: wykluczyć wrażliwe atrybuty/proxy, wpływ kontroli.
12) Ekonomia i wydajność
Funkcje kosztów: policz koszt/funkcję i koszt/żądanie, unikaj ciężkich przyłączeń online.
Gotówka: gorące funkcje w pamięci RAM, zimno - leniwe.
Materializacja: agregacja offline; online tylko krytyczny.
Kontyngenty: limity na powtórki, backtests na oknach czasowych; obciążenie zwrotne przez zespół.
13) Przykłady kodu SQL/Pseudo
Próbka punktowa dla churn (30 dni ciszy):sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;
Okno depozytu online (Flink SQL, 10 min):
sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);
14) Plan działania w zakresie wdrażania
MVP (4-6 tygodni):1. Katalog sygnałów i Funkcja Sklep v1 (5-10 funkcji dla płatności/Gameplay).
2. Podstawowy model churn/deposit (XGBoost) + A/B dla 10-20% ruchu.
3. Surfowanie online z pamięcią podręczną (p95 <150 ms) i kanarkami.
4. Monitorowanie dryfu/jakości, karta modelowa, książeczka startowa.
Faza 2 (6-12 tygodni):- Punktacja RG/AML, funkcje wykresu, wyzwalacze w czasie rzeczywistym.
- Modele podnoszenia premii, bandyci kontekstowi, ocena pozapolityczna.
- Auto-re-pociąg dryfem/kalendarzem, automatyzacja dokumentacji.
- Personalizacja katalogu gier (seq2rec), wielobiektywna optymalizacja (dochód/odpowiedzialność).
- Wieloregionalne surfing, SLA/kwoty, obciążenie zwrotne na funkcje/wniosek.
- Audyty uczciwości i testy warunków skrajnych, wiertarki DR i repozytoria uwalniania WORM.
15) RACI
R (odpowiedzialny): MLOps (platforma/obsługa), Data Science (modele/eksperymenty), Data Eng (cechy/rurociągi).
A (Odpowiedzialność): szef danych/CDO.
C (skonsultowano się): Zgodność/DPO (PII/RG/AML/DSAR), Bezpieczeństwo (KMS/secrets), SRE (SLO/value), Finance (effect/ROI), Legal.
I (Poinformowany): Produkt/Marketing/Operacje/Wsparcie.
16) Lista kontrolna przedsprzedaży
- Cechy uzgodnione online/offline, testy tranzytowe przeszły.
- Karta modelowa (właściciel, dane, mierniki, ryzyko, uczciwość) jest wypełniona.
- Uwolnienie kanaryjskie/fichflag; SLA i powiadomienia o opóźnieniu/błędzie/dryfie.
- Egzekwowane polityki PII/DSAR/RTBF/Legal Hold; kłody są bezosobowe.
- Incydent/rollback runbook; Strategia awaryjna.
- Eksperymenty są formalizowane (hipotezy, wskaźniki, czas trwania, MDE).
- Koszty wnioskowania i funkcji są uwzględnione w budżecie; uwzględniono kwoty i limity.
17) Anty-wzory
Rozbieżność funkcja online/offline → niedostępność.
Synchroniczne zewnętrzne interfejsy API w „gorącej ścieżce” bez pamięci podręcznej i czasu.
Nieprzezroczyste wzory metryczne/brak kart modelowych.
Przekwalifikowanie/dryfowanie bez monitorowania i prześwietlania.
PII w analityce i szkoleniu bez CLS/RLS/minimalizacji.
„Jeden wielki model dla wszystkiego” bez rozkładu domeny.
18) Najważniejsze
ML in iGaming to nie zestaw modeli „magicznych”, ale dyscyplina: spójne dane i funkcje, powtarzalne szkolenia offline, niezawodne surfowanie online, rygorystyczne MLOp, przejrzyste wskaźniki i etyka/zgodność. Wykonując ten przewodnik, będziesz budować system, który konsekwentnie zwiększa dochody i zatrzymywanie, zmniejsza ryzyko i spełnia wymogi regulacyjne - na skalę, szybko i przewidywalnie.