Nauczanie z nauczycielem i bez niego
1) Dlaczego i kiedy
Nadzorowany: istnieje etykieta → przewidujemy prawdopodobieństwo/klasę/wartość. Używamy go, gdy „poprawna odpowiedź” jest jasna i istnieje historia: churn, depozyt 7 dni, ryzyko RG/AML, prawdopodobieństwo odpowiedzi na ofertę, prognoza LTV.
Bez nadzoru: nie ma znaków → znajdujemy struktury/klastry/anomalie/utajone czynniki: segmentacja graczy, pierścienie oszustw, profile tematyczne gier, wykrywanie awarii dostawców, kompresja znaków.
Zasada wyboru: jeśli decyzja biznesowa zależy od konkretnej prognozy probabilistycznej → nadzorowane; jeśli celem jest otwarcie nieznanych wzorów/sygnałów lub zmniejszenie wymiaru danych → bez nadzoru. W praktyce są one połączone.
2) Typowe przypadki iGaming
Nadzorowane
Churn/reaktywacja: klasyfikacja binarna (go/not go), modele podwyższenia do uderzenia.
Skłonność do złożenia/zakupu: prawdopodobieństwo zdarzenia w horyzoncie T.
RG/AML: wskaźnik ryzyka, prawdopodobieństwo strukturyzacji, sesja podejrzana.
Premia przeciwko nadużyciom: prawdopodobieństwo oszukańczego użycia promo.
Zalecenia (ranking): prawdopodobieństwo kliknięcia/zakładu na grze (listwise/pointwise).
Bez nadzoru
Segmentacja gracza: k-means, GMM, HDBSCAN według RFM/behavior/genre.
Anomalie: Las izolacji, LOF, AutoEncoder na płatności/wzory gier.
Analiza wykresu: klastrowanie w kolumnie „player-device-card-IP”.
Downsize: PCA/UMAP do wizualizacji i inżynierii funkcji.
Modele tematyczne: NMF/LDL do opisów gier/czatów wsparcia.
3) Dane i cechy
Połączenia punktowe w czasie, aby wykluczyć wyciek danych.
Charakterystyczne okna: 10 min/1 h/1 dzień/7 dni/30 dni (odpoczynek, częstotliwość, waluta).
Kontekst: rynek/jurysdykcja/DST/wakacje, dostawca/gatunek, urządzenie/ASN.
Funkcje wykresu: liczba unikalnych kart/IP/urządzeń, centralność.
Normalizacja waluty/strefy czasowej, SCD II dla użytkowników/gier/dostawców.
4) Algorytmy i mierniki
Z nauczycielem
Algorytmy: LogReg, XGBoost/اGBM/CatBoost, TabNet; dla rankingu - LambdaMART/GBDT; seria czasu - Prorok/ETS/Gradient wzmocniony TS.
Wskaźniki: ROC-AUC/PR-AUC, F1 @ operacyjny próg, KS (ryzyko), NDCG/MAP @ K (zalecenia), MAPE/WAPE (prognozy), przewidywany koszt z wagami FP/FN.
Bez nauczyciela
Klaster: k-means/GMM (liczba klastrów - łokieć/sylwetka), HDBSCAN (gęstość).
Anomalie: Las Izolacyjny/LOF/AutoEncoder; metryki - precision @ k on expert markup, AUCPR on synthetic anomalies.
Wymiar: PCA/UMAP do projektowania funkcji i wizualizacji.
5) Podejście połączone
Pół-nadzorowane: pseudo-pęcherzyki dla części nieprzydzielonych danych (samokształcenie), regulacja spójności.
Self-Supervised: contrasting/masked tasks (session/game embeddings) → use downstream in supervised.
Active Learning: system oferuje kandydatów do znakowania (maksymalna niepewność/różnorodność) → oszczędza pracę ekspertów AML/RG.
Słaby nadzór: heurystyka/zasady/odległe oznakowanie forma „słabe” etykiety, a następnie kalibrować.
6) Proces: od offline do surfingu online
1. Offline: zbieranie/przygotowywanie → podział według czasu/rynków → szkolenie/walidacja → backtest.
2. Semantyka metryczna: jednolite wzory (na przykład churn_30d) i stałe okna czasowe.
3. Sklep funkcyjny: jednolite formuły funkcji online/offline; badania zgodności.
4. Surfing online: punkty końcowe gRPC/REST, SLA według opóźnień, AB routing/kanaryjskie wydania.
5. Monitorowanie: dryf danych/prognozowania (PSI/KL), opóźnienie p95, błąd mierników biznesowych, wpisy.
7) Prywatność i zgodność
Minimalizacja PII: pseudonimizacja, izolacja mapowania, CLS/RLS.
Pobyt: poszczególne rurociągi/klucze szyfrujące według regionów (EOG/UK/BR).
DSAR/RTBF: usuń/edytuj funkcje i dzienniki; zachować podstawy prawne dla wyjątków.
Przechowywanie prawne: zamrażanie detektywistyczne/artefakty sprawozdawcze.
Sprawiedliwość: Funkcja Proxy Audytu, Raporty Skutków (SHAP), Polityka interwencji RG.
8) Ekonomia i wydajność
Koszt obliczenia funkcji (koszt/funkcja) i wnioskowanie (koszt/żądanie).
Materializacja kruszyw offline; online - tylko krytyczne okna.
Pamięć podręczna uprawnień/wyniki punktacji dla krótkiego TTL, asynchroniczne wyszukiwania z timeouts.
Kwoty i budżety na powtórki/backtests; obciążenie zwrotne według polecenia/modelu.
9) Przykłady (fragmenty)
9. 1 Wybór punktowy w czasie dla churn_30d
sql
WITH base AS (
SELECT user_pseudo_id, DATE(event_time) AS asof
FROM silver. fact_events
GROUP BY user_pseudo_id, DATE(event_time)
),
feat AS (
SELECT b. user_pseudo_id, b. asof,
SUM(CASE WHEN e. type='deposit' AND e. event_time>=b. asof - INTERVAL '30' DAY
AND e. event_time<b. asof THEN amount_base ELSE 0 END) AS dep_30d,
COUNT(CASE WHEN e. type='bet' AND e. event_time>=b. asof - INTERVAL '7' DAY
AND e. event_time<b. asof THEN 1 END) AS bets_7d
FROM base b
JOIN silver. fact_events e USING (user_pseudo_id)
GROUP BY b. user_pseudo_id, b. asof
),
label AS (
SELECT f. user_pseudo_id, f. asof,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events x
WHERE x.user_pseudo_id=f. user_pseudo_id
AND x.event_time>f. asof AND x.event_time<=f. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS churn_30d
FROM feat f
)
SELECT FROM feat JOIN label USING (user_pseudo_id, asof);
9. 2 Anomalie płatnicze (pseudokoda, las izolacyjny)
python
X = build_features (payments_last_7d) # sum/frequency/novelty/BIN/ASN/time model = IsolationForest (contamination = 0. 01). fit(X_train)
scores = -model. decision_function(X_test)
alerts = where (scores> THRESHOLD) # AML case candidates
9. 3 Segmentacja środków k (gatunki RFM +)
python
X = scale(np. c_[R, F, M, share_slots, share_live, share_sports])
km = KMeans(n_clusters=8, n_init=20, random_state=42). fit(X)
segments = km. labels_
9. 4 Próg kosztów dla modelu binarnego
python threshold = pick_by_expected_cost(scores, labels, cost_fp=5. 0, cost_fn=50. 0)
10) Ocena, walidacja i eksperymenty
Offline: podział czasowy (pociąg/val/test według czasu/rynku), backtesting, bootstrap trust.
Online: A/B/n, sekwencyjne testy, CUPED/diff-in-diff.
Poza polityką: IPS/DR dla polityki personalizacji.
Kalibracja: Platt/Isotonic dla prawidłowych prawdopodobieństw.
Kontrola degradacji: wpisy według wskaźników biznesowych i PR-AUC/KS.
11) RACI
R (odpowiedzialny): Data Science (modele/eksperymenty), MLOp (platforma/obsługa), Data Eng (cechy/rurociągi).
A (Odpowiedzialność): szef danych/CDO.
C (Konsultowane): Zgodność/DPO (PII/RG/AML), Bezpieczeństwo (KMS/secrets), SRE (SLO/value), Finance (ROI).
I (Poinformowany): Produkt/Marketing/Operacje/Wsparcie.
12) Plan działania w zakresie wdrażania
MVP (4-6 tygodni):1. Katalog celów/etykiet i sygnałów (churn_30d, propensity_7d, risk_rg).
2. Funkcja Sklep v1 (5-10 funkcji), podstawowe modele XGBoost, deski rozdzielcze mierników offline.
3. segmentacja k-means (8 klastrów) + opis segmentów; Las Izolacji dla płatności.
4. Surfowanie online z pamięci podręcznej, p95 <150 ms; A/B dla 10-20% ruchu.
Faza 2 (6-12 tygodni):- Aktywny/półinstrumentowany niedobór etykiet (AML/RG), samodzielnie nadzorowane osadzanie gier/sesji.
- Uwolnienia kanaryjskie, monitoring dryfu, automatyczne przekwalifikowanie.
- Pojedyncza warstwa semantyczna metryk i funkcja dopasowania online/offline.
- znaki wykresów i pierścienie nadużyć finansowych; modele bonusowe uplift.
- wieloregionalna służba, kwoty/obciążenie zwrotne; Archiwum wydań WORM.
- Kontrola uczciwości, testy warunków skrajnych, wypadki w książkach startowych.
13) Lista kontrolna przedsprzedaży
- Pobieranie próbek w czasie i testy zapobiegające wyciekom.
- Kalibracja prawdopodobieństwa; Wybierz oczekiwany próg kosztów.
- Karty modelowe (właściciel, dane, mierniki, zagrożenia, uczciwość).
- Funkcja Sklep Online/Test zgodności offline.
- Monitorowanie dryfu/opóźnienia/błędów, wpisy i auto-rollback.
- Polityka PII/DSAR/RTBF/Legal Hold; pozyskiwanie drewna jest bezosobowe.
- Obliczony plan A/B i moc statystyczna; Książka startowa jest gotowa.
14) Anty-wzory
Mieszanie nowych zdarzeń w etykietach (wyciek) i brak punktu w czasie.
„Jeden model dla wszystkich” zamiast rozkładu domeny.
Niektóre biblioteczne prawdopodobieństwa → nieprawidłowe progi biznesowe.
Ślepy lot: brak monitoringu dryfu/jakości online.
Overcomplication online (ciężkie połączenia zewnętrzne bez pamięci podręcznej i czasu).
Segmenty bez interpretacji biznesowej i właściciela.
15) Najważniejsze
nadzorowane uczenie się zapewnia wymierne prognozy i zarządzanie ryzykiem/dochodami; bez nauczyciela - struktura i sygnały, gdzie nie ma śladów. Ich połączenie (pół/samodzielne, aktywne uczenie się) w dyscyplinie danych (punkt w czasie, sklep funkcyjny), zgodność i MLOp daje platformie iGaming stały wzrost przychodów netto, spadek oszustw i terminowe interwencje RG - z powtarzalności, kontroli kosztów i gotowości do audytu.