Обучение с учителем и без

1) Зачем и когда

С учителем (Supervised): есть метка (лейбл) → прогнозируем вероятность/класс/значение. Используем, когда понятен «правильный ответ» и есть история: churn, депозит в 7 дней, риск RG/AML, вероятность отклика на оффер, прогноз LTV.
Без учителя (Unsupervised): меток нет → находим структуры/кластеры/аномалии/латентные факторы: сегментация игроков, колечки фрода, тематические профили игр, выявление провайдерских сбоев, сжатие признаков.

Правило выбора: если бизнес-решение зависит от конкретного вероятностного прогноза → supervised; если цель — открыть неизвестные паттерны/сигналы или снизить размерность данных → unsupervised. На практике комбинируются.

2) Типовые кейсы iGaming

Supervised

Churn/реактивация: бинарная классификация (уйдет/не уйдет), uplift-модели для воздействия.
Пропенсити к депозиту/покупке: вероятность события в горизонте T.
RG/AML: риск-скор, вероятность структурирования, подозрительная сессия.
Антиабьюз бонусов: вероятность мошеннического использования промо.
Рекомендации (ранжирование): вероятность клика/ставки на игру (listwise/pointwise).

Unsupervised

Сегментация игроков: k-means, GMM, HDBSCAN по RFM/поведению/жанрам.
Аномалии: Isolation Forest, LOF, AutoEncoder на платежах/игровых паттернах.
Графовый анализ: кластеризация в графе «игрок–девайс–карта–IP».
Понижение размерности: PCA/UMAP для визуализации и фич-инжиниринга.
Тематические модели: NMF/LDL для описаний игр/чатов поддержки.

3) Данные и фичи

Point-in-time соединения, чтобы исключить data leakage.
Окна признаков: 10 мин/1 ч/1 день/7 дней/30 дней (recency, frequency, monetary).
Контекст: рынок/юрисдикция/DST/праздники, провайдер/жанр, устройство/ASN.
Графовые признаки: количество уникальных карт/IP/девайсов, центральности.
Нормализация валют/часовых поясов, SCD II для users/games/providers.

4) Алгоритмы и метрики

С учителем

Алгоритмы: LogReg, XGBoost/LightGBM/CatBoost, TabNet; для ранжирования — LambdaMART/GBDT; временные ряды — Prophet/ETS/Gradient Boosted TS.
Метрики: ROC-AUC/PR-AUC, F1@операционный порог, KS (риск), NDCG/MAP@K (рекомендации), MAPE/WAPE (прогнозы), expected cost с весами FP/FN.

Без учителя

Кластеризация: k-means/GMM (число кластеров — elbow/silhouette), HDBSCAN (плотностной).
Аномалии: Isolation Forest/LOF/AutoEncoder; метрики — precision@k на разметке экспертов, AUCPR на синтетических аномалиях.
Размерность: PCA/UMAP для фич-конструирования и визуализаций.

5) Комбинированные подходы

Semi-Supervised: псевдолейблы для части неразмеченных данных (self-training), consistency regularization.
Self-Supervised: контрастивные/маскированные задачи (эмбеддинги сессий/игр) → используют downstream в supervised.
Active Learning: система предлагает кандидатов на разметку (максимум неопределенности/разнообразия) → экономит труд экспертов AML/RG.
Weak Supervision: эвристики/правила/дистантная разметка формируют «слабые» лейблы, потом калибруем.

6) Процесс: от офлайна к онлайновому сервингу

1. Офлайн: сбор/подготовка → split по времени/рынкам → обучение/валидация → backtest.
2. Семантика метрик: единые формулы (например, churn_30d) и фиксированные временные окна.
3. Feature Store: единые формулы фич online/offline; тесты соответствия.
4. Онлайн-сервинг: эндпоинты gRPC/REST, SLA по латентности, AB-роутинг/канареечные релизы.
5. Мониторинг: дрейф данных/предсказаний (PSI/KL), latency p95, ошибка бизнес-метрик, алерты.

7) Приватность и комплаенс

PII-минимизация: псевдонимизация, изоляция маппингов, CLS/RLS.
Residency: отдельные конвейеры/ключи шифрования по регионам (EEA/UK/BR).
DSAR/RTBF: удаляем/редактируем фичи и логи; храним правовые основания исключений.
Legal Hold: заморозка артефактов расследований/отчетности.
Fairness: аудит прокси-фич, отчеты влияния (SHAP), политика интервенций RG.

8) Экономика и производительность

Стоимость вычисления фич (cost/feature) и инференса (cost/request).
Материализация офлайн-агрегатов; онлайн — только критичные окна.
Кэш разрешений/результатов скоринга на короткие TTL, асинхронные lookups с таймаутами.
Квоты и бюджеты на реплеи/бэктесты; chargeback по командам/моделям.

9) Примеры (фрагменты)

9.1 Point-in-time выборка для churn_30d

sql
WITH base AS (
SELECT user_pseudo_id, DATE(event_time) AS asof
FROM silver. fact_events
GROUP BY user_pseudo_id, DATE(event_time)
),
feat AS (
SELECT b. user_pseudo_id, b. asof,
SUM(CASE WHEN e. type='deposit' AND e. event_time>=b. asof - INTERVAL '30' DAY
AND e. event_time<b. asof THEN amount_base ELSE 0 END) AS dep_30d,
COUNT(CASE WHEN e. type='bet' AND e. event_time>=b. asof - INTERVAL '7' DAY
AND e. event_time<b. asof THEN 1 END) AS bets_7d
FROM base b
JOIN silver. fact_events e USING (user_pseudo_id)
GROUP BY b. user_pseudo_id, b. asof
),
label AS (
SELECT f. user_pseudo_id, f. asof,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events x
WHERE x.user_pseudo_id=f. user_pseudo_id
AND x.event_time>f. asof AND x.event_time<=f. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS churn_30d
FROM feat f
)
SELECT FROM feat JOIN label USING (user_pseudo_id, asof);

9.2 Аномалии платежей (псевдокод, Isolation Forest)

python
X = build_features (payments_last_7d) # sum/frequency/novelty/BIN/ASN/time model = IsolationForest (contamination = 0. 01). fit(X_train)
scores = -model. decision_function(X_test)
alerts = where (scores> THRESHOLD) # AML case candidates

9.3 Сегментация k-means (RFM + жанры)

python
X = scale(np. c_[R, F, M, share_slots, share_live, share_sports])
km = KMeans(n_clusters=8, n_init=20, random_state=42). fit(X)
segments = km. labels_

9.4 Стоимостной порог для бинарной модели

python threshold = pick_by_expected_cost(scores, labels, cost_fp=5. 0, cost_fn=50. 0)

10) Оценка, валидация и эксперименты

Офлайн: temporal split (train/val/test по времени/рынкам), backtesting, bootstrap доверия.
Онлайн: A/B/n, sequential tests, CUPED/дифф-в-дифф.
Off-policy: IPS/DR для политик персонализации.
Калибровка: Platt/Isotonic для корректных вероятностей.
Контроль деградации: alerты по бизнес-метрикам и PR-AUC/KS.

11) RACI

R (Responsible): Data Science (модели/эксперименты), MLOps (платформа/сервинг), Data Eng (фичи/пайплайны).
A (Accountable): Head of Data/CDO.
C (Consulted): Compliance/DPO (PII/RG/AML), Security (KMS/секреты), SRE (SLO/стоимость), Finance (ROI).
I (Informed): Продукт/Маркетинг/Операции/Поддержка.

12) Дорожная карта внедрения

MVP (4–6 недель):

1. Каталог целей/лейблов и сигналов (churn_30d, propensity_7d, risk_rg).

2. Feature Store v1 (5–10 фич), базовые модели XGBoost, дашборды офлайн-метрик.

3. Сегментация k-means (8 кластеров) + описание сегментов; Isolation Forest для платежей.

4. Онлайновый сервинг с кэшем, p95 < 150 мс; A/B на 10–20% трафика.

Фаза 2 (6–12 недель):

Active/Semi-Supervised для дефицита лейблов (AML/RG), self-supervised эмбеддинги игр/сессий.
Канареечные релизы, дрейф-мониторинг, автоперетренировка.
Единый семантический слой метрик и согласование online/offline фич.

Фаза 3 (12–20 недель):

Графовые признаки и кольца фрода; uplift-модели бонусов.
Мульти-региональный сервинг, квоты/chargeback; WORM-архив релизов.
Fairness-аудит, стресс-тесты, runbooks инцидентов.

13) Чек-лист перед продом

Point-in-time выборки и тесты против leakage.
Калибровка вероятностей; выбор порога по expected cost.
Карточки моделей (owner, данные, метрики, риски, fairness).
Feature Store: тест соответствия online/offline.
Мониторинг дрейфа/латентности/ошибок, алерты и авто-роллбек.
Политики PII/DSAR/RTBF/Legal Hold; логирование обезличено.
План A/B и статистическая мощность посчитаны; runbook отката готов.

14) Анти-паттерны

Смешение новых событий в лейблы (leakage) и отсутствие point-in-time.
«Одна модель на все» вместо доменной декомпозиции.
Нека либрованные вероятности → неверные бизнес-пороги.
Полет «вслепую»: нет мониторинга дрейфа/качества в онлайне.
Переусложнение в онлайне (тяжелые external-join’ы без кэша и таймаутов).
Сегменты без бизнес-интерпретации и владельца.

15) Итог

Обучение с учителем дает измеримый прогноз и управление риском/доходом; без учителя — структуру и сигналы там, где меток нет. Их сочетание (semi/self-supervised, active learning) при дисциплине данных (point-in-time, Feature Store), комплаенсе и MLOps дает iGaming-платформе устойчивый прирост Net Revenue, снижение фрода и своевременные RG-интервенции — с воспроизводимостью, контролем стоимости и готовностью к аудиту.

Обучение с учителем и без

Unsupervised

Без учителя

Свяжитесь с нами

Быстрая связь

Видео скоро обновится

Мы сейчас очень загружены проектами