Омӯзиши мошин дар IGaming
1) Парвандаҳо ва арзиши корӣ
Маҳсулот/даромад: Пешгӯии LTV, ҷилавгирӣ (баромад), майл ба амонат/харид, супоришҳо/дархостҳои динамикӣ, оянда-беҳтарин амал/пешниҳод.
Маркетинг/CRM: намуди зоҳирӣ, сегментатсия, триггерҳои вақти воқеӣ, оптимизатсияи бонус (ABO - Оптимизатсияи бонуси ба сӯиистифода тобовар).
Хавф/Мувофиқат: зидди қаллобӣ/AML (суръат, сохтор, хусусиятҳои графикӣ), Бозии масъул (RG) - сатҳи хавф, триггерҳои мудохила.
Амалиёт/SRE: пешгӯии ҳодисаҳо, пешгӯии қобилият/ҳаракати нақлиёт, аномалияҳои провайдер.
Молия: Пешгӯии GGR/NGR, ҳассосияти Fx, муайянкунии манипулятсияи муштарак.
Роҳнамои таъсир: + 3-7% ба даромади холис аз ҳисоби фардикунонӣ, 20-40% ба қаллобӣ-зиён, 10-25% ба зарба, вокуниши SLA RG <5 s ҳангоми онлайн.
2) Муҳандисии хусусӣ
Манбаъҳо: бозӣ, пардохт/PSP, аутентификатсия, дастгоҳҳо/ASN/geo, RG/KYC/KYB, маркетинги UTM, гузоришҳои провайдерҳо, дастгирӣ/матнҳо.
Хусусиятҳои асосӣ:- Тирезаҳои рафторӣ: Меъёри N/амонатҳо ва миқдор барои 10 дақиқа/соат/рӯз, истироҳат/басомад/пул.
- Пайдарпаӣ: занҷирҳои бозиҳо, вақт бо фаъолияти охирин, хусусиятҳои сессия.
- Geo/дастгоҳ: кишвар/бозор, ASN, навъи дастгоҳ/браузер.
- Графика: пайвастҳои плеер-корт-дастгоҳ-IP, ҷузъҳо/марказҳо (ҳалқаҳои қаллобӣ).
- Контекстуалӣ: вақти рӯз/рӯзи ҳафта/таътилҳои бозор, ноустувории провайдер/жанр/бозӣ.
- RG/AML: маҳдудиятҳо, канорагирӣ, парчамҳои скрининг, PEP/санксияҳо (тавассути кэш/асинхрон).
- Танзими асъор ва вақт (UTC + маҳалли бозор).
- Андозаҳои таърихӣ (SCD II).
- Дар бораи табдилдиҳии онлайн/офлайнӣ розӣ шавед (рамзи ягонаи Store Store).
3) Меъморӣ: офлайн ↔ онлайн
3. 1 Ҳалқаи офлайн
Lakehouse: биринҷӣ → нуқра (нормализатсия/ғанисозӣ) → Тилло (маҷмӯаҳо).
Дӯкони хусусият (офлайн): қайди формула, ҳамроҳшавӣ ба вақт, моделсозии маҷмӯаҳои таълимӣ.
Омӯзиш: зарфҳои вобастагии собит; таҷрибаҳои пайгирӣ (ченакҳо/артефактҳо/додаҳо).
Санҷиш: тақсимоти k-fold/муваққатӣ, backtest, арзёбии берун аз сиёсат.
3. 2 Пайвасти онлайн
Indest → Коркарди ҷараён: Flink/Spark/Чӯб бо тирезаҳо/нишонаҳои обӣ, номутаносибӣ.
Дӯкони хусусият (онлайн): кэши пасти патентӣ (Redis/Scylla) + кастҳои офлайнӣ.
Хизматрасонӣ: Нуқтаҳои ниҳоии REST/GRPC, графикаи баҳодиҳӣ, масири AB, релизҳои канарӣ.
Дӯконҳои вақти воқеӣ: барои панелҳо/қоидаҳо клик/Pinot.
4) Моделҳо ва равишҳои намунавӣ
Таснифот/баҳодиҳӣ: churn/deposit/қаллобӣ/RG (Log
Гурӯҳбандӣ/тавсияҳо: омилсозӣ/гурӯҳбандии рӯйхат (Lambda), seq2rec (RNN/Transformers), бандитҳои контекстӣ.
Аномалияҳо: Ҷангали изолятсия, SVM-синфи як, Авто Рамзгузор, Паёмбар/TS барои силсилаи вақт.
График: Node2Vec/GraphSAGE/GNN барои ҳалқаҳои қаллобӣ.
Сабабҳо: моделҳои баландошёна, T-learner/X-learner, Do
NLP/ASR: чиптаҳо/чатҳо, таснифи шикоятҳо, ҳиссиёт, мавзӯъҳо.
5) Нишондиҳандаҳои сифат
Таснифот: ROC-AUC/PR-AUC, F1 дар ҳадди амалиётӣ, арзиши пешбинишуда (вазни FP/FN), KS барои баҳодиҳии хатар.
Тавсияҳо: NDCG @ K, MAP @ K, фарогирӣ/гуногунрангӣ, CTR/CVR онлайн.
TS/Дурнамо: MAPE/SMAPE, WAPE, P50/P90 хатогӣ, фарогирии PI.
RG/AML: дақиқ/ёдраскунӣ дар SLA, маънои вақт ба фосила.
Иқтисод: боло рафтани даромади холис, қаллобӣ сарфа карда шуд, маъракаҳои ROI, сӯиистифода аз бонус.
6) Арзёбӣ ва таҷрибаҳо
Офлайн: тақсимоти муваққатӣ, бозгашт аз ҳафта/бозор/иҷорагир.
Онлайн: A/B/n, CUPED/diff-in-diff, санҷишҳои пайдарпай.
Сиёсати берунӣ: IPS/DR барои сиёсати фардикунонӣ.
Стат. қудрат: ҳисоб кардани андозаи интихоб бо назардошти ихтилоф ва MDE.
python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)
7) Махфият, ахлоқ, риояи
Кам кардани PII: тахаллусҳо, ҷудокунии харитасозӣ, CLS/RLS.
Истиқомат: контурҳои алоҳидаи EEA/UK/BR; бе ҳамроҳшавии байниминтақавӣ бидуни асос.
DSAR/RTBF: несткунӣ/таҳрир дар хусусиятҳо ва гузоришҳо; Нигоҳдории ҳуқуқӣ барои парвандаҳо/ҳисоботдиҳӣ.
Адолат/ғараз: аудити хусусиятҳо, таъсири нобаробар, назорати тағирёбандаҳои прокси.
Шарҳ: SHAP/аҳамияти хусусият, кортҳои моделӣ (соҳиб, сана, маълумот, ченакҳо, хатарҳо).
Амният: KMS/CMK, асрори берун аз гузоришҳо, бойгонии WORM.
8) MLOps: давраи ҳаёт
1. Маълумот ва хусусиятҳо: схемаҳо/шартномаҳо, қоидаҳои DQ (мукаммалӣ/беҳамтоӣ/диапазон/муваққатӣ), насл.
2. Омӯзиш: контейнерҳо, автотунинг, таҷрибаҳои пайгирӣ.
3. Санҷиш: санҷишҳои мутобиқати ноҳиявӣ, ғараз/адолат, санҷишҳои иҷро.
4. Нашр (CI/CD/CT): роликҳои канарӣ/марҳилавӣ, парчамҳои хусусӣ, "оғози торик".
5. Хизматрасонӣ: autoscaling, caching, gRPC/REST, танаффус/бозгашт.
6. Мониторинг: дрифти маълумот/пешгӯӣ (PSI/KL), таъхири p95, сатҳи хатогӣ, фарогирӣ, "ченакҳои хомӯш".
7. Бозсозӣ: ҷадвал/триггерҳо оид ба дрифт/таназзули ченакҳо.
8. Ҳодисаҳо: дафтарчаи корӣ, бозгашти модел, пастравӣ (қоида/модели оддӣ).
9) Дӯкони хусусият (ядрои пайдарҳамӣ)
Офлайн: ҳисобкунии нуқта-вақт, зидди ихроҷ, хусусияти версияи формула.
Онлайн: таъхири кам (≤ 10-30 мс), TTL, мувофиқат бо офлайн.
Шартномаҳо: ном/тавсиф, соҳиб, SLA, формула, санҷишҳои онлайн/офлайнӣ.
yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5
10) Баҳодиҳӣ ва қоидаҳои онлайн
Қоидаҳои гибридии ML +: модел → суръат + тавзеҳот; қоидаҳо - посбон/ахлоқ/қонун.
Дӯзандагӣ: Намунаҳои CEP (сохтор/суръат/дастгоҳ) + холҳои ML.
SLA: p95 охири-охири 50-150 мм барои фардикунонӣ, ≤ 2-5s барои огоҳиҳои RG/AML.
python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))
11) Маълумоти омӯзишӣ: намунаҳо ва тамғакоғазҳо
Тирезаҳои ҳодиса: t0 - истинод, t0 + Δ - тамғакоғаз (амонат/сиёҳ/қаллобӣ).
Назорати ихроҷ: ҳамроҳшавӣ ба вақт, истисно кардани рӯйдодҳои оянда.
Мувозинат: вазнҳои табақабандӣ/синфӣ, талафоти фокусӣ барои синфҳои нодир.
Этика: сифатҳои ҳассос/шахсони боэътимодро истисно кунед, таъсири назорат.
12) Иқтисод ва маҳсулнокӣ
Хусусиятҳои хароҷот: арзиши ҳисобкунӣ/хусусият ва арзиш/дархост, пешгирӣ кардани ҳамроҳшавии онлайн.
Нақд: хусусиятҳои гарм дар RAM, хунук - танбал.
Материализатсия: ҷамъбасти офлайнӣ; танҳо онлайн интиқодӣ.
Квотаҳо: маҳдудиятҳои такрорӣ, пасзаминаи тирезаҳои вақт; бозпас гирифтани даста.
13) Намунаҳои Кодекси SQL/Псевдо
Намунаи вақт барои churn (30 рӯзи хомӯшӣ):sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;
Равзанаи амонатии онлайн (Flink SQL, 10 дақиқа):
sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);
14) Харитаи роҳсозӣ
MVP (4-6 ҳафта):1. Каталоги сигналҳо ва мағозаи хусусият v1 (хусусиятҳои 5-10 барои пардохт/бозӣ).
2. Модели асосии churn/амонатӣ (XGB boost) + A/B барои 10-20% трафик.
3. Серфинги онлайн бо кэш (p95 <150 ms) ва релизҳои канарӣ.
4. Мониторинги дрифт/сифат, корти моделӣ, дафтарчаи такрорӣ.
Марҳилаи 2 (6-12 ҳафта):- Баҳодиҳии RG/AML, хусусиятҳои графикӣ, триггерҳои вақти воқеӣ.
- Моделҳои болоӣ барои мукофотпулӣ, бандитҳои контекстӣ, арзёбии берун аз сиёсат.
- Аз нав ба таври худкор тавассути тақвим/тақвим, автоматизатсияи ҳуҷҷатгузорӣ.
- Фардикунонии феҳристи бозиҳо (seq2rec), оптимизатсияи бисёрҳадаф (даромад/масъулият).
- Серфинги бисёрсоҳавӣ, SLA/квотаҳо, пардохт барои хусусиятҳо/хулоса.
- Санҷишҳои одилона ва санҷишҳои стресс, машқҳои DR ва анборҳои WORM.
15) RACI
R (Масъул): MLOps (платформа/хидмат), Илми маълумот (моделҳо/таҷрибаҳо), Data Eng (хусусиятҳо/қубурҳо).
A (Ҳисоботдиҳанда): Роҳбари маълумот/CDO.
C (Машварат): Мутобиқат/DPO (PII/RG/AML/DSAR), Амният (KMS/асрҳо), SRE (SLO/value), Молия (эффект/ROI), Ҳуқуқӣ.
I (Маълумот): Маҳсулот/Маркетинг/Амалиёт/Дастгирӣ.
16) Рӯйхати санҷиши пеш аз фурӯш
- Хусусиятҳои мувофиқашудаи онлайн/офлайн, санҷишҳои транзитӣ гузаштанд.
- Корти намунавӣ (соҳиб, маълумот, ченакҳо, хатарҳо, адолат) пур карда мешавад.
- Нашри канарӣ/fichflag; SLA ва таъхири/хатогӣ/ҳушдорҳо.
- PII/DSAR/RTBF/Сиёсати нигоҳдории ҳуқуқӣ; гузоришҳо ғайришахсӣ мебошанд.
- Дафтарчаи садама/бозгашт; стратегияи бозгашт.
- Таҷрибаҳо ба расмият дароварда мешаванд (гипотезаҳо, ченакҳо, давомнокӣ, MDE).
- Арзиши хулоса ва хусусият ба буҷет дохил карда мешавад; квотаҳо ва маҳдудиятҳо дохил карда мешаванд.
17) Анти-намунаҳо
Номутобиқатии хусусияти онлайн/офлайнӣ → дастнорас будан.
API-ҳои берунаи синхронӣ дар "роҳи гарм" бидуни кэш ва танаффус.
Формулаҳои метрикии ношаффоф/кортҳои намунавӣ нестанд.
Бозомӯзӣ/кашолакунӣ бидуни мониторинг ва overtraining.
PII дар таҳлил ва омӯзиш бидуни CLS/RLS/ҳадди аққал.
"Як модели калон барои ҳама" бидуни таҷзияи домейн.
18) Сатри поён
ML дар IGaming маҷмӯи моделҳои "ҷодугарӣ" нест, балки интизом: маълумот ва хусусиятҳои пайваста, омӯзиши такрории офлайнӣ, серфинги боэътимоди онлайн, MLO-ҳои қатъӣ, ченакҳои шаффоф ва ахлоқ/мувофиқат. Бо риояи ин дастур шумо системае месозед, ки пайваста даромад ва нигоҳдориро афзоиш медиҳад, хавфро коҳиш медиҳад ва ба талаботи танзимкунанда - дар миқёс, зуд ва пешгӯишаванда мувофиқат мекунад.