Таълим бо ва бе муаллим
1) Чаро ва кай
Назорат карда мешавад: тамғакоғазе мавҷуд аст, ки мо эҳтимолият/синф/арзишро пешгӯӣ мекунем. Мо онро вақте истифода мебарем, ки "ҷавоби дуруст" равшан аст ва ҳикояе ҳаст: churn, амонат 7 рӯз, хатари RG/AML, эҳтимолияти посух ба пешниҳод, пешгӯии LTV.
Назорат карда намешавад: нишонаҳо вуҷуд надоранд → мо сохторҳо/кластерҳо/аномалияҳо/омилҳои ниҳонӣ: сегментатсияи бозингарон, ҳалқаҳои қаллобӣ, профилҳои мавзӯии бозиҳо, ошкор кардани камбудиҳои провайдер, фишурдани аломатҳо.
Қоидаи интихоб: агар қарори соҳибкорӣ аз пешгӯии мушаххаси эҳтимолӣ → назоратшаванда вобаста бошад; агар ҳадаф кушодани намунаҳо/сигналҳои номаълум ё кам кардани андозаи маълумот → беназорат бошад. Дар амал, онҳо якҷоя карда мешаванд.
2) Ҳолатҳои маъмулии IGaming
Назорат карда мешавад
Churn/reactivation: таснифи бинарӣ (рафтан/нарафтан), моделҳои боло барои таъсир.
Майл ба амонат/харид: эҳтимолияти ҳодиса дар уфуқи Т.
RG/AML: сатҳи хавф, эҳтимолияти сохтор, ҷаласаи шубҳанок.
Анти-сӯиистифодаи бонус: эҳтимолияти истифодаи қаллобии промо.
Тавсияҳо (рейтинг): эҳтимолияти клик/гарав дар бозӣ (listwise/pointwise).
Беназорат
Тақсимоти бозингар: k-маънои, GMM, HDBSCAN аз ҷониби RFM/рафтор/жанр.
Аномалияҳо: Ҷангали изолятсия, LOF, Autoder Encoder оид ба пардохтҳо/шакли бозӣ.
Таҳлили графикӣ: кластерӣ дар сутуни "плеер-дастгоҳ-корт-IP".
Downsize: PCA/UMAP барои визуалӣ ва муҳандисии хусусӣ.
Моделҳои мавзӯӣ: NMF/LDL барои тавсифи бозӣ/чатҳои дастгирӣ.
3) Маълумот ва хусусиятҳо
Пайвастшавӣ дар вақти вақт барои истисно кардани ихроҷи маълумот.
Тирезаҳои хос: 10 дақиқа/1 соат/1 рӯз/7 рӯз/30 рӯз (истироҳат, басомад, пул).
Контекст: бозор/қаламрав/DST/идҳо, провайдер/жанр, дастгоҳ/ASN.
Хусусиятҳои графикӣ: шумораи кортҳои беназир/IP/дастгоҳҳо, марказӣ.
Нормализатсияи минтақаи асъор/вақт, SCD II барои корбарон/бозиҳо/провайдерҳо.
4) Алгоритмҳо ва ченакҳо
Бо муаллим
Алгоритмҳо: Log барои раддабандӣ - Lambda-MART/GBDT; силсилаи вақт - Паёмбар/ETS/Градиенти афзоишёфта TS.
Нишондиҳандаҳо: ROC-AUC/PR-AUC, ҳадди амалиётӣ F1 @, KS (хатар), NDCG/MAP @ K (тавсияҳо), MAPE/WAPE (пешгӯиҳо), арзиши пешбинишуда бо вазни FP/FN.
Бе муаллим
Кластерӣ: k-means/GMM (шумораи кластерҳо - оринҷ/силуэт), HDBSCAN (зичӣ).
Аномалияҳо: Ҷангали изолятсия/LOF/Auto-Encoder; ченакҳо - дақиқ @ k оид ба нишонаи коршиносон, AUCPR оид ба аномалияҳои синтетикӣ.
Андоза: PCA/UMAP барои тарроҳӣ ва визуализатсия.
5) Равишҳои омехта
Назорати нимсола: футури псевдо барои қисми маълумоти тақсимнашуда (худтанзимкунӣ), танзими пайдарҳамӣ.
Худидоракунии назоратшаванда: вазифаҳои муқобил/ниқоб (дарунсохти сессия/бозӣ) → истифодаи поёноб дар зери назорат.
Омӯзиши фаъол: система номзадҳои аломатгузорро пешниҳод мекунад (номуайянии ҳадди аксар/гуногунрангӣ) → кори коршиносони AML/RG-ро сарфа мекунад.
Назорати заиф: эвристика/қоидаҳо/нишонаи дурдасти тамғакоғазҳо "заиф", пас калибрченкунӣ.
6) Раванд: аз офлайн то серфинги онлайн
1. Офлайн: ҷамъоварӣ/тайёр кардан → тақсим аз рӯи вақт/бозорҳо → омӯзиш/санҷиш → бозгашт.
2. Семантикаи ченакҳо: формулаҳои ягона (масалан, churn_30d) ва тирезаҳои вақти собит.
3. Дӯкони хусусият: формулаҳои хусусияти ягона онлайн/офлайн; санҷишҳои мутобиқат.
4. Серфинги онлайнӣ: Нуқтаҳои охири GRPC/REST, SLA аз рӯи таъхир, хатсайрҳои AB/канарӣ.
5. Мониторинг: дрифти маълумот/пешгӯӣ (PSI/KL), таъхири p95, хатогии ченкунии тиҷорат, огоҳиҳо.
7) Махфият ва риояи он
Кам кардани PII: псевдонимизатсия, ҷудокунии харитасозӣ, CLS/RLS.
Истиқомат: қубурҳои инфиродӣ/калидҳои рамзгузорӣ аз рӯи минтақа (EEA/UK/BR).
DSAR/RTBF: нест кардан/таҳрир кардани хусусиятҳо ва гузоришҳо; асосҳои қонуниро барои истисноҳо нигоҳ доред.
Нигоҳдории ҳуқуқӣ: Артефактҳои тафтишотӣ/гузоришдиҳӣ.
Адолат: Хусусияти прокси аудит, Ҳисобот оид ба таъсир (SHAP), Сиёсати дахолати RG.
8) Иқтисод ва маҳсулнокӣ
Арзиши ҳисоб кардани хусусият (арзиш/хусусият) ва хулоса (арзиш/дархост).
Материализатсияи агрегатҳои офлайнӣ; онлайн - танҳо тирезаҳои интиқодӣ.
Кэши иҷозатҳо/натиҷаҳои баҳодиҳӣ барои TTL кӯтоҳ, ҷустуҷӯи асинхронӣ бо танаффус.
Квотаҳо ва буҷетҳо барои такрорӣ/пасзаминаҳо; пуркунии барқ аз ҷониби фармон/модел.
9) Намунаҳо (пораҳо)
9. 1 Интихоби вақт барои churn_30d
sql
WITH base AS (
SELECT user_pseudo_id, DATE(event_time) AS asof
FROM silver. fact_events
GROUP BY user_pseudo_id, DATE(event_time)
),
feat AS (
SELECT b. user_pseudo_id, b. asof,
SUM(CASE WHEN e. type='deposit' AND e. event_time>=b. asof - INTERVAL '30' DAY
AND e. event_time<b. asof THEN amount_base ELSE 0 END) AS dep_30d,
COUNT(CASE WHEN e. type='bet' AND e. event_time>=b. asof - INTERVAL '7' DAY
AND e. event_time<b. asof THEN 1 END) AS bets_7d
FROM base b
JOIN silver. fact_events e USING (user_pseudo_id)
GROUP BY b. user_pseudo_id, b. asof
),
label AS (
SELECT f. user_pseudo_id, f. asof,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events x
WHERE x.user_pseudo_id=f. user_pseudo_id
AND x.event_time>f. asof AND x.event_time<=f. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS churn_30d
FROM feat f
)
SELECT FROM feat JOIN label USING (user_pseudo_id, asof);
9. 2 Аномалияҳои пардохт (псевдокод, ҷангали изолятсия)
python
X = build_features (payments_last_7d) # sum/frequency/novelty/BIN/ASN/time model = IsolationForest (contamination = 0. 01). fit(X_train)
scores = -model. decision_function(X_test)
alerts = where (scores> THRESHOLD) # AML case candidates
9. 3 Сегментатсияи k-маънои (RFM + жанрҳо)
python
X = scale(np. c_[R, F, M, share_slots, share_live, share_sports])
km = KMeans(n_clusters=8, n_init=20, random_state=42). fit(X)
segments = km. labels_
9. 4 Ҳадди хароҷот барои модели бинарӣ
python threshold = pick_by_expected_cost(scores, labels, cost_fp=5. 0, cost_fn=50. 0)
10) Арзёбӣ, санҷиш ва таҷрибаҳо
Офлайн: тақсимоти муваққатӣ (қатора/вал/санҷиш аз рӯи вақт/бозор), ақибнишинӣ, боварии пурбор.
Онлайн: A/B/n, санҷишҳои пайдарпай, CUPED/diff-in-diff.
Сиёсати берунӣ: IPS/DR барои сиёсати фардикунонӣ.
Калибрченкунӣ: Платт/Изотоникӣ барои эҳтимолияти дуруст.
Назорати таназзул: огоҳиҳо аз рӯи нишондиҳандаҳои тиҷорат ва PR-AUC/KS.
11) RACI
R (Масъул): Илми маълумот (моделҳо/таҷрибаҳо), MLOps (платформа/хидмат), Data Eng (хусусиятҳо/қубурҳо).
A (Ҳисоботдиҳанда): Роҳбари маълумот/CDO.
C (Машварат): Мувофиқат/DPO (PII/RG/AML), Амният (KMS/асрҳо), SRE (SLO/value), Молия (ROI).
I (Маълумот): Маҳсулот/Маркетинг/Амалиёт/Дастгирӣ.
12) Харитаи роҳ
MVP (4-6 ҳафта):1. Феҳристи нишонаҳо/нишонаҳо ва сигналҳо (churn_30d, propensity_7d, risk_rg).
2. Хусусияти Store v1 (хусусиятҳои 5-10), моделҳои асосии XGB, панелҳои ченакҳои офлайнӣ.
3. Ҷудосозии k-маънои (8 кластер) + тавсифи сегментҳо; Ҷангали изолятсия барои пардохтҳо.
4. Серфинги онлайн бо кэш, p95 <150 ms; A/B барои 10-20% трафик.
Марҳилаи 2 (6-12 ҳафта):- Active/Semi-назоратшаванда барои камбуди тамғакоғазҳо (AML/RG), ҷобаҷогузории худидоракунии бозӣ/сессия.
- Варақаҳои канарӣ, мониторинги дрифт, бозомӯзии худкор.
- Як қабати ягонаи семантикии ченакҳо ва хусусияти мутобиқати онлайн/офлайн.
- Аломатҳои графикӣ ва ҳалқаҳои қаллобӣ; моделҳои бонуси боло.
- Хизматрасонии бисёрҷониба, квотаҳо/пардохтҳо; Бойгонии WORM релизҳо.
- Аудити одилона, санҷишҳои стресс, ҳодисаҳои китобчаҳо.
13) Рӯйхати санҷиши пеш аз фурӯш
- Санҷишҳои интихобӣ ва зидди ихроҷи вақт.
- Калибрченкунии эҳтимолият; Ҳадди арзиши пешбинишударо интихоб кунед.
- Кортҳои намунавӣ (соҳиб, маълумот, ченакҳо, хатарҳо, адолат).
- Дӯкони хусусият онлайн/санҷиши мутобиқати офлайнӣ.
- Мониторинги drift/latency/хатогӣ, огоҳиҳо ва худкори бозгашт.
- PII/DSAR/RTBF/Сиёсати нигоҳдории ҳуқуқӣ; воридшавӣ ғайришахсӣ аст.
- Нақшаи A/B ва қувваи оморӣ ҳисоб карда мешавад; Runbook runback омода аст.
14) Анти-намунаҳо
Омезиши рӯйдодҳои нав ба тамғакоғазҳо (ихроҷ) ва набудани нуқтаи вақт.
"Як модел барои ҳама" ба ҷои таҷзияи домейн.
Баъзе эҳтимолияти librated → ҳадди нодурусти тиҷорат.
Парвози нобино: мониторинги онлайн/сифат нест.
Overcomplication онлайн (пайвастҳои вазнини беруна бидуни кэш ва танаффус).
Сегментҳо бидуни тафсири тиҷорат ва соҳиби.
15) Сатри поён
Омӯзиши назоратшаванда пешгӯиҳои андозагиришаванда ва идоракунии хавфҳо/даромадҳоро таъмин мекунад; бе муаллим - сохтор ва сигналҳое, ки дар он нишонаҳо мавҷуд нестанд. Омезиши онҳо (омӯзиши нимтайёр/худидоракунанда, фаъолона) дар интизоми маълумот (нуқтаи вақт, Дӯкони хусусият), мутобиқат ва MLO-ҳо ба платформаи IGaming афзоиши устувори даромади холис, кам шудани қаллобӣ ва мудохилаҳои саривақтии RG - бо такрористеҳсолкунӣ, назорати хароҷот ва омодагӣ ба аудит.