GH GambleHub

iGaming машина үйрөнүү

1) Бизнес-учурлар жана баалуулук

Продукт/киреше: LTV божомолу, churn (агылып), депозиттик/сатып алуу үчүн пропенсити, динамикалык миссиялар/тапшырмалар, next-best-action/offer.
Маркетинг/CRM: look-alike, сегментация, реалдуу убакыт триггерлер, бонустарды оптималдаштыруу (ABO - Abuse-resistant Bonus Optimization).
Тобокелдик/Комплаенс: антифрод/AML (velocity, структуралоо, графикалык белгилер), Responsible Gaming (RG) - тобокелдик-тез, кийлигишүү триггерлери.
Операциялар/SRE: инциденттерди алдын ала айтуу, capacity/traffic forecasting, провайдерлердин аномалиялары.
Каржы: GGR/NGR прогноз, Fx-сезгичтик, контрагенттердин манипуляцияларын детекциялоо.

Эффекттин көрсөткүчтөрү: + 3-7% к Net Revenue персоналдаштыруу аркылуу, − 20-40% к fraud-loss, − 10-25% к churn, SLA жооп RG <5 с онлайн.

2) Маалыматтар жана белгилер (Feature Engineering)

Sources: gameplay, төлөмдөр/PSP, Authentication, түзмөктөр/ASN/гео, RG/KYC/KYB, маркетинг UTM, жөнөтүүчүлөр, саппорт/тексттер.

Негизги чыпкалар:
  • Жүрүм-турум терезелер: N коюмдар/депозиттер жана суммасы 10 мин/саат/күн, recency/frequency/monetary.
  • Ырааттуулугу: оюн чынжырлары, акыркы активдүүлүк менен убакыт, сессиялык белгилер.
  • Гео/түзмөк: өлкө/базар, ASN, түзмөк/браузер түрү.
  • Graphics: байланыш оюнчу-карта-түзмөк-IP, компоненттери/борборлоштурулган (fraud rings).
  • Контексттик: күнү-түнү/жума күнү/базар майрамдары, провайдер/жанр/оюндун туруксуздугу.
  • RG/AML: лимиттер, өзүн-өзү четтетүү, скрининг желектери, РЕР/санкциялар (кэш/асинхрон аркылуу).
Сунуштар:
  • Валюталарды жана убакытты нормалдаштырыңыз (UTC + жергиликтүү рынок).
  • Тарыхта өлчөө (SCD II).
  • Онлайн/оффлайн трансформациясын макулдашуу (Feature Store дүкөнүндөгү бирдиктүү код).

3) Архитектура: онлайн онлайн

3. 1 оффлайн контур

Lakehouse: Bronze → Silver (нормалдаштыруу/байытуу) → Gold (datasets).
Feature Store (оффлайн): формула реестри fich, point-in-time join, окутуу тандоолорун материалдаштыруу.
Окутуу: туруктуу көз карандылык менен контейнерлер; трекинг эксперименттер (метрика/экспонаттар/маалыматтар).
Валидация: k-fold/temporal split, backtest, off-policy баалоо.

3. 2 онлайн контур

Ingest → Stream Processing: Flink/Spark/Beam менен терезелер/watermarks, демпотенттик.
Feature Store (онлайн): Төмөн категориялуу кэш (Redis/Scylla) + оффлайн жазуулар.
Serving: REST/gRPC End Points, Count эсеби, AB-роутинг, канар релиздери.
Real-Time Display: ClickHouse/Pinot үчүн панелдер/эрежелер.

4) типтүү моделдер жана ыкмалар

Классификация/эсеби: churn/депозит/frod/RG (LogReg, XGBoost/LightGBM, TabNet, CatBoost).
Ранжирлөө/сунуштар: факторизация/тизме-рангирлөө (LambdaMART), seq2rec (RNN/Transformers), контексттик бандиттер.
Аномалиялар: Isolation Forest, One-Class SVM, AutoEncoder, убактылуу катарлар үчүн Prophet/TSfresh.
Graphics: Node2Vec/GraphSAGE/GNN шакек алдамчылык үчүн.
Себеп (causal): uplift-моделдер, T-learner/X-learner, DoWhy/CausalML.
NLP/ASR: билеттер/чаттар, даттануулардын классификациясы, sentiment, темалар.

5) Сапат Metrics

Классификация: ROC-AUC/PR-AUC, иш босогосунда F1, expected cost (салмактуу FP/FN), тобокелдик-эсеби үчүн KS.
Сунуштар: NDCG @K, MAP @K, coverage/diversity, CTR/CVR онлайн.
TS/Forecast: MAPE/SMAPE, WAPE, P50/P90 ката, PI каптоо.
RG/AML: SLA боюнча precision/кайра чакыртып алуу, орточо убакыт-to-intervene.
Экономика: Net Revenue uplift, fraud saved, ROI кампаниялар,% бонустук кыянаттык.

6) Баалоо жана эксперименттер

Оффлайн: temporal split, жумалар/базарлар/тенанттар боюнча backtest.
Онлайн: A/B/n, CUPED/diff-in-diff, sequential tests.
Off-саясат: IPS/DR жекелештирүү саясаты үчүн.
Стат. кубаттуулугу: дисперсия жана MDE эске алуу менен үлгү өлчөмүн эсептөө.

Наркы боюнча босогону эсептөөнүн мисалы (псевдокод):
python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)

7) Купуялык, этика, комплаенс

PII-минималдаштыруу: псевдонимдер, жылуулоо, CLS/RLS.
Резиденттүүлүк: EEA/UK/BR өзүнчө контурлары; негизсиз кросс-аймактык join 'os жок.
DSAR/RTBF: өчүрүү/Phiches жана Logs түзөтүү; Юридикалык Hold учурларда/отчеттуулук үчүн.
Fairness/калыс: аудит fich, disparate impact, прокси-өзгөрмөлөрдү көзөмөлдөө.
Explainability: SHAP/feature importance, модель карталары (owner, дата, маалыматтар, метрика, тобокелдиктер).
Коопсуздук: KMS/CMK, каттоо сырлары, WORM-релиздер Archives.

8) MLOps: жашоо айлампасы

1. Data & Features: схемалар/контракттар, DQ эрежелери (completeness/uniqueness/range/temporal), сызык.
2. Окутуу: контейнерлер, Autotyuning, трекинг эксперименттер.
3. валидация: схема шайкештик тесттер, bias/fairness, аткаруу тесттер.
4. Release (CI/CD/CT): канарейка/этап-этабы, Чич-желектер, "караңгы баштоо".
5. Сервинг: автоскейлинг, кэширование, gRPC/REST, timeouts/retry.
6. Мониторинг: маалыматтар/божомолдор (PSI/KL), latency p95, error-rate, coverage, "silent metrics".
7. Re-train: график/триггерлер боюнча дрейф/деградация метриктер.
8. Окуялар: runbook, кайтуу модели, fallback (эреже/жөнөкөй модели).

9) Feature Store (ырааттуулук өзөгү)

Оффлайн: point-in-time эсептөө, anti-leakage, fich формуласынын версиясы.
Онлайн: төмөн латенттүүлүк (≤ 10-30 ms), TTL, оффлайн менен шайкештик.
Келишимдер: аты-жөнү/сүрөттөлүшү, ээси, SLA, формула, онлайн/оффлайн ылайык тесттер.

Fich Specification мисал (YAML):
yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5

10) Онлайн эсеби жана эрежелери

Гибрид ML + Руль: модель → тез + түшүндүрмө; эрежелер - hard-guard/этика/мыйзам.
Тигүү: CEP үлгүлөрү (structuring/velocity/device switch) + ML-эсеби.
SLA: p95 end-tu-end 50-150 ms жекелештирүү үчүн, ≤ 2-5 RG/AML alerts үчүн.

Psevdocode багыттоо:
python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))

11) окутуу үчүн маалыматтар: үлгүлөрү жана этикеткалар

Окуя терезелери: t0 - шилтеме, t0 + Δ - лейбл (депозит/кара/фрод).
Leakage-control: point-in-time join, келечектеги окуяларды алып салуу.
Баланстоо: стратификация/класстардын салмагы, сейрек кездешүүчү класстар үчүн focal loss.
Этика: сезгич атрибуттарды/прокси жокко чыгаруу, таасирин көзөмөлдөө.

12) Экономика жана аткаруу

Fich наркы: cost/feature жана cost/request карап, оор онлайн-join 's качуу.
Кэш: RAM ысык чач, муздак - lazy.
Материалдаштыруу: оффлайн агрегациясы; онлайн гана сын.
Квоталар: репликаларга, убакыттын терезелери боюнча бектесттерге лимиттер; командалар боюнча chargeback.

13) SQL/psevdocode мисалдар

churn (30 күндүк жымжырттык) үчүн пункту-жылы-убакыт үлгү:
sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;
Онлайн депозиттер терезе (Flink SQL, 10 мин):
sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);

14) Ишке ашыруунун жол картасы

MVP (4-6 жума):

1. Сигнал каталогу жана Feature Store v1 (Payments/Gameplay үчүн 5-10 сүрөт).

2. Churn/депозиттин базалык модели (XGBoost) + A/B 10-20% трафикке.

3. Кэш (p95 <150 ms) жана канарейка релиздери менен онлайн тейлөө.

4. Drift/сапатын мониторинг, карта модели, runbook кайра.

2-этап (6-12 жума):
  • RG/AML эсептери, графикалык белгилер, реалдуу убакыт триггерлери.
  • бонустар үчүн Uplift моделдер, контексттик бандиттер, off-саясат баа берүү.
  • Авто-ре-трейн дрейф/календар боюнча, документтерди автоматташтыруу.
Этап 3 (12-20 жума):
  • Оюн каталогун персоналдаштыруу (seq2rec), көп объективдүү оптималдаштыруу (киреше/жоопкерчилик).
  • Multi-аймактык тейлөө, SLAs/квота, fich/inferance боюнча chargeback.
  • Fairness-аудит жана стресс-тесттер, DR-машыгуулар жана WORM-релиздер сактоо.

15) RACI

R (Responsible): MLOps (платформа/сервинг), Data Science (моделдер/эксперименттер), Data Eng (фич/пайплайндар).
A (Accountable): Head of Data / CDO.
C (Consulted): Compliance/DPO (PII/RG/AML/DSAR), Security (KMS/Secrets), SRE (SLO/наркы), Finance (Effect/ROI), Legal.
I (Informed): Продукт/Маркетинг/Операциялар/Колдоо.

16) Азык-түлүктүн алдындагы чек-тизме

  • Чичтер онлайн/оффлайн макулдашылган, репродуктивдүү тесттер өттү.
  • Карта модели (owner, маалыматтар, метрика, тобокелдиктер, fairness) толтурулган.
  • Канар релиз/fichflag; SLA жана alerty latency/каталар/drift.
  • PII/DSAR/RTBF/Legal Hold саясаты сакталат; Логи аноним.
  • Runbook окуялар/кайра; fallback стратегиясы.
  • Эксперименттер түзүлгөн (гипотезалар, метрика, узактыгы, MDE).
  • Infenerce жана fich наркы бюджетке жазылган; квоталар жана лимиттер киргизилген.

17) Анти-үлгүлөрү

айырмачылыктар онлайн/оффлайн → бузукулук.
кэш жана убакыт жок "ысык жолдо" синхрондуу тышкы API.
Метриканын тунук эмес формулалары/үлгү карталарынын жоктугу.
Мониторинг жана кайра машыгуусуз кайра даярдоо/дрейф.
PII CLS/RLS/минималдаштыруу жок аналитика жана окутуу.
Домендик декомпозициясыз "баары үчүн бир чоң модель".

18) Жыйынтык

iGaming ML - "сыйкырдуу" моделдер топтому эмес, жана тартип: макулдашылган маалыматтар жана Fich, ойнотулган offline тренинг, ишенимдүү онлайн тейлөө, катуу MLOps, ачык-айкын метрика жана этика/комплаенс. Бул нускамага ылайык, сиз кирешени жана кармап турууну туруктуу түрдө көбөйткөн, тобокелдиктерди азайткан жана жөнгө салуу талаптарын сактаган системаны түзөсүз - масштабда, тез жана алдын ала айтууга болот.

Contact

Биз менен байланышыңыз

Кандай гана суроо же колдоо керек болбосун — бизге кайрылыңыз.Биз дайым жардам берүүгө даярбыз!

Интеграцияны баштоо

Email — милдеттүү. Telegram же WhatsApp — каалооңузга жараша.

Атыңыз милдеттүү эмес
Email милдеттүү эмес
Тема милдеттүү эмес
Билдирүү милдеттүү эмес
Telegram милдеттүү эмес
@
Эгер Telegram көрсөтсөңүз — Emailден тышкары ошол жактан да жооп беребиз.
WhatsApp милдеттүү эмес
Формат: өлкөнүн коду жана номер (мисалы, +996XXXXXXXXX).

Түшүрүү баскычын басуу менен сиз маалыматтарыңыздын иштетилишине макул болосуз.