მანქანების სწავლება iGaming- ში

1) ბიზნესის საქმეები და ღირებულება

პროდუქტი/შემოსავალი: პროგნოზი LTV, churn (გადინება), პროპენსიტი ანაბრის/შეძენისთვის, დინამიური მისიები/სტუმარი, შემდეგი საუკეთესო მოქმედება/offer.
მარკეტინგი/CRM: look-alike, სეგმენტი, რეალურ დროში გამომწვევი, ბონუსის ოპტიმიზაცია (ABO - აბუს-რესისტენტი ბონუს ოპტიკა).
რისკი/შესაბამისობა: ანტიფროდი/AML (velocity, სტრუქტურა, გრაფიკული მახასიათებლები), Responsible Gaming (RG) - რისკის ნაკადი, ჩარევის გამომწვევი.
ოპერაციები/SRE: ინციდენტების პროგნოზი, capacity/traffic forecasting, პროვაიდერების ანომალიები.
ფინანსები: GGR/NGR პროგნოზი, Fx მგრძნობელობა, კონტრარგუმენტების მანიპულირება.

ეფექტის მითითებები: + 3-7% Net Revenue- ზე პერსონალიზაციის გამო, − 20-40% fraud-loss- ზე, − 10-25% churn, SLA რეაგირება RG <5 ინტერნეტით.

2) მონაცემები და ნიშნები

წყაროები: gameplay, გადახდები/PSP, ავთენტიფიკაცია, მოწყობილობები/ASN/Geo, RG/KYC/KYB, მარკეტინგული UTM, პროვაიდერის შრიფტები, ჩექმები/ტექსტები.

ძირითადი ფიჩები:

ქცევითი ფანჯრები: N განაკვეთები/ანაბრები და თანხები 10 წთ/საათში/დღეში, ჩანაწერები/უფასო/მონეტარული.
თანმიმდევრობა: თამაშების ჯაჭვები, ბოლო მოქმედების დრო, სესიის ნიშნები.
გეო/მოწყობილობა: ქვეყანა/ბაზარი, ASN, მოწყობილობის ტიპი/ბრაუზერი.
გრაფიკული: მოთამაშის რუკა-IP, კომპონენტები/ცენტრალური (fraud rings).
კონტექსტური: დღის დრო/კვირის დღე/ბაზრის არდადეგები, პროვაიდერი/ჟანრი/თამაშის ცვალებადობა.
RG/AML: ლიმიტები, თვითკმაყოფილება, სკრინინგის დროშები, REP/სანქციები (ქეში/ასინქრონის საშუალებით).

რეკომენდაციები:

ვალუტის ნორმალიზება და დრო (UTC + ბაზრის ლოკალი).
აღწერეთ გაზომვები (SCD II).
დაუკავშირდით ონლაინ/ოფლაინ ტრანსფორმაციას (ერთი კოდი Feature Store- ში).

3) არქიტექტურა: ხაზგარეშე და ონლაინ

3. 1 ოფლაინ კონტური

Lakehouse: Bronze - Silver (ნორმალიზაცია/გამდიდრება) - Gold (datasets).
Feature Store (offline): fich ფორმულების რეესტრი, წერტილოვანი დრო join, სასწავლო ნიმუშების მატერიალიზაცია.
ტრენინგი: კონტეინერები ფიქსირებული დამოკიდებულებით; ექსპერიმენტების ტრეკინგი (მეტრიკა/არტეფაქტები/მონაცემები).
სავალდებულო: k-fold/temporal split, backtest, off-policy ქულა.

3. 2 ონლაინ კონტური

Ingest Stream Processing: Flink/Spark/Beam ფანჯრებით/watermarks, idempotence.
Feature Store (ონლაინ): დაბალი დონის ქეში (Redis/Scylla) + ოფლაინი.
Serving: REST/GRPC endpoints, Scoring Earl, AB Routing, კანარის გამოშვებები.
ნამდვილი დროის ფანჯრები: ClickHouse/Pinot პანელებისთვის/წესებისთვის.

4) ტიპიური მოდელები და მიდგომები

კლასიფიკაცია/სკორინგი: churn/დეპოზიტი/frode/RG (LogReg, XGBoost/LightGBM, TabNet, CatBoost).
რანჟირება/რეკომენდაციები: ფაქტორიზაცია/ჩამოთვლა (LambaMART), seq2rec (RNN/Transformers), კონტექსტური ბანდიტები.
ანომალიები: იზოლაციის ტყე, One-Class SVM, AutoEncoder, Prophet/TSfresh დროებითი რიგებისთვის.
გრაფიკი: Node2Vec/GraphSAGE/GNN თაღლითობის რგოლებისთვის.
მიზეზი (causal): uplift მოდელები, T-learner/X-learner, DoWhy/CausalML.
NLP/ASR: თიკეტები/ჩეთები, საჩივრების კლასიფიკაცია, სენტიმენტი, თემები.

5) ხარისხის მეტრიკა

კლასიფიკაცია: ROC-AUC/PR-AUC, F1 ოპერაციულ ზღურბლებზე, ექსპექტირებული საყრდენი (შეჩერებული FP/FN), KS რისკის ესკალაციისთვის.
რეკომენდაციები: NDCG @ K, MAP @ K, coverage/diversity, CTR/CVR ინტერნეტით.
TS/Forecast: MAPE/SMAPE, WAPE, P50/P90 შეცდომა, PI საფარი.
RG/AML: precision/recall in SLA, საშუალო დრო.
ეკონომიკა: uplift Net Revenue, fraud saved, ROI კამპანიები,% ბონუს აბიუზი.

6) შეფასება და ექსპერიმენტები

offline: temporal split, backtest კვირის/ბაზრების/ტენანტების მიხედვით.
ონლაინ: A/B/n, CUPED/Sequential tests.
Off-policy: IPS/DR პერსონალიზაციის პოლიტიკოსისთვის.
Stat. ძალა: ნიმუშის ზომების გაანგარიშება დისპერსიის და MDE- ს გათვალისწინებით.

ბარიერის გაანგარიშების მაგალითი (ფსევდო კოდი):

python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)

7) კონფიდენციალურობა, ეთიკა, შესაბამისობა

PII მინიმიზაცია: ფსევდონიმები, მაპინგების იზოლაცია, CLS/RLS.
რეზიდენცია: ცალკეული EEA/UK/BR კონტურები; ჯვარედინი რეგიონალური ჯონის გარეშე.
DSAR/RTBF: წაშლა/გამოცემა ფიჩებში და ლოგოებში; იურიდიული ჰოლდი საქმეების/ანგარიშგებისთვის.
Fairness/მიკერძოება: fich აუდიტი, დისპარატის იმპაქტირება, proxy ცვლადის კონტროლი.
Explorainity: SHAP/feature importance, მოდელების ბარათები (owner, თარიღი, მონაცემები, მეტრიკა, რისკები).
უსაფრთხოება: KMS/CMK, საიდუმლოებები ლოგოების მიღმა, WORM გამოშვების არქივები.

8) MLOps: სასიცოცხლო ციკლი

1. Data & Features: სქემები/კონტრაქტები, DQ წესები (completeness/uniqueness/range/temporal), ხაზოვანი.
2. ტრენინგი: კონტეინერები, ავტოკატასტროფა, ექსპერიმენტების ტრეკინგი.
3. შესაბამისობა: სქემების თავსებადობის ტესტები, bias/fairness, შესრულების ტესტები.
4. გამოშვება (CI/CD/CT): კანარის/ეტაპობრივი გამოსხივება, წინა დროშები, „მუქი გაშვება“.
5. სერვინგი: ავტო სკეილინგი, ქეშირება, gRPC/REST, timeouts/retrais.
6. მონიტორინგი: მონაცემთა/პროგნოზების დრიფტი (PSI/KL), latency p95, error-rate, coverage, „silent metrics“.
7. Re-train: გრაფიკი/ტრიგერები მეტრიკის დრიფტზე/დეგრადაციაზე.
8. ინციდენტები: runbook, მოდელის დაბრუნება, fallback (წესი/მარტივი მოდელი).

9) Feature Store (თანმიმდევრობის ბირთვი)

ოფლაინი: წერტილის დროში გაანგარიშება, ანტი-აწევა, fich ფორმულის ვერსია.
ონლაინ: დაბალი ლატენტობა (10-30 ms), TTL, კოორდინაცია ოფლაინთან.
კონტრაქტები: სახელი/აღწერა, მფლობელი, SLA, ფორმულა, ონლაინ/ოფლაინ შესაბამისობის ტესტები.

ფიკის სპეციფიკაციის მაგალითი (YAML):

yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5

10) ონლაინ ეკიპაჟი და წესები

ჰიბრიდი ML + Rules: მოდელი - score + ახსნა; წესები - hard-guard/ეთიკა/კანონი.
Ssyvka: CEP ნიმუშები (სტრუქტურა/velocity/მოწყობილობა switch) + ML ესკიზი.
SLA: p95 და tu-150 ms პერსონალიზაციისთვის, 2-5 ევრო RG/AML ალერტებისთვის.

მარშრუტიზაციის ფსევდო კოდი:

python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))

11) სასწავლო მონაცემები: ნიმუშები და ეტიკეტები

ღონისძიების ფანჯრები: t0 - რეფერენდუმი, t0 + C- ეტიკეტი (ანაბარი/შავი/ფროდი).
Leakage კონტროლი: point-in-time join, მომავალი მოვლენების გამორიცხვა.
დაბალანსება: კლასების სტრატიფიკაცია/წონა, იშვიათი კლასებისთვის ფოკალური სიყვარული.
ეთიკა: გამორიცხეთ მგრძნობიარე ატრიბუტები/მარიონეტები, გააკონტროლეთ გავლენა.

12) ეკონომიკა და პროდუქტიულობა

Fich- ის ღირებულება: გაითვალისწინეთ cost/feature და cost/request, თავიდან აიცილეთ მძიმე ონლაინ-join.
ქეში: RAM- ის ცხელი ფიჩები, ცივი - ლაზი.
მატერიალიზაცია: ოფლაინ აგრეგაცია; მხოლოდ კრიტიკული ინტერნეტით.
კვოტები: ნაწლავების შეზღუდვები, დროის ფანჯრები; chargeback გუნდები.

13) SQL/ფსევდო კოდის მაგალითები

Point-in-time ნიმუში churn (30 დღე დუმილი):

sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;

ონლაინ ანაბრის ფანჯარა (Flink SQL, 10 წთ):

sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);

14) გზის განხორციელების რუკა

MVP (4-6 კვირა):

1. სიგნალების კატალოგი და Feature Store v1 (5-10 ფიჩი Payments/Gameplay).

2. ძირითადი churn/დეპოზიტის მოდელი (XGBoost) + A/B ტრაფიკის 10-20% -ით.

3. ონლაინ სერვინგი ქეშით (p95 <150 ms) და კანარის გამოშვებებით.

4. დრიფტის/ხარისხის მონიტორინგი, მოდელის ბარათი, runbook გამოტოვება.

ეტაპი 2 (6-12 კვირა):

RG/AML მორიელები, გრაფიკული ნიშნები, რეალურ დროში ტრიგერები.
Uplift მოდელები პრემიებისთვის, კონტექსტური ბანდიტები, off-policy ქულა.
ავტო-რე-ტრეინი დრიფტის/კალენდრის მიხედვით, დოკუმენტაციის ავტომატიზაცია.

ეტაპი 3 (12-20 კვირა):

თამაშების კატალოგის პერსონალიზაცია (seq2rec), მრავალ ობიექტური ოპტიმიზაცია (შემოსავალი/პასუხისმგებლობა).
მულტფილმის რეგიონალური სერვინგი, SLAs/კვოტები, chargeback fich/infection.
Fairness აუდიტი და სტრესული ტესტები, DR სავარჯიშოები და WORM გამოშვების საცავი.

15) RACI

R (Responsible): MLOps (პლატფორმა/serving), Data Science (მოდელები/ექსპერიმენტები), Data Eng (fici/pyplines).
A (Accountable): Head of Data / CDO.
C (კონსალტინგი): კომპლექსი/DPO (PII/RG/AML/DSAR), უსაფრთხოება (KMS/საიდუმლოებები), SRE (SLO/ღირებულება), Finance (ეფექტი/ROI), ლეგალი.
I (ინფორმირებული): პროდუქტი/მარკეტინგი/ოპერაციები/მხარდაჭერა.

16) ჩეკის სია გაყიდვამდე

Fichi შეთანხმებულია ონლაინ/offline, გადაკეთების ტესტები გაიარა.
მოდელის ბარათი (owner, მონაცემები, მეტრიკა, რისკები, fairness) სავსეა.
კანარის გამოშვება/ficflag; SLA და ალერტები latency/შეცდომები/დრიფტი.
პოლიტიკოსები PII/DSAR/RTBF/Legal Hold დაცულია; ლოგები ანონიმურია.
Runbook ინციდენტები/გამოტოვება; fallback სტრატეგია.
ექსპერიმენტები შედგენილია (ჰიპოთეზები, მეტრიკა, ხანგრძლივობა, MDE).
ინვესტიციის და ფიგურის ღირებულება შედის ბიუჯეტში; შედის კვოტები და შეზღუდვები.

17) ანტი შაბლონები

ონლაინ/ოფლაინ ფრჩხილების შეუსაბამობა - დაუდევრობა.
სინქრონული გარე API ცხელი ბილიკებით ქეშისა და ტაიმაუტის გარეშე.
გაუმჭვირვალე მეტრული ფორმულები/მოდელის ბარათების არარსებობა.
გადამზადება/დრიფტი მონიტორინგისა და გადატვირთვის გარეშე.
PII ანალიტიკასა და ტრენინგში CLS/RLS/მინიმიზაციის გარეშე.
„ერთი დიდი მოდელი ყველაფრისთვის“ დომენის დაშლის გარეშე.

18) შედეგი

IGaming- ში ML არ არის „ჯადოსნური“ მოდელების ერთობლიობა, არამედ დისციპლინა: შეთანხმებული მონაცემები და ფიჩები, რომელიც ასახავს ოფლაინ ტრენინგს, საიმედო ონლაინ სერვინგს, მკაცრ MLOps- ს, გამჭვირვალე მეტრიკებს და ეთიკას/შესაბამისობას. ამ ხელმძღვანელობის შემდეგ, თქვენ ააშენებთ სისტემას, რომელიც სტაბილურად ზრდის შემოსავალს და შენარჩუნებას, ამცირებს რისკებს და აკმაყოფილებს მარეგულირებელ მოთხოვნებს - მასშტაბის, სწრაფად და პროგნოზირებად.

მანქანების სწავლება iGaming- ში

დაგვიკავშირდით

სწრაფი კავშირი

ვიდეო მალე განახლდება

ჩვენ ახლა ძალიან დაკავებული ვართ პროექტებით