მასწავლებელთან სწავლა
1) რატომ და როდის
მასწავლებელთან (Supervised): არსებობს ეტიკეტი (ეტიკეტი), რომელიც პროგნოზირებს ალბათობას/კლასს/მნიშვნელობას. ჩვენ ვიყენებთ, როდესაც გასაგებია „სწორი პასუხი“ და არსებობს ისტორია: churn, 7 დღის ანაბარი, RG/AML რისკი, ოფერზე პასუხის ალბათობა, LTV პროგნოზი.
მასწავლებლის გარეშე (Unsupervised): ეტიკეტი არ არის, ჩვენ ვიპოვნებთ სტრუქტურას/მტევანს/ანომალიებს/ლატენტურ ფაქტორებს: მოთამაშეთა სეგმენტაცია, ფროიდის რგოლები, თამაშების თემატური პროფილები, პროვაიდერების გაუმართაობის იდენტიფიცირება, მახასიათებლების შეკუმშვა.
არჩევანის წესი: თუ ბიზნეს გადაწყვეტა დამოკიდებულია კონკრეტულ სავარაუდო პროგნოზზე - supervised; თუ მიზანია უცნობი ნიმუშების/სიგნალების გახსნა ან მონაცემთა განზომილების შემცირება. პრაქტიკაში გაერთიანებულია.
2) ტიპიური შემთხვევები iGaming
Supervised
Churn/რეაქტივაცია: ორობითი კლასიფიკაცია (დატოვებს/არ დატოვებს), გავლენის მოდელები.
პროპენსიტი ანაბრის/შეძენის მიმართ: მოვლენის ალბათობა T- ის ჰორიზონტზე.
RG/AML: რისკი, სტრუქტურის ალბათობა, საეჭვო სესია.
პრემიების ანტიაბიუსი: პრომო თაღლითური გამოყენების ალბათობა.
რეკომენდაციები (რანგირება): დაწკაპუნების/თამაშის განაკვეთების ალბათობა (listwise/pointwise).
Unsupervised
მოთამაშეთა სეგმენტი: k-means, GMM, HDBSCAN RFM/ქცევა/ჟანრები.
ანომალიები: იზოლაციის ტყე, LOF, AutoEncoder გადახდებზე/თამაშის ნიმუშებზე.
გრაფიკული ანალიზი: კლასტერიზაცია გრაფიკში „მოთამაშის ბარათის IP“.
განზომილების დაქვეითება: PCA/UMAP ვიზუალიზაციისა და წინა ინჟინერიისთვის.
თემატური მოდელები: NMF/LDL თამაშების/დამხმარე ჩატის აღწერისთვის.
3) მონაცემები და ფიჩები
Point-in-time კავშირი მონაცემთა ლეგალიზაციის აღმოსაფხვრელად.
ნიშნების ფანჯრები: 10 წთ/1 სთ/1 დღე/7 დღე/30 დღე (ჩანაწერები, თავისუფლების აღკვეთა, მონეტა).
კონტექსტი: ბაზარი/იურისდიქცია/DST/არდადეგები, პროვაიდერი/ჟანრი, მოწყობილობა/ASN.
გრაფიკული ნიშნები: უნიკალური ბარათების რაოდენობა/IP/მოწყობილობები, ცენტრალური.
ვალუტების/დროის ზონების ნორმალიზაცია, SCD II users/games/providers.
4) ალგორითმები და მეტრიკა
მასწავლებელთან
ალგორითმები: LogReg, XGBoost/LightGBM/CatBoost, TabNet; რანგისთვის - LambdaMART/GBDT; დროებითი რიგები - Prophet/ETS/Gradient Boosted TS.
მეტრიკა: ROC-AUC/PR-AUC, F1 @ ოპერაციული ბარიერი, KS (რისკი), NDCG/MAP @ K (რეკომენდაციები), MAPE/WAPE (პროგნოზები), ექსპექტირებული cost Fp/FN.
მასწავლებლის გარეშე
კლასტერიზაცია: k-means/GMM (მტევნების რაოდენობა - elbow/silhouette), HDBSCAN (მკვრივი).
ანომალიები: იზოლაციის ტყე/LOF/AutoEncoder; მეტრიკა - precision @ k ექსპერტების მარკირებაზე, AUCPR სინთეზურ ანომალიებში.
განზომილება: PCA/UMAP წინა დიზაინისა და ვიზუალიზაციისთვის.
5) კომბინირებული მიდგომები
Semi-Supervised: ფსევდო მთვარეები შეუმჩნეველი მონაცემების ნაწილისთვის, კონსენსუსის რეგულირება.
Self-Supervised: კონტრასტული/შენიღბული დავალებები (სესიების/თამაშების ემბედინგი) - იყენებენ downstream supervised.
აქტიური Learning: სისტემა კანდიდატებს სთავაზობს მარკირებას (მაქსიმალური გაურკვევლობა/მრავალფეროვნება) - დაზოგავს AML/RG ექსპერტების მუშაობას.
Weak Supervision: euristics/წესები/დისტანციური ნიშნები ქმნიან „სუსტი“ ეტიკეტებს, შემდეგ კი კალიბრს.
6) პროცესი: ოფლაინიდან ონლაინ სერვინგამდე
1. ოფლაინი: დროულად/ბაზრებზე split- ის შეგროვება/მომზადება - ტრენინგი/შესაბამისობა - backtest.
2. სემანტიკა მეტრიკა: ერთიანი ფორმულები (მაგალითად, churn _ 30d) და ფიქსირებული დროებითი ფანჯრები.
3. Feature Store: ერთი ფორმულა fich online/offline; შესაბამისობის ტესტები.
4. ონლაინ Serving: endpoints gRPC/REST, SLA ლატენტობის, AB Routing/კანარის გამოშვებები.
5. მონიტორინგი: მონაცემთა/პროგნოზების დრიფტი (PSI/KL), latency p95, ბიზნეს მეტრიკის შეცდომა, ალერტები.
7) კონფიდენციალურობა და შესაბამისობა
PII მინიმიზაცია: ფსევდონიზაცია, მაპინგების იზოლაცია, CLS/RLS.
Residence: ცალკეული კონვეიერები/დაშიფვრის გასაღებები რეგიონების მიხედვით (EEA/UK/BR).
DSAR/RTBF: წაშლა/რედაქტირება ფიჩები და ლოგოები; შეინარჩუნეთ გამონაკლისების სამართლებრივი საფუძვლები.
Legal Hold: გამოძიების/ანგარიშგების არტეფაქტების გაყინვა.
Fairness: მარიონეტული ფიჩის აუდიტი, გავლენის მოხსენებები (SHAP), RG ჩარევის პოლიტიკა.
8) ეკონომიკა და პროდუქტიულობა
გაანგარიშების ღირებულება (cost/feature) და ინვესტიცია (cost/request).
ხაზგარეშე ერთეულების მატერიალიზაცია; ონლაინ - მხოლოდ კრიტიკული ფანჯრები.
ნებართვების ქეში/მოკლე TTL- ის მორიელის შედეგები, ასინქრონული lookups ტაიმაუტებით.
კვოტები და ბიუჯეტები რეპლეი/ბეიკესტისთვის; chargeback ბრძანებები/მოდელები.
9) მაგალითები (ფრაგმენტები)
9. 1 Point-in-time ნიმუში churn _ 30d- ისთვის
sql
WITH base AS (
SELECT user_pseudo_id, DATE(event_time) AS asof
FROM silver. fact_events
GROUP BY user_pseudo_id, DATE(event_time)
),
feat AS (
SELECT b. user_pseudo_id, b. asof,
SUM(CASE WHEN e. type='deposit' AND e. event_time>=b. asof - INTERVAL '30' DAY
AND e. event_time<b. asof THEN amount_base ELSE 0 END) AS dep_30d,
COUNT(CASE WHEN e. type='bet' AND e. event_time>=b. asof - INTERVAL '7' DAY
AND e. event_time<b. asof THEN 1 END) AS bets_7d
FROM base b
JOIN silver. fact_events e USING (user_pseudo_id)
GROUP BY b. user_pseudo_id, b. asof
),
label AS (
SELECT f. user_pseudo_id, f. asof,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events x
WHERE x.user_pseudo_id=f. user_pseudo_id
AND x.event_time>f. asof AND x.event_time<=f. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS churn_30d
FROM feat f
)
SELECT FROM feat JOIN label USING (user_pseudo_id, asof);
9. 2 გადახდის ანომალიები (ფსევდო კოდი, იზოლაციის ტყე)
python
X = build_features (payments_last_7d) # sum/frequency/novelty/BIN/ASN/time model = IsolationForest (contamination = 0. 01). fit(X_train)
scores = -model. decision_function(X_test)
alerts = where (scores> THRESHOLD) # AML case candidates
9. 3 K-means სეგმენტი (RFM + ჟანრები)
python
X = scale(np. c_[R, F, M, share_slots, share_live, share_sports])
km = KMeans(n_clusters=8, n_init=20, random_state=42). fit(X)
segments = km. labels_
9. 4 ორობითი მოდელის ბარიერი
python threshold = pick_by_expected_cost(scores, labels, cost_fp=5. 0, cost_fn=50. 0)
10) შეფასება, ამოცნობა და ექსპერიმენტები
offline: temporal split (train/val/test დროში/ბაზრებზე), backtesting, bootstrap ნდობა.
ონლაინ: A/B/n, sequential tests, CUPED/in-in.
Off-policy: IPS/DR პერსონალიზაციის პოლიტიკოსისთვის.
კალიბრაცია: Platt/Isotonic სწორი ალბათობებისთვის.
დეგრადაციის კონტროლი: ბიზნეს მეტრიკის ალერტები და PR-AUC/KS.
11) RACI
R (Responsible): მონაცემთა მეცნიერება (მოდელები/ექსპერიმენტები), MLOps (პლატფორმა/serving), Data Eng (ფიჩები/piplines).
A (Accountable): Head of Data/CDO.
C (Consulted): Compliance/DPO (PII/RG/AML), უსაფრთხოება (KMS/საიდუმლოებები), SRE (SLO/ღირებულება), Finance (ROI).
I (ინფორმირებული): პროდუქტი/მარკეტინგი/ოპერაციები/მხარდაჭერა.
12) გზის განხორციელების რუკა
MVP (4-6 კვირა):1. მიზნების/ეტიკეტებისა და სიგნალების კატალოგი (churn _ 30d, propensity _ 7d, risk _ rg).
2. Feature Store v1 (5-10 fich), XGBoost ბაზის მოდელები, ოფლაინ მეტრული დაშბორდები.
3. k-means (8 მტევანი) სეგმენტი + სეგმენტების აღწერა; Isolation Forest გადახდისთვის.
4. ონლაინ სერვინგი ქეში, p95 <150 ms; A/B ტრაფიკის 10-20% -ით.
ეტაპი 2 (6-12 კვირა):- Active/Semi-Supervised ეტიკეტის დეფიციტისთვის (AML/RG), self-supervision თამაშები/სესიები.
- კანარის გამოშვებები, დრიფტის მონიტორინგი, ავტომატური რეესტრი.
- მეტრიკის ერთი სემანტიკური ფენა და ონლაინ/ოფლაინ ფიშის კოორდინაცია.
- გრაფიკული ნიშნები და ფროიდის რგოლები; პრემიების მოდელები.
- მულტფილმის რეგიონალური სერვინგი, კვოტები/chargeback; WORM გამოშვების არქივი.
- Fairness აუდიტი, სტრესის ტესტები, runbooks ინციდენტები.
13) ჩეკის სია გაყიდვამდე
- Point in time ნიმუშები და ტესტები leakage.
- ალბათობის კალიბრაცია; ექსპექტირებული ბარიერის არჩევანი.
- მოდელების ბარათები (owner, მონაცემები, მეტრიკა, რისკები, fairness).
- Feature Store: ონლაინ/ოფლაინ შესაბამისობის ტესტი.
- დრიფტის/ლატენტობის/შეცდომების მონიტორინგი, ალერტები და ავტო-როლბეკი.
- პოლიტიკოსები PII/DSAR/RTBF/Legal Hold; ლოჯისტიკა დეპრესიულია.
- გეგმა A/B და სტატისტიკური ძალა ითვლება; runbook მზად არის.
14) ანტი შაბლონები
ეტიკეტებში ახალი მოვლენების შერევა და წერტილოვანი დროის არარსებობა.
დომენის დაშლის ნაცვლად „ერთი მოდელი ყველაფრისთვის“.
გარკვეული ლიბანის ალბათობა - არასწორი ბიზნეს ბარიერები.
ფრენა „ბრმად“: არ არსებობს დრიფტის/ხარისხის მონიტორინგი ინტერნეტით.
გადატვირთვა ინტერნეტით (მძიმე ექსტერნალ-ჯინი ქეშისა და ტაიმაუტის გარეშე).
სეგმენტები ბიზნესის ინტერპრეტაციისა და მფლობელის გარეშე.
15) შედეგი
მასწავლებელთან ტრენინგი იძლევა გაზომილ პროგნოზს და რისკის/შემოსავლის მენეჯმენტს; მასწავლებლის გარეშე - სტრუქტურა და სიგნალები, სადაც ეტიკეტი არ არის. მათი კომბინაცია (semi/self-supervised, active learning) მონაცემთა დისციპლინაში (წერტილის დრო, Feature Store), შესაბამისობა და MLOps იძლევა iGaming პლატფორმას Net Revenue- ის სტაბილურ ზრდას, ფროლის შემცირებას და და და აუდიტის ღირებულება და მზადყოფნა.