ანომალიების და კორელაციების ანალიზი
1) რატომ არის ეს iGaming
iGaming ცხოვრობს რეალურ დროში: დეპოზიტები შეფერხდა, თამაშების სპეციფიკური პროვაიდერი „ჩაძირული“, ფეტვი ააფეთქა, შეიცვალა ტრაფიკის ნაზავი. საჭიროა დისციპლინა, რომელიც:- ადრე აღმოაჩენს გადახრებს (სანამ KPI და შემოსავალი ეცემა მოხსენებებში).
- განასხვავებს წარუმატებლობას სეზონური/აქციების/ტურნირებისგან.
- პოულობს ძირეულ მიზეზებს (RCA) „სიმპტომების მკურნალობის“ ნაცვლად.
- იგი აკვირდება კონფიდენციალურობასა და ეთიკას (RG/AML) PII- ს განაწილების გარეშე.
2) ანომალიების ტიპოლოგია
წერტილები (წერტილი): ერთჯერადი მწვერვალი/მარცხი (მაგ., spike შეცდომები PSP).
სერიული (კოლექცია): ატიპიური მნიშვნელობების თანმიმდევრობა (გრძელი დეგრადაცია).
კონტექსტური (კონტექსტი): ღამით ნორმალური, დღის განმავლობაში არანორმალური (ეს დამოკიდებულია კონტექსტზე: საათი/ქვეყანა/არხი).
რეჟიმის/ტენდენციის შეცვლა: დონე, დისპერსია, სეზონურობა მკვეთრად შეიცვალა.
სტრუქტურული: გადასასვლელი/დუბლიკატები, schema drift.
მიზეზობრივი საგამოძიებო: მეზობელი კვანძის ცვლილებამ (PSP/პროვაიდერმა) „შეცვალა“ ჩვენი რიგები.
3) მონაცემთა მომზადება და კონტექსტი
კალენდარი და სეზონური: შაბათ/არდადეგები/ტურნირები/აქციები, ცალკეული ძირითადი ხაზები.
აგრეგაციის ფენები: 1-წთ/5-წთ/სთ, ქვეყნის მასშტაბით/ბრენდი/პროვაიდერი/მოწყობილობა.
ნორმალიზაცია: per-capita (მოთამაშისთვის/სესიაზე), დღის განმავლობაში, FX- ის მიხედვით.
დროის ფიჩები: rolling mean/std, EWMA, Lagis, კვირის დღე, „წუთი cut-off“.
ხარისხი: ჩვენ ფილტრაციას ვაძლევთ დაგვიანებულ მოვლენებს/დუბლიკატებს, აღმოფხვრის timezone შეცდომებს.
4) გამოვლენის მეთოდები (მარტივიდან ჰიბრიდამდე)
სტატისტიკა და დროის რიგები
Robust z-score (საშუალო/IQR), EWMA, STL დაშლა (trend/seasonal/remain).
CUSUM/ADWIN მგრძნობიარეა საშუალო/დისპერსიის ცვლის მიმართ.
Change points (მაგალითად, PELT/BOCPD): ჩაწერეთ რეჟიმის შეცვლის წერტილები.
Prophet/ETS - პროგნოზი + ნდობის დერეფანი - გამონაბოლქვი ინტერვალის გარეთ.
მრავალგანზომილებიანი/მკვრივი
Isolation Forest, LOF, One-Class SVM - როდესაც ბევრი ნიშანია (PSP, geo, არხი, მოწყობილობა).
Autoencoder (რეკონსტრუქცია/შეცდომა) რთული ნიმუშებისთვის.
ონლაინ ნაკადები
დაეშვა ფანჯრები, კვანტური ესკიზები, EWMA + ჰისტერეზი; watermarks და late data აღრიცხვა.
Dual-thresholds (შესასვლელი/გასასვლელი ანომალიიდან) drebezg- ის ჩახშობის მიზნით.
ჰიბრიდი
დომენის წესები (SLO შეგნებული) + სტატისტიკა/ML უფრო მაღალია, ვიდრე სიზუსტე და ახსნა.
5) დეტექტივის ხარისხი: როგორ გაზომოთ
Precision/Recall/F1 აღნიშნულია ინციდენტებში.
ATTD (Average Time To Detect) და TTR (ნორმალიზებამდე დრო).
Duration bias: ჯარიმა „მოციმციმე“ (ხშირი შესასვლელი/გასასვლელი ანომალიიდან).
Ex-post ბიზნეს მეტრიკა: „რამდენი რაუნდი/დეპოზიტი გადაარჩინა“, „რამდენი P1 თავიდან აიცილეს“.
Stability: დეპრესიული ყალბი შფოთვის წილი; p95 „მშვიდი ღამეები“.
6) კორელაცია, მიზეზი და ხაფანგები
კორელაცია - მიზეზი: საერთო დრაივერს (მოქმედებას/გარე დაუნს) შეუძლია ორივე მეტრის „წარმართვა“.
Partial correlation (პირობითი), Mutual Information (MI) - როდესაც კავშირები არაწრფივია.
Granger causality (დროებითი მიზეზი) - ერთი სერია ეხმარება მეორეს პროგნოზირებას.
DAG/causal discovery (პროგნოზირებადი შემოწმებით) - ჰიპოთეზა გავლენის მიმართულების შესახებ.
Simpson's paradox: აგრეგატები „იტყუება“ სტრატიფიკაციის გარეშე (ქვეყანა/არხი/მოწყობილობა).
Leakage: მომავალი ინფორმაციის შემცველი ნიშნები იძლევა ყალბი მიზეზების გამო.
7) Root-Cause Analysis (RCA)
დამოკიდებულების გრაფიკი: თამაშების პროვაიდერები - ლობი, გადახდის განაკვეთები/PSP და KPI.
გაზომვის სკანი: ვინ „გატეხა“? (ქვეყანა, ბრენდი, პროვაიდერი, გადახდის მეთოდი, OS).
კონტრასტული ჯგუფები: სადაც არის ანომალია/არა - შედარებით რისკი/odds ratio.
Shapley/Feature attribution მრავალგანზომილებიანი ანომალიების მოდელებისთვის.
სცენარები „რა-თუ“: გამორთეთ საეჭვო სეგმენტი - აღდგება KPI?
8) ხმაურის შემცირება და პრიორიტეტიზაცია
ჰისტერეზი: „5 ფანჯრიდან 3 ირღვევა“ დასადასტურებლად.
დინამიური ბარიერები: baseline ± k·, quantil 5/95, სეზონური პროფილები.
ჯგუფი: ერთი ინციდენტი „პროვაიდერ A“ - ში 300 თამაშის ალერტის ნაცვლად.
SLO ცნობიერება: ალერტიმი მხოლოდ იმ შემთხვევაში, თუ ისინი გავლენას ახდენენ SLO/ბიზნეს ბარიერზე.
Supressia: N alerts მაქსიმუმ T წუთში ერთი labels ნაკრები.
9) კონვეიერი: ონლაინ და ხაზგარეშე
ონლაინ: Flink/Spark Streaming/CEP - წუთიანი ფანჯრები, watermarks, დუპლიკაცია, იდემპოტენტობა.
ოფლაინი: ბექტესტი ისტორიის წლისთვის, „სინთეზური“ ინციდენტების ინჟექცია, კანდიდატების შედარება.
ModelOps: წესების/მოდელების ვერსია (MAJOR/MINOR/PATCH), shadow/canary და rollback წესებისთვის.
10) კონფიდენციალურობა, ეთიკა, შესაბამისობა
Zero-PII ფიჩორებსა და ალერტებში; ნიშნები იდენტიფიკატორების ნაცვლად.
RG/AML: ცალკეული არხები და წვდომა; redaction ტექსტი.
Bias: შეამოწმეთ გაფანტვა მგრძნობიარე განზომილებებით (ქვეყანა/მეთოდი/მოწყობილობა) - ნუ გადააქცევთ ანომალიას დისკრიმინაციად.
Legal Hold/DSAR: დეტექტივების/გადაწყვეტილებების ისტორიის შენახვა - WORM ჟურნალი.
11) კეისი iGaming (მზა შაბლონები)
გადახდები/PSP
გამოვლენა: 'success _ rate _ deposits _ 5m' baseline _ 28d- ზე ქვემოთ, 3/5 ფანჯრის დადასტურება P1.
RCA: ჭრილობა 'psp, country, method'; რიგების/რეაგირების შემოწმება.
თამაშის პროვაიდერები
დეტექტივი: 'rounds _ per _ min' პროვაიდერი A <60% rolling _ quantile (0. 1) 28d - P1- სთვის.
მოქმედება: დამალეთ A თამაშების საიდუმლოებები, აცნობეთ პროვაიდერს, შეცვალეთ ლობი.
RG
დეტექტივი: 'high _ risk _ share- ზე> 3 პროცენტული პუნქტით B-P2 ბრენდის 10 წუთში.
RCA: კამპანიები/პრემიები, ახალი მოწყობილობების ზრდა, გეო-ცვლა.
ანტიფროდი
დეტექტივი: 'chargeback _ rate _ 60m> Buttle + 3' და 'news _ device _ share' P1.
მოქმედება: გამკაცრდეს გამკაცრება/გამოსაყენებლად შეზღუდვები.
12) არტეფაქტები და შაბლონები
12. 1 YAML წესები (ონლაინ)
yaml rule_id: psp_success_drop severity: P1 source: stream:payments. metrics_1m baseline: {type: seasonal_quantile, period: P28D, quantile: 0. 1, by: [hour, dow, country, psp]}
detect:
type: ratio_below value: 0. 6 confirm: {breaches_required: 3, within: PT5M}
labels: {psp: "$psp", country: "$country"}
actions:
- route: pagerduty:payments
- soars: [{name: switch_psp, params: {backup: "PSP_B"}}]
privacy: {pii_in_payload: false}
version: 1. 4. 0
12. 2 ოფლაინ ბექტესტის კონფისკაცია
yaml dataset: payments_gold period: {from: "2025-07-01", to: "2025-10-31"}
inject_scenarios:
- type: level_shift target: success_rate where: {psp: "PSP_A", country: "EE"}
from: "2025-09-15T12:00Z"
delta: -0. 02 metrics: [precision, recall, f1, attd_sec]
12. 3 RCA ინციდენტის პასპორტი
ინციდენტი: drop rounds @ provider A
პერიოდი: 2025-11-01 18: 10-18: 35 (ევროპა/კიევი)
Root-node: `games. engine. provider_A` (change-point @18:12)
Аффект: `lobby_clicks ↓`, `rounds_per_min ↓ 45%`, `GGR/min ↓ 28%`
კონტრარგუმენტები: payments OK, PSP OK, FX/stats ნორმალური
მოქმედებები: hide tiles, პროვაიდერის კონტაქტი, სტატუსის ბანერი
შედეგი: აღდგენა @ 18:34; ზარალის თავიდან აცილება X
13) პროცესის წარმატების მეტრიკა
Precision/Recall/F1 ინციდენტების P1/P2 (მარკირება დომენის მფლობელების მიერ).
ATTD/MTTR წუთებში (საშუალო/p90).
ხმაური: - „ყალბი ღამის“ შფოთვის X%, Y ალერტები/შეცვლა.
RCA დრო: საშუალო დრო ძირეული მიზეზის გამო.
Business saved: შენახული ანაბრების/რაუნდის შეფასება.
Coverage: მეთვალყურეობის ქვეშ მყოფი კრიტიკული გზების 95% -ზე მეტი.
14) პროცესები და RACI
Domain Owners (R) - წესები/ძირითადი ხაზები/ინციდენტების ნიშნები.
Data Platform/Observability (R) - დეტექტივის, შენახვის ძრავა, SLO.
ML Lead (R) - ანომალიების, კალიბრაციის, fairness მოდელები.
SRE/SecOps (R) - ინტეგრაცია SOAR/PagerDuty- სთან, ინციდენტები.
CDO/DPO (A) - კონფიდენციალურობის/ეთიკის პოლიტიკა, Zero-PII.
Product/Finance (C) - SLO ბარიერები და ბიზნესის პრიორიტეტები.
15) გზის განხორციელების რუკა
0-30 დღე (MVP)
1. კრიტიკული გზები: payments, game _ rounds, freshness ingest.
2. ძირითადი ხაზები საათების/დღეების და საკვანძო გაზომვების გასწვრივ (ქვეყანა/ბრენდი/psp/პროვაიდერი).
3. მარტივი დეტექტორები: EWMA/robust z-score + ჰისტესეზი.
4. ალერტის არხები და 3 runbook 'a (გადახდა/თამაშები/DQ).
5. ბექტესტა 3-6 თვის ისტორიაში; ინციდენტების აღნიშვნა.
30-90 დღე
1. Change-points, seasonal quantiles, მულტიმოდური მწკრივები.
2. Isolation Forest/LOF მრავალგანზომილებიანი შემთხვევებისთვის; shadow რეჟიმი.
3. დამოკიდებულების RCA გრაფიკი და ნახევრად ავტომატური განაწილება.
4. SLO ცნობიერი ბარიერები; suppression/grouping; ბენზინგასამართი სადგურები.
3-6 თვე
1. Champion-Challenger წესები/მოდელები; ბარიერების მანქანა-tuning.
2. გარე ინტეგრაცია (პროვაიდერები/PSP) ხელმოწერილი ვებჰუკებით.
3. მოხსენებები „ალერტების წვლილი MTTR/შემოსავალში“; კვარტალური ჰიგიენის სესიები.
4. საკამათო ექსპერიმენტები საკამათო კორელაციებისთვის (A/B, Granger, ინსტრუმენტული ცვლადები).
16) ანტი შაბლონები
ბარიერი „თვალზე“, საერთოა ყველა ქვეყნისთვის/საათისთვის/არხისთვის.
სეზონური/მოქმედებების უგულებელყოფა ყალბი ალერტების „ქარიშხალი“.
არ არსებობს ბექტესტები და ინციდენტების მარკირება - ოპტიმიზაცია არაფერია.
კორელაციების დევნა სტრატიფიკაციის გარეშე/პარტიული corr არის ყალბი მიზეზები.
ლოგები/ალერტები PII- სთან, ეკრანის კადრები საერთო არხებში.
„მარადიული“ წესები აუდიტის გარეშე და მფლობელის გარეშე.
17) დაკავშირებული მონაკვეთები
ალერტები მონაცემთა ნაკადებიდან, DataOps პრაქტიკა, API ანალიტიკოსები და მეტრიკა, აუდიტი და ვერსია, MLOps: მოდელების ექსპლუატაცია, წვდომის კონტროლი, უსაფრთხოება და დაშიფვრა, მონაცემთა შენახვის პოლიტიკა, მიკერძოების შემცირება.
შედეგი
ანომალიების და კორელაციების ანალიზი არ არის „ML მაგია“, არამედ საინჟინრო სისტემა: სწორი კონტექსტი და სეზონურობა, წესებისა და მოდელების ჰიბრიდი, მკაცრი ხარისხის მეტრიკა და კონტროლირებადი RCA. IGaming- ში ასეთი სისტემა ამცირებს MTTR- ს, იცავს შემოსავალს და ინარჩუნებს მოთამაშეთა და რეგულატორების ნდობას - კონფიდენციალურობის დარღვევის გარეშე.