GH GambleHub

ანალიტიკა ცვლისა და პროდუქტიულობის შესახებ

1) მიზანი და მნიშვნელობა

ანალიტიკური ცვლა არის გაზომვის სისტემა, რომელიც 24 × 7 ოპერაციების კონტროლს პროგნოზირებს: იგი ადასტურებს SLO- ს დაფარვას, იდენტიფიცირებს ვიწრო ადგილებს (ღამის ცრემლები, გადატვირთული დომენები), ხელს უშლის დამწვრობას და აუმჯობესებს ქუდების ხარისხს. IGaming- ისთვის ეს პირდაპირ გავლენას ახდენს დეპოზიტების/სეტლების სიჩქარეზე, KYC/AML ვადებსა და რეპუტაციაზე.


2) მეტრიკის ტაქსონომია

2. 1 საფარი და მზადყოფნა

Coverage Rate -% სრული შემადგენლობა (როლი/დომენი/რეგიონი).
On-Call Readiness არის ცვლის წილი დანიშნულ IC/CL- სთან და აქტუალურ კონტაქტებთან.
Handover SLA - გადაცემის ფანჯრის დაცვა (10-15 წთ) და შემოწმების ფურცელი.

2. 2 რეაქციის და აღდგენის სიჩქარე

MTTA/MTTR (slots Day/Swing/Night, დომენების მიხედვით): საშუალო, p90.
Detection Lead არის ლაგი SLI დეგრადაციასა და პირველ მოქმედებას შორის.
Post-Release Monitoring Time - გამოშვების ფაქტობრივი დაკვირვება.

2. 3 ცვლის გადაცემის ხარისხი

Handover Defect Rate - ჩეკების სიის შეუსრულებელი წერტილები.
Info Drift არის ფაქტების შეუსაბამობა Var-rum- ს, ITSM- ს და სტატუს არხს შორის.
Action Carryover არის დავალებების წილი, რომლებიც „გადაადგილდნენ“ მფლობელის/ETA გარეშე.

2. 4 ტვირთი და დაღლილობა

Pager Fatigue: ალერტები/ადამიანი/კვირა, ღამის პეიზაჟები, P1/ადამიანი/ცვლა.
Escalation Density: ინციდენტების წილი, რომლებიც მიაღწიეს L2/L3- ს (runbook ფიქსიების L1 წინააღმდეგ).
Idle vs. Busy Ratio: პროდუქტიული დატვირთვის დრო vs. მოლოდინი.

2. 5 ეფექტურობა და ავტომატიზაცია

Auto-Fix Rate - ავტოსატრანსპორტო საშუალებებით/ბოტით გადაჭრილი ინციდენტები.
Runbook Usage - სტანდარტული სცენარების მიხედვით დახურული ალერტების%.
First Contact Resolution (FCR) - დახურვა L1 დონეზე ესკალაციის გარეშე.
Mean Time Between Incidents (MTBI) - დომენის/სლოტის სტაბილურობა.

2. 6 სამართლიანობა და სტაბილურობა

Fair SharIndex არის ღამით/შაბათ-კვირის ერთგვაროვნება ადამიანებისთვის.
Replacement SLA - ჩანაცვლება, რომელიც დადასტურებულია შეცვლამდე 48 საათით ადრე.
Training Coverage არის Shadow Slot- ის ცვლის წილი ონბორდინგისთვის.

2. 7 ბიზნეს თაიგული

SLO Impact Score - რამდენ დროს ინახავდა SLO მწვანე ზონაში.
Revenue at Risk (proxy) - ცვლაში დაკარგული შემოსავლის შეფასება P1/P2- დან.
Partner Latency/Declines არის PSP/KYC პარტნიორების წვლილი ცვლის ინციდენტებში.


3) მონაცემთა მოდელი

3. 1 მოვლენების მარცვალი

shift _ event: დასაწყისი/დასასრული, შემადგენლობა, როლები (IC/CL/L1/L2), რეგიონი, დომენები.
alert _ event: სიგნალი, პრიორიტეტი, მფლობელი, დახურვა, runbook/ავტო მოქმედება.
incident _ event: P1-P4, დრო, IC/CL, სტატუს გამოცემა.
andover _ check: ჩეკის ფურცლის ნიშნები + დეფექტები/კომენტარები.
release _ watch: სათვალთვალო ფანჯრები, კარიბჭეები, ავტო-გამოტოვება.
worklog: პროდუქტიული წუთები (დიაგნოზი, ფიქსაცია, კომფორტი, პოსტ-mortem).
fatigue _ signal: პეიჯების/ღამეების სიხშირე, დამუშავებული საათი.

3. 2 დიაგრამა (გამარტივებული)

Ключи: `timestamp`, `tenant`, `region`, `environment`, `domain`, `role`, `severity`.
შენახვის ვარიანტები: ღონისძიების ტბა (parquet/iceberg) + წინასწარი აგრეგატები DWH/TSDB.
პოლიტიკა PII: მხოლოდ აგრეგატები და ფსევდონიმები; ელექტრონული ფოსტის/ID ნიღბები.


4) მონაცემთა შეგროვება (ETL)

1. ChatOps/bot: ბრძანებები '/handover ', '/incident', '/runbook '- ჟურნალი WORM.
2. ITSM: ინციდენტების/თიკეტების სტატუსები, Var-rums- ის თაიგული.
3. Metrics API: SLI/SLO (auth-success, bet→settle p99, error-rate), KRI (queue lag, PSP declines).
4. დაგეგმვის ცვლა: კალენდარი, ჩანაცვლება, როლები, shadow.
5. CI/CD: გამოშვებები, სათვალთვალო ფანჯრები, მანქანის გამოტოვება.

ETL ნორმალიზდება, დასძენს 'shift _ slot' (Day/Swing/Night), ითვლის დერივირებულ მეტრიკას (MTTA/MTTR, Fair-Share).


5) დაშბორდი

5. 1 Exec (კვირის მიმოხილვა/თვე)

CFR, MTTR, Auto-Fix Rate, SLO Impact, Revenue-at-Risk (proxy).
გადატვირთვის რუკა და დომენები (თერმული).

5. 2 Ops/SRE (ყოველთვიური/ყოველდღიურად)

Real Time პანელი: ღია P1-P4, burn-rate, რიგები/რეპლიკაცია, guardrails.
ჩეკების და დეფექტების სტატუსის ჰენდოვერის რუკა.
Fatigue პანელი: პეიჯი/ადამიანი, ღამე/ადამიანი (ბოლო 4 კვირა), გაფრთხილებები.

5. 3 Team/Domain

MTTA/MTTR დომენის მიხედვით, FCR, Runbook Usage, ესკალაციების წილი L2/L3.
Fair Shari Replacement SLA კონკრეტული გუნდისთვის.


6) ფორმულები და ბარიერები

Coverage Rate = დაფარული საათი/168. მიზანი 99% -ს შეადგენს.
Handover SLA =% ცვლა, სადაც გადაცემა ხორციელდება და შემოწმების სია დახურულია 15 წუთის განმავლობაში (მიზანი 95%).
Pager Fatigue (კვირა) : p95 ალერტა/ადამიანი სამიზნე; გაფრთხილება> p90.
Fair SharIndex = 1 − (ღამით/target _ ღამეები). მიზანი 0. 8.
Auto-Fix Rate არის 40% L1 კვარტლისთვის (მიზანი დამოკიდებულია სიმწიფეზე).
Runbook Usage 70% განმეორებითი ალერტებისთვის (ტოპ 10 სიგნალი).

საკონტროლო ბარათები (X-MR, p-ქარტიები) MTTA/MTTR და Defect Rate; ალერტები საკონტროლო საზღვრებში გასვლისას.


7) ანალიტიკური მეთოდები

ანომალიები: STL/ESD/CUSUMUM ალერტებზე და MTTA/MTTR, აღნიშვნა outlaers და მიზეზები (გამოშვება, პროვაიდერი).
დატვირთვის პროგნოზირება: Prophet/ARIMA ალერტებზე და P1/P2 სლოტზე - FTE დაგეგმვა.
შედეგის ატრიბუტი: პროცესებში ცვლილებების uplift მოდელი (მაგალითად, ახალი hendover შაბლონი) - MTTR.
საკონტროლო ექსპერიმენტები: A/B შიდა პროცესებში (ჩეკის სიის ვერსია, ახალი რუნბოკი).
კოჰორტის ანალიზი: ახალბედა შესრულება (shadow-solo) vs. გამოცდილი.


8) ინტეგრაცია

ინციდენტი-ბოტი: ცვლის მეტრიკის კვარცხლბეკი, იხსენებს არაკეთილსინდისიერ ჰენდოვერს, იწყება რეტრო.
Release პორტალი: გამოშვების ფანჯრებს აკავშირებს დატვირთვის მწვერვალებთან; auto-pause წითელი SLO.
Metrics API: მზა SLO view + exemplars (trace _ id) RCA- სთვის.
HR/PTO: shrinkage ფაქტორები - fair shar- ის დაგეგმვა და ანალიტიკა.


9) პოლიტიკოსები და RACI

Ops Analytics Owner (SRE/Platform): მონაცემთა მოდელი, დაშბორდები, მეტრიკის სიზუსტე.
Service Owners: დომენის სიგნალების ინტერპრეტაცია, გაუმჯობესების გეგმები.
Duty Manager: KPI/KRI ყოველკვირეული ანალიზი, სლოტების ბალანსი.
Compliance/Sec: PII/SoD დაცვა ტელემეტრიასა და მოხსენებებში.
Training Lead: ონბორდის გეგმები ანალიტიკის დასკვნებიდან.


10) არტეფაქტების შაბლონები

10. 1 მეტრიკის კატალოგი (YAML)

yaml apiVersion: ops.analytics/v1 kind: MetricCatalog items:
- id: coverage_rate owner: "SRE"
formula: "covered_hours / 168"
slice: ["region","slot","domain"]
target: ">=0.99"
- id: mtta_p50 owner: "Ops"
formula: "median(ack_ts - alert_ts)"
slice: ["slot","severity","domain"]
target: "<=5m (P1)"
- id: handover_defect_rate owner: "Ops"
formula: "defects / handovers"
target: "<=5%"
- id: pager_fatigue_p95 owner: "SRE"
formula: "p95(alerts_per_person_week)"
target: "<=team_threshold"

10. 2 მოთხოვნის მაგალითი (SQL ერთეული)

sql
SELECT slot, domain,
percentile_cont(0.5) WITHIN GROUP (ORDER BY ack_s-emit_s) AS mtta_p50,
percentile_cont(0.9) WITHIN GROUP (ORDER BY ack_s-emit_s) AS mtta_p90,
AVG(auto_fix)::float AS autofix_rate
FROM alerts_fact
WHERE ts BETWEEN:from AND:to AND severity IN ('P1','P2')
GROUP BY slot, domain;

10. 3 ჩეკის სიის ჰენდოვერი (ხარისხის სიგნალები)

SLO/SLI დანართი

მფლობელებს აქვთ ღია ინციდენტები/ETA

დაგეგმილი სამუშაოები/გამოშვებები დაკავშირებულია

დაფიქსირდა პროვაიდერის რისკები

Comm მონახაზები მზად არიან

კონტაქტები აქტუალურია

Watchlist განახლებულია


11) რისკების მართვა და გაუმჯობესება

KRI: ღამის სლოტზე DLQ/queue-lag ზრდა, FCR <სამიზნე ვარდნა, ინფო დრიფტის ზრდა.
გაუმჯობესების გეგმა: ყოველკვირეული Ops გეგმა მფლობელებთან/ETA- სთან ერთად ტოპ 3 წარუმატებლობისთვის.
დისციპლინის პოსტ-შურისმაძიებელი ცვლა: რეტრო ჰენდოვერებისა და ალერტების დეფექტების შესახებ.
პროცესის A/B: ახალი რეგულაციების გავლენის შემოწმება MTTR/Auto-Fix- ზე.


12) KPI/OKR მაგალითები (კვარტალი)

KR1: MTTR P1 (mediana) 22 წუთიდან 15 წუთამდე.
KR2: Handover SLA - 95% სამ სლოტში.
KR3: Auto-Fix Rate - 45% ტოპ 10 სიგნალის წესებისთვის.
KR4: Pager Fatigue p95 - 20% -ით (ალერტინგის ოპტიმიზაციის შემდეგ).
KR5: Fair-Share Index ≥ 0. 85 ყველა გუნდში.


13) განხორციელების გზის რუკა (6-10 კვირა)

ნვე. 1-2: მოვლენების სქემები, ETL ბოტა/ITSM/Metrics API, პირველი მეტრიკის კატალოგი, ძირითადი დაშბორდები.
ნვე. 3-4: საკონტროლო ბარათები და ბარიერები, fatigue პანელი, handover ხარისხი, გამოშვება.
ნვე. 5-6: დატვირთვის პროგნოზირება (სლოტები/დომენები), სამართლიანი პაკეტი და რეალიზება-ანალიტიკა.
ნვე. 7-8: ავტომობილების რჩევები (რომელი runbooks- ის ავტომატიზაცია), ROI ავტო - ფიქსის მოხსენებები, რეტრო შაბლონები.
ნვე. 9-10: ექსპერიმენტები პროცესებში (A/B ჩეკების ფურცლები), KPI Exec Panels, გუნდების სწავლება.


14) ანტიპატერები

განიხილეთ „ცვლის წარმატება“ მხოლოდ დახურული პიკეტების რაოდენობით (MTTR/SLO კონტექსტის გარეშე).
უგულებელყოფილი დეფექტების უგულებელყოფა („და ეს უკვე გასაგებია“).
მეტრიკი ნორმალიზაციის გარეშე ტრაფიკის მოცულობით/სეზონური მწვერვალებით.
პერსონიფიკაცია და „ადამიანების რეიტინგი“ სირთულის/შეყვანის პირობების გათვალისწინების გარეშე.
სამართლიანი წილის არარსებობა - დაწვა და შეცდომების ზრდა.
ნულოვანი კორელაცია გამოშვებებთან/ექსპერიმენტებთან - ყალბი დასკვნები.
მონაცემები WORM აუდიტის გარეშე და PII პოლიტიკის გარეშე.


შედეგი

სმენისა და შესრულების ანალიტიკა არის ChatOps, ITSM და ტელემეტრიული გაზომვების წარმოების სისტემა: KPI/KRI მკაფიო ტაქსონომია, მონაცემთა სწორი მოდელები, სხვადასხვა როლებისთვის დაშბორდები, სტატისტიკური მეთოდები და კავშირი SLO/ბიზნეს ეფექტთან. ეს მიდგომა აუმჯობესებს დატვირთვას, აჩქარებს რეაქციას, ამცირებს დამწვრობას და პროგნოზირებს iGaming პლატფორმის ოპერაციების ხარისხს.

Contact

დაგვიკავშირდით

დაგვიკავშირდით ნებისმიერი კითხვის ან მხარდაჭერისთვის.ჩვენ ყოველთვის მზად ვართ დაგეხმაროთ!

ინტეგრაციის დაწყება

Email — სავალდებულოა. Telegram ან WhatsApp — სურვილისამებრ.

თქვენი სახელი არასავალდებულო
Email არასავალდებულო
თემა არასავალდებულო
შეტყობინება არასავალდებულო
Telegram არასავალდებულო
@
თუ მიუთითებთ Telegram-ს — ვუპასუხებთ იქაც, დამატებით Email-ზე.
WhatsApp არასავალდებულო
ფორმატი: ქვეყნის კოდი და ნომერი (მაგალითად, +995XXXXXXXXX).

ღილაკზე დაჭერით თქვენ ეთანხმებით თქვენი მონაცემების დამუშავებას.