GH GambleHub

Аналитика өзгөрүүлөр жана аткаруу

1) Максаты жана баалуулугу

Смена аналитикасы - бул 24 × 7 операцияларын башкарууну алдын ала айтууга боло турган өлчөө системасы: SLO камтылышын тастыктайт, тар жерлерди (түнкү слотторду, ашыкча жүктөлгөн домендерди) аныктайт, күйүп кетүүнү алдын алат жана хендоверлердин сапатын жогорулатат. iGaming үчүн бул түздөн-түз депозиттер/сеттл ылдамдыгына таасир этет, KYC/AML-шарттары жана кадыр-баркы.


2) Метриктердин таксономиясы

2. 1 камтуу жана даяр

Coverage Rate - толук курамы менен саат% (ролу/домен/аймак боюнча).
On-Call Readiness - дайындалган IC/CL жана валиддик байланыштар менен сменалардын үлүшү.
Handover SLA - өткөрүп терезе сактоо (10-15 мин) жана чек тизмеси.

2. 2 жооп жана калыбына келтирүү ылдамдыгы

MTTA/MTTR (Day/Swing/Night уячалары боюнча, домендер боюнча): медиана, p90.
Detection Lead - SLI-деградация менен биринчи аракеттин ортосундагы артта.
Post-Release Monitoring Time - иш жүзүндө чыгаруу байкоо.

2. 3 Сапаттуу которуу

Handover Defect Rate - чек тизмесинин толтурулбаган пункттары.
Info Drift - вар-рум, ITSM жана статус-каналдын ортосундагы фактылардын айырмачылыгы.
Action Carryover - ээси/ETA жок "көчүп" милдеттердин үлүшү.

2. 4 Жүк жана чарчоо

Pager Fatigue: alertov/адам/жума, түнкү пейдж, P1/адам/нөөмөт.
Escalation Density: L2/L3 жеткен окуялар үлүшү (L1 runbook-фикстер каршы).
Idle vs. Busy Ratio: жемиштүү жүктөө убактысы vs. күтүү.

2. 5 натыйжалуулугу жана автоматташтыруу

Auto-Fix Rate - auto/бот менен чечилген окуялар.
Runbook Usage - стандарттык жагдайлар боюнча жабык Алерт%.
Биринчи байланыш Resolution (FCR) - эскалация жок L1 деъгээлинде жабуу.
Mean Time Between Incidents (MTBI) - домен/слоттун туруктуулугу.

2. 6 Адилеттүүлүк жана туруктуулук

Fair-Share Index - адамдар боюнча түн/дем алыш бир калыпта.
Replacement SLA - 48 саат ≥ тастыкталган алмаштыруу.
Training Coverage - онбординг үчүн shadow-slot менен сменалардын үлүшү.

2. 7 Бизнес байланыш

SLO Impact Score - SLOну жашыл зонада канча убакытка алмаштырды.
Revenue at Risk (прокси) - нөөмөттө P1/P2 кеткен кирешени баалоо.
Partner Latency/Declines - PSP/KYC өнөктөштөрүнүн сменалык окуяларга кошкон салымы.


3) Маалыматтар модели

3. 1 Окуялардын даны

shift_event: башталышы/аягы, курамы, ролдору (IC/CL/L1/L2), аймак, домендер.
alert_event: сигнал, артыкчылык, ээси, жабуу, runbook/auto жардам.
incident_event: P1-P4, убакыт, IC/CL, статус-жарыялоо.
handover_check: чек барактын белгилери + кемчиликтер/комментарийлер.
release_watch: байкоо терезелери, гейтс, авто-спот.
worklog: өндүрүмдүү мүнөттөр (диагностика, фикстер, комм-апдейттер, пост-мортем).
fatigue_signal: Пейджер/түн жыштыгы, иштеген саат.

3. 2 Схема (жөнөкөйлөштүрүлгөн)

Ключи: `timestamp`, `tenant`, `region`, `environment`, `domain`, `role`, `severity`.
сактоо параметрлери: окуя lake (parquet/iceberg) + DWH/TSDB алдын ала агрегаттар.
PII саясаты: агрегаттар жана псевдонимдер гана; e-mail/ID жашыруу.


4) Маалыматтарды чогултуу (ETL)

1. ChatOps/бот: командалар '/handover ', '/incident', '/runbook '→ WORM журналы.
2. ITSM: инциденттердин/билеттердин статусу, вар-румдар менен байланыш.
3. Metrics API: SLI/SLO (auth-success, bet→settle p99, error-rate), KRI (queue lag, PSP declines).
4. Смена пландоочу: календарлар, алмаштыруулар, ролдор, shadow.
5. CI/CD: релиздер, байкоо терезелер, auto-rolls.

ETL нормалдаштырат, 'shift _ slot' (Day/Swing/Night) кошот, derived-метриканы эсептейт (MTTA/MTTR, Fair-Share).


5) Дашборд

5. 1 Exec (жума/ай карап чыгуу)

CFR, MTTR, Auto-Fix Rate, SLO Impact, Revenue-at-Risk (proxy).
Слотторду жана домендерди ашыкча жүктөө картасы (жылуулук).

5. 2 Ops/SRE (ай сайын/күн сайын)

Real-Time Panel: ачык P1-P4, burn-rate, кезек/репликация, guardrails.
Чек тизмеси жана кемчиликтер статусу Хендовер-карта.
Fatigue панели: пейджи/адам, түн/адам (акыркы 4 жума), эскертүү.

5. 3 Team/Domain

MTTA/MTTR домен, FCR, Runbook Usage, L2/L3 боюнча эскалациялардын үлүшү.
Белгилүү бир команда үчүн Fair-Share жана Replacement SLA.


6) Формулалар жана босоголор

Coverage Rate = капталган саат/168. Максаты ≥ 99%.
Handover SLA =% которуу аткарылган жана чек тизмеси 15 мин ≤ жабылган сменалар (95% ≥ максаты).
Pager Fatigue : p95 alert/адам ≤ максаттуу; эскертүү> p90.
Fair-Share Index = 1 − (σ түн/ target_ночей). Максаты ≥ 0. 8.
Auto-Fix Rate ≥ 40% чейрек үчүн L1 (максаты жетилген көз каранды).
Runbook Колдонмо ≥ 70% кайталанган Алерт үчүн (Top 10 сигналдар).

MTTA/MTTR жана Defect Rate үчүн контролдук карталар (X-MR, p-charts); контролдук чектен чыкканда алерталар.


7) Аналитикалык ыкмалар

Аномалиялар: STL/ESD/CUSUM Алерт жана MTTA/MTTR, Outlaers белгилөө жана себептери (релиз, провайдер).
жүктү алдын ала: Prophet/ARIMA Алерт жана слот P1/P2 → FTE пландаштыруу.
Натыйжанын атрибуциясы: процесстердеги өзгөрүүлөрдүн uplift модели (мисалы, жаңы hendover шаблон) → MTTR.
Control Experiments: A/B ички процесстерде (чек тизмесинин варианты, жаңы runbook).
Когорт талдоо: үйрөнчүктөрдүн аткаруу (shadow → solo) ж.б. тажрыйбалуу.


8) Интеграция

Окуя-бот: нөөмөт метрикасын постит, жабык хендоверди эске салат, ретро башталат.
Release-портал: жүк чокулары менен релиздик терезелерди байланыштырат; кызыл SLO менен auto-pause.
Metrics API: RCA үчүн даяр SLO + exemplars (trace_id).
HR/PTO: кыскартуу факторлору (shrinkage) → пландаштыруу жана аналитика fair-share.


9) Саясат жана RACI

Ops Analytics Owner (SRE/Platform): маалыматтар модели, dashboard, тактык метрика.
Service Owners: домендик сигналдарды чечмелөө, жакшыртуу пландары.
Duty Manager: жума сайын талдоо KPI/KRI, уячалардын балансы.
Compliance/Sec: телеметрия жана отчеттордо PII/SoD сактоо.
Training Lead: аналитиканын корутундусунан онбординг пландары.


10) Артефакттардын үлгүлөрү

10. 1 Метриканын каталогу (YAML)

yaml apiVersion: ops.analytics/v1 kind: MetricCatalog items:
- id: coverage_rate owner: "SRE"
formula: "covered_hours / 168"
slice: ["region","slot","domain"]
target: ">=0.99"
- id: mtta_p50 owner: "Ops"
formula: "median(ack_ts - alert_ts)"
slice: ["slot","severity","domain"]
target: "<=5m (P1)"
- id: handover_defect_rate owner: "Ops"
formula: "defects / handovers"
target: "<=5%"
- id: pager_fatigue_p95 owner: "SRE"
formula: "p95(alerts_per_person_week)"
target: "<=team_threshold"

10. 2 суроо-мисал (SQL-агрегат)

sql
SELECT slot, domain,
percentile_cont(0.5) WITHIN GROUP (ORDER BY ack_s-emit_s) AS mtta_p50,
percentile_cont(0.9) WITHIN GROUP (ORDER BY ack_s-emit_s) AS mtta_p90,
AVG(auto_fix)::float AS autofix_rate
FROM alerts_fact
WHERE ts BETWEEN:from AND:to AND severity IN ('P1','P2')
GROUP BY slot, domain;

10. 3 Хендовер чек тизмеси (сапат сигналдары)

SLO/SLI отчет тиркелет

Ачык окуялар ээлери бар/ETA

Пландаштырылган иштер/релиздер байланыштуу

Провайдердик тобокелдиктер

Комм-долбоорлор даяр

On-call байланыштар актуалдуу

Watchlist жаңыланды


11) Тобокелдиктерди жана жакшыртууларды башкаруу

KRI: DLQ/queue-лагдын түнкү уячага өсүшү, FCR кулашы <максаттуу, Info Drift.
Жакшыртуунун планы: ээлери менен жумалык Ops-план/ETA топ 3 ийгиликсиз.
Пост-мортем нөөмөт дисциплинасы: хендоверлердин кемчиликтери жана алерттердин флаппинги боюнча ретро.
Процессуалдык A/B: MTTR/Auto-Fix боюнча жаңы регламенттердин таасирин текшерүү.


12) KPI/OKR мисалдар (чейрек)

KR1: MTTR P1 (медиана) ↓ 22 мин 15 мин чейин.
KR2: Handover SLA ≥ 95% үч уячада.
KR3: Auto-Fix баасы ≥ 45% жогорку 10 сигналдык эрежелер үчүн.
KR4: Pager Fatigue p95 ↓ 20% (Алертинг оптималдаштыруу кийин).
KR5: Fair-Share Index ≥ 0. 85 бардык командаларда.


13) Жол картасы киргизүү (6-10 жума)

Нед. 1-2: окуялар схемалары, боттун ETL/ITSM/Metrics API, метриканын биринчи каталогу, негизги дашборддор.
Нед. 3-4: контролдук карталар жана босоголор, fatigue-panel, handover-сапаты, релиздер менен байламта.
Нед. 5-6: жүктү алдын ала (Slots/домендер), fair-Share жана replacement-аналитика.
Нед. 7-8: auto сунуштар (кандай runbooks автоматташтыруу), ROI auto fix отчеттор, retro шаблондору.
Нед. 9-10: Exec панелдер боюнча тажрыйба (A/B чек барактар), KPI, команда окутуу.


14) Антипаттерндер

"Өзгөрүүнүн ийгилиги" жабык билеттердин саны боюнча гана эсептелет (MTTR/SLO контекстисиз).
Хендовер-кемчиликтерге көңүл бурбоо ("ансыз деле түшүнүктүү").
Traffic көлөмү/сезондук чокулары нормалдаштыруу жок Metrics.
Персонификация жана "адамдардын рейтинги" татаалдыкты/кирүү шарттарын эске албаганда.
Жок fair-share → чарчоо жана каталардын өсүшү.
Релиздер/эксперименттер менен нөлдүк корреляция → жалган корутундулар.
WORM аудит жана PII саясаты жок маалыматтар.


Жыйынтык

Сменалардын жана өндүрүмдүүлүктүн аналитикасы - бул ChatOps, ITSM жана телеметриянын үстүнөн өлчөө системасы: так KPI/KRI таксономиясы, туура маалымат моделдери, ар кандай ролдор үчүн дашборддор, статистикалык ыкмалар жана SLO/бизнес эффектиси менен байланыш. Бул ыкма жүктөрдү теңдейт, реакцияны тездетет, чарчоону азайтат жана iGaming платформасынын операцияларынын сапатын алдын ала жакшыртат.

Contact

Биз менен байланышыңыз

Кандай гана суроо же колдоо керек болбосун — бизге кайрылыңыз.Биз дайым жардам берүүгө даярбыз!

Интеграцияны баштоо

Email — милдеттүү. Telegram же WhatsApp — каалооңузга жараша.

Атыңыз милдеттүү эмес
Email милдеттүү эмес
Тема милдеттүү эмес
Билдирүү милдеттүү эмес
Telegram милдеттүү эмес
@
Эгер Telegram көрсөтсөңүз — Emailден тышкары ошол жактан да жооп беребиз.
WhatsApp милдеттүү эмес
Формат: өлкөнүн коду жана номер (мисалы, +996XXXXXXXXX).

Түшүрүү баскычын басуу менен сиз маалыматтарыңыздын иштетилишине макул болосуз.