GH GambleHub

Amallar we Dolandyryş → Metrikleri we SLA barlagy

Metrleriň we SLA barlaglary

1) Bu näme üçin zerur?

Metrikler nädogry bolsa, kararlar nädogry bolar, SLA "kagyz ýüzünde" bozular ýa-da tersine problemalary gizlär. Metrleriň we SLA-nyň barlagy ulanyjylaryň we hyzmatdaşlaryň öňünde wadalaryň deňeşdirilmegini, ygtybarlylygyny we kanuny taýdan goralmagyny kepillendirýär.

Maksatlar:
  • Ýeke-täk "hakykat çeşmesini" (SSOT) we köpeldilýän hasaplamalary üpjün etmek.
  • Daşbordlaryň/hasabatlaryň/billingiň arasyndaky tapawudy azaltmak.
  • SLA-ny başarnykly we barlanylýan et (evidence-based).
  • Ölçeglerdäki zaýalanmalary hyzmatlardaky ýaly ir ýüze çykarmak.

2) Jogapkärçiligiň esasy düşünjeleri we çäkleri

Metrik (metrika): ölçelýän ululyk (RPS, p95, CR, GGR, Success Rate).
KPI/OKR: Metrikler baglanan maksatlar.
SLO: hyzmatyň maksatly hili (mysal üçin "p99 ≤ 400 ms 99. 9% wagt").
SLA: daşarky wada; kanuny taýdan möhüm, SLO esaslanýar.
OLA: toparlaryň/satyjylaryň arasyndaky içerki şertnama, SLA-ny goldaýar.
SSOT: Maglumatlary hasabatlar üçin salgylanma hasaplanýan ulgam/ammar.

3) Metrikleriň taksonomiýasy (gatlaklar)

1. Infrastruktura: CPU/Memory/IO/Net, pod/düwünler, HPA/VPA.
2. Platforma: nobatlar/akymlar (lag, throughput), BD/keşler (konnektler, hit), API (p95/p99, 5xx).
3. Iş akymlary: goýumlar/netijeler, nyrhlar, oýunlaryň başlamagy, ygtyýarnama, KYC.
4. Önüm/marketing: öwrümler, ARPPU/LTV, kampaniýalar.
5. Prosesleriň hili: MTTA/MTTR, Change Failure Rate, çek sahypalaryny ýapmak.

Düzgün: her metrikada gatlak, eýesi we formula bolmaly.

4) Maglumatlaryň çeşmeleri we "hakykat"

Teleemetriýa onlaýn: Prometheus/OTel, Logy (ELK/ClickHouse), Tracking.
Wakalar we buhgalteriýa: Kafka/Outbox, DWH/data-mart (BigQuery/ClickHouse).
El artefaktlary: postmortemler, barlaglar, hadysalaryň sanawy.
Daşarky sanawlar: üpjün edijileriň hasabatlary (PSP/KYC/studiýalar), billing.

Gapma-garşylygy çözmek: "online vs DWH" gapma-garşylygy ýüze çykan halatynda ileri tutulýan düzgün hereket edýär (mysal üçin, SLA üçin - çeşmesi yzarlanylýan DWH agregatlary).

5) Metrikleri barlamak prosesi (dolandyryş kontury)

1. Inwentar: metrikler/SLO/SLA katalogy (ady, eýesi, gatlagy, formulasy, çeşmesi, hasaplama ýygylygy).
2. Formulalary barlamak: SQL/senagat soraglaryny kesgitleme bilen deňeşdirmek (hasaplamalaryň unit-synaglary).
3. Samplirlemek we gaýtadan barlamak: wakalaryň/bloglaryň setirlerini saýlamak we el bilen deňeşdirmek.
4. Konturlary deňeşdirmek: onlaýn daşbordlary we DWH hasabatlaryny deňeşdirmek.
5. Üýtgeşmelere gözegçilik etmek: shemalar/logika goýberilende formulalaryň seslenmegi.
6. SLA barlagy: gurnamalaryň we kadadan çykmalaryň dogrulygyny barlamak (planned maintenance, fors-major).
7. Hasabat we gowulaşmalar: ýüze çykarylan tapawutlaryň we möhletler bilen fiksleriň sanawy.

6) Kesgitlemeler we formulalar (nusgalar)

Success Rate (API):
  • `success = requests - (5xx + timeouts + circuit_open)`
  • `success_rate = success / requests`
Latency p95/p99:
  • SSOT-da ýekeje penjire kesgitlemesi (5m/1h rolling) we agregasiýa (HDR/TDigest) ýazylýar.
SLO (mysal):
  • 'SLO _ availability _ month = (_ iş wagty - rugsat edilýän _ kadadan çykmalar )/umumy _ wagt'
SLA (üpjün ediji üçin mysal):
  • `SLA_month = 99. UTC penjiresi boýunça aptaýmyň 90% -i, tranzit operatorlarynda ýüze çykýan betbagtçylyklary subut edýän meýilleşdirilen penjireleri (T-48 habarnamany) hasaba almazdan (resminamalary). "

7) Maglumatlaryň hili: barlaglar we alertler

Hil barlagy:
  • Полнота (completeness): `received_events / expected_events ≥ 0. 99`.
  • Öz wagtynda (timeliness): ýüklemek gijikdirmesi ≤ N minut.
  • Özboluşlylyk (uniqueness): açarlar boýunça goşa bolmazdan (idempotency-key).
  • Ylalaşylyk (consistency): jemi/walýuta/alamatlar.
  • Çyzykly (monotonicity): Hasaplaýjylar "aýlanmaýar".
Ölçegleriň (pikirleriň) hili üçin alertler:

ALERT MetricsIngestionLagHigh
IF dwh_ingest_lag_minutes > 15 FOR 10m

ALERT EventsCompletenessDrop
IF (events_received / events_expected) < 0. 99 FOR 15m

ALERT DuplicateEventsSpike
IF rate(events_duplicates_total[10m]) > baseline_7d 2

8) SLA/OLA barlagy: usulyýet

1. Kadadan çykmalar senenamasyny ýygnaň: meýilleşdirilen penjireler, ylalaşylan pese gaçmalar, wendorlaryň hereketleri.
2. Apteými hasaplamak: SSOT-a esaslanýan ýeke-täk wagt zolagy boýunça.
3. Wakalar bilen deňeşdirme: wagt, biletler, postmortemler.
4. Atributiýa: öz şowsuzlyklary, üpjün ediji, tranzit, DDoS, kadalaşdyryjy işler.
5. SLA perimetri: ulanyjy tejribesi (E2E) vs bir aýratyn API.
6. Hasabat: aý/çärýek boýunça hasabat: hakykat, gyşarmalar, öwezini dolmalar (eger ulanylsa), düzediş çäreleri.

9) Hasaplaşyklaryň köpeldilmegini barlamak

Formulalaryň wersiýasy: SQL/PromQL/doc-spesifikasiýalary bolan Git-repozitorium.
Birlik-metrik synaglar: synthetic data (edge-cases: pass, dubli, senäniň çäkleri).
Data lineage: Dashborddan başlangyç tablisalara we wakalara.
Snapshotlar: gaýtadan hasaplamalary deňeşdirmek üçin maglumatlary kesmek üçin doňdurmak.

10) Gözegçilik nusgalary (sampling)

Her gün: Esasy akymlar boýunça 10-20 waka (depozit/stawka/KUS) - DWH marşrutyny el bilen barlamak.
Her hepde: 1% agregatlar boýunça "online vs DWH" deňeşdirmek üçin sampl.
Her aý: SLA effektli hadysalaryň toplumy - jikme-jik rekonstruksiýa.

Saýlama akt şablony (gysgaça):

Date/Window: 2025-10-01.. 2025-10-07
Metric: SLO_api_p99
Source A: Prometheus (rolling 5m)
Source B: DWH snapshot (1h buckets)
Deviation: + 6. 2% (A above B)
Reason: different aggregation windows
Action: align window in both contours to 5m/rolling
Term/Owner: 2025-11-10/squad-observability

11) Daşbordlaryň we duýduryşlaryň barlagy

Metrikleriň bitewi sözlügi: sözlük göni daşbordda.
Relizleriň/wakalaryň düşündirişleri: gyşarmalaryň sebäbini görmek üçin.
"Çykmazdan öň/soň" deňeşdirme: awtomatiki regressiýa panelleri.
Dubli/tapawutlar: "iki dürli p99" - formulalary/penjireleri düzetmek.
Panelleriň elýeterliligi: hukuklar, ätiýaçlyk, salgylanmalara/wersiýalara gözegçilik.

12) Metriklerdäki üýtgeşmeleri dolandyrmak

RFC prosesi: formulanyň/penjiräniň/çeşmäniň üýtgemegi - SLA/hasabatlara täsirine baha bermek bilen RFC arkaly.
Göçmek "expand → migrate → contract": iki wersiýany wagtlaýyn alyp barýarys, deňeşdirýäris, soň köne wersiýany öçürýäris.
Aragatnaşyklar: "täze usul boýunça" gymmatlyklaryň üýtgemegi barada önüme/işe öňünden habar bermek.

13) iGaming/fintech aýratynlyklary

Islegiň iň ýokary derejesi: metrikler partlaýjy ýüklere çydamaly (agregasiýalar "ýapyşmaýar").
Üpjün edijiler: SLA wendorlaryň OLA baglydyr → olaryň hasabatlaryny, hadysalaryň ýagdaýyny we kwotalaryny saklamak.
Bahasy: 'cost _ per _ 1k _ calls' we 'üstünlik bahasy' - hökmany paneller.
Antifrod/töwekgelçilik: metrikanyň gijikdirilmegine we "ýalan işlemegine" duýgurlyk.

14) Auditiň daşbordlary (iň az toplum)

Metrics Health: completeness/timeliness/duplicates, ingest-lag, ошибки ETL.
SLO/SLA Evidence: hasaplanan SLO, hakyky SLA, kadadan çykmalar, hadysalara/hereketlere salgylanmalar.
Online vs DWH Compare: p95/p99/Success Rate, gyşarmalar we tendensiýalar.
Vendor SLA: üpjün edijiler boýunça uptime/kwotalar/taým-autlar/bahasy.
Release Impact: çyzgylar/açylandan soň metrikleriň regressiýasy.

15) Auditiň çek-sanawy (amal)

  • Eýeleri we formulalary bolan metrikler/SLO/SLA katalogy möhümdir.
  • SSOT her hasabat/panel üçin kesgitlenildi.
  • Formulanyň unit-synaglary ýaşyl, hasaplamalaryň paýlaýjylary resminamalaşdyrylýar.
  • Maglumatlaryň hili üçin aladalar işjeňdir (completeness/timeliness/duplicates).
  • "Online vs DWH" ≤ rugsat edilýän çäk tapawudy (mysal üçin ≤ 2%).
  • SLA-nyň ylalaşylan kadadan çykmalary resminamalaşdyryldy we hasabata goşuldy.
  • Gözegçilik nusgalary geçirildi we aktlar düzüldi.
  • Formuladaky ähli üýtgeşmeler RFC we migrasiýadan geçdi.

16) Mysallar (bölekler)

PromQL - p99-dan öň/soň deňeşdirme:

api_p99_ms:release:ratio =
(api_latency_p99_ms{release="after"} / api_latency_p99_ms{release="before"})
SQL - Wakalaryň dolulygyna gözegçilik:
sql
SELECT event_date,
COUNT() AS received,
SUM(expected_count) AS expected,
COUNT()::decimal / NULLIF(SUM(expected_count),0) AS completeness
FROM events
JOIN expected_events USING (event_date, event_type)
WHERE event_type IN ('deposit','bet_placed','kyc_completed')
AND event_date BETWEEN:from AND:to
GROUP BY 1;
Alertmanager düzgüni - konturlaryň tapawudy:

ALERT DwhVsOnlineDrift
IF abs(dwh_kpis{metric="api_p99"} - online_kpis{metric="api_p99"}) > 0. 02 online_kpis
FOR 30m
LABELS {severity="warning", team="observability"}

17) Anti-patternler

Dürli panellerde "bir" metrikanyň iki dürli formulasy.
Göçmezden we habarnamasyz metrikany üýtgetmek - OKR/SLA-da "bökmek".
Lokal Excel hasabatlary "hakykat" hökmünde (dikeldip bolmaýar).
SLA hasaplamalarynda wagt zolaklaryny we senenamalary garyşdyrmak.
SLA-nyň kadadan çykmalary dokumentleşdirilmeýär.
Ölçegleriň hili barada hiç hili alert ýok.

18) Ölçegleriň kämillik KPI

Drift Rate Online, DWH (maksat ≤ 2%).
Metrics Health Uptime (ingest/ETL degradasiýasyz wagt).
Time-to-Fix Formula (formuladaky ýalňyşlygy düzetmek wagty).
SLA Dispute Rate (hyzmatdaşlar bilen jedelli ýagdaýlaryň ýygylygy).
Coverage SLO/SLA (resmi suratlandyrylan SLO/SLA bilen kritiki ýollaryň paýy).

19) Rollar we jogapkärçilik

Metrikanyň/hyzmatyň eýesi: formula, çeşme, daşbord, alertler.
Observability/SRE: SSOT/platforma, formula synaglary, maglumatlaryň hiliniň aladalary.
Data/BI: DWH, hasabatyň gaýtalanmagy, lineage.
Aklawçylar/hyzmatdaş-dolandyryjylar: SLA-şertnamalar we kadadan çykmalar.
Waka dolandyryjysy: SLA bilen hadysalaryň atributy we baglanyşygy.

20) Çalt başlamak (30 gün)

1-nji hepde: Metrikleri/SLO/SLA we eýelerini sanamak; SSOT bellemek.
2-nji hepde: Maglumat hiliniň aladalaryny we "Online vs DWH" panelini açyň.
3-nji hepde: Gözegçilik nusgalaryny geçirmek, p95/p99 penjiresini tekizlemek.
4-nji hepde: formulalar üçin RFC prosesini resmileşdirmek, programmalar bilen aýlyk SLA hasabatyny taýýarlamak.

21) FAQ

Q: SLA üçin SSOT näme hasaplamaly?
A: Göçürip bolýan hasaplamalar (DWH) we doly çyzykly ammar; onlaýn paneller - hukuk namalary üçin däl-de, operatiw gözegçilik üçin.

Q: "iki p99" bilen nähili göreşmeli?
A: Metrikler katalogynda penjiräni/agregasiýa usulyny düzetmek, panelleri göçürmek, süýşmek üçin aladalary goşmak.

Q: Meýilleşdirilen işleri nädip göz öňünde tutmaly?
A: Kadadan çykmalar senenamasyny ýöretmek we olary şertnamanyň düzgünleri boýunça awtomatiki usulda SLA-dan aýyrmak; tassyklaýjy artefaktlary saklamak.

Contact

Biziň bilen habarlaşyň

Islendik sorag ýa-da goldaw boýunça bize ýazyp bilersiňiz.Biz hemişe kömek etmäge taýýar.

Telegram
@Gamble_GC
Integrasiýany başlamak

Email — hökmany. Telegram ýa-da WhatsApp — islege görä.

Adyňyz obýýektiw däl / islege görä
Email obýýektiw däl / islege görä
Tema obýýektiw däl / islege görä
Habar obýýektiw däl / islege görä
Telegram obýýektiw däl / islege görä
@
Eger Telegram görkezen bolsaňyz — Email-den daşary şol ýerden hem jogap bereris.
WhatsApp obýýektiw däl / islege görä
Format: ýurduň kody we belgi (meselem, +993XXXXXXXX).

Düwmäni basmak bilen siz maglumatlaryňyzyň işlenmegine razylyk berýärsiňiz.