Amallar we Dolandyryş → Öndürijilik metrikleri
Öndürijilik ölçegleri
1) Näme üçin öndürijilik metrikleri gerek?
Öndürijilik, ulgamyň berlen bahada jogap wagty we geçiriş ukyby boýunça maksatly SLO-lary üpjün etmek ukybydyr. Metriksiz mümkin däl:- hadysalara çenli pese gaçmagy ýüze çykarmak,
- kuwwatyny we býudjetini çaklamak,
- alternatiw çözgütleri deňeşdirmek (keş vs BD, gRPC vs REST),
- çykarylandan soň regressiýalary dolandyrmak.
Ýörelgeler: metrikleriň ýeke-täk sözlügi, persentiller boýunça agregasiýa (p50/p90/p95/p99), "gyzgyn" we "sowuk" ýollaryň aýratyn hasaby, kontekst (wersiýa, sebit, üpjün ediji, enjam).
2) Metrikleriň taksonomiýasy
2. 1 Esasy SRE çarçuwalary
Dört altyn signal: Latency, Traffic, Errors, Saturation.
RED (mikroservisler üçin): Rate, Errors, Duration.
USE (demir üçin): Utilization, Saturation, Errors.
2. 2 Derejeler
Infrastruktura: CPU, RAM, disk, tor, konteýnerler, düwünler.
Platforma/Hyzmatlar: API-endpointler, nobatlar, nagt pullar, DB, wakalaryň tekerleri.
Müşderi tejribesi: Web Vitals, ykjam SDK, akym, CDN.
Maglumat platformasy: ETL/ELT, akymlar, penjireler, BI gijikdirmeler.
Iş taýdan möhüm flowlar: ygtyýarnama, KYC, goýumlar/tölegler, oýun-tapgyrlar.
3) Esasy metrikleriň we formulalaryň katalogy
3. 1 API we mikroservisler
RPS (Requests per second).
Latency p50/p95/p99 (ms) - has gowusy "end-to-end" we "backend-only".
Error Rate (%) = 5xx + tassyklanan 4xx/ähli soraglar.
Saturation: workerleriň nobatynyň ortaça uzynlygy, "in-flight" soraglary.
Cold Start Rate (FaaS üçin).
Throttling/Dropped Requests.
SLO mysal: p95 latency ≤ 250 ms EU-Gündogar sebitinde RPS-den 2k-a çenli; ýalňyşlyklar ≤ 0. 5%.
3. 2 Maglumat bazalary
QPS/Transactions/s, avg/median query time, p95 query time.
Lock Waits / Deadlocks, Row/Index Hit Ratio, Buffer Cache Miss%.
RepLag (replikasiýa), Checkpoint/Flush time, Autovacuum lag.
Hot Keys/Skew - ýüki boýunça iň ýokary açarlar.
"Ýadro soraglary" formulasy: QPS/ vCPU_core_count → şardlamak üçin signal.
3. 3 Nagt we CDN
Hit Ratio (%), Evictions/s, Latency p95, Item Size percentiles.
Origin Offload (%) для CDN, TTFB, Stale-while-revalidate hit%.
3. 4 Nobatlar/akymlar
Ingress/egress msg/s, Consumer Lag (habarlar/wagt), Rebalance rate.
Processing Time p95, DLQ Rate.
3. 5 Infrastruktura/konteýnerler
CPU Utilization %, CPU Throttle %, Run Queue length.
Memory RSS/Working Set, OOM kills, Page Faults.
Disk IOPS/Latency/Throughput, Network RTT/ retransmits.
Node Saturation: pods pending, pressure (CPU/Memory/IO).
3. 6 Web-müşderi (UX)
Core Web Vitals: LCP, INP, CLS.
TTFB, FCP, TTI, Resource Timing (DNS, TLS, TTFB, download).
Error Rate (JS), Long Tasks, SPA route change time.
CDN Geo-Latency.
3. 7 Jübi müşderisi
App Start time (cold/warm), ANR rate, Crash-free sessions %.
Network round-trips/session, Payload size, Battery drain/session.
Offline success rate (kesilen amallar).
3. 8 Data-platforma we hasabat
Freshness Lag (T-now → витрина), Throughput rows/s, Job Success %.
Cost per TB processed, Skew partiýa, Late events%.
BI Time-to-Render p95 esasy daşbordlar üçin.
3. 9 Domen-kritiki flow (iGaming mysal hökmünde)
Auth p95, KYC TTV (Time-to-Verify), Deposit/Withdrawal p95.
Game Round Duration p95, RNG call latency, Provider RTT p95.
Payment PSP success rate, Chargeback investigation SLA.
4) Kadalaşma, persentil we atributiýa
Orta agyrylara garşy: p50/p90/p95/p99 düzedýäris - orta agyrylary ýumşadýar.
Kesmeler: programmanyň wersiýasy, sebit, üpjün ediji, tor kanaly (4G/Wi-Fi), enjam.
Baglanyşyk: sebäp-netije zynjyrlary üçin "backend-only" we "real-user" metrikalaryny baglanyşdyrýarys.
Exemplars/Traces: ekstremal ýüzleri yzarlamalar bilen baglanyşdyrýarys.
5) Bosagalar we alertler (takmynan tor)
Latency p95 (core API): warning> 250 ms, critical> 400 ms 5 min yzly-yzyna.
Error rate: warning > 0. 5%, critical> 2% (global däl).
DB RepLag: warning > 2 s, critical > 10 s.
Kafka consumer lag (time): warning > 30 s, critical > 2 min.
Web LCP (p75): warning > 2. 5 s, critical > 4 s.
Mobile ANR: warning > 0. 5%, critical > 1%.
ETL Freshness: warning > +15 min, critical > +60 min от SLA.
Statiki + uýgunlaşdyryjy bosagalary (möwsümliligi, gündelik şablonlary), hyzmatlara/goýberişlere görä aldawçylaryň toparlanmagyny we toparlanmagyny ulanýarys.
6) Öndürijiligi barlamak
Görnüşleri: baseline, stres, uzyn (soak), bulam-bujar (degrade links/PSP).
Ýükleýiş profilleri: hakyky söwdalar (distribution-based), "burstlar", sebit pikleri boýunça.
Maksatlar: maksatly RPS we mix amallarynda SLO-ny gazanmak, backpressure-i tassyklamak.
Geçiş ölçegleri: Throughput, Error%, p95 latency, GC arakesmeleri, CPU throttle, queue lag, cost/run.
Regressiýa düzgüni: p95 deň profil bilen> 10% hasam erbetleşmese we haýyşyň bahasy (CPU-ms/haýyş)> 15% ýokarlanmasa, goýbermek üstünlikli hasaplanýar.
7) Kuwwaty meýilleşdirmek we bahasy/öndürijiligi
Demand model: RPS sagatlar boýunça × ortaça iş/haýyş (CPU-ms, IO-ops).
Headroom: 30-50% möhüm ýollar üçin ätiýaçlyk, P95 boýunça awto-skaling.
Cost KPIs: Cost per 1k requests, Cost per GB served, $ per 1 p. p. LCP gowulaşmak.
Keş/denormalizasiýa: "cache ROI" = (CPU-ms tygşytlamak − keş bahasy).
Ýyly we sowuk sebitler: CDN/edge-de offload, "diňe okamak" göçürmesi.
8) Gözegçilik etmek we profillemek tejribesi
Yzarlamalar: ähli hop 'lar arkaly paýlanan trace-ID; akylly sempleme (tail-based).
Metrikler: Prometheus/OpenTelemetry, atlaryň we bellikleriň ýeke-täk belligi.
Logi: trace/span boýunça korrelasiýa bilen, budget log-ses, redaktirleme PII.
Profiller: CPU/Heap/Alloc/Lock profiles, üznüksiz profillemek (eBPF).
Nusga nusgalary: p99 partlamalary span/SQL/PSP-koll bilen baglanyşdyrýarys.
9) Relizleriň we toparlaryň ölçegleri (doly bolmagy üçin)
DORA: Deployment Frequency, Lead Time, Change Failure Rate, MTTR.
SPACE: kanagatlanma, öndürijilik, işjeňlik, aragatnaşyk, netijelilik.
Bu metrikler demir hakda däl, ýöne öndürijiligiň durnuklylygyna gönüden-göni täsir edýär.
10) Anti-patternler
Orta yzarlamak: p95/p99 äsgermezlik etmek.
"Global" error rate: agyryly endpointleri gizleýär.
Wersiýalar boýunça atributsyz: müşderiniň regressiýalaryny tutmak mümkin däl.
Alert-spam: gisterezissiz we möwsümliligiň düzedilmegi.
"Kör" optimizasiýasy: profilleriň we ýollaryň ýoklugy.
UX we backend latency garyşyk: müşderiniň tejribesi boýunça nädogry netijeler.
11) Çek-listler
Metrikleriň bitewi standartı
- Formulalar, birlikler, eýeler bilen metrik sözlük
- Hökmany çap p50/p90/p95/p99
- Trace-korrelasiýa we log-korrelasiýa
- Bellikler: sebit, wersiýa, üpjün ediji, enjam, tor kanaly
- Histerezis we de-duplikasiýa bilen çäkler
Çykmazdan ozal
- Bazline p95/p99 steýjada we önümçilikde
- Kanar traffigi + A/B metrlerini deňeşdirmek
- Çalt yza gaýdyp gelýän baýdak
- Gözegçilik meýilnamasy (observability runbook)
Yzygiderli
- Iň haýal N soraglarynyň/SQL
- Nagt syýasaty we TTL barlagy
- Freshness we DB replikasiýalaryny barlamak
- Daşarky üpjün edijileriň zaýalanma synaglary (PSP, KYC)
12) Kiçi pleýbuklar (mysal)
Pese gaçmak p95/api/payments
1. PSP-iň error% we daşarky wagtlaryny barlaň.
2. Kollbekleriň consumer lag nobatlaryny barlaň.
3. p99 trace mysallaryna göz aýlamak: SQL/HTTP dar ýeri?
4. Maglumat kitaplarynyň/çäkleriniň kesşini açyň, N + 1 azaldyň.
5. Býudjet: workeriň serişdelerini wagtlaýynça 20% ýokarlandyrmak, awtoscale-i goşmak.
6. Post-fix: indeks (psp_id, status, created_at), retrai-jitter.
DB-de RepLag ösüşi
1. "Agyr" haýyşlary we uzyn amallary barlaň.
2. Replikasiýa parallelligini ulalt, checkpoint sazla.
3. Okamagy/replikalary diňe okamaga goýberiň.
4. Iň ýokary penjirelerde - bölekleýin denorm + batchi.
13) formula/SQL mysallary (ýönekeýleşdirilen)
Error Rate
sql
SELECT endpoint,
100. 0 SUM(CASE WHEN status >= 500 THEN 1 ELSE 0 END) / COUNT() AS error_pct
FROM http_logs
WHERE ts >= now() - interval '5 minutes'
GROUP BY 1
HAVING COUNT() > 500;
Latency p95 (TDigest/Approx)
sql
SELECT endpoint, approx_percentile(latency_ms, 0. 95) AS p95_ms
FROM http_metrics
WHERE ts >= date_trunc('hour', now())
GROUP BY 1;
Consumer Lag (wagt)
sql
SELECT topic, consumer_group,
max(produced_ts) - max(consumed_ts) AS lag_interval
FROM stream_offsets
GROUP BY 1,2;
Web LCP p75
sql
SELECT approx_percentile(lcp_ms, 0. 75) AS lcp_p75
FROM web_vitals
WHERE country = 'UA' AND device IN ('mobile','tablet')
AND ts >= current_date;
14) Daşbordlara we hasabatlylyga goşulmak
KPI kartoçkalary: p95 latency, error%, RPS, WoW/DoD trendleri bilen saturation.
Top-N "iň erbet" endpointler/SQL/çeşmeleri, basylýan drill-down → trace.
Müşderiniň wersiýalarynyň baglanyşygy: grafa "wersiýa → p95 LCP/INP → öwrülişik".
Dünýä kartasy: geo-latency (CDN), PSP latency sebitler boýunça.
SLO paneli: SLO-da wagtyň paýy, SLO-dan uçuşlar, "ýalňyşlyklaryň býudjeti".
15) Netijeler
Öndürijilik metrikleri ulgamlaýyn düzgün-nyzam: bir sözlük, burç, atributiýa, gowy gözegçilik we berk SLO. Tehniki (gizlinlik, laglar, kesh-hitler) we önüm signallaryny (KYC wagty, p95, LCP) birleşdirip, tejribäniň hilini we gowşuryş bahasyny dolandyrýarsyňyz - öňünden aýdyp bolar we ulalyp bolar.