Амалиётҳо ва → Нишондиҳандаҳои Идоракунии Идоракунӣ
Нишондиҳандаҳои иҷро
1) Чаро ченакҳои иҷро
Иҷрои ин қобилияти система барои таъмин намудани SLO-ҳои мақсаднок дар вақти посух ва интиқол бо арзиши додашуда мебошад. Бе ченак ғайриимкон аст:- таназзулро пеш аз ҳодисаҳо ошкор кунед,
- иқтидор ва буҷаро пешгӯӣ кунед,
- алтернативаҳоро муқоиса кунед (кэш vs DB, GRPC vs REST),
- идоракунии регрессияи пас аз озодкунӣ.
Принсипҳо: луғати ягонаи ченакҳо, ҷамъбасти фоизҳо (p50/p90/p95/p99), баҳисобгирии алоҳида барои роҳҳои "гарм" ва "хунук", контекст (версия, минтақа, провайдер, дастгоҳ).
2) Таксономияи ченакҳо
2. 1 Чаҳорчӯбаҳои асосии SRE
Чор сигнали тиллоӣ: Таъхир, трафик, хатогиҳо, қаноатмандӣ.
RED (барои microservices): Нарх, хатогиҳо, давомнокӣ.
ИСТИФОДА (барои сахтафзор): Истифодабарӣ, қаноатмандӣ, хатогиҳо.
2. 2 Сатҳҳо
Инфраструктура: CPU, RAM, диск, шабака, контейнерҳо, гиреҳҳо.
Платформа/Хидматҳо: Нуқтаҳои ниҳоии API, навбатҳо, кэшҳо, пойгоҳи додаҳо, автобусҳои чорабинӣ.
Таҷрибаи муштариён: Web Vitals, SDK-ҳои мобилӣ, ҷараён, CDN.
Платформаи маълумот: ETL/ELT, ҷараёнҳо, мағозаҳо, таъхири BI.
Ҷараёни муҳими тиҷорат: авторизатсия, KYC, пасандозҳо/пардохтҳо, даври бозӣ.
3) Феҳристи ченакҳои асосӣ ва формулаҳо
3. 1 API ва microservices
RPS (Дархостҳо дар як сония).
Latency p50/p95/p99 (ms) - беҳтараш "ба охир" ва "танҳо ақиб".
Меъёри хатогӣ (%) = 5xx + 4xx тасдиқшуда/ҳамаи дархостҳо.
Қаноатмандӣ: Дарозии миёнаи навбати коргарон, дархостҳои парвоз.
Меъёри оғози сард (барои FAA).
Тротлинг/Дархостҳои партофташуда.
Мисоли SLO: таъхири p95 ≤ 250 ms бо RPS то 2k дар минтақаи ИА-Шарқӣ; хатогиҳо ≤ 0. 5%.
3. 2 Пойгоҳи додаҳо
QPS/Амалиётҳо/s, вақти дархости avg/median, вақти дархости p95.
Қулфи интизорӣ/қаторҳо, таносуби сатр/индекси хит, мисси кэши буферӣ%.
Replag (нусхабардорӣ), нуқтаи назоратӣ/вақти оббозӣ, ақибмонии Autovacuum.
Калидҳои гарм/Skew - калидҳои боло N аз рӯи сарборӣ.
Формулаи "Дархостҳои асосӣ": QPS/ vCPU_core_count → сигнал барои шарора.
3. 3 Кэш ва CDN
Таносуби хит (%), кӯчдиҳӣ/с, Latency p95, фоизи андозаи ашё.
Origin Offload (%) dlya CDN, TTFB, Stale-will-revalidate hit%.
3. 4 Навбатҳо/ҷараёнҳо
Ingress/egress msg/s, Lag Consumer, Сатҳи тавозун.
Вақти коркард p95, меъёри DLQ.
3. 5 Инфраструктура/зарфҳо
Истифодаи CPU%, CPU Throttle%, Дарозии Run Queue.
Хотираи RSS/Маҷмӯи корӣ, OOM мекушад, Хатогиҳои саҳифа.
IOPS/Latency/Интиқол, Шабака RTT/retransmits.
Сатри гиреҳ: пойҳои интизорӣ, фишор (CPU/Memory/IO).
3. 6 Мизоҷи веб (UX)
Vitals Core Web: LCP, INP, CLS.
TTFB, FCP, TTI, Вақти захираҳо (DNS, TLS, TTFB, зеркашӣ).
Меъёри хатогӣ (JS), Вазифаҳои дароз, вақти тағир додани масири SPA.
CDN Geo-Latency (фоиз).
3. 7 Муштарии мобилӣ
Вақти оғози барнома (хунук/гарм), сатҳи ANR, ҷаласаҳои бидуни садама%.
Сафарҳои шабакавӣ/сессия, андозаи сарборӣ, резиши батарея/сессия.
Сатҳи муваффақияти офлайнӣ.
3. 8 Платформаи маълумот ва ҳисобот
Ақибмонии тару тоза (T-now → vitrina), сатрҳо/ҳо, муваффақияти кор%.
Арзиши як бемории сил коркард шудааст, Skew аз ҷониби ҳизб, Чорабиниҳои дер%.
BI Time-to-Render p95 барои панелҳои калидӣ.
3. 9 Ҷараёни интиқодӣ-домейнҳо (IGaming ҳамчун намуна)
Auth p95, KYC TTV (Вақт барои санҷиш), амонат/бозхонди p95.
Давомнокии даври бозӣ p95, таъхири занги RNG, провайдери RTT p95.
Сатҳи муваффақияти PSP пардохт, тафтишоти Chargeback SLA.
4) Нормализатсия, фоизҳо ва атрибутсия
Фоизҳо нисбат ба ҳисоби миёна: ислоҳи p50/p90/p95/p99 - ба ҳисоби миёна дарди қуллаи ҳамворро ҳамвор кунед.
Қисматҳо: версияи барнома, минтақа, провайдер, канали шабака (4G/Wi-Fi), дастгоҳ.
Таносуб: мо ченакҳои "backend-танҳо" ва "real-user" -ро барои занҷирҳои сабабӣ мепайвандад.
Намунаҳо/Нишонаҳо: фоизҳои шадидро бо нишонаҳо мепайвандад.
5) Ҳудудҳо ва огоҳиҳо (шабакаи тахминӣ)
Latency p95 (аслии API): огоҳӣ> 250 мс, интиқодӣ> 400 мс 5 дақиқа дар як саф.
Сатҳи хатогӣ: огоҳӣ> 0. 5%, интиқодӣ> 2% (нуқтаи ниҳоӣ, на ҷаҳонӣ).
DB Replag: огоҳӣ> 2 с, интиқодӣ> 10 с.
Қафои истеъмолкунандаи Кафка (вақт): огоҳӣ> 30 с, интиқодӣ> 2 дақ.
Веб LCP (p75): огоҳӣ> 2. 5 с, интиқодӣ> 4 с.
ANR мобилӣ: огоҳӣ> 0. 5%, интиқодӣ> 1%.
ETL Тару тоза: огоҳӣ> + 15 дақиқа, интиқодӣ> + 60 дақиқа ott SLA.
Мо ҳадди статикӣ + мутобиқшавиро (мавсимӣ, намунаҳои рӯз), ихтисор ва гурӯҳбандии огоҳиҳоро тавассути хидматҳо/релизҳо истифода мебарем.
6) Санҷиши иҷро
Намудҳо: ибтидоӣ, стресс, дарозмуддат (шустан), бетартибӣ (пайвандҳои таназзул/PSP).
Профилҳои сарборӣ: барои амалиёти воқеӣ (тақсимот), "таркишҳо", қуллаҳои минтақавӣ.
Ҳадафҳо: Дастовардҳои SLO бо RPS-и мақсаднок ва амалиётҳои омехта, тасдиқи бозгашт.
Нишондиҳандаҳои иҷро: Интиқол, Хатогӣ%, таъхири p95, таваққуфи GC, дроссели CPU, ақибмонии навбат, арзиш/давидан.
Қоидаи регрессия: озодкунӣ бомуваффақият ҳисобида мешавад, агар p95 таназзул наёбад> 10% бо профили баробар ва арзиши дархост (CPU-ms/дархост)> 15% зиёд нашудааст.
7) Банақшагирии қобилият ва нарх/нишондиҳанда
Модели талабот: RPS соат ба соат × кор/дархости миёна (CPU-ms, IO-ops).
Хона: 30-50% маржа барои роҳҳои муҳим, миқёси худкор аз ҷониби P95.
Арзиши KPI: Арзиши як дархости 1к, Арзиши як ГБ хизмат мекунад, $1 p. p. такмили LCP.
Кэшинг/denormalization: хонед "кэш ROI" = (пасандозҳои CPU-ms − арзиши кэш).
Минтақаҳои гарм ва хунук: ба CDN/канор бор кунед, танҳо нусхабардории хондан.
8) Амалияи мушоҳида ва профил
Нишонаҳо: микроэлементҳои тақсимшуда дар тамоми теппаҳо; интихоб интеллектуалӣ аст (ба дум асос ёфтааст).
Андозагирӣ: Prometheus/OpEN Telemetry, нотаҳои ягонаи номҳо ва тамғакоғазҳо.
Гузоришҳо: бо таносуби пайгирӣ/дарозӣ, буҷа барои сабти садо, таҳрири PII.
Профилҳо: Профилҳои CPU/Heap/Alloc/Lock, профилҳои доимӣ (e
Намунаҳои намуна: пардаи p99-ро бо занги мушаххас/SQL/PSP пайваст кунед.
9) Нишондиҳандаҳои озодкунӣ ва гурӯҳӣ (барои пуррагӣ)
DORA: Басомади густариш, вақти пешбар, тағир додани сатҳи нокомӣ, MTTR.
SPACE: қаноатмандӣ, иҷро, фаъолият, иртибот, самаранокӣ.
Ин ченакҳо дар бораи оҳан нестанд, балки ба устувории иҷро бевосита таъсир мерасонанд.
10) Анти-намунаҳо
Нишондиҳандаҳои миёна: нодида гирифтани p95/p99.
Сатҳи хатогии "глобалӣ": нуқтаҳои дардоварро пинҳон мекунад.
Бидуни ишора бо версияҳо: дастгир кардани регрессияи муштариён ғайриимкон аст.
Спам ҳушдор: ҳудудҳои бидуни гистерезис ва ислоҳи мавсимӣ.
Оптимизатсияи нобино: баҳо додан ё пайгирӣ кардан нест.
Омезиши UX ва таъхири ақиб: хулосаҳои нодуруст аз таҷрибаи муштариён.
11) Рӯйхати санҷишҳо
Стандарти ягонаи метрикӣ
- Луғати ченакҳо бо формулаҳо, воҳидҳо, соҳибон
- Фоизҳои ҳатмӣ p50/p90/p95/p99
- Таносуби пайгирӣ ва таносуби сабти ном
- Барчаспҳо: минтақа, версия, провайдер, дастгоҳ, канали шабака
- Ҳудудҳо бо гистерезис ва такрорӣ
Пеш аз нашр
- Базаи p95/p99 дар саҳна ва prod
- Трафики канарӣ + муқоисаи метрикии A/B
- Хусусияти парчами зуд
- Дафтарчаи мушоҳидаҳо
Мунтазам
- Slowest Top N Query/Шарҳи SQL
- Сиёсати кэши аудиторӣ ва TTL
- Санҷиши тару тоза ва такрори пойгоҳи додаҳо
- Санҷишҳои таназзули провайдери беруна (PSP, KYC)
12) Китобҳои мини бозӣ (мисол)
Таназзул p95/api/пардохтҳо
1. Хатогии% ва PSP- ро санҷед.
2. Ҷамъоварии навбатҳои ақибмонии истеъмолкунандагонро санҷед.
3. Намоиши p99 намунаҳо аз пайгирии мушкилии SQL/HTTP?
4. Феҳрист/маҳдудияти кэшро фаъол созед, N + 1-ро кам кунед.
5. Буҷа: захираҳои коргаронро муваққатан 20% афзоиш медиҳад, автоскаларо дар бар мегирад.
6. Post-fix: индекс аз рӯи (psp_id, ҳолат, created_at), retray-jitter).
Афзоиши Replag дар DB
1. Дархостҳои "вазнин" ва муомилоти дарозро санҷед.
2. Мувофиқати репликатсияро зиёд кунед, нуқтаи назоратро танзим кунед.
3. Хомӯш кардани кэш/нусхаи танҳо барои хондан.
4. Дар тирезаҳои қуллаҳо - қисман denorm + маҷмӯаҳо.
13) Намунаҳои формулаҳо/SQL (соддакардашуда)
Меъёри хатогӣ аз рӯи нуқтаи ниҳоӣ
sql
SELECT endpoint,
100. 0 SUM(CASE WHEN status >= 500 THEN 1 ELSE 0 END) / COUNT() AS error_pct
FROM http_logs
WHERE ts >= now() - interval '5 minutes'
GROUP BY 1
HAVING COUNT() > 500;
Таъхир p95 (TD iest/Тақрибан)
sql
SELECT endpoint, approx_percentile(latency_ms, 0. 95) AS p95_ms
FROM http_metrics
WHERE ts >= date_trunc('hour', now())
GROUP BY 1;
Ақибмонии истеъмолкунандагон (вақт)
sql
SELECT topic, consumer_group,
max(produced_ts) - max(consumed_ts) AS lag_interval
FROM stream_offsets
GROUP BY 1,2;
Веб LCP p75
sql
SELECT approx_percentile(lcp_ms, 0. 75) AS lcp_p75
FROM web_vitals
WHERE country = 'UA' AND device IN ('mobile','tablet')
AND ts >= current_date;
14) Ҷойгиркунӣ дар панели панелҳо ва ҳисобот
Кортҳои KPI: таъхири p95, хатогии%, RPS, пуррагӣ бо тамоюлҳои Wo
Нуқтаҳои Top N "бадтарин "/SQL/захираҳо, пайгирии пармакунии clickable → пайгирӣ.
Коррелятсияи версияи муштарӣ: сутуни "версияи → p95 LCP/INP → табдилдиҳӣ".
Харитаи ҷаҳонӣ: geo-latency (CDN), таъхири PSP аз рӯи минтақа.
Панели SLO: ҳиссаи вақт дар SLO, суқути SLO, "буҷаи хато".
15) Натиҷаҳо
Нишондиҳандаҳои иҷро як интизоми системаҳо мебошанд: луғатҳои ягона, фоизҳо, атрибутсия, мушоҳидаҳои хуб ва SLO-ҳои қатъӣ. Бо омезиши техникӣ (ниҳонӣ, ақибмонӣ, хитҳои кэш) ва сигналҳои маҳсулот (вақти KYC, пасандози p95, LCP), шумо сифати таҷриба ва арзиши таҳвили онро - пешгӯишаванда ва миқёспазир идора мекунед.