Ҳисоботҳои саривақтӣ ва аудити SLA
1) Чаро ба мо раванди расмии ҳисоботдиҳӣ лозим аст?
Эътимоди муштариён ва шаффофияти шартнома - як усули ягонаи андозагирӣ, ҳисобҳои такрорӣ.
SLO ва идоракунии хатогиҳои буҷа - алоқамандии далели мавҷудият бо релизҳо ва ҳодисаҳо.
Қарзҳои дурусти SLA формулаҳои объективӣ, пардохтҳои пешбинишаванда/ҷубронпулӣ мебошанд.
Устувории ҳуқуқӣ - асоси далелҳо, аудити мустақил, Холдинги ҳуқуқӣ.
2) Мӯҳлатҳо ва ҳудудҳо
Мавҷудияти SLI - фоизи санҷишҳо/амалиётҳои муваффақ дар як давра.
SLO - ҳадафи дохилӣ (мас. 99. 95% дар 28 рӯз).
SLA - ӯҳдадории беруна (масалан, 99. 9 %/моҳ + қарзҳои хидматрасонӣ).
Равзанаи андозагирӣ - моҳи тақвимӣ (SLA) ва тирезаи ғелонда (SLO).
Ҳаҷм - кадом ҷузъҳо ба ҳисоб дохил карда мешаванд (канор, API, пардохтҳо) ва онҳо нестанд (портали админ, ғайридавлатӣ).
3) Манбаъҳои ҳақиқат (ва вақте ки кадоме масъул аст)
1. Синтетика (қуттии сиёҳ/бе сар) SLI ибтидоӣ барои "дастрасии корбар ба чашм" мебошад.
2. Гузоришҳо/ченакҳо - миқёс ва табиати нокомиро тасдиқ мекунанд.
3. Чорабиниҳои корӣ "муваффақияти муомилот" мебошанд (масалан, пардохти ваколатдор).
4. Саҳифаи вазъ - иртиботи ҷамъиятӣ; бар зидди далелҳои № 1-3 тафтиш карда мешавад.
Дар сурати ихтилофот: афзалият ба синтетика бо кворуми дуруст аз ≥ 2 минтақа дода мешавад.
4) Методологияи ҳисобкунии дастрасӣ
4. 1 Формулаи асосӣ
Availability = Успешные проверки / Все проверки
ErrorBudget = 1 − SLO
Downtime(m) = (1 − Availability) × Длительность_периода(в мин)
4. 2 Кворуми минтақавӣ
Ҳодиса ҳисоб карда мешавад, агар ≥ минтақаҳои мустақили N/ASN ҳамзамон нокомиро сабт кунанд.
Тавсия дода мешавад: N = 2 аз 3 (EU/NA/APAC).
4. 3 намуди SLI
HTTP SLI: kod 2xx/3xx, ниҳонӣ ≤ T.
DNS/TLS SLI: NXDOMAIN/SERVFAIL/мӯҳлати кор.
Бизнеси SLI: муомилоти бомуваффақият/ҳама кӯшишҳо (ба истиснои камбудиҳои муштарӣ).
4. 4 Истисноҳо (ҳуҷҷатгузорӣ)
Тирезаҳои ба нақша гирифташуда пешакӣ N соат эълон карда мешаванд ва мушоҳида карда мешаванд.
Majeure Force аз SLA (масалан, провайдери офатҳои табиӣ IX) - танҳо дар сурати мавҷуд будани далелҳо ва огоҳии оммавӣ.
Хатогиҳо/маҳдудиятҳои муштарӣ (квота зиёд шуд, 4xx).
5) Сиёсати нигоҳдории тиреза
Вақтҳои дар шартнома мувофиқашуда (масалан, Офтоб 02: 00-04: 00 UTC + 0).
'Нигоҳдорӣ = markers ҳақиқӣ дар ҳушёрӣ/панелҳо → хориҷ кардан аз SLI.
Ҳадди огоҳӣ: ҳадди аққал 5 рӯзи корӣ (ё тавре ки дар шартнома).
Аз тиреза - таъсири SLA ба назар гирифта мешавад.
6) Парвандаҳои канорӣ ва қоидаҳои яклухткунӣ
Brownout (қисман таназзул): фоизи нокомиҳоро ҳисоб кунед (вақти вазншуда), на "0/1".
Гузариш: воҳиди ҳадди аққали ҳисоб - фосилаи намуна (масалан, 30-60 сония) + гистерезис (барои: 2-5 дақиқа).
Кашиши соат: ҳама вақт дар UTC ва ISO-8601; Синхронизатсияи NTP.
7) Намунаҳои Prom
Муваффақияти сканкунии HTTP:promql probe_success{job="blackbox-http"} == 1
p95 таъхир:
promql histogram_quantile(0.95, sum by (le, target) (rate(probe_http_duration_seconds_bucket[5m])))
Вақти SLA дар як моҳ (сония):
promql sum_over_time((probe_success==1)[30d]) / (30246060)
Кворуми нокомӣ (минтақа ≥ 2 аз 3 дақиқа):
promql sum by (target) (max_over_time((probe_success==0)[3m])) >= 2
8) Намунаҳои SQL (ҷамъбасти ҳисобот)
Вақти моҳ ва вақти корӣ:sql with checks as (
select target, ts, success -- success: 1/0 from synthetic_checks where ts >=:from and ts <:to
),
agg as (
select date_trunc('month', ts) m, target,
sum(success)::float / count() as availability from checks group by 1,2
)
select m, target, availability,
(1-availability) extract(epoch from (date_trunc('month', m) + interval '1 month' - date_trunc('month', m))) / 60 as downtime_minutes from agg;
Ҳамоҳангсозии саҳифа (Ҳодисаҳо):
sql select a.m, a.target, a.downtime_minutes, s.incident_id, s.start_utc, s.end_utc from monthly_downtime a left join statuspage_incidents s on a.m = date_trunc('month', s.start_utc)
and tstzrange(s.start_utc, s.end_utc) && daterange(a.m, a.m + interval '1 month');
9) Қолаби ҳисоботи ҳармоҳа (ба мизоҷон писанд аст)
yaml period: "2025-10-01..2025-10-31 (UTC)"
services:
- name: "API Edge"
sla: "99.90%"
measured_availability: "99.93%"
downtime:
total: "30m 14s"
windows:
- start: "2025-10-12T03:12Z"
end: "2025-10-12T03:38Z"
impact: "EU+NA, HTTP 5xx spike, p95>2s"
root_cause: "DB connection pool exhaustion"
rca_link: "INC-20251012-0312"
slo_budget:
period_target: "0.10%"
consumed: "0.07%"
- name: "Payments API"
sla: "99.95%"
measured_availability: "99.97%"
summary:
sla_breaches: 0 service_credits: 0 maintenance:
announced: 2 total_duration: "48m"
signatures:
generated_at: "2025-11-01T10:00Z"
report_id: "SLA-2025-10-API"
10) Қарзҳои SLA: ҳисоб ва татбиқ
Ҷадвали қарзҳо: масалан, 99. 0–99. 5% → 5% MRR; 98. 0–99. 0% → 10% ва ғайра.
Ҳақиқӣ: Қарз ҳамчун қайди кредитӣ ба суратҳисоби оянда татбиқ карда мешавад.
Автоматика: "агар 'андозагирии _ мавҷудияти Намоиш барои муштарӣ: корти порталии "SLA balance credits". 11) Аудит, далелҳо ва нигоҳдории ҳуқуқӣ Роҳи аудит: кӣ/чӣ/ҳангоми ҳисоб кардан, версияи методология, чекҳо. 12) Оштӣ бо саҳифаи мақоми давлатӣ Ҳодиса дар саҳифаи мақом бояд ҷадвал ва ҷузъҳо дошта бошад. 13) Ҳодисаҳо ва гузоришҳо Ҳар як равзанаи вақти истироҳат ба корти INC мувофиқат мекунад (ID, SEV, соҳиб, RCA, CAPA). 14) Назорати сифати маълумот Гигиенаи намунаҳо:> 99% пораҳои бомуваффақияти агентҳо, набудани холигоҳҳо> 5 дақиқа. 15) Амният ва махфият TLS/MTLS барои ворид кардан, имзои пакет (HMAC). 16) Панели панелҳо ва виджетҳои SLO (чӣ нишон додан) Дастрасии умумӣ аз рӯи хидмат барои моҳ/семоҳа. 17) Нақшаи амалисозӣ (3 такрорӣ) 1. Модел ва маълумот (2 ҳафта): ислоҳи SLI/SLO/SLA, синтетикаи кворум, ҷамъоварии "ашёи хом" дар DWH. 18) Рӯйхати назорати сифат гузориш диҳед 19) Мини-FAQ Чаро синтетика манбаи асосӣ аст? Деградатсияи қисман чӣ гуна бояд ҳисоб карда шавад? Оё ба ман лозим аст, ки чекҳои "хом" -ро нигоҳ дорам? Ҳисоботҳои саривақтӣ ва аудити SLA "рақам дар охири моҳ" нестанд, балки системаи такрории андозагирӣ, қоидаҳо ва далелҳо: SLI-ҳои дуруст, санҷишҳои кворум, формулаҳои шаффоф, робита бо ҳодисаҳо ва биллинг, назорати истисноӣ ва нигоҳдории ҳуқуқӣ. Методологияро сабт кунед, ҳисобҳо ва кредитҳоро автоматӣ кунед, аудитро нигоҳ доред - ва SLA-ҳои шумо идорашаванда, фаҳмо ва бехатар мешаванд.
Маълумоти хом тағйирнопазир аст (танҳо замима); тасҳеҳ - бо сабтҳои алоҳида.
Нигоҳдории ҳуқуқӣ: ях кардани доираи маълумот (намунаҳо, гузоришҳо, кортҳои ҳодиса, огоҳиҳо).
Бойгонии нусхабардорӣ - WORM/S3 Қулфи объект.
Номутобиқатии вақт/миқёс § аз ҷониби номутобиқатӣ сабт шудааст ва аз ҷониби RCA ҷойгир карда шудааст.
Хулосаи гузориш қисмати қайдҳои мусолиҳаро дар бар мегирад.
Дар ҳисобот: истинод ба INC, сабаби решаи кӯтоҳ, вазъи CAPA.
Барои SEV-1: мавзӯъҳои постмор ≤ 48 соат пас аз пӯшида.
Анти-садо: кворум + бисёр тиреза, debounce.
Намунаи пайгирӣ/сабти ном сабт ва ҳуҷҷатгузорӣ карда мешавад.
Санҷишҳои метод: санҷишҳои воҳиди ҳисобҳо, файлҳои тиллоӣ дар асоси маълумоти таърихӣ.
Нашри PII дар гузоришҳо/гузоришҳо; Гузориши SLA набояд маълумоти шахсиро ифшо кунад.
RBAC/ABAC оид ба ҳисоботҳо; нишонаҳои дастрасӣ ба дафтари аудит навишта мешаванд.
Тирезаҳои вақти корӣ бо шиддатнокӣ ва канали муайянкунӣ.
Хатогии сӯзондани буҷа (зуд/суст) ва тамоюлҳо.
Нашри такрорӣ - шарҳи ҳисобҳо.
Дурнамои қарзҳои SLA - бо тамоюли кунунӣ.
2. Ҳисобкунӣ ва ҳисобот (2-3 ҳафта): формулаҳо, SQL/Prom-QL, қолабҳои YAML/PDF, портали муштариён, қарзҳои худкор.
3. Аудит ва автоматизатсия (3-4 ҳафта): Нигоҳдории ҳуқуқӣ, оштӣ бо саҳифаи мақом, веб-китобҳои имзошуда, қоидаҳои баҳс.
Он ба роҳи корбар наздиктарин аст ва периметри (DNS/CDN/WAF) -ро дар бар мегирад. Нишондиҳандаҳо/гузоришҳо - сабабро равшан кунед.
Вақти вазнин: таносуби нокомӣ × давомнокии тиреза, на "ҳама ё ҳеҷ чиз".
Бале кардам. Барои санҷиш ва ҳисобкунии дубора дар баҳс - хом лозим аст.
Натиҷа