Amallardaky rollar we borçlar
1) Näme üçin rollary resmileşdirmeli?
Rollaryň takyk paýlanyşy MTTA/MTTR-ni peseldýär, "çal zolaklary" ýok edýär, goýberişleri çaltlaşdyrýar we SLO/komplaense laýyklygyny köpeldip bolýar. Rollar = jogapkärçilik + ygtyýarlyklar + interfeýslar (kime ýazýarys, kime eskalasiýa edýäris, haýsy kararlara ygtyýar berilýär).
2) Esasy RACI modeli
R (Responsible) - işi ýerine ýetirýär.
A (Accountable) - jemleýji jogapkärçilik çekýär we kararlary kabul edýär.
C (Consulted) - bilermen, öňünden/wagtynda maslahatlaşýar.
I (Informed) - SLA arkaly habar berilýär.
3) Rollaryň katalogy (düşündirişleri we borçlary)
3. 1 Incident Commander (IC)
Maksady: wakanyň jogabyna ýolbaşçylyk edýär SEV-1/0.
Ygtyýarlyklar: SEV yglan etmek, goýberilişleri doňdurmak, traffigi üýtgetmek, güýçlendirmek.
Esasy wezipeler: timline, karar bermek, ünsi saklamak, wezipeleri paýlamak, Go/No-Go.
Artefaktlar: hadysanyň kartoçkasy, SLA täzelenmeleri, jemleýji AAR.
3. 2 P1/P2 On-Call (Primary/Secondary)
Maksat: ilkinji jogap we tehniki hereketler.
P1: triaj, playbuklary işe girizmek, IC bilen aragatnaşyk.
P2: ekap, çylşyrymly üýtgeşmeler, konteksti saklamak, tupan wagtynda - sabpotlary alýar.
3. 3 SRE / Platform Engineer
Maksat: platforma we periliň ygtybarlylygy (SLO, alertler, GitOps, awtoskeýl, DR).
Wezipeler: SLI/SLO, töwekgelçilik arassaçylygy, progressiw goýberişler, infrastruktura hökmünde kod, capacity, observability.
Waka wagtynda: köküň diagnostikasy, gaýdyşlar/folbekler, degrade-UX goşulýar.
3. 4 Service Owner / Product Owner
Maksat: işewürlik nukdaýnazaryndan hyzmatyň hili.
Wezipeler: SLO/ileri tutulýan ugurlary kesgitlemek, relizleri/penjireleri utgaşdyrmak, Go/No-Go-a gatnaşmak.
Comms: Comms bilen bilelikde müşderilere haçan we näme diýmeli?
3. 5 Release Manager
Maksat: üýtgeşmeleri howpsuz getirmek.
Wezipeler: relizleri orkestrlemek, geýtleriň barlagy, kanareýa/gök-ýaşyl, relizleriň düşündirişleri, wakalarda freeze.
3. 6 CAB Chair / Change Manager
Maksat: üýtgemek töwekgelçiligini dolandyrmak.
Wezipeler: RFC prosesi, meýilnama/backout, gapma-garşylyklaryň senenamasy, ýokary töwekgelçiligi tassyklamak.
3. 7 RCA Lead / Problem Manager
Maksat: Wakadan soňky derňew, CAPA.
Wezipeler: wagt aralygy, subutnama sebäpliligi, hereketleri düzetmek/öňüni almak, gözegçilik D + 14/D + 30.
3. 8 Security (IR Lead, AppSec/CloudSec)
Maksat: howpsuzlyk we howpsuzlyk hadysalaryna jogap bermek.
Wezipeler: triage security-wakalar, açarlaryň aýlanmagy, izolýasiýa, forensika, kadalaşdyryjy habarnamalar, WORM-audit.
3. 9 DataOps / Analytics
Maksat: maglumatlaryň we paýlaýynlaryň ygtybarlylygy.
Wezipeler: täzelik/hil (DQ), maglumat şertnamalary, lineage, bekfilller, SLA BI/hasabatlar.
3. 10 FinOps
Maksady: dolandyrylýan gymmaty.
Wezipeler: kwotalar/çäkler, $/birlik hasabatlary, býudjet geýtleri, optimizasiýalar (log-göwrümler, egress, ätiýaçlyk).
3. 11 Compliance / Legal
Maksady: düzgünleşdirijiniň we şertnamalarynyň berjaý edilmegi.
Wezipeler: habarnamalaryň, retensiýanyň/üýtgewsizligiň möhletleri, köpçülige açyk tekstleri utgaşdyrmak.
3. 12 Support / Comms
Maksady: müşderiler/içerki steýkholderler bilen aragatnaşyk.
Wezipeler: status-sahypa, täzelenmeleriň maketleri, habarlaryň ýygylygy we aýdyňlygy, seslenme ýygylygy.
3. 13 Vendor Manager / Provider Owner
Maksady: daşarky üpjün edijiler bilen gatnaşyklar (PSP/KYC/CDN we ş.m.).
Wezipeler: eskalasiýa, SLA/OLA, ätiýaçlyk ugurlary, penjireleri utgaşdyrmak.
4) Çalşykdaky we güýçlenişdäki rollar
Çalşyk: P1/P2 + IC-of-the-day (P1 bilen birleşdirilmez).
Wagt eskalasiýalary: P1 → P2 (ack bolmazdan 5 minut) → IC (10 minut) → Duty Manager (15 minut).
Quiet Hours: P2/P3 signallary oýanmaýar; Howpsuzlyk signallary - hemişe.
5) Özara gatnaşyk interfeýsleri (kim kim bilen we nädip)
IC Release Manager: freeze/rollback çözgütleri.
IC Comms: täzelenme tekstleri we ýygylygy.
SRE DataOps: SLO-gardraillerde biznes-SLI (tölegleriň üstünligi, maglumatlaryň täzeligi).
Howpsuzlyk Kanuny: howpsuzlyk hadysalary barada habarlar, habarnamalaryň möhletleri.
Vendor Owner IC: üpjün ediji statusy, switchover/folbek.
6) Rollar boýunça KPI
IC: Time-to-Declare, SEV-1/0 boýunça Comms SLA, MTTR berjaý edilýär.
P1/P2: MTTA, Time-to-First-Action, pleýbuklary yzarlamak%.
SRE/Platform: SLO coverage, Alert Hygiene,% awto-yza gaýdyp barmak üstünlikli.
Release Manager: Change Failure Rate, On-time windows, Mean Rollback Time.
RCA Lead: Postmortem Lead Time, CAPA Completion/Overdue, Reopen ≤ 5–10%.
Security: Mean Time to Contain, Secret/Cert Rotation Time.
DataOps: Freshness SLO Adherence, Success Rate Backfills.
Comms: Status Accuracy, Complaint Rate/waka.
FinOps: $/birlik,% Koq tygşytlamak, kwotalaryň berjaý edilmegi.
7) Rol kartoçkalarynyň şablonlary
7. 1 IC kartoçkasy
Role: Incident Commander
Scope: SEV-1/0 (prod)
Decisions: declare SEV, freeze deploy, traffic shift, rollback/failover
Runbooks: rb://core/ic, rb://comms/status
SLA: TTD ≤10m, first comms ≤15m, updates q=15–30m
Escalations: Duty Manager (15m), Exec On-call (30m)
7. 2 Kartoçka P1/P2
Role: Primary/Secondary On-call (service: checkout-api)
Runbooks: rb://checkout/5xx, rb://checkout/rollback
Tools: logs, traces, SLO board, feature flags
SLA: Ack ≤5m, first action ≤10m, handover at shift boundaries
7. 3 Release Manager kartoçkasy
Role: Release Manager
Gates: tests, signatures, active_sev=none, SLO guardrails green 30m
Strategy: canary 1/5/25%, blue-green optional, auto-rollback on burn
Evidence: release annotations, diff configs, dashboards before/after
8) Prosesler we rollaryň gatnaşmagy (gysgaça maglumat)
A — Accountable, R — Responsible, C — Consulted, I — Informed.
9) Çek-listler
9. 1 Rollaryň bellenilmegi
- Her bir roluň eýesi, orunbasary we örtük zolagy bar.
- Ygtyýarlyklar beýan edilýär (haýsy kararlary kabul edip biler).
- Oýun kitaplary we aragatnaşyk kanallary birikdirildi.
- SLA reaksiýasy/coms tarapyndan çap edildi.
- Her hyzmatyň katalogynda (CMDB) bar.
9. 2 Çalşyk we ulanyjy
- Çalşyk kartoçkasy täzelendi (işjeň hadysalar, töwekgelçilikler, penjireler).
- JIT/JEA elýeterliligi barlandy.
- Kanalyň ses habary: "çalşyk kabul edildi/tabşyryldy".
9. 3 Wakadan soňky
- AAR geçirildi, RCA bellendi.
- Eýeler/möhletler bilen CAPA, D + 14/D + 30 gözegçilik.
- Täzelenen oýun kitaplary/alertler/syýasatlar.
10) Anti-patternler
Näbelli "kim karar berýär" → gijikdirmeler we iki gezek tagallalar.
IC P1 bilen birleşdirildi - ýolbaşçylygy ýitirmek.
Legal/Comms bilen ylalaşmazdan köpçülige açyk koms.
Release Manager we geýtsiz goýberiň → CFR ösüşi.
Rollary saklamagyň ýoklugy (kesel/dynç alyş).
"Gahrymançylyk" prosesiň ýerine: el bilen halas edýäris, ýöne gyralary düzetmeýäris.
CMDB/hyzmat katalogynda rollar görkezilmedi → ýiten eskalasiýa.
11) Gurallara goşulmak
ChatOps: команды `/who oncall`, `/declare sev1`, `/freeze`, `/rollback`, `/status update`.
Katalog/CMDB: hyzmatda - eýesi, on-call, SLO, daşbordlar, oýun kitaplary, penjireler bar.
Alert-as-Code: Her sahypada owner we pleýbuk bar.
GitOps: IC/Release çözgütleri relizleriň we bellikleriň düşündirişlerinde görkezilýär.
12) Rollaryň paýlanyşynyň kämillik ölçegleri
Kataloglarda rollaryň coverage: ≥ 100% möhüm hyzmatlar.
On-call SLA: Ack p95 ≤ 5 min; Page Storm p95 gözegçilik astynda.
Postmortem SLA: taslama ≤ 72s; CAPA completion ≥ 85%.
Change governance: RFC/CAB bilen ýokary töwekgelçilikli üýtgeşmeler% ≥ 95%.
Comms: Adherence ≥ 95%, Complaint Rate ↓ QoQ.
13) Kiçi şablonlar
13. 1 Hyzmat üçin RACI (repo faýly)
yaml service: payments-api roles:
owner: team-payments oncall: oncall-payments ic: ic-of-the-day raci:
incident: {A: ic-of-the-day, R: oncall-payments, C: security,data, I: mgmt,comms}
releases: {A: release-manager, R: dev,platform, C: security, I: support}
changes: {A: cab, R: owner, C: sre,security, I: affected-teams}
postmortem: {A: rca-lead, R: owner, C: security,data, I: mgmt}
13. 2 Rol profili (Markdown)
Role: Duty Manager
Purpose: Escalation and SEV-1/0
Powers: Assign ICs, reallocate resources, approve freeze
Inputs: # war-room channel, SLO dashboards, IC reports
Outputs: resolutions, post-factual report, CAPA escalations
14) Jemleýji
Amallar, rollar aç-açan, ygtyýarlyklar bilen üpjün edilende we gurallara ýerleşdirilende durnukly bolýar. Rollaryň katalogy, RACI, her bir rol üçin aýdyň interfeýsler we metrikler hadysalary, goýberişleri we üýtgeşmeleri dolandyrylýan proseslere öwürýär: kararlar çalt kabul edilýär, töwekgelçilikler gözegçilik edilýär we ulanyjylar durnukly hyzmaty görýärler.