Нақшҳо ва масъулиятҳо дар амалиёт
1) Чаро нақшҳоро ба расмият дароред
Тақсимоти нақши возеҳ MTTA/MTTR-ро коҳиш медиҳад, минтақаҳои хокистариро нест мекунад, релизҳоро суръат мебахшад ва SLO/мутобиқатро такроршаванда месозад. Ролҳо = масъулият + мақомот + интерфейсҳо (ба кӣ менависем, ба кӣ афзоиш медиҳем, кадом қарорҳо ваколатдоранд).
2) Модели асосии RACI
Р (Масъул) - корро иҷро мекунад.
A (Ҳисоботдиҳанда) - масъулияти ниҳоиро бар дӯш мегирад ва қарор қабул мекунад.
C (Машварат) - коршинос, пеш аз/дар давоми машварат.
Ман (Маълумот) - аз ҷониби SLA хабар дода шудааст.
3) Феҳристи нақшҳо (тавсифҳо ва масъулиятҳо)
3. 1 Фармондеҳи ҳодиса (IC)
Мақсад: Вокуниш ба ҳодисаи SEV-1/0.
Мақомот: SEV-ро эълон кунед, релизҳоро ях кунед, трафикро иваз кунед, шиддат гиред.
Вазифаҳои асосӣ: ҷадвал, қабули қарорҳо, нигоҳ доштани фокус, тақсимоти вазифаҳо, Go/No-Go.
Артефактҳо: корти ҳодиса, навсозиҳои SLA, AAR ниҳоӣ.
3. 2 P1/P2 Занг задан (ибтидоӣ/миёна)
Ҳадаф: аксуламали аввалия ва амалҳои техникӣ.
P1: триаж, китобҳои бозӣ, иртибот бо IC.
P2: нусхабардорӣ, тағироти мураккаб, нигоҳ доштани контекст, дар тӯфон - зерқиматҳоро мегирад.
3. 3 Муҳандиси SRE/Платформа
Мақсад: эътимоднокии платформа ва релс (SLO, огоҳиҳо, Gitops, autoscale, DR).
Вазифаҳо: SLI/SLO, гигиенаи ҳушдор, релизҳои пешрафта, инфрасохтор ҳамчун рамз, қобилият, мушоҳида.
Ҳангоми ҳодиса: ташхиси решавӣ, рахҳо/пӯшишҳо, таназзули UX фаъол аст.
3. 4 Соҳиби хидмат/соҳиби маҳсулот
Мақсад: сифати хизматрасонӣ ба маънои тиҷорат.
Вазифаҳо: муайян кардани SLO/афзалиятҳо, ҳамоҳангсозии релизҳо/тирезаҳо, иштирок дар Go/No-Go.
Comms: Муайян кардани кай ва чӣ ба муштариён дар баробари Comms.
3. 5 Мудири озодкунӣ
Мақсад: Расонидани тағироти бехатар.
Вазифаҳо: оркестри релизҳо, санҷиши дарвозаҳо, канарӣ/кабуд-сабз, шарҳи релизҳо, яхкунӣ барои ҳодисаҳо.
3. 6 Раиси CAB/Менеҷери тағирот
Мақсад: Тағйир додани идоракунии хатар
Вазифаҳо: Раванди RFC, нақша/бозгашт, тақвими низоъ, тасдиқи хавфи баланд.
3. 7 Роҳбари RCA/Менеҷери мушкилот
Мақсад: таназзули пас аз ҳодиса, CAPA.
Вазифаҳо: ҷадвал, сабабҳои исботшуда, амалҳо барои ислоҳ/пешгирӣ, назорати D + 14/D + 30.
3. 8 Амният (Роҳбари IR, App
Мақсад: Вокуниш ба амният ва ҳодисаҳо.
Вазифаҳо: чорабиниҳои амниятӣ, гардиши калидӣ, ҷудокунӣ, криминалистика, огоҳиномаҳои танзимкунанда, аудити WORM.
3. 9 Маълумот/таҳлил
Мақсад: эътимоднокии маълумот ва қубурҳо.
Вазифаҳо: тару тоза/сифат (DQ), шартномаҳои маълумот, насл, бозгашт, SLA BI/ҳисоботҳо.
3. 10 FIN
Мақсад: арзиши идорашаванда.
Вазифаҳо: квотаҳо/маҳдудиятҳо, ҳисоботҳо $/воҳид, дарвозаҳои буҷа, оптимизатсия (ҳаҷми вуруд, egress, фармоиш).
3. 11 Мувофиқат/Ҳуқуқӣ
Мақсад: риояи танзим ва шартнома.
Вазифаҳо: шартҳои огоҳӣ, нигоҳдорӣ/тағйирнопазирии далелҳо, ҳамоҳангсозии матнҳои оммавӣ.
3. 12 Дастгирӣ/Comms
Мақсад: иртибот бо муштариён/ҷонибҳои манфиатдори дохилӣ.
Вазифаҳо: саҳифаи вазъ, масхарабозии навсозиҳо, басомад ва возеҳии паёмҳо, ҷамъоварии фикру мулоҳизаҳо.
3. 13 Менеҷери фурӯшанда/Соҳиби провайдер
Мақсад: муносибат бо провайдерҳои беруна (PSP/KYC/CDN ва ғайра).
Вазифаҳо: шиддат, SLA/OLA, хатсайрҳои эҳтиётӣ, ҳамоҳангсозии тиреза.
4) Нақшҳо дар баст ва шиддат
Shift: P1/P2 + IC-of-рӯз (бо P1 якҷоя нашавед).
Афзоиши вақт: P1 → P2 (5 дақиқа бе акк) → IC (10 дақиқа) → Менеҷери навбатӣ (15 дақиқа).
Соатҳои хомӯш: сигналҳои P2/P3 бедор намешаванд; сигналҳои амниятӣ - ҳамеша.
5) Интерфейси робитаҳо (ки бо кӣ ва чӣ гуна)
Менеҷери барориши IC ↔: қарорҳои яхкунӣ/бозгашт.
IC ↔ Comms: навсозии матнҳо ва басомад.
SRE ↔ Маълумотҳо: бизнеси SLI (муваффақияти пардохт, тозагии маълумот) дар SLO-гардолудҳо.
Амният ↔ ҳуқуқӣ: гузоришҳо дар бораи ҳодисаҳои амниятӣ, давраҳои огоҳӣ.
Соҳиби фурӯшанда ↔ IC: мақоми провайдер, гузариш/folback.
6) KPI аз рӯи нақш (нишондиҳандаҳо)
IC: Вақт ба эъломия, мувофиқати Comms SLA, MTTR аз ҷониби SEV-1/0.
P1/P2: MTTA, Time-to-First-Action,% пайравӣ аз китобҳои бозӣ.
SRE/Платформа: фарогирии SLO, Alert Hygiene,% автомобилҳо бомуваффақият.
Менеҷери озодкунӣ: Меъёри нокомӣ, тирезаҳои саривақтӣ, вақти миёнаи бозгашт.
Роҳбари RCA: Вақти пешбари Постмортем, Анҷоми CAPA/Overdue, Reopen ≤ 5-10%.
Амният: Вақти миёнаи нигоҳ доштан, вақти гардиши махфӣ/сертификатсия.
Маълумот: Риояи SLO Freshness, Сатҳи муваффақият.
Comms: Дақиқии вазъ, сатҳи шикоят/ҳодиса.
Финҳо: $/воҳид, пасандозҳои% QOQ, риояи квота.
7) Қолабҳои корти нақш
7. 1 Корти IC
Role: Incident Commander
Scope: SEV-1/0 (prod)
Decisions: declare SEV, freeze deploy, traffic shift, rollback/failover
Runbooks: rb://core/ic, rb://comms/status
SLA: TTD ≤10m, first comms ≤15m, updates q=15–30m
Escalations: Duty Manager (15m), Exec On-call (30m)
7. 2 корти P1/P2
Role: Primary/Secondary On-call (service: checkout-api)
Runbooks: rb://checkout/5xx, rb://checkout/rollback
Tools: logs, traces, SLO board, feature flags
SLA: Ack ≤5m, first action ≤10m, handover at shift boundaries
7. 3 Барориши корти менеҷер
Role: Release Manager
Gates: tests, signatures, active_sev=none, SLO guardrails green 30m
Strategy: canary 1/5/25%, blue-green optional, auto-rollback on burn
Evidence: release annotations, diff configs, dashboards before/after
8) Равандҳо ва иштироки нақшҳо (хулоса)
A - Ҳисоботдиҳанда, R - Масъул, C - Машварат, I - Маълумот.
9) Рӯйхати санҷишҳо
9. 1 Таъини нақшҳо
- Ҳар як нақш соҳиби, ивазкунанда ва минтақаи фарогирӣ дорад.
- Ваколатномаҳо (кадом қарорҳо метавонанд қабул карда шаванд) тавсиф карда мешаванд.
- Китобҳои бозӣ ва пайвандҳо.
- SLA-ҳои нашршуда бо аксуламал/comms.
- Нақш дар CMDB барои ҳар як хидмат дастрас аст.
9. 2 Shift ва таҳвил
- Навсозии корти Shift (ҳодисаҳои фаъол, хатарҳо, тирезаҳо).
- Дастрасии JIT/JEA тасдиқ карда шуд.
- Паёми Эхо ба канали "тағирот қабул/қабул карда шуд".
9. 3 Ҳодисаи пас аз ҳодиса
- AAR гузаронида шуд, RCA таъин карда шуд.
- CAPA бо соҳибон/мӯҳлатҳо, назорати D + 14/D + 30.
- Китобҳои нав/огоҳиҳо/сиёсатҳо.
10) Анти-намунаҳо
Маълум нест, ки "кӣ қарор медиҳад" → талошҳоро ба таъхир меандозад ва такрор мекунад.
IC дар якҷоягӣ бо P1 - аз даст додани роҳбарӣ.
Супоришҳои ҷамъиятӣ бидуни мувофиқа бо Legal/Comms.
Озодкунӣ бидуни Менеҷери Релиз ва дарвозаҳо → афзоиши CFR.
Бе фармоиши нақш (беморӣ/рухсатӣ).
"Қаҳрамонон" ба ҷои ин раванд: мо дастӣ наҷот медиҳем, аммо релизро ислоҳ намекунем.
Нақшҳо дар Каталоги CMDB/Service инъикос карда намешаванд
11) Ҷобаҷогузорӣ ба асбобҳо
Чатҳо: команды '/ки oncall ', '/эълон сев1', '/ях кардан ', '/бозгашт', '/навсозӣ '.
Директория/CMDB: хидмат соҳиби, занг, SLO, панели панелҳо, дафтарҳои бозӣ, тирезаҳо мебошад.
Alert-as-Code: Ҳар як саҳифа соҳиби ва дафтарчаи пешфарз мебошад.
Gitops: Қарорҳои IC/Release дар эзоҳҳо ва чиптаҳо инъикос карда мешаванд.
12) Нишондиҳандаҳои камолоти тақсимоти нақш
Фарогирии нақшҳо дар феҳристҳо: ≥ 100% хидматҳои муҳим.
SLA-и занг: Ack p95 ≤ 5 дақ; Саҳифаи Storm p95 таҳти назорат аст.
Postmortem SLA: лоиҳаи ≤ 72h; Анҷоми CAPA ≥ 85%.
Идоракунии тағирот:% тағироти хавфи баланд бо RFC/CAB ≥ 95%.
Comms: Риояи 95%, Меъёри шикоят QOQ.
13) Қолабҳои мини
13. 1 RACI барои хидмат (файл дар репо)
yaml service: payments-api roles:
owner: team-payments oncall: oncall-payments ic: ic-of-the-day raci:
incident: {A: ic-of-the-day, R: oncall-payments, C: security,data, I: mgmt,comms}
releases: {A: release-manager, R: dev,platform, C: security, I: support}
changes: {A: cab, R: owner, C: sre,security, I: affected-teams}
postmortem: {A: rca-lead, R: owner, C: security,data, I: mgmt}
13. 2 Профили нақш (Markdown)
Role: Duty Manager
Purpose: Escalation and SEV-1/0
Powers: Assign ICs, reallocate resources, approve freeze
Inputs: # war-room channel, SLO dashboards, IC reports
Outputs: resolutions, post-factual report, CAPA escalations
14) Сатри поён
Амалиётҳо ҳангоми шаффофият, тавонмандӣ ва асбобҳо мустаҳкам мебошанд. Феҳристи нақшҳо, RACI, интерфейсҳои дақиқ ва ченакҳо барои ҳар як нақш ҳодисаҳо, релизҳо ва тағиротро ба равандҳои идорашаванда табдил медиҳанд: қарорҳо зуд қабул карда мешаванд, хатарҳо назорат карда мешаванд ва корбарон хидмати устуворро мебинанд.