SOP: <амали зуд/ҳадаф>
Стандартикунонии тартиботи амалиётӣ
1) Чаро ба шумо лозим аст
SOP ширкати "ОС-и амалиётӣ" мебошад. Стандартизатсия бетартибӣ ва "услубҳои инфиродӣ" -ро аз байн мебарад, MTTR-ро коҳиш медиҳад, садоҳо ва садамаҳоро ҳушдор медиҳад, дар киштӣ суръат мебахшад ва натиҷаҳоро дубора интишор мекунад.
Вазифаҳо:- Тағйирёбии амалҳоро дар ҳодисаҳо ва реҷаҳо коҳиш диҳед.
- Омӯзишро суръат бахшед ва сифати дастгоҳҳоро беҳтар кунед.
- Равандҳоро аудиторӣ кунед: аудит, ченакҳо, такмили маълумот.
- Риояи талаботи меъёрӣ ва дохилиро таъмин намояд.
2) Принсипҳои стандартизатсия
1. Формати ягона ва истилоҳот. Як notation, як таъриф (SLO, ETA, Соҳиб).
2. Амал, на энсиклопедия. Танҳо қадамҳои тасдиқшаванда, меъёрҳои муваффақият ва бозгашт.
3. Шохаи ҳадди аққал. Ба ҷои freewheling ҳалли худро тоза кунед.
4. Версия ва моликият. Ҳар як SOP соҳиби, версия ва санаи таҷдиди назар мебошад.
5. Интегратсия бо асбобҳо. Истинодҳо ба панели панелҳо, чиптаҳо, ficheflags, фармонҳои CLI.
6. Дастрасӣ дар занг. Зуд ҷустуҷӯ, хондан, иҷро кардан бо як пайванд.
7. Такмили пайваста. Вазифаҳои навсозии пас аз марг → SOP.
3) Чаҳорчӯбаи SOP (қолаб)
4) SOP classification
Incident: P1/P2 (critical), P3 (important).
Operational routines: releases, feature flags, database migrations, provider failover.
DR/BCP: disabling the region, restoring from backup, working offline.
Quality control/audit: revisions, readiness questionnaires, access.
Security/compliance: KYC/AML checks, log storage, privacy.
5) RACI: Ownership and Responsibility
Process R (performer) A (responsible) C (consultant) I (notify)
------------------------ --------------- ----------------- --------------- -------------
Create/Update SOP Domain Owner Head of Ops SRE/Compliance Teams
SLA Revision Ops Enablement Head of Ops Domain leads All
Use in an incident On-call Incident Manager Domain Owner Stakeholders
6) SOP lifecycle
1. Initiation: need from post-mortem/incident/audit.
2. Draft: by template, with specific artifacts and commands.
3. Review: Domain Owner + Head of Ops + specialized consultants.
4. Publishing: to portal/repository; annotations on dashboards.
5. Training: short training/screencast, knowledge test.
6. Application: recorded in ticket/incident.
7. Audit: by SLA revision or after a significant event.
8. Archiving: mark 'deprecated', indicate replacement.
7) Documentation as code (minimum standard)
We store SOP in Git (Markdown + YAML metadata), PR review, CI-lint.
Required fields are 'owner', 'version', 'last _ review', 'sla _ review'.
Link checker and structure validator in CI; auto-release portal after merge.
Significant changes - through changelog and notifications in the # ops channel.
8) SOP integrations
Incident Manager: Open SOP button when creating/escalating an incident.
Grafana/Observability: references from panels to relevant SOPs; release annotations.
Feature Flags/Release: canary step templates, SLO gates, rollback.
AI assistant: RAG search by SOP, TL; DR and proposals for action.
BCP/DR: DR-playbook automatically loaded by trigger.
9) SOP quality check (KPI and review)
KPI:
Coverage ≥ 90% of critical scenarios are closed by SOP.
Review SLA ≤ 180 days (share of overdue - 0).
Usage Rate ≥ 70% of overt SOP incidents.
DoD Pass Rate ≥ 90% of steps are closed with success criteria.
Broken Links = 0 (по CI).
Weekly monitoring:
Top 5 used and top 5 obsolete SOPs.
SOP communication ↔ postmortems: whether Preventive Actions have been performed.
Noisy SOPs (frequent rollback returns) are candidates for recycling.
10) Containment standards
Steps → specifics: commands/queries/parameters + expected effect in metric.
Time requirements: ETA for updates/next steps.
Escalation: clear matrix, contacts, backup channels.
Security: warnings, restrictions, PII/secrets - via vault/links.
Localization: in the on-call language (critical for distributed commands).
11) SOP examples (fragments)
SOP: Canary pause in SLO degradation
Триггерҳо: error_budget_burn> 4x 10m, api_p99> 1. 3 × базавӣ 10м
Қадамҳо:- 1) Дар асбоби озодкунӣ канарейка таваққуф кунед
- 2) Санҷидани панелҳои "Тағйир додани бехатарӣ" ва "API p99"
- 3) Сохтани чиптаи REG-
, муайян кардани заминаи/тиреза - ДО: p99 ≤ 1. 1 × ибтидоии 15 м, <базавӣ × 1 хатогӣ. 2
- Бозгашт: пурра хомӯш кардани парчам, постмортем ≤ 72ч
SOP: PSP Provider Feilover
Триггерҳо: quota_usage>0. 9 Ё outbound_error_rate>2×baseline 5м
Қадамҳо:- 1) Фаъолсозии масири PSP-Y (конфигуратсия/тугма)
- 2) Гузаронидани пасандозҳо ва p95 PSP-Y -ро санҷед
- 3) Эзоҳҳо дар графикҳо, навсозӣ дар # evention-channel
- Оё: success_rate ≥ 99. 5%, p95 ≤ 300ms 10m
- Бозгашт: 20% қисман баргардонидани трафик ҳангоми мӯътадилсозии PSP-X
12) Рӯйхати санҷишҳо
Рӯйхати омодагии SOP:
[] Ҳадаф ва триггерҳо равшан ва ченшаванда мебошанд.
[] Қадамҳо барои фармонҳо/истинодҳо мавҷуданд.
[] Оё D/Rollback таҳия шудааст.
[] Тамосҳо ва тамосҳо муҳиманд.
[] Метамаълумот пур карда шудааст (соҳиб, версия, last_review).
[] Санҷиши пайванд ва CI validator мегузарад.
Рӯйхати санҷиши барномаҳои SOP (дар ҳодиса):
[] SOP аз истиноди менеҷер/панел кушода шуд.
[] Қадамҳо ба анҷом расиданд ва натиҷаҳо сабт шуданд.
[] Оё расид/Не - Санҷида шуд.
[] Амалҳо/номутобиқатӣ дар чипта сабт карда мешаванд.
[] Навсозӣ/такмилдиҳии SOP, ки аз ҷониби вазифаҳо сохта шудаанд (агар лозим бошад).
13) Омӯзиш ва интернат
Курсҳои хурд оид ба SOP-ҳои калидӣ (Пардохтҳо/Бетҳо/Бозиҳо/KYC).
Вазифаи сояафкан бо истифодаи ҳатмии SOP дар омӯзиш.
Ҳафтаинаи "клиникаҳои SOP": 30 дақиқа таҳлил/такмил.
Симулятсияҳо (рӯзҳои бозӣ): таҳияи DR ва ҳодисаҳои SOP.
14) Идоракунии тағирёбии SOP
RFC тавассути PR, барчаспҳои 'ноболиғ/асосӣ/шикастан'.
Шикастани тағирот - бо омӯзиш ва эълони ҳатмӣ.
Огоҳиномаҳои худкор ба соҳибони домейн ва ҳангоми занг.
Алоҳида "Ёддоштҳои SOP-Release" дар охири ҳар ҳафта.
15) Анти-намунаҳо
Шакли ройгон "тавре ки маълум мешавад" ва намунаҳои гуногун бо фармон.
SOP бидуни санаи соҳиб/бознигарӣ/таҷдиди назар.
Матнҳои "Энсиклопедӣ" ба ҷои амалҳои зина ба зина.
Не Rollback/DO - ҳеҷ чиз барои санҷиши муваффақият бо.
Истинодҳои шикаста, "дастур аз фармонҳои чат", қадамҳои хусусии "махфӣ".
SOP-и ноаён бидуни сабт ё омӯзиш тағир меёбад.
16) 30/60/90 - нақшаи амалисозӣ
30 рӯз:
Қолаби SOP ва стандартҳои ҳадди аққалро тасдиқ кунед.
Эҷод кардани репозиторияи 'ops-sop/' (docs-as-code), даргиронидани линтерҳои CI.
Рақамгузорӣ кардани 10-15 SOP-ҳои муҳим (ҳодисаҳо/релизҳо/провайдерҳо).
Менеҷери ҳодисаҳо ва панелҳои намоёнро ба истиноди SOP пайваст кунед.
60 рӯз:
Барои сенарияҳои интиқодӣ фарогирии ≥ 70% -ро фаро гиред.
Ҳафтаинаи "Клиникаҳои SOP" ва тренингҳои зангиро оғоз кунед.
Илова кардани ҷустуҷӯи AI (RAG) аз ҷониби SOP ва TL; Кортҳои DR.
Шарҳи SLA (180 рӯз) -ро ворид кунед ва дар бораи SOP-ҳои гузашта гузориш диҳед.
90 рӯз:
Фарогирӣ ≥ 90%, Меъёри истифода ≥ 70% ҳодисаҳо.
Дар ҳама SOP-ҳо ҷобаҷо кунед, пайвандҳои шикаста (0).
SOP KPI-ро барои фармони OKR (MTTR, Меъёри нокомии тағирот) бандед.
Ретро ва беҳбудиҳои семоҳаи ояндаро сабт кунед.
17) FAQ
Савол: SOP аз runbook чӣ фарқ дорад?
A: SOP - тартиби стандартӣ (танзими "чӣ гуна"). Китоби корӣ - дастурҳои муфассал барои парванда/хидмати мушаххас. Аксар вақт, SOP ба як ё якчанд дафтарчаҳо ишора мекунад.
Савол: Дар SOP чанд тафсилот бояд вуҷуд дошта бошад?
Ҷ: Танҳо барои оператор кофтани амалҳо бидуни "кофтан" дар сӯҳбат кофӣ аст. Ҳамаи он чизе, ки ба амал таъсир намерасонад, дар маводи истинод алоҳида аст.
Савол: Чӣ гуна бояд аҳамият нигоҳ дошт?
A: Нусхаҳои SLA (≤ 180 рӯз), ёдраскуниҳои автоматӣ, линтерҳои CI ва ченакҳои Usage/Do Ҳама гуна ҳодисаи инҳироф → вазифаи навсозии SOP.