Checkout xidmətinin kanarya buraxılışı
1) Niyə əməliyyatların sənədləşdirilməsi lazımdır
Əməliyyat sənədləri təşkilatın idarə oluna bilən yaddaşıdır: MTTR-i aşağı salır, işi standartlaşdırır, auditdən keçməyə kömək edir və keyfiyyətsiz komandaları genişləndirir. Yaxşı sənədlər:- şifahi bilikləri təkrarlanan prosedurlara çevirir;
- məsuliyyət sərhədlərini və eskalasiya nöqtələrini təyin edir;
- uyğunluq və təhlükəsizlik üçün sübut mənbəyi kimi xidmət edir;
- onbording sürətləndirir və «dar boğazlar» risklərini azaldır.
2) Sənədlərin taksonomiyası (nə üçün)
Siyasət (Siyasət): niyyət və çərçivə («nə və niyə»). Nümunə: Hadisə idarəetmə siyasəti.
Standard (Standart): məcburi minimum tələblər («nə qədər»). Nümunə: TLS sertifikatlarının yenilənmə vaxtı.
SOP/Procedure (Standart əməliyyat proseduru): ardıcıl addımlar («kimi»). Nümunə: Kanarya yayılması ilə buraxılış.
Runbook: tipik hadisələr (alert/əməliyyatlar) üçün addım-addım təlimatlar. Məsələn: «API 5xx böyüdü - fəaliyyət alqoritmi».
Playbook: variantları və çatlamalar ilə ssenari həllər dəsti. Nümunə: «Ödəniş provayderi ilə problemlər».
KB (Bilik Bazası): Cavablar, FAQ, alətlər üzrə arayışlar.
Checklist: Hərəkətlərdən əvvəl məcburi maddələrin qısa siyahısı.
Record/Evidence: tamamlanmış addımlar jurnalı, ekran görüntüləri/qeydlər/imzalar.
3) Yaxşı sənədləşmə prinsipləri
Vahid həqiqət mənbəyi (SSOT). Sənədlər təkrarlanmır; püskürtmək köhnəlmək deməkdir.
Docs-as-Code. Git-də saxlayırıq, code-review-dan keçirik, versiyalar və difflər görünür.
Actionable-first. Başlanğıcda - qısa kart: nə vaxt başlayacaq, kimin sahibi, nə etməli, tamamlama meyarları.
Atom və ünvanlılıq. Bir sənəd - bir vəzifə/proses.
Yenilənmə qabiliyyəti. Aydın sahibi və SLA yeniləmələri (məsələn, rüblük).
Müşahidə. Dashboard/alert/metrik linklər daxili.
Təhlükəsizlik-by-design. Həssaslıq təsnifatı, gizli gizlətmə, giriş nəzarəti.
4) Sənədin həyat dövrü (Governance)
1. Başlanğıc: ərizə/bilet → sənəd növü → sahibi.
2. Layihə: şablon, minimum nümunələr, standartlara istinadlar və SLO.
3. Review: texniki (SRE/platforma/təhlükəsizlik), prosedur (proses meneceri).
4. Nəşr: master filialda, versiya/tarix işarəsi, status verilməsi (active/experimental/deprecated).
5. Təlim/Rabitə: dəyişiklik elanı, qısa təlim/demo.
6. Retrospektiv: insidentlərin/təlimlərin nəticələrinə əsasən düzəlişlər etmək.
7. Audit və arxiv: dəyişməz iz (kim/nə vaxt dəyişdi), arxivdə köhnəlmiş versiyalar.
5) SOP/Runbook strukturu (minimum)
1. Kart: Adı, Identifikator, Versiya/Tarix, Sahibi, Məsul Rollar, Əlaqəli Siyasət/Standartlar.
2. Nə zaman tətbiq olunur: başlanğıc şərtləri (alert/hadisə/iş pəncərəsi).
3. Hazırlıq: hüquqlar/alətlər/məlumatlar, risk-qiymətləndirmə, kommunikasiyalar.
4. Addımlar: nömrələnmiş, komandalar/ekran görüntüləri/gözlənilən nəticələr.
5. Uğur/geri dönüş meyarları: Aydın SLI/SLO həddi.
6. Eskalasiya: kim, nə vaxt və necə (kanal, telefon, provayder).
7. Təhlükəsizlik/uyğunluq: həssas məlumatlar, qadağalar, hərəkətlərin qeydləri.
8. Post-actions: biletlərin bağlanması, statusun yenilənməsi, sübutların toplanması.
9. Dəyişiklik tarixi (changelog).
6) Tərtibat üslubu və qaydaları
Aydın və qısa: 1 addım - 1 hərəkət - 1 nəticə.
Imperiv: «Yerinə yetirin»..., «Yoxlayın»..., «Yuvarlanın»....
Ekran görüntüləri/komandalar: addımın yanında; komandalar - kopyalanan bloklar; gözlənilən nəticəni qeyd edin.
Dəyişkənlik: «Əgər A → addım X, əgər B → addım Y» budaqları.
Kohortluq: harada aktualdır - regionları/provayderləri/tenantları qeyd edin.
Lokalizasiya: əsas sənədlər - ən azı 2 dildə; köçürmələrin statusunu göstərin.
Tags və axtarış: xidmət, komponent, provayder, hadisə növü, SLO, versiyası.
7) Docs-as-Code və alətlər
Saxlama: Git (main/feat/bugfix), PR-review, required checks.
Format: Markdown/AsciiDoc; PlantUML/Mermaid diaqramları; JSON/YAML sxemləri.
Post: statik sayt (Docusaurus/MkDocs) + axtarış.
Doğrulama: CI-lint, link testi, orfoqrafiya, kod blokları validatorları.
İnteqrasiya: ChatOps-komandaları '/runbook open X ', alertlərdə ən son versiyanın göstərilməsi.
Əlaqə: CMDB/servis kataloqu, sənədləşmə, daşbordlar.
8) Giriş nəzarəti və təsnifat
Классы: Public / Internal / Confidential / Restricted.
Bölmə: açıq təlimatlar (ümumi statuslar) vs qapalı (açarlar, komandalar, şəbəkə diaqramları).
Sirləri: mətndə qadağan; gizli saxlama və playsholders istifadə edin.
Audit: həssas SOP üçün oxu/dəyişiklik jurnalı.
9) Hadisə və buraxılışlarla əlaqə
Hər bir alertdə - müvafiq runbook bağlantısı.
Hər bir hadisədə - istifadə olunan SOP-ə keçid və nişanların çeki.
RCA sonra - CAPA-fəaliyyət kimi sənədlərin yenilənməsi.
Buraxılışdan əvvəl - checklist: geri dönüş hazırlığı, deqradasiya bayraqları, provayderlərin təmasları.
10) Minimum məcburi dəst (MVP dock paketi)
Hadisə menecmenti və eskalasiya siyasəti (SEV/P səviyyələri, zamanlama).
Monitorinq standartı və alert siyasəti (burn rate, kvorum).
SOP: Release/return (canary/blue-green), BD (expand/contract) miqrasiyası.
Runbook: «Yüksək error-rate», «Böyümə p99», «Ödənişlərin uğurunun azalması», «TLS/DNS problemi».
Xarici provayderlərin Playbook (ödənişlər/KYC/CDN): əlaqə, limitlər, folbeklər.
Sirlərin və girişlərin idarə edilməsi siyasəti.
RCA və Post-mortem şablonları.
Xidmət sahibləri cədvəli (RACI) və dashboard xəritəsi.
11) Sənədlərin keyfiyyət metrikası (SLO sənəd)
Coverage: SOP/Runbook ilə kritik yollar%.
Freshness: sənədlərin payı təzə N gün (məsələn, 90).
Usability:% hadisələr eskalasiya olmadan runbook görə qapalı.
Findability: lazımi sənəd axtarışının medianı (sorğular/qeydlər üzrə).
Defect rate: Revew/100 sənəd haqqında qeydlərin sayı.
Adoption: runbook doğru link ilə alert payı.
Compliance evidence rate: əlavə edilmiş dəlillərlə% tapşırıqlar.
12) Çek vərəqləri
SOP yaradılması üçün çek siyahısı
- Sahibi və hədəf auditoriyası müəyyən edilmişdir.
- Start şərtləri və stop meyarları var.
- Addımlar başqa bir mühəndis tərəfindən yoxlanılır.
- Dashboard/Alert/Tools üçün daxili bağlantılar.
- Heç bir sirr; playsholders və vault link var.
- Geri çəkilmə və eskalasiya təsvir edilmişdir.
- «Hərəkətlərdən sonra» çek siyahısı əlavə edilib.
- Versiyası, tarixi, changelog.
Review çek siyahısı
- Sənəd taksonomiyaya uyğundur (siyasət və addımları qarışdırmır).
- Dil sadə, imperativ, qeyri-müəyyən.
- Komandalar «quru run «/stage yoxlanılır.
- Risklər və nəzarət nöqtələri göstərilir.
- Mövcudluq (Internal/Restricted) düzgündür.
- CI-də linterlər/validatorlar keçdi.
13) Lokalizasiya, versiya və mövcudluq
Versiyası: 'MAJOR. MINOR. MAJOR proseslərin uyğunluğunu pozduğu PATCH '.
Dillər: «mənbə» dilini və tərcümə statusunu qeyd edin (up-to-date/needs review).
Form faktoru: on-call üçün mobil/gecə ekranı, IC çap kartları.
14) Dock-avtomatlaşdırma (praktikadan)
CLI şablonlarından SOP çərçivələrinin yaradılması ('doc new sop --service = payments').
Xidmət etiketlərinə görə son dashbordlara bağlantıların avtomatik daxil edilməsi.
Vaxtı keçmiş sənədlər haqqında xatırlatma botları (freshness SLA).
Evidence paketinin audit müddəti üçün ixracı (PDF/ZIP).
Həlldə istifadə olunan sənədlərin versiyası ilə insident biletlərinin əlaqələndirilməsi.
15) Təhlükəsizlik və uyğunluq
«Risklər» və «Nəzarət tədbirləri» bölmələri.
evidence imzalar/hash ilə dəyişməz arxiv saxlamaq.
Standartlara bağlanması (məsələn, bildiriş/retensiya vaxtı), aydın uyğunluq sahibləri.
16) Anti-nümunələr
Sahibləri və yeniləmə tarixləri olmadan «Wiki-labirint».
Komandalarla qarışıq siyasətçilər - heç kim yerinə yetirəcək bir şey tapa bilməz.
Kontekstsiz sənədlər (SLO, daşbord, eskalasiya yoxdur).
Sirləri olan ekran görüntüləri və ya CLI alternativləri olmadan «Bura basın» təlimatları.
«Bir guru necə bilir» - tribal knowledge fiksasiya olmadan.
Arxiv PDF-ləri yeganə versiya kimi redaktə olunmur, axtarılmır.
17) Şablonlar (fraqmentlər)
SOP papaq (nümunə)
SOP-ID: OPS-REL-001
18) gündəlik iş daxil
Həftəlik doc-dairələr: 1-2 sənəd təhlili, aktuallaşdırma, təcrübə mübadiləsi.
Game-days: Simulyasiyalarda SOP/Runbook reallığının yoxlanılması.
Bağlama: məcburi sənədlər dəsti ilə yeni başlayanların marşrutu + qısa kvizalar.
Doc-borc: prioritetləşdirmə ilə təkmilləşdirmələr (impact × effort).
19) Yekun
Əməliyyatların sənədləşdirilməsi arxiv deyil, iş alətidir. Bir kod kimi aparıldıqda, sahibləri, təzəlik metrikləri və hadisələrə, buraxılışlara və təlimlərə daxil olduqda, təşkilat proqnozlaşdırıla bilər: daha az səhv, daha sürətli reaksiya, başa düşülən məsuliyyət və audit hazırlığı. Qısa yazın, müntəzəm olaraq yeniləyin, rutini avtomatlaşdırın və sənədlər vaxt və pula qənaət etməyə başlayacaq.