Komandaların və növbələrin rotasiyası
1) Rotasiya məqsədləri
Rotasiya, tükənmədən və konteksti itirmədən davamlı örtük, proqnozlaşdırıla bilən yük və sürətli reaksiya təmin etmək üçün sistemli bir yoldur. Əsas məqsədlər:- page və gecə saatlarının bərabər paylanması;
- fors-major zəmanətli əvəzetmə;
- qrafiklərin, tətillərin və məhdudiyyətlərin şəffaflığı;
- SLA/komplayens tələblərinə riayət edilməsi və auditin qorunması.
2) Rollar və əhatə
P1 (Primary on-call): ilk cavab, triaj, IC ilə sinxronizasiya.
P2 (Secondary on-call): həddindən artıq yük/eskalasiya üçün backup.
IC-of-the-day/Duty Manager: SEV-1 + -də lider, həllərin koordinasiyası.
Observer/Shadow: Page olmadan «kölgə» rejimində təlim.
- növbədən 30 dəqiqə ± buraxılışlardan qaçın;
- mürəkkəb pəncərələr üçün iki aktiv slot saxlamaq (P1 + P2);
- IC xüsusi bir dəyişikliyə malikdir, P1 birləşdirmir.
3) Rotasiya modelləri
8 saatlıq növbə ilə 24/7: səhər/gündüz/gecə (3 briqada). Minimum yorğunluq, daha çox keçid.
12 saatlıq növbə ilə 24/7: daha az keçid, kompensasiya və ciddi limitlər lazımdır.
Follow-the-sun: Bölgələr əhatə dairəsini saat zonalarına ötürür; daha az gecə çağrı.
Follow-the-moon: gecə örtüyü yerli prime-time xaricində yük üçün «uzaq» bölgəyə köçürülür.
Week-on/Week-off: bir həftə on-call, sonra bir həftə page olmadan (yetkin komandalar və aşağı səs-küy üçün).
4) Ədalət və davamlılıq qaydaları
Gecə/həftə sonu kvotaları: bir müddət ərzində adambaşına N gecədən və M həftəsonu növbəsindən çox deyil.
Peycey balansı: mühəndis üçün bir dövr üçün> hədəf həddi varsa - yenidən bölüşdürmə/yenidən bölüşdürmə.
Tək qadağa: gecə pəncərələri yalnız P1 + P2.
Əlçatmazlıq pəncərələri: əvvəlcədən planlaşdırılır (tətil/xəstəlik/təlim), cədvəl avtomatik olaraq yenidən hesablanır.
Gölge dövrləri: Hər yeni on-call kölgədə 2 növbə ≥ keçir.
5) Qrafikin planlaşdırılması və nəşri
Planlaşdırma üfüqü: 6-8 həftə, yenidən baxılması - hər 2 həftədən bir.
Rotasiyaların ümumi təqvimi (ictimai read-only), hər bir yuvada - P1/P2/IC/Shadow, əlaqə.
Əvəzetmələr (swap) bilet/ərizə ilə rəsmiləşdirilir və bric bot tərəfindən təsdiqlənir.
Nəşr: T-14 gün minimum, dəyişiklik - komanda bildirişi ilə.
6) Ötürmə prosedurları (handover)
Variant kartı (məcburi sahələr): aktiv hadisələr (ID/SEV/sahibi), növbəti addım/ETA, pəncərə riskləri (relizlər/miqrasiyalar/kvotalar), SLO vəziyyəti, deqradasiya fiç bayraqları, status-səhifə/komms daxil.
Çek siyahısı: kart yeniləndi, bütün şifahi biliklər → biletlər, yenilənmiş zamanlayıcılar təqdim edildi, P2 əlaqə təsdiqləndi.
Çek siyahısı «qəbul edirəm»: kartı oxudum, 2-4 saat ərzində daşbordları yoxladım, hadisələrin sahibliyini qəbul etdim, kanala əks-mesaj verdim.
7) Yorğunluğun idarə edilməsi (fatigue)
Page/saat və/və ya növbə limitləri, P2-də avto eskalasiya.
P2/P3 siqnalları üçün Quiet Hours (yalnız Page-kritik zərər).
Post-incident rest: ağır gecələrdən sonra məcburi istirahət (SEV-1 +).
Həftəlik alert review → səs-küyün azaldılması, qaydaların düzəldilməsi.
Yük monitorinqi: «page/adam» cədvəli və komandanın əhval-ruhiyyəsi (NPS növbələri).
8) Təhlükəsizlik və uyğunluq
JIT/JEA girişləri: on-call hüquqları yalnız növbə pəncərəsinə verilir.
Audit-iz: kim növbətçi idi, kim qəbul etdi, hansı hərəkətlər edildi; dəyişməz saxlama.
Həssas əməliyyatlarla növbətçilik (PII/ödənişlər): ayrı bir növbə və icazə sinfi; şəxsi cihazların qadağan edilməsi, SSO + mTLS.
Legal/PR/Privacy ilə əlaqə nöqtələri növbə kartında qeyd olunur.
9) Avtomatlaşdırma
ChatOps peycer təqvimi: bot «kim on-call» dərc edir, '/swap 'imkan verir, mənbələrdən (dashbordlar, biletlər, buraxılışlar) handover kartı yaradır.
Növbənin başlanğıcında hazırlıq yoxlanılır: peycer səsi, VPN/SSO, giriş, rabitə.
Sənəd şablonları: rutin və hadisələr üçün SOP/Runbook; Alertlərdə avtomatik bağlantılar.
Relizlərlə inteqrasiya: reliz-şərhlər → ilk 30 dəqiqə üçün açar olmayan alertlərin müvəqqəti yatırılması.
10) Rotasiya keyfiyyətinin metrikası
MTTA/MTTR növbə ətrafında (± 30 dəqiqə keçid).
Handover Defect Rate - bir növbədə kontekst itkisi ilə insidentlərin payı.
Alerts per on-call hour,% actionable.
Load per person - peyci/nəfər/həftə; iştirakçılar arasında dispersiya.
Missed/Late Updates - Comms SLA-da gecikmələr.
Swap rate və səbəbləri (yorğunluq/məzuniyyət/münaqişələr).
NPS növbələri (qısa sorğu) və trend.
11) Cədvəl şablonları
A. 24/7, 8 saatlıq (3 briqada)
Brigade A: 08: 00-16: 00
Brigade B: 16: 00-00: 00
Brigade C: 00: 00-08: 00
Each team: P1 + P2, IC on a separate schedule (day slot)
Rotation: A→B→C every week; weekend moves in a circle
B. Follow-the-sun (3 region)
EU: 07:00–15:00 AMER: 15:00–23:00 APAC: 23:00–07:00 (UTC)
Each region: P1 local, P2 neighboring
IC: coincides with active region; transfer 15 minutes before shift
V. week-on/Week-off (aşağı səs-küy)
Week 1: Team X (P1/P2) Week 2: Team Y
Daily IC common to both
Limit: no more than 2 consecutive weeks for one person
12) Çek vərəqləri
Qrafik dərc edilməzdən əvvəl
- Hər bir yuvada «deşik», P1 + P2 olmadan 24/7 örtük.
- Tətil/təhsil/giriş məhdudiyyətləri nəzərə alınır.
- Gecə/həftə sonu balansı ədalətlidir.
- IC və Shadow təyin.
- Peycer/təqvim ilə avtomatik sinxronizasiya aktiv.
Dəyişiklik başladı
- P1/P2/IC təsdiqləndi (bot/chat).
- Giriş, əlaqə, dashboard yoxlanılır.
- Əl kartı qəbul edildi, əks-mesaj göndərildi.
Növbə tamamlandı
- Handover kartı yenilənib və bağlanıb.
- Hadisələr next step/ETA ilə ötürülür.
- Qısa AAR tamamlandı, təkmilləşdirmələr qeydə alındı (əgər uğursuzluqlar varsa).
13) Anti-nümunələr
Backup olmadan gecə tək P1.
Üfüq və əvəz olmadan bir həftə qabaqcadan qrafik nəşr.
IC və gates olmadan növbə zamanı buraxılışlar.
Kart və biletsiz «şifahi» ötürmələr.
Ağır gecələrdən sonra sıfır kompensasiya/istirahət.
Swap auditinin olmaması və dəyişdirilmə səbəbləri.
Təlimsiz rotasiya: yeni on-call dərhal «döyüşə».
14) Yol xəritəsi (4-6 həftə)
1. Ned. 1: inventar örtük, model seçimi (24/7 və ya follow-the-sun), rolların təyinatı.
2. Ned. 2: təqvim + peycer + bot, handover/SOP şablonları.
3. Ned. 3: pilot 2-3 həftəlik dövr, metrik toplama (alerts/saat, növbə ətrafında MTTA).
4. Ned. 4: alert review, səs-küy və kvota sazlama, Shadow-smen daxil.
5. Ned. 5-6: kompensasiya/quiet saatlarının rəsmiləşdirilməsi, idarəetmə hesabatları, swap avtomatlaşdırılması.
15) Yekun
Rotasiya Excel deyil, prosesdir: şəffaf qrafiklər, rollar və əl kartları; təqvim və peycerin avtomatlaşdırılması; ədalətli yorğunluq qaydaları və limitləri; keyfiyyət metrik və müntəzəm rəylər. Bu yanaşma ilə növbələr proqnozlaşdırıla bilər, insanlar sabit olur və istifadəçilər və tərəfdaşlar komandanın saatlarla dəyişdiyini görmürlər.