Թիմերի և սխեմաների ռոտացիան
1) Հավատարմագրման նպատակները
Լուծումը համակարգային միջոց է, որպեսզի ապահովենք շարունակական ծածկումը, կանխատեսելի բեռը և արագ արձագանքը առանց արտահոսքի և կոնտեքստի կորստի։ Հիմնական նպատակները
լանդշաֆտների և գիշերային ժամերի միասնական բաշխում;
երաշխավորված փոխարինումը fors majore;
գծապատկերների, արձակուրդների և սահմանափակումների թափանցիկությունը.
SLA/complaens պահանջների պահպանումը և կոդավորման պահպանումը։
2) Դերեր և ծածկույթ
P1 (Primary on-call) 'առաջին պատասխանը, եռյակը, IC-ի համաժամացումը։
P2 (Secondary on-call): bakap տեղափոխման/շարժասանդուղքների համար։
IC-of-the-day/Duty Live-ը 'SEV-1 + առաջնորդը, որոշումների համակարգումը։
Observer/Shadow 'ուսուցում «ստվերի» ռեժիմում առանց լանդշաֆտների։
Առաջարկություններ
խուսափեք ածխաջրածիններից 30 րոպե փոփոխությունից;
Բարդ պատուհանների համար պահել երկու ակտիվ արցունքներ (P1 + P2);
IC-ն ունի առանձնահատուկ փոփոխություն, չի համատեղում P1-ը։
3) Միգրացիայի մոդելները
24/7 8 ժամ հերթափոխով 'առավոտ/օր/գիշեր (3 բրիգադ)։ Առնվազն հոգնածություն, ավելի շատ անցում։
24/7 12 ժամյա հերթափոխով 'ավելի քիչ փոխազդեցություններ, անհրաժեշտ է փոխհատուցում և խիստ սահմաններ։
Follow-the-sun: տարածաշրջանները փոխանցում են ծածկույթը ժամացույցի գոտիներով։ ավելի քիչ գիշերային լանդշաֆտներ։
Follow-the-moon: Գիշերային ծածկույթը փոխանցվում է «հեռավոր» տարածաշրջանին, որպեսզի բեռը դուրս լինի 220 մ-ից։
Week-on/Week-off: մեկ շաբաթ on-call, ապա շաբաթը առանց լանդշաֆտների (հասուն թիմերի և ցածր աղմուկի համար)։
4) Արդարության և կայունության կանոնները
Գիշերվա քվոտաները/հանգստյան օրերը 'ոչ ավելի, քան N գիշերն ու M-ը, մեկ օրվա ընթացքում։
Լանդշաֆտի հավասարակշռությունը, եթե ինժեները պետք է լինի> ռեմեդեյշն ժամանակահատվածի ընթացքում 'վերաբաշխում/ռեմեդեյշն։
Միայնակ արգելք 'գիշերային պատուհանները միայն P1 + P2։
Անհասանելիության պատուհանները 'նախապես պլանավորված են (արձակուրդ/հիվանդություն/կրթություն), գրաֆիկը ինքնաբերաբար հաշվարկվում է։
Shadow-ժամանակահատվածները 'յուրաքանչյուր նոր on-call անցնում է ստվերում 242 մղոն։
5) Գրաֆիկայի պլանավորումը և հրատարակումը
Պլանավորման հորիզոնը '6-8 շաբաթ, ֆուտբոլ' յուրաքանչյուր երկու շաբաթ։
Միգրացիայի ընդհանուր օրացույցը (ընդհանուր հասանելի read-only), յուրաքանչյուր վանկում 'P1/P2/IC/Shadow, կոնտակտներ։
Փոխարինումները (swap) կազմված են թիկետի/դիմումի միջոցով և ապացուցվում են բրիջի բոտով։
Հրապարակումը 'T-14 օրվա ընթացքում նվազագույն փոփոխություն' թիմի ծանուցմամբ։
6) Փոխանցման ընթացակարգերը (handover)
Հերթափոխի քարտը (պարտադիր դաշտերը) 'ակտիվ միջադեպեր (ID/SEV/սեփականատեր), հաջորդ քայլը/ETA, պատուհանի ռիսկերը (ալյումինե/105/քվոտա), SLO-ի վիճակը, ներառյալ ֆիչի դրոշները, կարգավիճակ-էջ/կոմունա։
Չեկ-թերթիկը «փոխանցում» է, քարտը թարմացված է, բոլոր բանավոր գիտելիքները, ապդեյթների թայմերը ցուցադրվում են, հաստատվում է P2 կապը։
Չեկ-թերթ «Ես ընդունում եմ», կարդացի քարտը, ստուգեցի տաշբորդերը 2-4 ժամվա ընթացքում, ընդունեցի պատահարների սեփականությունը, դարձրեց էխո հաղորդագրություն ջրանցքում։
7) Հոգնածության կառավարումը (fatigue)
Լիմիտները լանդշաֆտներ/ժամ և/կամ հերթափոխը, P2-ի վրա էսկալացիա, երբ ավելանում են։
Quiet Hours-ը P2/P3 ազդանշանների համար (միայն Page-կրիտիկական)։
POST-incident rest: Պարտադիր հագնումները ծանր գիշերներից հետո (SEV-1 +)։
Շաբաթական alere review-ը ցույց է տալիս աղմուկի նվազումը, կանոնների ճշգրտությունը։
Աշխատանքային բեռը '«Պեյջի/չելի» գրաֆիկը և թիմի տրամադրությունը (NPS smen)։
8) Անվտանգությունն ու համադրումը
JIT/JMS-հասանելի. on-call իրավունքները տրվում են միայն փոփոխության պատուհանի վրա։
Աուդիտի հետք. Ով հերթապահում էր, ով ընդունում էր, թե ինչ գործողություններ են կատարվել։ անփոփոխ պահեստավորում։
Զգայուն դեղամիջոցներով հերթապահություն (PII/վճարումներ) 'մենի և թույլատրությունների առանձին դաս։ անձնական սարքերի արգելք, SSO + mTSA։
Legal/PR/Privacy-ի հետ կապի կետերը նշված են փոփոխության քարտեզի մեջ։
9) Ավտոմատիզացիա
ChatOps։ Բոտը հրատարակում է «ով-call», թույլ է տալիս , ստեղծում է handover քարտը աղբյուրներից (dashbords, tikets, line)։
Հերթափոխի սկզբում պատրաստակամության ստուգումը 'լանդշաֆտի ձայնը, PPN/SSO, հասանելի, կապ։
Փաստաթղթերի ձևանմուշները ՝ SOP/Runbook ռուտինի և ռուտինի համար։ մայրուղիներ Ալերտերում։
Էքսպոզիցիայի հետ ինտեգրումը 'ռելիզը-նոմինացիաները առաջին 30 րոպեների ընթացքում բացատրում են ոչ-ոքի ալերտների ժամանակավոր ճնշումը։
10) Ներարկումների որակի մետրիկները
MTTA/MTTR-ը հերթափոխի շուրջ (փոխանցումներից 30 րոպե)։
Handover Systement Rate-ը ենթատեքստի կորստի մի մասն է։
Alerper on-call hour (median/95-րդ percentil), actionable տոկոսը։
Load per person - լանդշաֆտներ/չել/շաբաթ; մասնակիցների միջև ցրումը։
Missed/Late Systates-ը Comics SLA-ի փորձարկումներն են։
Swap rate-ը և պատճառները (հոգնածություն/արձակուրդ/հակամարտություններ)։
NPS փոփոխություն (կարճ հարցումով) և միտում։
11) Գծապատկերների ձևանմուշները
A. 24/7, 8-ժամյա (3 բրիգադ)
Brigade A: 08: 00-16: 00
Brigade B: 16: 00-00: 00
Brigade C: 00: 00-08: 00
Each team: P1 + P2, IC on a separate schedule (day slot)
Rotation: A→B→C every week; weekend moves in a circle
B. Follow-the-sun (3 շրջան)
EU: 07:00–15:00 AMER: 15:00–23:00 APAC: 23:00–07:00 (UTC)
Each region: P1 local, P2 neighboring
IC: coincides with active region; transfer 15 minutes before shift
V. Week-on/Week-off (ցածր աղմուկ)
Week 1: Team X (P1/P2) Week 2: Team Y
Daily IC common to both
Limit: no more than 2 consecutive weeks for one person
12) Չեկ թերթերը
Գրաֆիկի հրապարակումից առաջ
- Ծածկում 24/7 առանց «ծխի», P1 + P2 յուրաքանչյուր արցունքում։
- Հաշվի առեք արձակուրդը/ուսուցումը/հասանելիության սահմանափակումը։
- Գիշերային/հանգստյան օրերի հավասարակշռությունը արդար է։
- Նշանակված IC և Shadow։
- Լանդշաֆտի/օրացույցի համաժամացումը միացված է։
Փոփոխությունը սկսվեց
- P1/P2/IC հաստատեցին ներկայությունը (բոտ/չաթ)։
- Ստուգված են հասանելի, հաղորդակցություն, դաշնամուր։
- Handover քարտը ուղարկվել է էխո հաղորդագրություն։
Փոփոխությունը
- Handover քարտը նորարարված է և փակված։
- Միջադեպերը կապված են next step/ETA-ի հետ։
- Կարճ AAR-ը գրանցվում է բարելավումներ (եթե ձախողումներ կային)։
13) Anti-patterna
Միայնակ P1-ը գիշերը առանց bakap-ի։
Գրաֆիկի հրապարակումը մեկ շաբաթ առաջ առանց հորիզոնի և փոխարինման։
Ալգորիթմները հերթափոխի պահին առանց IC և խաղացողների։
«Բանավոր» փոխանցումները առանց քարտի և տիկետների։
Զրոյական փոխհատուցում/կոշիկներ ծանր գիշերներից հետո։
Ռուսական swap's և պատճառների բացակայությունը։
Առանց ուսուցման, նոր on-call անմիջապես «պայքարի»։
14) Ճանապարհի քարտեզը (4-6 շաբաթ)
1. Մոսկվան։ 1: Բուլգարիզացիա, մոդելի ընտրություն (24/7 կամ follow-the-sun), դերերի նշանակումը։
2. Մոսկվան։ 2 '+ լանդշաֆտային + բոտա, handover/SOP ձևանմուշներ։
3. Մոսկվան։ 3: օդաչու 2-3 շաբաթ ցիկլի, մետրի հավաքումը (aler.ru/hour, MTTA-ի շուրջ)։
4. Մոսկվան։ 4: al.review, աղմուկի և քվոտի թյունինգը, Shadow-Men-ի շահագործումը։
5. Մոսկվան։ 5-6 'փոխհատուցման/quiet hours-ի ձևավորումը, կառավարման զեկույցները, swap' s ավտոմատիզացումը։
15) Արդյունքը
Միգրացիան գործընթաց է, ոչ թե Exco 'թափանցիկ գրաֆիկներ, դերեր և handover քարտեր։ օրացույցի և լանդշաֆտի ավտոմատացում; արդար կանոնները և հոգնածության սահմանները. որակի նշաններ և ակնարկներ։ Այս մոտեցման դեպքում փոփոխությունը դառնում է կանխատեսելի, մարդիկ կայուն են, իսկ օգտագործողները և գործընկերները չեն նկատում, որ թիմը փոխվում է ժամերով։