چرخش تیم و شیفت
1) اهداف چرخش
چرخش یک روش سیستماتیک برای ارائه پوشش مداوم، بار قابل پیش بینی و پاسخ سریع بدون فرسودگی و از دست دادن زمینه است. اهداف کلیدی:- حتی توزیع صفحات و ساعات شب ؛
- جایگزینی تضمین شده در مورد نیروی برق ؛
- شفافیت برنامه ها، تعطیلات و محدودیت ها ؛
- انطباق با الزامات SLA/انطباق و حفظ حسابرسی.
2) نقش ها و پوشش
P1 (اولیه در تماس): اولین پاسخ، تریاژ، هماهنگ سازی با IC.
P2 (ثانویه در تماس): پشتیبان گیری برای اضافه بار/تشدید.
IC از روز/مدیر وظیفه: رهبر در SEV-1 +، هماهنگی تصمیمات.
Observer/Shadow: یادگیری سایه بدون صفحات.
- اجتناب از انتشار ± 30 دقیقه از تغییر ؛
- برای پنجره های پیچیده، دو اسلات فعال (P1 + P2) را نگه دارید ؛
- IC یک تغییر اختصاصی دارد، P1 را ترکیب نمی کند.
3) مدل های چرخش
24/7 با شیفت 8 ساعته: صبح/روز/شب (3 خدمه). حداقل خستگی، تعویض بیشتر.
24/7 با شیفت 12 ساعته: سوئیچ کمتر، نیاز به جبران خسارت و محدودیت های سخت.
Follow-the-sun: مناطق پوشش را در سراسر مناطق زمانی انتقال می دهند. صفحات شبانه کمتر
Follow-the-moon: پوشش شبانه به منطقه «دور» برای بار خارج از زمان اولیه محلی منتقل می شود.
هفته در/هفته خاموش: یک هفته در تماس، پس از آن یک هفته بدون صفحات (برای تیم های بالغ و سر و صدای کم).
4) قوانین عدالت و پایداری
سهمیه شب/آخر هفته: حداکثر N شب و M شیفت آخر هفته به ازای هر نفر در هر دوره.
تعادل صفحات: اگر مهندس> آستانه هدف در هر دوره - توزیع مجدد/اصلاح.
ممنوعیت تک: پنجره های شب فقط P1 + P2.
پنجره های در دسترس بودن: برنامه ریزی شده در پیش (تعطیلات/بیماری/آموزش)، برنامه به طور خودکار محاسبه می شود.
دوره های سایه: هر تماس جدید ≥ 2 تغییر در سایه طول می کشد.
5) برنامه ریزی و انتشار برنامه
افق برنامه ریزی: 6-8 هفته، تجدید نظر - هر 2 هفته.
تقویم عمومی چرخش (عمومی فقط خواندنی)، در هر اسلات - P1/P2/IC/Shadow، مخاطبین.
جایگزینی (مبادله) با یک بلیط/درخواست صادر می شود و توسط یک ربات پل تایید می شود.
انتشار: برای T-14 روز حداقل, تغییرات - با اطلاع رسانی تیم.
6) روش های تحویل
Shift card (فیلدهای مورد نیاز): active incidents (ID/SEV/owner), next step/ETA, window risks (releases/migrations/quotas), SLO status, enabled degradation feature flags, status page/comms.
چک لیست «پاس»: کارت به روز شده است، تمام دانش شفاهی → بلیط، تایمر برای به روز رسانی تنظیم شده است، تماس با P2 تایید شده است.
چک لیست را «قبول» می کنم: کارت را خواندم، داشبورد را در 2-4 ساعت بررسی کردم، حوادث را در اختیار گرفتم، یک پیام اکو به کانال ایجاد کردم.
7) مدیریت خستگی (خستگی)
محدودیت صفحه بندی/ساعت و/یا تغییر، خودکار تشدید به P2 زمانی که بیش از.
ساعات آرام برای سیگنال های P2/P3 (فقط آنهایی که صفحه بحرانی تحت تاثیر قرار).
استراحت پس از حادثه: مرخصی اجباری پس از شبهای سنگین (SEV-1 +).
بررسی هشدار هفتگی → کاهش نویز، ویرایش قانون.
نظارت بر بار: برنامه صفحه/فرد و روحیه تیم (تغییرات NPS).
8) ایمنی و انطباق
دسترسی JIT/JEA: حقوق تماس فقط به پنجره تغییر داده می شود.
پیگیری حسابرسی: چه کسی در حال انجام وظیفه بود، چه کسی اقدامات انجام شده را انجام داد ؛ ذخیره سازی غیر قابل تغییر
وظیفه با عملیات حساس (PII/پرداخت): تغییر جداگانه و کلاس تحمل ؛ غیر فعال کردن دستگاه های شخصی، SSO + mTLS.
نقاط تماس قانونی/PR/حریم خصوصی بر روی کارت تغییر مشخص شده است.
9) اتوماسیون
تقویم ↔ پیجر ↔ ChatOps: ربات منتشر می کند «چه کسی در تماس»، اجازه می دهد تا «/swap »، ایجاد یک کارت تحویل از منابع (داشبورد، بلیط، انتشار).
بررسی آمادگی در ابتدای تغییر: صدای پیجر، VPN/SSO، دسترسی، ارتباطات.
قالب های سند: SOP/Runbook برای روال ها و حوادث ؛ مراجع خودکار در هشدارها.
ادغام با نسخه ها: حاشیه نویسی انتشار → سرکوب موقت هشدارهای غیر کلیدی برای 30 دقیقه اول.
10) معیارهای کیفیت چرخش
MTTA/MTTR در اطراف تغییر (± 30 دقیقه از سوئیچینگ).
نرخ نقص تحویل - نسبت حوادث از دست رفته در هر تغییر.
هشدارها در هر ساعت تماس (صدک متوسط/95)،٪ عملی است.
بار در هر فرد - صفحات/فرد/هفته ؛ تفاوت بین شرکت کنندگان
به روز رسانی های از دست رفته/دیر - تاخیر در Comms SLA.
نرخ مبادله و علل (خستگی/تعطیلات/درگیری).
تغییرات NPS (با بررسی کوتاه) و روند.
11) قالب برنامه
A. 24/7، 8 ساعته (3 تیپ)
Brigade A: 08: 00-16: 00
Brigade B: 16: 00-00: 00
Brigade C: 00: 00-08: 00
Each team: P1 + P2, IC on a separate schedule (day slot)
Rotation: A→B→C every week; weekend moves in a circle
B. دنبال خورشید (3 منطقه)
EU: 07:00–15:00 AMER: 15:00–23:00 APAC: 23:00–07:00 (UTC)
Each region: P1 local, P2 neighboring
IC: coincides with active region; transfer 15 minutes before shift
B. هفته/هفته خاموش (سر و صدای کم)
Week 1: Team X (P1/P2) Week 2: Team Y
Daily IC common to both
Limit: no more than 2 consecutive weeks for one person
12) چک لیست
قبل از انتشار نمودار
- پوشش 24/7 بدون سوراخ، P1 + P2 در هر اسلات.
- تعطیلات/آموزش/محدودیت در دسترس بودن در نظر گرفته شود.
- تعادل شب/تعطیلات آخر هفته عادلانه است.
- IC و سایه اختصاص داده شده است.
- خودکار همگام سازی با پیجر/تقویم فعال است.
تغییر آغاز شد
- P1/P2/IC حضور تایید شده (ربات/چت).
- دسترسی، ارتباطات، داشبورد بررسی شده است.
- کارت تحویل دریافت شد، اکو ارسال شد.
تغییر کامل شد
- کارت تحویل به روز شده و بسته شده است.
- حوادث منتقل شده از مرحله بعدی/ETA.
- AAR کوتاه انجام شد، پیشرفت ثبت شد (اگر شکست وجود دارد).
13) ضد الگوهای
P1 تنها در شب بدون پشتیبان.
انتشار برنامه برای هفته پیش رو بدون افق و جایگزینی.
انتشار در زمان تغییر بدون IC و دروازه.
برنامه های «شفاهی» بدون کارت و بلیط.
صفر جبران/زمان پس از شب های سنگین.
هیچ حسابرسی از مبادلات و دلایل جایگزینی وجود ندارد.
چرخش بدون آموزش: یک تماس جدید بلافاصله «به نبرد».
14) نقشه راه پیاده سازی (4-6 هفته)
1. «ند». 1: موجودی پوشش، انتخاب مدل (24/7 یا پیگیری خورشید)، تخصیص نقش.
2. «ند». 2: شروع تقویم + پیجر + ربات، قالب تحویل/SOP.
3. «ند». 3: خلبان چرخه 2-3 هفته، جمع آوری معیارها (هشدار/ساعت، MTTA در اطراف شیفت).
4. «ند». 4: بررسی هشدار، تنظیم سر و صدا و سهمیه، ورود به شیفت سایه.
5. «ند». 5-6: رسمی سازی جبران خسارت/ساعات آرام، گزارش برای مدیریت، اتوماسیون مبادله.
15) خط پایین
چرخش یک فرآیند است، نه اکسل: نمودارهای شفاف، نقش ها و کارت های تحویل ؛ تقویم و اتوماسیون پیجر ؛ قوانین و محدودیت های خستگی منصفانه ؛ معیارهای کیفیت و بررسی های منظم. با این رویکرد، تغییرات قابل پیش بینی می شوند، مردم پایدار می شوند و کاربران و شرکا متوجه نمی شوند که تیم ساعت به ساعت تغییر می کند.