GH GambleHub

Ротация команд и смен

1) Цели ротации

Ротация — это системный способ обеспечить непрерывное покрытие, предсказуемую нагрузку и быструю реакцию без выгорания и потери контекста. Ключевые цели:
  • равномерное распределение пейджей и ночных часов;
  • гарантированная замена при форс-мажоре;
  • прозрачность графиков, отпусков и ограничений;
  • соблюдение требований SLA/комплаенса и сохранение аудита.

2) Роли и покрытие

P1 (Primary on-call): первый ответ, триаж, синхронизация с IC.
P2 (Secondary on-call): бэкап для перегрузки/эскалаций.
IC-of-the-day / Duty Manager: лидер при SEV-1+, координация решений.
Observer/Shadow: обучение в режиме “тень” без пейджей.

Рекомендации:
  • избегать релизов ±30 минут от смены;
  • для сложных окон держать два активных слота (P1+P2);
  • IC имеет выделенную смену, не совмещает P1.

3) Модели ротаций

24/7 с 8-часовыми сменами: утро/день/ночь (3 бригады). Минимум усталости, больше переключений.
24/7 с 12-часовыми сменами: меньше переключений, нужна компенсация и строгие лимиты.
Follow-the-sun: регионы передают покрытие по часовым поясам; меньше ночных пейджей.
Follow-the-moon: ночное покрытие переносится в “дальний” регион для нагрузки вне локального прайм-тайма.
Week-on / Week-off: одна неделя on-call, затем неделя без пейджей (для зрелых команд и низкого шума).

4) Правила справедливости и устойчивости

Квоты ночей/выходных: не более N ночей и M выходных смен на человека за период.
Баланс пейджей: если на инженера приходится > целевого порога за период — перераспределение/ремедиэйшн.
Запрет одиночек: ночные окна только P1+P2.
Окна недоступности: планируются заранее (отпуск/болезнь/обучение), график пересчитывается автоматически.
Shadow-периоды: каждый новый on-call проходит ≥ 2 смен в тени.

5) Планирование и публикация графика

Горизонт планирования: 6–8 недель, пересмотр — каждые 2 недели.
Общий календарь ротаций (общедоступный read-only), в каждом слоте — P1/P2/IC/Shadow, контакты.
Замены (swap) оформляются тикетом/заявкой и подтверждаются бридж-ботом.
Публикация: за T-14 дней минимум, изменения — с уведомлением команды.

6) Процедуры передачи (handover)

Карточка смены (обязательные поля): активные инциденты (ID/SEV/владелец), следующий шаг/ETA, риски окна (релизы/миграции/квоты), состояние SLO, включенные фич-флаги деградации, статус-страница/коммс.
Чек-лист “передаю”: карточка обновлена, все устные знания → тикеты, таймеры апдейтов выставлены, подтвержден контакт P2.
Чек-лист “принимаю”: прочитал карточку, проверил дашборды за 2–4 часа, принял владение инцидентами, сделал эхо-сообщение в канал.

7) Управление усталостью (fatigue)

Лимиты пейджей/час и/или смену, авто-эскалация на P2 при превышении.
Quiet Hours для P2/P3 сигналов (страдают только Page-критические).
Post-incident rest: обязательные отгулы после тяжелых ночей (SEV-1+).
Еженедельный alert review → снижение шума, правка правил.
Мониторинг нагрузки: график “пейджи/чел” и настроение команды (NPS смен).

8) Безопасность и комплаенс

JIT/JEA-доступы: права on-call выдаются только на окно смены.
Аудит-след: кто дежурил, кто принял, какие действия выполнялись; неизменяемое хранение.
Дежурства с чувствительными операциями (PII/платежи): отдельный класс смен и допусков; запрет личных устройств, SSO+mTLS.
Точки контакта с Legal/PR/Privacy отмечены в карточке смены.

9) Автоматизация

Календарь ↔ пейджер ↔ ChatOps: бот публикует “кто on-call”, позволяет `/swap`, создает карточку handover из источников (дашборды, тикеты, релизы).
Проверка готовности в начале смены: звук пейджера, VPN/SSO, доступы, связь.
Шаблоны документов: SOP/Runbook для рутин и инцидентов; автоссылки в алертах.
Интеграция с релизами: релиз-аннотации → временные подавления неключевых алертов на первые 30 минут.

10) Метрики качества ротаций

MTTA/MTTR вокруг смены (±30 минут от переключений).
Handover Defect Rate — доля инцидентов с потерей контекста в смену.
Alerts per on-call hour (медиана/95-й перцентиль), % actionable.
Load per person — пейджи/чел/неделя; дисперсия между участниками.
Missed/Late Updates — просрочки по Comms SLA.
Swap rate и причины (усталость/отпуск/конфликты).
NPS смены (по короткому опросу) и тренд.

11) Шаблоны расписаний

А. 24/7, 8-часовые (3 бригады)


Brigade A: 08: 00-16: 00
Brigade B: 16: 00-00: 00
Brigade C: 00: 00-08: 00
Each team: P1 + P2, IC on a separate schedule (day slot)
Rotation: A→B→C every week; weekend moves in a circle

Б. Follow-the-sun (3 региона)


EU: 07:00–15:00      AMER: 15:00–23:00      APAC: 23:00–07:00 (UTC)
Each region: P1 local, P2 neighboring
IC: coincides with active region; transfer 15 minutes before shift

В. Week-on / Week-off (низкий шум)


Week 1: Team X (P1/P2) Week 2: Team Y
Daily IC common to both
Limit: no more than 2 consecutive weeks for one person

12) Чек-листы

Перед публикацией графика

  • Покрытие 24/7 без “дырок”, P1+P2 в каждом слоте.
  • Учтены отпуска/обучение/ограничения доступности.
  • Баланс ночей/выходных справедливый.
  • Назначены IC и Shadow.
  • Авто-синхронизация с пейджером/календарем включена.

Смена началась

  • P1/P2/IC подтвердили присутствие (бот/чат).
  • Проверены доступы, связь, дашборды.
  • Принята карточка handover, отправлено эхо-сообщение.

Смена завершена

  • Карточка handover обновлена и закрыта.
  • Инциденты переданы с next step/ETA.
  • Выполнен короткий AAR, зафиксированы улучшения (если были сбои).

13) Анти-паттерны

Одинокий P1 ночью без бэкапа.
Публикация графика на неделю вперед без горизонта и замены.
Релизы в момент смены без IC и гейтов.
“Устные” передачи без карточки и тикетов.
Нулевая компенсация/отгулы после тяжелых ночей.
Отсутствие аудита swap’ов и причин замен.
Ротация без обучения: новый on-call сразу “в бой”.

14) Дорожная карта внедрения (4–6 недель)

1. Нед. 1: инвентаризация покрытия, выбор модели (24/7 или follow-the-sun), назначение ролей.
2. Нед. 2: запуск календаря+пейджера+бота, шаблоны handover/SOP.
3. Нед. 3: пилот 2–3 недельных цикла, сбор метрик (alerts/hour, MTTA вокруг смен).
4. Нед. 4: alert review, тюнинг шумов и квот, ввод Shadow-смен.
5. Нед. 5–6: формализация компенсации/quiet hours, отчеты для менеджмента, автоматизация swap’ов.

15) Итог

Ротация — это процесс, а не Excel: прозрачные графики, роли и handover-карточки; автоматизация календаря и пейджера; справедливые правила и лимиты усталости; метрики качества и регулярные обзоры. При таком подходе смены становятся предсказуемыми, люди — устойчивыми, а пользователи и партнеры не замечают, что команда меняется по часам.

Contact

Свяжитесь с нами

Обращайтесь по любым вопросам или за поддержкой.Мы всегда готовы помочь!

Telegram
@Gamble_GC
Начать интеграцию

Email — обязателен. Telegram или WhatsApp — по желанию.

Ваше имя необязательно
Email необязательно
Тема необязательно
Сообщение необязательно
Telegram необязательно
@
Если укажете Telegram — мы ответим и там, в дополнение к Email.
WhatsApp необязательно
Формат: +код страны и номер (например, +380XXXXXXXXX).

Нажимая кнопку, вы соглашаетесь на обработку данных.