GH GambleHub

Операциялар және басқару → Ауысымдар арасында контексті беру

Ауысымдар арасында контексті жіберу

1) Бұл не үшін қажет

Ауысым келеді - жүйе «жүгіріп жатыр». Хендовердің сапасы MTTR, алерт шуы және релиздердің тұрақтылығына тікелей әсер етеді. Жақсы хендовер - бұл жылдам бағдар, айқын тәуекелдер және түсінікті келесі қадамдар.

Мақсаттары:
  • Оқыс оқиғалар, релиздер және провайдерлер бойынша контекстің жоғалуын болдырмау.
  • Жаңа ауысымның «кіру уақытын» сағатқа емес, минутқа дейін азайту.
  • SLO сындарлы жолдарды тұрақтандыру (депозит, мөлшерлеме, ойынды іске қосу, шығару).
  • Коммуникацияларды болжамды және тексерілетін ету.

2) Жақсы хендовер принциптері

1. Стандартталған нысан (бір үлгі, бір терминология).
2. Бірыңғай артефакттар (бірдей дашбордтарға/тикеттерге/runbook 'и сілтемелері).
3. Таймбокс (қысқа «брифинг» + «лонгрид» жазбаша түрде).
4. Actionable: соңында - «кім/не/қашан» тапсырмаларының айқын тізімі.
5. SLO-бағдарлану: «оқиғалар журналы» емес, SLO/қателер бойынша мәртебе.
6. Трассалануы: кез келген факт артефактпен расталады.

3) Рөлдер мен жауапкершілік

Lead ауысым (кететін): хендовер пакетін дайындайды, брифинг өткізеді.
Lead ауысым (қабылдаушы): сұрақтарды/тәуекелдерді белгілейді, қабылдауды растайды.
Инцидент менеджері: оқиғаның таймлайн/арнасын жаңартады, SLA жаңартуларын қадағалайды.
Домен иелері (Payments/Bets/Games/KYC): өз секциялары бойынша «мәртебе мен тәуекел» береді.
SRE/Observability: артефактілерді (дашбордтар, релиздер аңдатпалары, алерттар) қолдайды.

4) Тайминг және арналар

Ауысымға дейін T-30 мин: ауысым статусын тоқтатады, үлгісін жаңартады.
T-10 мин: дыбыстық/бейне арнада жылдам брифинг (максимум 15-20 минут).
T + 0: «#ops -handover» жалпы арнасында хендовер пакетін жариялау.
T + 15 мин: қабылдаушы ауысым қабылдауды растайды және ашық сұрақтарды нақтылайды.
Эскалация: барлық «қызыл» пункттер бірден тиісті команданың арнасына.

5) Хендовер пакетінің құрылымы (шаблон)


Handoff - <date, time, TZ>
Shift: <outgoing> → <receiving>
Overall SLO status (last 4h):
- API p95/p99: <values/trends>
- Error rate: <values/trends>
- Queue lag/DB connections/Cache: <brief>
Critical incidents:
- <INC-123>: status, impact, next update ETA, links (ticket, channel, postmortem draft)
Providers (PSP/KYC/studios):
- PSP-X: quotas/errors/fake <links>
- KYC-A: Webhook delays <links>
Releases/Features:
- In progress: <service>, stage (canary X%), gate/metrics, risk
- Scheduled: windows/locks/dependencies
Risks and observations:
- <briefly, with links and graphs>
Action items (before <time>):
- [Owner] <task>, readiness criterion
Useful links:
- Dashboard Overview, dependency map, escalation matrix, runbook 'and
On-call contacts:
- Domains/Names/Channels

6) Шағын SOP хендовер

1. Өтіп бара жатқан ауысым релиздер мен дашбордтардың аннотацияларын (SLO, провайдерлер, кезектер) жаңартады.
2. Соңғы 4 сағат ішінде «қызыл» алерталарды тексереді, мәртебесін/себебін белгілейді.
3. «Тәуекелдер мен байқаулар» бөлімін жаңартады (үрдістер/күдік, фактілер емес).
4. Мерзімі өткен және иелері бар Action items бағдарламасын толтырады.
5. Брифинг өткізеді: 10-15 минут, қатаң түрде үлгі бойынша.
6. Қабылдаушы ауысым сұрақтар қояды; қажет болса - иелеріне дереу өршіту.
7. Қабылдауды растау: «қабылданды, сұрақтар/жоқ», алғашқы қадамдар тізімі.

7) Хендовер сапасының өлшемдері (KPI)

Handoff Quality Score (HQS) - чек парағы бойынша пакеттің (0-100) скорингі.
Handoff Time - брифингтің ұзақтығы (мақсатты дәліз 10-20 мин).
Acknowledgement SLA - қабылдауды растау ≤ 15 минут.
Missing Context Rate - ауысымнан кейін «контекст жоғалту» оқиғаларының үлесі.
Post-Handoff Incident Spike - алғашқы 60 минут ішінде қателіктердің/оқыс оқиғалардың өсуі.
Action Items SLA - ауысымнан кейін жабылған тапсырмалар үлесі.

8) Пакет сапасының чек-парағы (HQS бағасы)

  • SLO/негізгі метриктер 4 сағат ішінде трендтермен толтырылды.
  • Барлық «қызыл» алерталар себептермен/сілтемелермен санамаланған.
  • Оқиғалар: нөмірі, мәртебесі, әсері, келесі жаңартылуы (уақыты).
  • Провайдерлер: квоталар/қателер/фейловер, соңғы өзгерістер.
  • Релиздер/фичтер: сатылар, тәуекелдер, гейттер/канарейка.
  • Action items: иесі, мерзімі, дайындық өлшемі.
  • Сілтемелер: дашбордтар, арналар, runbook 'i, эскалация матрицасы.
  • On-call контактілері және резервтік байланыс арналары.

9) «Хендоверге арналған» дашбордтар (минимум)

Operations Overview: p95/p99, error rate, capacity headroom, queue lag.
Incidents Board: ашық оқиғалар, ETA жаңартулары, әсері.
Release & Feature: канарейка, «дейін/кейін» салыстыру, автогейта.
Providers Panel: квоталар, таймауттар, cost/1k calls, ауыстырып қосу.
Dependency Map: проблемалық қабырға (latency/errors/retries).

10) Хендоверлер (идеялар) сапасына арналған алерттар


ALERT HandoffNotPublished
IF handoff_published == 0 AND within(10m, shift_change) == true
LABELS {severity="warning", team="ops"}

ALERT HandoffAckSLA
IF handoff_ack_minutes > 15
LABELS {severity="warning", team="ops"}

ALERT MissingActionOwners
IF count_over_time(handoff_action_items{owner=""}[1h]) > 0
LABELS {severity="warning", team="ops"}

ALERT PostHandoffIncidentSpike
IF incidents_rate_60m_after_shift > baseline_14d 1. 5
LABELS {severity="info", team="ops"}

11) Коммуникация және апдейт форматы

Қысқа түбіртек үлгісі (ортақ арнаға):

[HH: MM] Handoff published. SLO OK/Degraded. Incidents: INC-123 (ETA 18:30), releases: bets-api canary 10%. Risks: PSP-X 85% quota. Action items: @ squad-payments until 7pm to check out the feilover.
Ережелер:
  • Сындарлы пункттер үшін жеке сөйлесулерсіз - тек ортақ арналар.
  • Кез келген «қызыл» аймақ - иелерімен дереу сөйлесу.
  • Барлық шешімдер/мәмілелер - деректерге сілтеме жасай отырып, жазбаша түрде.

12) Домендердің ерекшеліктері (iGaming)

Payments: басымдық: депозитті конверсиялау және авторизация уақыты, PSP фейловер бағыттары, провайдерлер бойынша лимиттер.
Bets: коэффициенттерді/кэштерді жаңарту, стриминг/кезек жүктемесі, есеп айырысу кідірісі.
Games/Live: хабар тарату іс-шаралары (джекпоттар/стримдер), вебсокеттер лимиттері, UI деградациясы.
KYC/AML: тексеру кезегі, SLA провайдерлері, шыңдарға сезімталдық.

13) Қарсы үлгілер

Хендовердің еркін «еркін нысаны» (әрқайсысы қалағанындай жазады).
Қабылдауды растайтын мерзім жоқ.
Action items және иелері жоқ бума.
Хендовер SLO/тәуекелдердің орнына «логтарды оқуға» айналады.
Жекеше чаттарда құпия шешімдер - трассаланудың болмауы.
Үлгіде артефактілерге сілтеме жоқ - тексеру үшін ештеңе жоқ.

14) Интеграция және артефактілер

Графиктердегі релиздердің аннотациялары, хендоверге автосілтемелер.
Link unfurling: Дашбордтарға/тикеттерге сілтемелер қою.
Runbook байламдары: нақты runbook қызметіне тікелей сілтемесі бар әрбір «қызыл» аймақ.
Эскалация матрицасы: үлгіде - бірыңғай өзекті құжат.

15) Сақтау саясаты және аудит

Хендоверлер - орталықтандырылған түрде сақталады (геос, күні/уақыты, авторлар).
HQS апта сайынғы аудиті және «нашар» хендоверлерді іріктеп талдау.
Үлгіні тексеру - тоқсан сайын немесе постмортем қорытындылары бойынша.

16) Жылдам бастау (30 күн)

1-апта: үлгіні, рөлдерді және тайминг бекіту; пилотты бір желіде іске қосу (мысалы, Payments).
Апта 2: «хендовер үшін» дашбордтарды, HandoffNotPublished/AckSLA алерттерін қосу.
Апта 3: HQS-скорард және аудит енгізіңіз 10% хендоверлер.
Апта 4: Bets/Games/KYC кеңейтіңіз, ретроспективаны өткізіңіз, SOP жаңартыңыз.

17) Пакетке арналған «тәуекел карточкаларының» мысалы


Risk: PSP-X hits 90% quota in prime time
Impact: rise in deposit refusals, SLO payments at risk
Signals: outbound_error_rate, quota_usage_ratio
Mitigation: raise PSP-Y up to 20% of traffic in advance, enable token cache
Owner/ETA: integrations@oncall / до 18:00

18) FAQ

Q: Егер брифинг ұзаққа созылса не істеу керек?
А: Қатаң таймбокс және «брифингтен кейін» ережесі. Пакетте асинхронды танысу үшін барлығы болуы тиіс.

Q: «Шындықтың түрлі нұсқаларымен» қалай күресуге болады?
А: Артефактілерді біріздендіру: бірыңғай дашбордтар, релиздер аңдатпалары, SLA үшін SSOT; оларға ғана сілтемелеу.

Q: Брифингті жазу керек пе?
А: Иә, даулы жағдайлар мен оқыту үшін. Бірақ жазба стандартталған жазбаша пакетті алмастыра алмайды.

Contact

Бізбен байланысыңыз

Кез келген сұрақ немесе қолдау қажет болса, бізге жазыңыз.Біз әрдайым көмектесуге дайынбыз!

Интеграцияны бастау

Email — міндетті. Telegram немесе WhatsApp — қосымша.

Сіздің атыңыз міндетті емес
Email міндетті емес
Тақырып міндетті емес
Хабарлама міндетті емес
Telegram міндетті емес
@
Егер Telegram-ды көрсетсеңіз — Email-ге қоса, сол жерге де жауап береміз.
WhatsApp міндетті емес
Пішім: +ел коды және номер (мысалы, +7XXXXXXXXXX).

Батырманы басу арқылы деректерді өңдеуге келісім бересіз.