GH GambleHub

Əməliyyat və İdarəetmə → Növbələr arasında kontekstin ötürülməsi

Növbələr arasında kontekstin ötürülməsi

1) Niyə lazımdır

Dəyişiklik gəlir - sistem artıq «qaçır». Hendover keyfiyyəti MTTR, alert səs-küy və buraxılışların sabitliyinə birbaşa təsir edir. Yaxşı bir hendover sürətli bir istinad, aydın risklər və başa düşülən növbəti addımlardır.

Məqsədlər:
  • Hadisələrin, buraxılışların və provayderlərin kontekst itkisini istisna etmək.
  • Yeni növbənin «giriş vaxtını» saatlara deyil, dəqiqələrə endirin.
  • Kritik yolların SLO sabitləşdirin (depozit, bahis, oyunun başlaması, çıxış).
  • Kommunikasiyaları proqnozlaşdırıla bilən və yoxlanıla bilən etmək.

2) Yaxşı hendover prinsipləri

1. Standartlaşdırılmış forma (bir şablon, bir terminologiya).
2. Vahid artefaktlar (eyni daşbordlara/biletlərə/runbook 'i).
3. Taymbox (qısa «brifinq» + «longrid» yazılı).
4. Actionable: sonda - «kim/nə/nə vaxt» vəzifələrinin aydın siyahısı.
5. SLO-yönümlülük: SLO/səhv statusu, «hadisə log» deyil.
6. İzlənilebilirlik: hər hansı bir fakt artefakt ilə təsdiqlənir.

3) Rollar və məsuliyyət

Lead növbə (gediş): hendover paketi hazırlayır, brifinq keçirir.
Lead Variant (ev sahibi): suallar/risklər qeyd, qəbul təsdiq.
Hadisə meneceri: hadisənin time line/kanalını yeniləyir, SLA yeniləmələrini izləyir.
Domen sahibləri (Payments/Bets/Games/KYC): bölmələri «status və risk» verir.
SRE/Observability: artefaktları dəstəkləyir (daşbordlar, relizlərin izahları, alertlər).

4) Vaxt və kanallar

Növbəyə T-30 dəq: gedən növbə vəziyyəti dondurur, şablonu yeniləyir.
T-10 min: səsli/video kanalda sürətli brifinq (maksimum 15-20 dəqiqə).
T + 0: «#ops -handover» ümumi kanalında hendover paketinin yayımlanması.
T + 15 dəq: qəbul edən növbə qəbulu təsdiqləyir və açıq sualları dəqiqləşdirir.
Eskalasiya: bütün «qırmızı» nöqtələr dərhal müvafiq komandanın kanalına.

5) Hendover paketinin strukturu (şablon)


Handoff - <date, time, TZ>
Shift: <outgoing> → <receiving>
Overall SLO status (last 4h):
- API p95/p99: <values/trends>
- Error rate: <values/trends>
- Queue lag/DB connections/Cache: <brief>
Critical incidents:
- <INC-123>: status, impact, next update ETA, links (ticket, channel, postmortem draft)
Providers (PSP/KYC/studios):
- PSP-X: quotas/errors/fake <links>
- KYC-A: Webhook delays <links>
Releases/Features:
- In progress: <service>, stage (canary X%), gate/metrics, risk
- Scheduled: windows/locks/dependencies
Risks and observations:
- <briefly, with links and graphs>
Action items (before <time>):
- [Owner] <task>, readiness criterion
Useful links:
- Dashboard Overview, dependency map, escalation matrix, runbook 'and
On-call contacts:
- Domains/Names/Channels

6) Mini SOP hendover

1. Gedən növbə relizlərin və daşbordların (SLO, provayderlər, növbələr) yenilənməsini təmin edir.
2. Son 4 saat ərzində «qırmızı» alertləri yoxlayır, status/səbəbi qeyd edir.
3. «Risklər və müşahidələr» bölməsini yeniləyir (trendlər/şübhələr, faktlar deyil).
4. Limitlər və sahibləri ilə Action items doldurur.
5. Brifinq keçirir: 10-15 dəqiqə, ciddi şəkildə şablona uyğun.
6. Ev sahibi sual verir; lazım gələrsə - sahibləri üçün ani eskalasiya.
7. Qəbul təsdiqi: «alındı, suallar/yox», ilk addımların siyahısı.

7) Hendover keyfiyyət metrikası (KPI)

Handoff Quality Score (HQS) - çek siyahısına görə paket (0-100).
Handoff Time - brifinq müddəti (hədəf dəhlizi 10-20 dəq).
Acknowledgement SLA - 15 dəqiqə ≤ qəbulun təsdiqi.
Missing Context Rate - növbədən sonra «kontekst itkisi» ilə insidentlərin payı.
Post-Handoff Incident Spike - ilk 60 dəqiqədə alert/insidentlərin artması.
Action Items SLA - növbədən sonra vaxtında bağlanmış tapşırıqların payıdır.

8) Paket keyfiyyətinin yoxlama siyahısı (HQS qiymətləndirilməsi)

  • 4 saat ərzində SLO/açar metrlər trendlərlə doldurulur.
  • Bütün «qırmızı» alertlər səbəbləri/linkləri ilə sadalanır.
  • Hadisələr: nömrə, status, təsir, növbəti yeniləmə (vaxt).
  • Provayderlər: kvotalar/səhvlər/feylover, son dəyişikliklər.
  • Buraxılışlar/Ficks: mərhələ, risklər, geytlər/kanareyka.
  • Action items: sahibi, müddəti, hazırlıq meyarı.
  • Linklər: dashboard, kanallar, runbook 'i, eskalasiya matrisi.
  • On-call əlaqə və ehtiyat rabitə kanalları.

9) Daşbordlar «hendover üçün» (minimum)

Operations Overview: p95/p99, error rate, capacity headroom, queue lag.
Incidents Board: açıq hadisələr, ETA yeniləmə, təsir.
Release & Feature: Kanaryalar, «əvvəl/sonra» müqayisə, avtoqeytlər.
Providers Panel: kvotalar, vaxt, cost/1k calls, keçid.
Dependency Map: problemli qabırğalar (latency/errors/retries).

10) Hendover keyfiyyəti üçün alertlər (fikirlər)


ALERT HandoffNotPublished
IF handoff_published == 0 AND within(10m, shift_change) == true
LABELS {severity="warning", team="ops"}

ALERT HandoffAckSLA
IF handoff_ack_minutes > 15
LABELS {severity="warning", team="ops"}

ALERT MissingActionOwners
IF count_over_time(handoff_action_items{owner=""}[1h]) > 0
LABELS {severity="warning", team="ops"}

ALERT PostHandoffIncidentSpike
IF incidents_rate_60m_after_shift > baseline_14d 1. 5
LABELS {severity="info", team="ops"}

11) Kommunikasiya və yeniləmə formatı

Qısa yeniləmə şablonu (ümumi kanala):

[HH: MM] Handoff published. SLO OK/Degraded. Incidents: INC-123 (ETA 18:30), releases: bets-api canary 10%. Risks: PSP-X 85% quota. Action items: @ squad-payments until 7pm to check out the feilover.
Qaydalar:
  • Kritik nöqtələr üçün şəxsi söhbətlər olmadan - yalnız ümumi kanallar.
  • Hər hansı bir «qırmızı» zona - sahibləri ilə dərhal trend.
  • Bütün qərarlar/kompromislər - yazılı formada, məlumatlara istinad etməklə.

12) Domen xüsusiyyətləri (iGaming)

Payments: prioritet: depozit çevirilməsi və avtorizasiya vaxtı, PSP feylover marşrutları, provayder limitləri.
Bets: əmsal/cache yeniləmələri, axın/növbə yükü, gecikmiş hesablamalar.
Games/Live: yayım tədbirləri (cekpotlar/axınlar), veb-saytların limitləri, UI deqradasiyası.
KYC/AML: yoxlama növbəsi, SLA provayderləri, zirvələrə həssaslıq.

13) Anti-nümunələr

Hendoverin sərbəst «ixtiyari forması» (hər kəs istədiyi kimi yazır).
Qəbulu təsdiqləmək üçün heç bir müddət yoxdur.
Action items və sahibləri olmadan paketi.
Hendover SLO/risklər əvəzinə «log oxumağa» çevrilir.
Şəxsi söhbətlərdə gizli həllər - izlənilməzlik.
Şablon əsərlərə heç bir istinad yoxdur - yoxlamaq üçün heç bir şey yoxdur.

14) İnteqrasiya və artefaktlar

Qrafiklərdə relizlərin şərhləri, hendoverə avtomatik linklər.
Link unfurling: açar metrləri ilə dashboard/biletlərə link daxil edin.
Runbook bağlama: xüsusi runbook birbaşa link ilə hər «qırmızı» zona.
Eskalasiya matrisi: şablonda - vahid aktual sənəd.

15) Saxlama siyasəti və audit

Hendoverlər - mərkəzləşdirilmiş şəkildə saxlanılır (geos, tarix/vaxt, müəlliflər).
Həftəlik HQS auditi və «pis» hendoverlərin seçici təhlili.
Şablonun təftişi - rübdə və ya postmortemlərin nəticələrinə əsasən.

16) Sürətli başlanğıc (30 gün)

Həftə 1: şablon, rollar və vaxt təsdiqləmək; pilot bir xətt (məsələn, Payments).
Həftə 2: «hendover üçün» daşbordları, HandoffNotPublished/AckSLA alertlərini işə salın.
Həftə 3: HQS-skorard və audit daxil edin 10% hendovers.
Həftə 4: Bets/Games/KYC genişləndirin, retrospektiv edin, SOP yeniləyin.

17) Paket üçün «risk kartları» nümunəsi


Risk: PSP-X hits 90% quota in prime time
Impact: rise in deposit refusals, SLO payments at risk
Signals: outbound_error_rate, quota_usage_ratio
Mitigation: raise PSP-Y up to 20% of traffic in advance, enable token cache
Owner/ETA: integrations@oncall / до 18:00

18) FAQ

S: Brifinq gecikərsə nə etməli?
A: Ciddi vaxt qutusu və «brifinqdən sonra» qaydası. Paketdə asinxron tanışlıq üçün hər şey olmalıdır.

Q: «Həqiqətin müxtəlif versiyaları» ilə necə mübarizə aparmaq olar?
A: Artefaktları unifikasiya etmək: vahid daşbordlar, buraxılış izahları, SLA üçün SSOT; yalnız onlara link.

Q: Brifinq qeyd etmək lazımdırmı?
A: Bəli, mübahisəli hallar və təlim üçün. Lakin qeyd standartlaşdırılmış yazı paketini əvəz etmir.

Contact

Bizimlə əlaqə

Hər hansı sualınız və ya dəstək ehtiyacınız varsa — bizimlə əlaqə saxlayın.Həmişə köməyə hazırıq!

İnteqrasiyaya başla

Email — məcburidir. Telegram və ya WhatsApp — istəyə bağlıdır.

Adınız istəyə bağlı
Email istəyə bağlı
Mövzu istəyə bağlı
Mesaj istəyə bağlı
Telegram istəyə bağlı
@
Əgər Telegram daxil etsəniz — Email ilə yanaşı orada da cavab verəcəyik.
WhatsApp istəyə bağlı
Format: ölkə kodu + nömrə (məsələn, +994XXXXXXXXX).

Düyməyə basmaqla məlumatların işlənməsinə razılıq vermiş olursunuz.