GH GambleHub

Վիրահատությունները և Կառավարումը հաստատեցին Կոնտեքստի փոխանցումը հերթափոխերի միջև

Կոնտեքստի փոխանցումը հերթափոխերի միջև

1) Ինչո՞ ւ է դա անհրաժեշտ

Փոփոխությունը գալիս է, համակարգը արդեն «վազում է»։ Հենդովերի որակը ուղղակիորեն ազդում է MTTR-ի վրա, Ալտերի աղմուկը և ռոտուլները։ Լավ հենդովերը արագ ուղեցույց է, հստակ ռիսկեր և հասկանալի հաջորդ քայլերը։

Նպատակները

Բացառել ենթատեքստը միջադեպերի, հաղորդագրությունների և պրովայդերների մասին։

Նվազեցնել նոր հերթափոխի «ժամանակը» մինչև րոպե, ոչ թե ժամ։

Կայունացնել SLO քննադատական ճանապարհները (դեպոզիտ, տոկոսադրույքը, խաղի մեկնարկը, եզրակացությունը)։

Հաղորդակցությունները դարձնել կանխատեսելի և ստուգելի։

2) Լավ շահենդովերի սկզբունքները

1. Ստանդարտացված ձևը (մեկ ձև, մեկ տերմինաբանություն)։

2. Միասնական արտեֆակտներ (հղում նույն dashbords/ticets/runbook "և)։

3. Թայմբոքսը (կարճ «ինդեքսը» + «լոնգրիդ» գրավոր տեսքով)։

4. Actionable: Վերջում '«ով/ինչ/երբ» առաջադրանքների ակնհայտ ցուցակը։

5. SLO կողմնորոշումը 'SLO/սխալների կարգավիճակը, ոչ թե «իրադարձությունների ծուղակը»։

6. Ուղեվարձը 'ցանկացած փաստ հաստատվում է արտեֆակտով։

3) Դերեր և պատասխանատվություն

Lead հերթափոխը (հեռացող), պատրաստվում է hendover փաթեթը, ծախսում է։

Lead փոփոխությունը (ընդունում) 'տեղադրում է հարցեր/ռիսկեր, հաստատում է ընդունումը։

Պատահականության ղեկավարը 'նորարարում է թայմլինը/կոդավորման ալիքը, հետևում է SLA apdeits-ին։

Օրինագծերի սեփականատերերը (Payments/Bets/Games/KYC), իրենց հատվածներով տալիս են «կարգավիճակ և ռիսկ»։

MSE/Observability: աջակցում են արտեֆակտները (dashbords, ածխաջրածիններ, ալերտներ)։

4) Թայմինգը և ջրանցքները

T-30 րոպե մինչև հերթափոխը, հեռացող փոփոխությունը սառեցնում է կարգավիճակը, նորարարում է ձևերը։

T-10 րոպե 'արագ ինդեքսը (15-20 րոպե առավելագույնը) ձայնային/վիդեո ալիքում։

T + 0: Ռուսական հենդովերի հրապարակումը «# ops-handover» ընդհանուր ալիքում։

T + 15 րոպե, ընդունող փոփոխությունը հաստատում է ընդունումը և պարզաբանում բաց հարցերը։

Էսկալացիա 'բոլոր կարմիր կետերը անմիջապես ռուսական թիմի ալիքի մեջ։

5) Ռոտենհենդովերի կառուցվածքը (ձևանմուշ)


Handoff - <date, time, TZ>
Shift: <outgoing> → <receiving>
Overall SLO status (last 4h):
- API p95/p99: <values/trends>
- Error rate: <values/trends>
- Queue lag/DB connections/Cache: <brief>
Critical incidents:
- <INC-123>: status, impact, next update ETA, links (ticket, channel, postmortem draft)
Providers (PSP/KYC/studios):
- PSP-X: quotas/errors/fake <links>
- KYC-A: Webhook delays <links>
Releases/Features:
- In progress: <service>, stage (canary X%), gate/metrics, risk
- Scheduled: windows/locks/dependencies
Risks and observations:
- <briefly, with links and graphs>
Action items (before <time>):
- [Owner] <task>, readiness criterion
Useful links:
- Dashboard Overview, dependency map, escalation matrix, runbook 'and
On-call contacts:
- Domains/Names/Channels

6) Mini-SOP hendover

1. Հեռացող փոփոխությունը նորարարում է ածխաջրերի և դաշբորդի (SLO, պրովայդերներ, հերթեր)։

2. Ստուգում է «կարմիր» ալերտները վերջին 4 ժամվա ընթացքում, գրանցում է կարգավիճակը/պատճառը։

3. Նորարարում է «Ռիսկեր և դիտարկումներ» բաժինը (միտումներ/կասկածներ, ոչ փաստեր)։

4. Լրացնում է Action items-ը dedlines և սեփականատերերի հետ։

5. Իրականացնում է ինդեքսը '10-15 րոպե, խստորեն ձևանմուշով։

6. Ընդունող փոփոխությունը հարցեր է տալիս. եթե անհրաժեշտ է ակնթարթային էսկալացիա սեփականատերերի համար։

7. Մրցույթի ապացույցը '«ստացվեց, հարցեր/ոչ», առաջին քայլերի ցուցակը։

7) Հենենդովերի որակի մետրիիկները (KPI)

Handoff Quality Score-ը (HQS) - Chack-Liste-ի վրա։

Handoff Time-ը ինդուկցիայի տևողությունն է (ռուսական միջանցքը 10-20 րոպե)։

Acknowledg.ru SLA-ն 15 րոպե է։

Missing Express Rate-ը փոփոխությունից հետո «ենթատեքստի կորստի» հաճախորդի մասն է։

Post-Handoff Incident Spike-ը առաջին 60 րոպեների ընթացքում alerts/2019 աճն է։

Action Items SLA-ը փոփոխությունից հետո փակված առաջադրանքների մասն է։

8) Chek-Like-ը (HQS գնահատական)

  • Լցված SLO/հիմնական մետրերը 4 ժամ տենդենցներով։
  • Բոլոր «կարմիր» ալերտները նշված են պատճառներով/հղումներով։
  • Միջադեպեր ՝ համարը, կարգավիճակը, ազդեցությունը, հաջորդ ապդեյթը (ժամանակ)։
  • Պրովայդերներ ՝ քվոտաներ/սխալներ/կեղծ, վերջին փոփոխությունները։
  • Ալմաթի/ֆիչին 'փուլ, ռիսկեր, խաղացողներ/կանարեյկա։
  • Action items: սեփականատերը, ժամանակահատվածը, պատրաստակամության չափանիշը։
  • Աքսեսուարներ 'dashbords, ալիքներ, runbook "և, շարժասանդուղքների մատրիցա։
  • Կոնտակտներ on-call և պահեստային կապի ալիքներ։

9) Dashbords «hendover» (նվազագույն)

Operations Overview: p95/p99, error rate, capacity headroom, queue lag.

Incidents Board: Բաց պատահարներ, ETA apdeits, ազդեցություն։

Releault & Feature: Kanaraks, համեմատություն «մինչև/հետո», ավտոմեքենաները։

Providers Panel: քվոտաներ, թայմաուտներ, cost/1k calls, 108։

Dependency Map: խնդրահարույց կողոսկրներ (latency/errors/retries)։

10) Ալերտայի որակը (գաղափարները)


ALERT HandoffNotPublished
IF handoff_published == 0 AND within(10m, shift_change) == true
LABELS {severity="warning", team="ops"}

ALERT HandoffAckSLA
IF handoff_ack_minutes > 15
LABELS {severity="warning", team="ops"}

ALERT MissingActionOwners
IF count_over_time(handoff_action_items{owner=""}[1h]) > 0
LABELS {severity="warning", team="ops"}

ALERT PostHandoffIncidentSpike
IF incidents_rate_60m_after_shift > baseline_14d 1. 5
LABELS {severity="info", team="ops"}

11) Հաղորդակցությունն ու ապդեյտների ձևաչափը

Կարճ ապդեյտա (ընդհանուր ջրանցքում)


[HH: MM] Handoff published. SLO OK/Degraded. Incidents: INC-123 (ETA 18:30), releases: bets-api canary 10%. Risks: PSP-X 85% quota. Action items: @ squad-payments until 7pm to check out the feilover.

Կանոնները

Առանց մասնավոր խոսքերի կրիտիկական կետերի համար միայն ընդհանուր ջրանցքներ են։

Ցանկացած կարմիր գոտի սեփականատերերի հետ չարտոնված տրեդն է։

Բոլոր լուծումները/փոխզիջումները գրավոր են, հղում տվյալները։

12) Առյուծների հատկությունները (iGaming)

Payments: առաջնահերթություն 'ավանդի փոխակերպումը և հեղինակային ժամանակը, PSA-ի կեղծ երթուղիները, պրովայդերների սահմանները։

Բեթս 'գործակիցների/քեշի նորարարությունները, որոնք տեղադրված են սթրիմինգի/հերթի վրա, հետաձգում են։

Games/Lenta.ru (ջեքպոտներ/սթրիմ), կայքերի սահմանները, UI-ի քայքայումը։

KYC/AML 'ստուգման հերթը, SLA պրովայդերը, պիկի զգայունությունը։

13) Anti-patterna

Ազատ «հիբրիդային ձևը» (յուրաքանչյուրը գրում է ինչպես ուզում է)։

Ոչ մի ապացույց չկա։

Փաթեթը առանց Action items-ի և սեփականատերերի։

Հենդովերը վերածվում է «լոգարանների կարդալու» SLO/ռիսկերի փոխարեն։

Գաղտնիության գաղտնի լուծումները ուղեղի բացակայությունն են։

Ձևանմուշները չեն պարունակում արտեֆակտների հղումներ, որոնք չեն կարող ստուգել։

14) Մոսկվան և արտեֆակտները

Օրինագծերի նույնականացումը գրաֆիկների վրա, ավտոսրահները հենդովերի մեջ։

Link unfurling: Տեղադրեք հղումներ dashbords/ticets, որոնք ունեն հիմնական մետրը։

Runbook-2019 'յուրաքանչյուր կարմիր գոտի, որը ուղիղ հղում է հատուկ runbook-ին։

Էսկալացիայի մատրիցա 'ձևանմուշում' մեկ իրական փաստաթուղթ։

15) Պահպանման և աուդիտի քաղաքականությունը

Հենդովերները, պահպանվում են կենտրոնացված (գեոս, ամսաթիվը/ժամանակը, հեղինակները)։

HQS-ի շաբաթական աուդիտը և «վատ» հենդովերների ընտրության վերլուծությունը։

Ձևանմուշների վերանայումը եռամսյակային է կամ հետմորտեմների արդյունքում։

16) Արագ սկիզբը (30 օր)

Շաբաթը 1 'հաստատել ձևանմուշները, դերերը և թայմինգը։ փորձարկել օդաչուն մեկ տողի վրա (օրինակ ՝ Payments)։

Շաբաթը 2: միացրեք dashbords «հենդովերի համար», HandofflInttPublished/AckSLA ալտերտերը։

Շաբաթը 3: ներդրել HQS-սկորրադ և 10 տոկոսը հենդովերներ։

Շաբաթ 4: ընդլայնել Bets/Games/KYC-ում, հետադարձ հայացք անցկացնել, թարմացնել SOP-ը։

17) «Ռիսկի քարտի» օրինակը մրցույթի համար


Risk: PSP-X hits 90% quota in prime time
Impact: rise in deposit refusals, SLO payments at risk
Signals: outbound_error_rate, quota_usage_ratio
Mitigation: raise PSP-Y up to 20% of traffic in advance, enable token cache
Owner/ETA: integrations@oncall / до 18:00

18) FAQ

Q 'Ի՞ նչ անել, եթե ճեպազրույցը ձգվում է։

A 'Խիստ թայմբոքսը և «տրեդը ճեպազրույցից հետո» կանոնը։ Փաթեթում ամեն ինչ պետք է լինի ասինխրոն ծանոթանալու համար։

Q 'Ինչպե՞ ս պայքարել «ճշմարտության տարբեր տարբերակների» հետ։

A 'Միավորել արտեֆակտները' մեկ դաշնամուրներ, օրինագծեր, SSOT SLA-ի համար։ բռնել միայն նրանց վրա։

Q 'Պե՞ տք է արդյոք գրի առնել ճեպազրույցը։

Ա 'Այո, վիճահարույց դեպքերի և ուսուցման համար։ Բայց ձայնագրությունը չի փոխարինում ստանդարտացված գրավոր փաթեթը։

Contact

Կապ հաստատեք մեզ հետ

Կապ հաստատեք մեզ հետ ցանկացած հարցի կամ աջակցության համար։Մենք միշտ պատրաստ ենք օգնել։

Սկսել ինտեգրացիան

Email-ը՝ պարտադիր է։ Telegram կամ WhatsApp — ըստ ցանկության։

Ձեր անունը ըստ ցանկության
Email ըստ ցանկության
Թեմա ըստ ցանկության
Նամակի բովանդակություն ըստ ցանկության
Telegram ըստ ցանկության
@
Եթե նշեք Telegram — մենք կպատասխանենք նաև այնտեղ՝ Email-ի дополнение-ով։
WhatsApp ըստ ցանկության
Ձևաչափ՝ երկրի կոդ և համար (օրինակ՝ +374XXXXXXXXX)։

Սեղմելով կոճակը՝ դուք համաձայնում եք տվյալների մշակման հետ։