GH GambleHub

Ծառայության պատուհաններ

1) Ի՞ նչ է «ծառայության պատուհանը» և ինչո՞ ւ է այն անհրաժեշտ։

Ծառայության պատուհանը նախապես համաձայնեցված ժամանակահատվածն է աշխատանքի համար, որոնք պոտենցիալ ազդում են հասանելիության/արտադրողականության վրա։ Նպատակը կանխատեսելի ինտեգրման, թափանցիկ հաղորդակցման և ապացուցողական հաշվետվության հետ վերահսկվող փոփոխություններն են։

Տեսակներ

Planned (պլանավորված) 'օրինագծեր, պաշտպանություններ, հավաստագրերի/ակնարկների հաշվարկներ, BD/brocers։

Emergency (արտակարգ) 'անվտանգության հրատապ ֆիքսներ/պատահականության արձագանքներ։

Silent/Zero-impact: Առանց ռուսական ազդեցության (թաքնված կանարեյներ, կրկնօրինակներ, զուգահեռ մուտքագրում)։

Provider-led: արտաքին պրովայդերների պատուհանները (PMS/KYC/CDN/Cloud)։

2) Սկզբունքներ

SLO-first 'պատուհանի ժամանակի/ձևաչափի որոշումը կայանում է SLI-ի և սխալների բյուջեների վրա։

Նվազագույն պայթուցիկ շառավղը 'կանարեյկան, որը կատարվում է աստիճանով, ամբողջական է։

Այսպիսով, յուրաքանչյուր վիրահատություն ունի backout պլան և ստուգված արձագանք։

Ճշմարտության միակ աղբյուրը 'պատուհանների օրացույցը + ticet/RTS ամբողջական փաթեթով։

Ապացույցը 'evidence (լոգներ, գրաֆիկներ, սկրինշոտներ, արտեֆակտներ) հավաքելը։

SLA-ի հաղորդակցությունը 'նախօրոք աշխատանքի ընթացքում, ավարտելուց հետո։

3) Պլանավորում 'ժամանակի ընտրություն և կայունություն

Պատուհանի ընտրությունը ցածր է, նվազագույն իմպորտը հիմնական կոորդինատների համար (տարածաշրջաններ/VIP/գործընկերներ)։

Ժամացույցի գոտիները 'ամրագրեք UTC + տեղական ժամանակը (օրինակ, Europe/Kyant)։

Բլեքլաուտ ժամանակահատվածները 'խնջույքի սեզոններում աշխատելու արգելք/իրադարձություններ (խաղեր, վաճառքներ, ստացիոնար «մահվան պատուհաններ»)։

Blast radius: հստակ որոշել, թե ում կանդրադառնա (ծառայություններ, տարածքներ, պրովայդերներ)։

4) Համաձայնեցման գործընթացը (RFC/CAB lite)

1. Նախաձեռնողը ստեղծում է ticet/RFC ռիսկի և պլանի վերլուծությամբ (տե՛ ս ներքևում)։

2. Ռիսկերի գնահատումը (Low/Med/High) և www.ru + MSE/անվտանգության սեփականատիրոջ հայտարարությունը։

3. Օրացույց 'փղի ամրագրում; հակամարտությունների ստուգում (այլ պատուհաններ/պրովայդերներ)։

4. Կոմմ պլանը 'նախապես նշված ծանուցումները և կարգավիճակը։

5. Go/J-Go-հանդիպումը (24-48 ժամ) High-risk-ի համար։

5) Պատրաստումը 'անվտանգության խաղացողներ

Ստուգումներ սկսելուց առաջ 'հաջողակ թեստեր սթեյջի վրա, արտեֆակտները ստորագրվել են, ընդհանուր ռիսկերը թույլատրելի են։

Կանարեյկա ՝ 1 տոկոսը 355 տոկոսը 25 տոկոսն է կոկորդով/տարածաշրջանով։ Ավտոմատ SLO-gardrails և Auto-antate։

Ֆիչա դրոշը և լիմիտները պատրաստ են։

Rollback/backout պլանը ստուգված է ավազի մեջ։ արձագանքման թիմերը մեկնաբանվում են։

Suppression alerts 'միայն սպասվող աղմուկի համար, SLO ազդանշանները չեն կուլ տալիս։

Հասանելի ՝ JIT/JFC վիրահատությունների համար, մանդատային աուդիտ։

6) Հաղորդակցություն (թայմինգ և բովանդակություն)

T-14/7/2 օր (պլանավորված) 'heads-up հաճախորդների/ներքին թիմերի համար (որ/երբ/ազդեցություն/կոնտակտներ)։

T-60/30/15 րոպե 'հիշեցումներ ներսում և կարգավիճակի էջում։

Աշխատանքի ընթացքում 'յուրաքանչյուր 15-30 րոպե (SEV կախվածություն) մոդելի վրա' Impact International Tramp։

Հետո 'վերջնական «Completed/Partially completed/Rolled back», փոփոխությունների ցանկը, SLO ստուգումը։

7) Աշխատանքի իրականացումը (հանրաքվե սցենարը)

1. Freeze-ը կապ չունի։

2. Անցումը canary (սահմանափակված կոորդինատներ) կատարվում է SLI/metrics p95/p99։

3. Կանաչ զգեստապահարաններում մասնաբաժնի ավելացումը։

4. Բիզնես SLI-ի ստուգումը (հակադարձում, վճարման/գրանցման հաջողությունը)։

5. Ֆունկցիոնալություն չեկի թերթիկի (happy path + կրիտիկական սցենարներ)։

6. Rele.ru/System-rele.ru լուծումը (IC/MSE/հյուրանոցների սեփականատերը)։

7. Suppression-ի հեռացումը, ռուսական ալերտ քաղաքական։

8) Պատուհանից հետո 'հավատարմագրում և հաշվետվություններ

Observation-ը (օրինակ, 1-24 ժամ) 'SLO-ի և սխալների հետևում։

Պատուհանի մասին զեկույցը 'ինչ են արել, չափումներ, շեղումներ, էվիդենցիա, արդյունք։

Եթե խնդիրներ կային, AAR no RCA no CAPA (կանոնների, թեստերի, փաստաթղթերի ֆիքսը)։

Արխիվ 'թիկեթ, արտեֆակտներ, ստորագրություններ, վերահսկողական գումարներ։

9) Արտաքին պրովայդերների հետ համակարգումը

Ապացուցված արցունքները և պրովայդերի շփումները։ պատուհանը նրանց կարգավիճակի համակարգում։

Ֆոլբեկ/միկրոօրգանիզացիա այլընտրանքային պրովայդերի վրա աշխատանքի ժամանակահատվածի համար։

Միասնական war-room պրովայդերի (չաթ/բրիջի) և SLA apdeits-ի հետ։

10) Գործընթացի հասունության մետրիկները

On-time rate: Պատուհանների տոկոսը, որոնք սկսվել/ավարտվել են ժամանակին։

Change failure rate: Պատուհանների տոկոսը/ազդում SLO-ի վրա։

Incident-during-MW-ն 'պատուհանի ժամանակ տեղի ունեցած միջադեպերը։

Communational SLA-ը ժամանակին ապդեյտների մասն է։

Evidence completeness: Պատուհանների տոկոսը ապացույցների ամբողջական փաթեթով։

Customer impact: բողոքներ/հյուսվածքներ 1 պատուհանի վրա, միտում։

Յոթ/30 օր անց 'SLO-ը և ռեցիդիվների բացակայությունը։

11) Չեկ թերթերը

Պատուհանից առաջ

  • RFC/ticet լցված է; ռիսկի գնահատումը կատարվում է; սեփականատերը նշանակվել է։
  • Կանարեյկան և backout պլանը ստուգված են. արձագանքման թիմերը բողոքում են։
  • JIT հասանելի է; ալերտները տրամադրված են (SLO-ն չի կուլ տալիս)։
  • Օրացույցը/կարգավիճակը և ծանուցումները։
  • Ալմաթի/մրցակցող պատուհանները սառեցված/շարժվող են։
  • Պրովայդերները ապացուցված են; շփումները և SLA-ն գրված են։

Ժամանակի ընթացքում

  • Apdeits գրաֆիկով; war-room ակտիվ է։
  • Gardrails SLO/սխալների գագաթնակետին հետևում են. խախտման դեպքում 'մեքենա-արձագանք։
  • Evidence-ը հավաքվում է (սկրինշոտներ, գրաֆիկներ մինչև/հետո, գործողությունների լոգ)։

Հետո

  • SLO կանաչ գոտում observation-ի ընթացքում։
  • Evidence-ի վերջին զեկույցը; կարգավիճակը-էջը նորարարված է։
  • CAPA-ն կազմված է (եթե կան շեղումներ); ստանդարտը նորարարված է։

12) Ձևանմուշներ

Ձևանմուշներ RFC ծառայության պատուհանի վրա


RFC: MW-2025-11-05-DB-Upgrade
Window: 2025-11-05 00: 00-02: 00 UTC (Europe/Kyiv 02: 00-04: 00)
Service/component: payments-db (PostgreSQL cluster A)
Type: Planned (High)
Target: Upgrade to 15. x for security/bugs
Blast radius: EU region, tenant EU, all write operations
Impact: up to 2 × p99 growth to 400 ms; short-term read-only (≤5 min)
Gardrails: error-rate <0. 5%, p99 <400 ms, SLO not impaired
План: expand→migrate→contract; canary 1 %/5 %/25%; 1..N steps (with commands)
Backout: rolling back replica/slots; TTL DNS does not change; rollback time ≤ 10 min
Suppression: noise of database/replica alerts; SLO alerts are active
Communications: T-7/T-2 days and T-60/15 minutes; war-room #mw-db-a
Owners: @ db-tl, @ sre-ic, @ payments-pm
Evidence: before/after p95/p99 graphs, migration logs, checksums
Risk: High (data) - confirmed by CAB

Հաճախորդների ծանուցման ձևը (հակիրճ)


Topic: Planned work 05. 11. 2025 02:00–04:00 (Europe/Kyiv)
We will update the payment database. Short delays and read-only mode (up to 5 minutes) are possible.
On-call contacts: status. example. com      support@example. com

Suppression կանոնները (գաղափարը)

yaml suppress:
- name: db-maintenance when: window("2025-11-05T00:00Z","2025-11-05T02:00Z")
match: [ "db. replica. lag", "db. connection. reset", "migration. progress" ]
keep: [ "slo. payment. success", "api. availability" ]

13) Կանոնավոր օրինագծերի առանձնահատկությունները

Աուդիտ-լոգը անփոփոխ է 'ով է, ով կատարում է, ինչ թիմեր, արտեֆակտներ։

PII/ֆինանսներ 'դիմակավորում evidence-ում, սահմանափակ հասանելիություն զեկույցներին։

Հաճախորդների և հաճախորդների ծանուցման ժամանակը պայմանագրերին համապատասխան է։

Պրովայդերական պատուհանները, որոնք տեղադրված են արտաքին SLA-ի և կոնտակտների հետ։

14) Anti-patterna

Պատուհանը առանց backout պլանի և ստուգված արձագանքի։

SLO ազդանշանների ներարկումը «ամեն դեպքում»։

Մրցակցող պատուհանները մեկ պրոֆիլում/տարածաշրջանում։

Կոմմ-լռություն 'չկա ապդեյթ «մինչև/հետո»։

Ձեռքի ուղղությունները վաճառվում են առանց հաճախորդների և ջութակների։

«Անվերջ» պատուհանները հաջողության անորոշ չափանիշների պատճառով։

Evidence-ի բացակայությունը որակը ապացուցելու բան չէ։

15) Ճանապարհի քարտեզը (4-6 շաբաթ)

1. Մոսկվան։ 1: ներդնել միասնական օրացույց և RSA ձևանմուշ; որոշել բլաուտ ժամանակահատվածները։

2. Մոսկվան։ 2: ստանդարտացնել գեյտերը (կանարեյկա, SLO գարդրեյլա, backout)։

3. Մոսկվան։ 3: ավտոմատիզացնել supression/անգիտակցություններ և կարգավիճակ-էջ։

4. Մոսկվան։ 4 'հաշվետվություններ և հասունություն; Շաբաթական MW ակնարկ։

5. Մոսկվան։ 5-6 'պրովայդերների և աուդիտի արխիվի հետ ինտեգրումը; High-risk պատուհանի սիմուլյացիա։

16) Արդյունքը

Ճիշտ կազմակերպված ծառայության պատուհանները կառավարվող, շրջադարձային և ապահով փոփոխություններ են։ SLO-gardrails-ի հետ, կանարյան բացատներում, խիստ հաղորդակցություններով և evidence-ի ամբողջական շարքով պատուհանը վերածվում է «սարսափելի ժամանակից» բարելավման մեխանիզմի 'առանց օգտագործողների և գործընկերների անակնկալների։

Contact

Կապ հաստատեք մեզ հետ

Կապ հաստատեք մեզ հետ ցանկացած հարցի կամ աջակցության համար։Մենք միշտ պատրաստ ենք օգնել։

Telegram
@Gamble_GC
Սկսել ինտեգրացիան

Email-ը՝ պարտադիր է։ Telegram կամ WhatsApp — ըստ ցանկության։

Ձեր անունը ըստ ցանկության
Email ըստ ցանկության
Թեմա ըստ ցանկության
Նամակի բովանդակություն ըստ ցանկության
Telegram ըստ ցանկության
@
Եթե նշեք Telegram — մենք կպատասխանենք նաև այնտեղ՝ Email-ի дополнение-ով։
WhatsApp ըստ ցանկության
Ձևաչափ՝ երկրի կոդ և համար (օրինակ՝ +374XXXXXXXXX)։

Սեղմելով կոճակը՝ դուք համաձայնում եք տվյալների մշակման հետ։