Xizmat koʻrsatish oynalari
1) «Xizmat ko’rsatish oynasi» nima va u nima uchun zarur?
Xizmat ko’rsatish oynasi - mavjud/unumdorlikka ta’sir ko’rsatadigan ishlar uchun oldindan kelishilgan vaqt oralig’i. Maqsad - tavakkalchilik, shaffof kommunikatsiya va dalillarga asoslangan hisobot bilan nazorat qilinadigan oʻzgarishlar.
Turlari:- Planned (rejali): relizlar, migratsiyalar, sertifikatlar/kalitlar rotatsiyasi, DB/brokerlarning yangilanishlari.
- Emergency (avariya): shoshilinch xavfsizlik fiksi/noxush qaytish.
- Silent/Zero-impact: foydalanuvchi taʼsirisiz (yashirin kanareykalar, replikalar, parallel kirish).
- Provider-led: tashqi provayderlar oynalari (PSP/KYC/CDN/Cloud).
2) Qonunning
SLO-first: oynaning vaqti/formati to’g’risidagi qaror SLI va xato byudjetlariga ta’sir qilish uchun qabul qilinadi.
Minimal portlash radiusi: kanareyka → bosqichli → to’liq yoqish.
Qaytariluvchanlik: har bir operatsiyada backout-reja va tasdiqlangan qaytarish mavjud.
Yagona haqiqat manbai: oynalar taqvimi + toʻliq maʼlumotlar toʻplami bilan tiket/RFC.
Dalillar: evidence to’plash (loglar, grafiklar, skrinshotlar, artefaktlar xeshlari).
SLA bo’yicha kommunikatsiyalar: oldindan, ish davomida, yakunlangandan keyin.
3) Rejalashtirish: vaqt va qamrov tanlash
Oynani tanlash: past trafik, asosiy kogortlar uchun minimal impakt (mintaqalar/VIP/sheriklar).
Soat mintaqalari: UTC + mahalliy vaqt (masalan, Europe/Kyiv).
Bleklaut davrlari: eng yuqori mavsumlarda/tadbirlarda ishlashni taqiqlash (o’yinlar, sotuvlar, reliz «o’lim oynalari»).
Blast radius: kimga ta’sir qilishini aniq aniqlash (servislar, hududlar, provayderlar).
4) Kelishish jarayoni (RFC/CAB lite)
1. Tashabbuskor tavakkalchilik tahlili va reja bilan/RFC chiptasini yaratadi (quyidagi namunaga qarang).
2. Xavflarni baholash (Low/Med/High) va servis egasining + SRE/xavfsizlikni tasdiqlashi.
3. Kalendar: slot bron qilish; mojarolarni tekshirish (boshqa oyna/provayderlar).
4. Komm-reja: oldindan kelishilgan bildirishnomalar va maqom-sahifa.
5. High-risk o’zgarishlari uchun Go/No-Go-uchrashuv (24-48 soat).
5) Tayyorgarlik: xavfsizlik geytalari
Steyjda muvaffaqiyatli testlar, artefaktlar imzolangan, umumiy xavflar yo’l qo’yiladigan ≤.
Kanareyka: 1% → 5% → 25% kogorta/mintaqa bo’yicha; avtomatik SLO-gardreylar va avto-otkat.
Tanazzul bayroqlari va limitlar tayyor.
Rollback/backout-rejasi qum qutisida tekshirilgan; qaytarish buyruqlari hujjatlashtirilgan.
Suppression alertlari: faqat kutilayotgan shovqin uchun, SLO-signallarni to’xtatib bo’lmaydi.
Foydalanuvchilar: JIT/JEA operatsiyalar uchun hisoblar, mandatli audit.
6) Kommunikatsiyalar (tayming va mazmuni)
T-14/7/2 kun (rejali): mijozlar/ichki jamoalar uchun heads-up (nima/qachon/ta’sir/kontaktlar).
T-60/30/15 daqiqa ichida va maqom sahifasida eslatmalar.
Ish paytida: yangilanishlar har 15-30 daqiqada (SEV-bog’liq) shablon bo’yicha: Impakt → Bosqich → Keyingi yangilanish.
So’ngra: yakuniy «Completed/Partially completed/Rolled back», o’zgarishlar ro’yxati, SLO tekshiruvi.
7) Ishlarni olib borish (referens-stsenariy)
1. Freeze bogʻlanmagan relizlar.
2. canary (cheklangan kogorta) → SLI/p95/p99 metriklarini kuzating.
3. Yashil gardreyllarda ulushni bosqichma-bosqich oshirish.
4. Biznes-SLIni tekshirish (konvertatsiya, to’lovlar/ro’yxatdan o’tkazishlarning muvaffaqiyati).
5. Funksiyani chek varaqasi bilan tekshirish (happy path + tanqidiy stsenariylar).
6. Release/No-release yechimi (IC/SRE/servis egasi).
7. Suppressionni olib tashlash, alert siyosatchilarni qaytarish.
8) Derazadan keyin: verifikatsiya va hisobot
Observation window (masalan, 1-24 soat): SLO va xatolarni kuzatish.
Deraza bo’yicha hisobot: nima qildingiz, metriklar, og’ishlar, evidence, yakun.
Agar muammolar bo’lsa: AAR → RCA → CAPA (qoidalar, testlar, hujjatlar).
Arxiv: tiket, artefaktlar, imzolar, nazorat summalari.
9) Tashqi provayderlar bilan muvofiqlashtirish
Provayderning tasdiqlangan slotlari va aloqalari; ularning status-tizimidagi oyna.
Ish davrida muqobil provayderga yo’naltirish.
Provayder (chat/brij) va SLA yangilanishlari bilan yagona war-room.
10) Jarayonning etuklik metrikasi
On-time rate: muddatida boshlangan/tugagan oynalar%.
Change failure rate: SLOga taʼsir koʻrsatuvchi oynalar%.
Incident-during-MW: oynada sodir bo’lgan hodisalar.
Communication SLA: o’z vaqtida yangilanishlar ulushi.
Evidence completeness: Dalillar to’plami to’liq bo’lgan oynalar%.
Customer impact: 1 oyna uchun shikoyat/chiptalar, trend.
7/30 kundan keyin: SLO barqarorligi va retsidivlarning yo’qligi.
11) Chek-varaqlar
Oynaning oldida
- RFC/chipta to’ldirilgan; tavakkalchilik baholash bajarildi; egasi tayinlangan.
- Kanareyka va backout-reja tekshirildi; qaytish buyruqlari sinovdan o’tkazildi.
- JIT kirish imkoniyati berilgan; Alertlar sozlangan (SLO bosilmagan).
- Kalendar/maqom sahifasi va xabarnomalar tayyorlandi.
- Relizlar/raqobatdosh derazalar - muzlatilgan/siljitilgan.
- Provayderlar tasdiqlandi; aloqalar va SLA yozilgan.
- Jadval bo’yicha yangilanishlar; war-room aktiv.
- SLO/xatolarning cho’qqisi bo’yicha gardreyllarga rioya qilinadi; buzilganda - avto-qaytish.
- Evidence yig’iladi (skrinshotlar, harakatlardan oldin/keyin grafiklar, harakatlar jurnali).
- observation window davomida yashil zonada SLO.
- evidence bilan yakuniy hisobot; maqom sahifasi yangilandi.
- CAPA rasmiylashtirilgan bo’lsa; hujjatlar yangilandi.
12) Namunalar
Xizmat koʻrsatish oynasidagi RFC namunasi
RFC: MW-2025-11-05-DB-Upgrade
Window: 2025-11-05 00: 00-02: 00 UTC (Europe/Kyiv 02: 00-04: 00)
Service/component: payments-db (PostgreSQL cluster A)
Type: Planned (High)
Target: Upgrade to 15. x for security/bugs
Blast radius: EU region, tenant EU, all write operations
Impact: up to 2 × p99 growth to 400 ms; short-term read-only (≤5 min)
Gardrails: error-rate <0. 5%, p99 <400 ms, SLO not impaired
План: expand→migrate→contract; canary 1 %/5 %/25%; 1..N steps (with commands)
Backout: rolling back replica/slots; TTL DNS does not change; rollback time ≤ 10 min
Suppression: noise of database/replica alerts; SLO alerts are active
Communications: T-7/T-2 days and T-60/15 minutes; war-room #mw-db-a
Owners: @ db-tl, @ sre-ic, @ payments-pm
Evidence: before/after p95/p99 graphs, migration logs, checksums
Risk: High (data) - confirmed by CAB
Mijoz xabarnomasi namunasi (qisqacha)
Topic: Planned work 05. 11. 2025 02:00–04:00 (Europe/Kyiv)
We will update the payment database. Short delays and read-only mode (up to 5 minutes) are possible.
On-call contacts: status. example. com support@example. com
Suppression qoidalari (g’oya)
yaml suppress:
- name: db-maintenance when: window("2025-11-05T00:00Z","2025-11-05T02:00Z")
match: [ "db. replica. lag", "db. connection. reset", "migration. progress" ]
keep: [ "slo. payment. success", "api. availability" ]
13) Tartibga solinadigan domenlar uchun xususiyatlar
Audit-log o’zgarmas: kim ma’qulladi, kim bajardi, qanday buyruqlar, artefaktlarning xeshlari.
PII/moliya: evidence-da yashirish, hisobotlardan foydalanish cheklangan.
Mijozlar va sheriklarni xabardor qilish muddatlari - kontraktlarga muvofiq.
Provayder oynalari - tashqi SLA va aloqalar bilan hujjatlashtirilgan.
14) Anti-patternlar
Backout-rejasiz va tekshirilgan qaytishsiz oyna.
«Har qanday holatda» SLO signallarini bostirish.
Bitta domen/mintaqadagi raqobatdosh oynalar.
Komm-sukunat: «oldin/vaqtida/keyin» yangilanishlar yo’q.
Audit va skriptsiz prodda qoʻlda tahrir qilish.
Muvaffaqiyatning noaniq mezonlari tufayli «cheksiz» oynalar.
Evidence sifatini tasdiqlaydigan hech narsa yo’q.
15) Joriy etish yo’l xaritasi (4-6 hafta)
1. Ned. 1: yagona kalendar va RFC namunasini kiritish; bleklaut-davrlarni belgilash.
2. Ned. 2: geytlarni (kanareyka, SLO-gardreylar, backout) standartlashtirish.
3. Ned. 3: relizlar va maqom sahifasining suppression/izohlarini avtomatlashtirish.
4. Ned. 4: hisobot va etuklik metrikasi; haftalik MW-review.
5. Ned. 5-6: provayderlar va audit-arxiv bilan integratsiya qilish; High-risk oynasini simulyatsiya qilish.
16) Jami
Toʻgʻri tashkil etilgan xizmat koʻrsatish oynalari boshqariladigan, qaytariladigan va isbotlanadigan xavfsiz oʻzgarishlardir. SLO-gardreylar, kanareyeklar, qattiq kommunikatsiyalar va to’liq evidence to’plami bilan deraza foydalanuvchilar va hamkorlar uchun kutilmagan hodisalarsiz «dahshatli vaqt» dan odatiy yaxshilash mexanizmiga aylanadi.