Texnologiyalar va infratuzilma → Bulutli arxitektura va SLA
Bulutli arxitektura va SLA
1) Nima uchun SLA va ularni qanday boshqarish kerak
SLA (Service Level Agreement) - biznes/hamkorlarga xizmat ko’rsatishning qulayligi, tezligi va to’g «riligi to’g» risida tashqi va’da.
SLO (Service Level Objective) - jamoalar uchun ichki maqsadli darajalar.
SLI (Service Level Indicator) - o’lchanadigan metriklar bo’lib, ular asosida SLO baholanadi.
iGaming/fintech uchun cho’qqilarning qattiq oynalari (turnirlar, hayot stavkalari, hisobot davrlari, «ish haqi» kunlari), PSP/KYC provayderlari va geografiyaga kuchli bog’liqlik xos. SLA bu xatti-harakatlarni hisobga olishi kerak, arxitektura esa nafaqat o’rtacha, balki qarama-qarshilikni ham kafolatlaydi.
2) Bazaviy terminologiya
Foydalanish imkoniyati (Availability) - vaqt oralig’ida muvaffaqiyatli so’rovlar ulushi.
Latentlik - asosiy operatsiyalar uchun P50/P95/P99.
Xato - aniq aniqlang (5xx, taymaut, biznes xatosi?).
RTO (Recovery Time Objective) - qancha vaqt tiklashga ruxsat beriladi.
RPO (Recovery Point Objective) - avariyada qancha ma’lumotlar yo’qolishi mumkin.
Error Budget - 1 − SLO, o’zgarishlar va hodisalar uchun «zaxira».
3) SLA ostidagi bulutli arxitektura ramkasi
3. 1 Ko’p zonalilik (Multi-AZ)
Holatni kamida 2-3 AZ ga replikatsiya qilish (DB, kesh, navbatlar).
Sovuq/issiq stendbay, avtomatik failover.
per-AZ health-cheklari bilan mahalliy balanslashtiruvchilar (L4/L7).
3. 2 Multiregion
Aktiv-aktiv: past RTO/RPO, konsistentlik va qiymati murakkabroq.
Aktiv-passiv (hot/warm): arzon, RTO katta, ammo ma’lumotlarni boshqarish oson.
Geografik routing (GeoDNS/Anycast), «blast radius» izolyatsiyasi.
3. 3 Omborlar va ma’lumotlar
Tranzaksion DB: mintaqa ichida sinxron replikatsiya, mintaqalararo asinxron replikatsiya.
Kesh: kross-mintaqaviy nusxalar, «local reads + async warmup» rejimi.
Obyekt ombori: versiyalash, hayot sikllari, cross-region replication.
Navbatlar/striming: ko’zgu klasterlari/ko’p mintaqaviy oqimlar.
3. 4 Konturlarni izolyatsiya qilish
Tanqidiy servislar (payments/wallet) va «og’ir» tahliliy vazifalarni ajratish.
Rate-limits/quotas konturlar orasidagi hisobotlarni «yemaslik» uchun.
4) Yuqori ommabop patternlar
Bulkhead & Pool Isolation - birikmalar va resurslar hovuzlarini izolyatsiya qilish.
Circuit Breaker + Timeouts - tashqi integratsiyalardan himoya qilish.
Idempotency - so’rovlarni ikki marta hisobdan chiqarmasdan takrorlaymiz.
Graceful Degradation - degradatsiyada nefundamental fichlarni (avatarklar, kengaytirilgan filtrlar) o’chirib qo’yamiz.
Backpressure - Kelayotgan oqimni boshqaring, «ufqgacha» navbatlarni oʻtkazmang.
Chaos/Failure Injection - ishonchlilik gipotezalarini tekshirish uchun rejalashtirilgan «muvaffaqiyatsizliklar».
5) DR strategiyalari (Disaster Recovery)
Tanlash: to’lovlar/hamyon - minimal Hot Standby; kontent/katalog - Warm; hisobotlar - Aniq oynali Backup & Restore.
6) SLI/SLO haqida: to’g "ri o’lchash
6. Darajalar bo’yicha 1 SLI
Mijoz SLI: end-to-end (shu jumladan, shlyuz va tashqi provayderlar).
Service SLI: «sof» yashirin/xizmat xatosi.
Biznes-SLI: CR (ro’yxatdan o’tish → depozit), T2W (time-to-wallet), PSP-decline rate.
6. 2 SLO misollari
Core API foydalanish imkoniyati: ≥ 99. 30 kun ichida 95%.
Payout-tashabbusning latentligi: P95 ≤ 350 ms, P99 ≤ 700 ms.
PSP vebxuklarini yetkazib berish: ≥ 99. 9% 60 sek davomida (retraylar bilan).
Data Freshness hisobotlari: ≤ 10 daqiqa 95% vaqt.
6. 3 Error Budget Policy
budjetning 50 foizi - o’zgarishlarga (relizlar/eksperimentlar), 50 foizi - hodisalarga.
Byudjetning yonishi → friz fich, faqat barqarorlashtirish.
7) Unumdorlik va masshtablash
SLO yo’naltirilgan signallarga ega HPA/VPA (nafaqat CPU, balki navbatlar/yashirin).
Jadval va tarixiy cho’qqilarga asoslangan taxminiy skeyling.
Warm pools/turnirlar oldidan DB/PSP ulanishlarini oldindan isitish.
Kesh va edge - RTTni kamaytirish, ayniqsa oʻyin kataloglari va statik assetalar uchun.
8) Tarmoq qatlami va global trafik
Anycast/GeoDNS latentlikni minimallashtirish va avariyalarni mahalliylashtirish uchun.
Failover-siyosati: mintaqaning health-namunalari, ostonalar, TTL bilan «stickiness».
chetida mTLS/WAF/Rate Limit, bot-trafikdan himoya qilish.
PSP/KYC ga allow-list va SLA-aware retraylari bo’yicha egress-nazorat.
9) Ma’lumotlar va konsistentlik
Muvofiqlik darajasini tanlash: qatʼiy (payments) vs eventual (katalog/reyting).
Tanqidiy buyruqlarni oʻqish va vertikal yuklash uchun CQRS.
Outbox/Inbox voqealarni «bir marta» yetkazish uchun.
Downtaymsiz migratsiyalar: expand-migrate-contract, MAJOR-oʻzgarishlar paytida ikki marta yozish.
10) SLA ostida kuzatish (Observability)
Shlyuz orqali treyslar:’trace _ id’ning hamkor/mintaqa/API versiyasi bilan korrelyatsiyasi.
burn-rate bilan SLO-dashbordlar, hududlar va provayderlar bo’yicha «ob-havo».
Alertlar simptomlar bo’yicha emas, balki proxy simptomlari bo’yicha (CPU emas, balki P99/xatolar).
Synthetics: target mamlakatlaridan tashqi tekshiruvlar (TR, BR, EU...).
Audit va hisobot: SLI/SLOni sheriklik portaliga eksport qilish.
11) Xavfsizlik va komplayens
Tarmoqlar segmentatsiyasi va maxfiy menejment (KMS/Vault).
Parvoz/tinchlikda shifrlash, PAN/PII tokenlash.
Ma’murlar/operatorlar uchun rollar bo’yicha foydalanish siyosati.
Audit uchun o’zgarmas loglar (WORM) va retenshn.
Regulyator: mintaqada saqlash, hisobotlar, SLAni bajarishning isbotlanishi.
12) FinOps: SLA qiymat drayveri sifatida
SLO tannarxiga narxlarni qo’ying: qancha turadi + 0. 01% foydalanish imkoniyati?
Yuqori oynalarni profil qiling, doimiy quvvatni oshirmang.
Orqa fon vazifalari uchun Right-sizing va «spot qaerda mumkin».
Konturlar uchun kvotalar va byudjetlar, «bepul» degradatsiyaga yo’l qo’ymang.
13) Ishonchlilikni sinovdan o’tkazish
GameDay/Chaos-sessiyalar: AZ/PSP o’chirish, navbatlarda kechikishlar, BGP uzilishlari.
DR-drili: Hududlarni RTO maqsadlari bilan almashtirish bo’yicha muntazam trening.
Load & Soak: haqiqiy stavka/turnir profillari bilan uzoq vaqt davom etadi.
Replay-hodisalar: mashhur fayllar va skriptlar kutubxonasi.
14) SLAning protsessual tomoni
SLO katalogi: egasi, formulasi, metrikasi, manbalari, alertlari.
RFC/ADR orqali oʻzgarishlar: error budgetga taʼsirini baholash.
Postmortemalar: arxitektura va ranbuklarni yaxshilash, SLOni tuzatish.
Hamkorlar bilan aloqa: tarqatish, status-sahifa, planned maintenance.
15) SLI/SLO/hisobotlar namunalari
15. 1 formula
SLI_availability = (успешные_запросы / все_запросы) 100%
SLI_latency_P99 = перцентиль_99(латентность_запроса)
SLI_webhook_D+60 = доля вебхуков, доставленных ≤ 60 сек
15. 2 Core API uchun SLO toʻplami misoli
Foydalanish imkoniyati (30 kun): 99. 95%
P95 endpoint ’/v2/payouts/create’: ≤ 350 ms
Xatolar 5xx (1 soat): <0. 3%
Webhook delivery ≤ 60 сек (P99): ≥ 99. 9%
Hamyon uchun RPO: ≤ 60 sek, RTO ≤ 5 min
15. 3 SLA hisoboti (siqish)
Bajarildi: 99. 97% (SLO 99. 95%) +
Buzilishlar: PSP taymautlari tufayli BR mintaqasi bo’yicha 2 ta epizod (jami 8 daqiqa).
Chora-tadbirlar: rad etish kodlari boʻyicha smart-routing qoʻshildi, PSP-B. ga warm pool ulanishlar koʻpaytirildi
16) Joriy etish chek-varaqasi
1. Tanqidiy foydalanuvchi yoʻllari va tegishli SLI belgilandi.
2. SLO 30/90 kunga + error budget policy.
3. Ko’p zonali va RTO/RPO maqsadli DR rejasi, muntazam drill.
4. Geo-targetdan Synthetics, per-region/per-PSP dashbordlari.
5. Barqarorlik patternlari: circuit breaker, backpressure, idempotency.
6. Oʻchiriladigan fich uchun degradatsiya va feature flags siyosati.
7. FinOps: konturlar boʻyicha byudjetlar, choʻqqilar prognozi, warm pools.
8. Xavfsizlik: segmentatsiya, shifrlash, audit.
9. Hamkorlar uchun SLA hujjatlari, aloqa jarayoni.
10. Retrospektivlar va SLOni har 1-2 chorakda qayta ko’rib chiqish.
17) Anti-patternlar
Oʻlchanadigan SLI va shaffof hisoblash uslubisiz SLAni va’da qilish.
Shlyuz/provayderlarni e’tiborsiz qoldirib, «xizmat kirishda» foydalanish imkoniyatini hisoblash.
Faqat o’rtacha latentlikka tayanib, P99 quyruqlarini e’tiborsiz qoldiring.
DR «qog’oz bo’yicha», haqiqiy mashg’ulotlarning yo’qligi.
Limitsiz «abadiy» resurslar: bitta hisobot prod.
Prod va og’ir tahlillarni bitta klaster/DBda aralashtirish.
18) Jami
SLA ostidagi bulutli arxitektura - bu texnik patternlar (multi-AZ/region, izolyatsiya, uzilishga chidamli ma’lumotlar), jarayonlar (SLO, error budget, DR-drili) va iqtisodiyot (FinOps) kombinatsiyasi. O’zingizga bashorat qilingan nosozliklarga huquq bering: muvaffaqiyatsizlikka chidamliligini sinab ko’ring, parsentil bo’yicha o’lchang, «portlash radiusi» ni cheklang va ochiq aloqa qiling. Shunda SLAning va’dalari marketing emas, balki boshqariladigan muhandislik amaliyotiga aylanadi.