Işiň dowamlylygy meýilnamasy
1) Maksady, sebiti we ýörelgeleri
Maksat: şowsuzlyklar ýüze çykan halatynda möhüm hyzmatlaryň (goýumlar, nyrhlar/oýunlar, netijeler, KYC/AML, sapport) dowam etdirilmegini we ygtyýarnamalary we şertnamalary bozmazdan çalt dikeldilmegini üpjün etmek.
Sebit: onlaýn platforma, töleg kontury, antifrod/KUS, DWH/BI, sapport, amal we hukuk funksiýalary, esasy satyjylar (PSP/KYC/bulut/CDN/studiýalar/agregatorlar).
Ýörelgeler: safety first, oýunçy, ilkinji nobatda, düzgünleşdiriji dogrylyk, RTO/RPO-ny minimallaşdyrmak, ýönekeý pese gaçmak reimesimleri, subut edilip bilinjek we yzygiderli maşklar.
2) BIA - işe edýän täsiriniň seljermesi
Möhüm prosesleri, girişi/çykyşy, garaşlylygy, "el bilen" alternatiwalary we maksatly RTO/RPO kesgitläň.
BIA (YAML) bölek mysaly:yaml process: payouts owner: head_of_payments criticality: tier1 dependencies: [psp1, psp2, bank_api, kyc_service, ledger_db]
rto: "4h"
rpo: "15m"
manual_workaround: "limited manual VIP payments when the PSP is completely unavailable"
max_tolerable_downtime: "8h"
legal_constraints: ["AML/KYC check before payout," "regulatory notification windows"]
3) Ssenariler/howplar (Risk → Impact → Response)
Tech: bulut sebitiniň ýykylmagy, DD şowsuzlygy, klasteriň ýitmegi, DDoS hüjümleri, CDN şowsuzlygy.
Satyjylar: PSP/KYC zaýalanma, oýun agregatory bilen arakesme, antifrodyň/sanksiýa barlagynyň ýoklugy.
Kiber: hasaby/açary bozmak, ransomware, PII syzmak.
Prosesler/adamlar: iş taşlaýyşlar/keseller, esasy hünärmenleriň gitmegi, goýberilişiň ýalňyşlygy.
Geo/fors-major: aragatnaşygyň/energiýanyň kesilmegi, harby/sanksiýa töwekgelçiligi, domenleriň/traffigiň petiklenmegi.
Her biri üçin: triggerler, eskalasiýa bosagasy, gözegçilik çäreleri, hyzmatyň pese gaçmagy we aragatnaşyk şablonlary.
4) Durnuklylygyň we strategiýanyň arhitekturasy
Sebitler boýunça active-active/active-standby; Çalt götermek üçin infrastructure as code.
Pese gaçma düzgünleri: read-only penjireler, möhüm däl oýun üpjün edijilerini öçürmek, töleg çäkleri, gijikdirilen kassautly "diňe goýumlar" (kanuny taýdan rugsat berilse), analitikanyň ýygylygynyň peselmegi/ETL.
Traffic management: Anycast CDN, geo-deňagramlylyk, health-checks, canary-marşrut.
Maglumatlar: PITR-bekaplar, üýtgeşmeler žurnallary, sebitara köpeltmek, kriptografiki bitewilik (heşler/WORM).
Açarlar/syrlar: garaşsyz KMS per-region, žurnallaşdyrylan "break-glass".
PSP/KYC multi-homing: awtomatiki feýlower, SLA/gizlinlik boýunça marşrut.
5) Buýruk gurluşy (Incident Command System)
Incident Commander (IC) - karar bermegiň ýeke-täk nokady.
Ops Lead (SRE/Platform) - tehniki durnuklaşdyryş, feýlower, metrika.
Business Continuity Lead - prosesleri/el amallaryny utgaşdyrmak.
Comms Lead - daşarky/içerki habarnamalar (oýunçylar, hyzmatdaşlar, düzgünleşdirijiler).
Howpsuzlyk/DPO - kiber hadysalar/gizlinlik, kadalaşdyryjy penjireler.
Payments/KYC Leads - PSP/KYC ssenarileri.
Liaisons: Legal, Support, VIP/CRM, Data/BI.
Düzgün: bir hadysada bir IC, anyk kanallar we çözgütleriň ýazgylary.
6) Aragatnaşyk meýilnamasy
Kanallar: war-room (söhbetdeşlik/köpri), ätiýaçlyk aragatnaşyklar (telefon/radio/alto-messenger), PSP/KYC/banklaryň öňünden barlanan aragatnaşyklary.
Daşarky habar şablonlary: status-sahypa, sosial ulgamlar, email/push; äheň - faktlar, möhletler, indiki ädimler.
Düzgünleşdirijiler we hyzmatdaşlar: öňünden kesgitlenen salgylar, habarnamalaryň SLA-lary; ylalaşylan formulalar.
Oýunçylar: aç-açan ETA, kompensasiýa/bonuslar (mümkin bolsa), pese gaçmak döwri üçin SSS.
7) Iş meýilnamalary (Runbooks)
Bölek mysallary:7. 1 Feýlower başga sebite
yaml trigger: "loss of primary availability> = 5m, p95_latency>threshold"
steps:
- IC approves region_failover
- SRE: flip traffic via GSLB to secondary
- Data: verify replication lag < RPO
- Apps: switch env vars/secrets; warm caches
- QA: smoke tests; Business: announce status rollback: "switch-back on 60m stability"
7. 2 PSP pese gaçmagy
yaml trigger: "auth_rate_psp1 < baseline-3σ 15m"
steps:
- Payments: route X%→psp2, include limits
- Comms: banner at the checkout, status page
- Finance: reconciliation plan for T + 0
- Legal: notification log and SLA letter
7. 3 KYC üpjün ediji elýeterli däl
yaml trigger: "kyc_sla_breach 30m"
steps:
- Risk: time limits of deposits/rates
- Ops: VIP/High-risk manual check
- Comms: KYC Time Increase Notice
- Vendor: escalation, protection switch
8) IT we maglumatlary dikeltmek (DR)
Ulgamlaryň kategoriýalary: Tier-1 (platforma/tölegler/KUS), Tier-2 (oýunlar/analitika), Tier-3 (içerki).
Ýokarlanmagyň tertibi: tor → syrlar/KMS → DB → kesh → API → öň/CDN → integrasiýa → analitika.
Bitewiligini barlamak: gözegçilik pullary, magazinesurnallary barlamak/göçürmek, amallary deňeşdirmek (reconciliation).
DR synaglary: her ýyl doly (switch-over), çärýekde bölekleýin; hakyky RTO/RPO-lary düzetmek.
9) Adamlar, ofisler we logistika
Remote-ready: ätiýaçlyk noutbuklar/modemler, SSO/MFA arkaly giriş, IC üçin "gyzyl" giriş.
Alternatiw ýerler: ätiýaçlyk ofisleri/iş ýerleri, geçişleriň sanawy, ewakuasiýa edilen halatynda meýilnama.
Çalşyklaryň aýlanmagy: başarnyklaryň matrisa, esasy rollaryň gaýtalanmagy, çalyşmak meýilnamasy.
Möhüm aragatnaşyk/energiýa üpjün edijileri: aragatnaşyklar, SLA, generatorlar/UPS (degişli bolsa).
10) Wendorlar we üpjünçilik zynjyry
BCP/DR-şertnamalardaky talaplar: RTO/RPO, hökmany synaglar, audit hukugy we bilelikdäki maşklar.
Subprosessorlaryň sanawy: aragatnaşyklar, outage meýilnamalary, offboarding wagtynda maglumatlaryň aýrylandygyny/eksport edilendigini tassyklamak.
Tier-1 çärýek review: hadysalar, DR-teswirnamalar, şahadatnamalaryň ýagdaýy, SLA.
11) Okuw, maşklar we synag
Tabletop çärýekde bir gezek: PSP/KYC/bulut/kiber ssenarileri.
Tehniki maşklar: DR bölekleýin/doly; DDoS/CDN geçiş; "kill-switch" SDK üpjün edijileri.
Aragatnaşyk maşklary: press-reliz/status-täzelenmeler/kadalaşdyryjy hatlar.
Retrospektivler: timline, RCA, CAPA, runbooks täzelenmesi we BIA.
12) Metrikler (KPI/KRI)
RTO/RPO hakykat (Tier-1 boýunça): maksatlara laýyk gelýär ≥ 95%.
MTTD/MTTR: peselmek tendensiýasy; MTTR möhüm hadysalar ≤ maksatly.
Feýloweriň üstünligi: maglumatlary/sargytlary/nyrhlary ýitirmezden, ≤ X min pese gaçmagy.
Coverage maşklary: ≥ 2 doly DR-synag/ýyl + 4 tabletop.
Aragatnaşyklar: birinji güne çenli wagt ≤ 15 minut, syýasata laýyklykda täzelenmeleriň ýygylygy.
Wendor resilience: 12 aýyň dowamynda tassyklanan DR-synaglary bilen Tier-1-iň paýy 100%.
13) RACI (ulaldylan)
14) Çek-listler
14. 1 Ready-to-Failover
- IC/Wendor/Düzgünleşdiriji aragatnaşyk
- Köpeliş saglygy, yzygiderli PITR-arka
- SDK/webhook üçin "kill-switch" barlandy
- Tassyklanan saglyk barlaglary bilen trafik dolandyryjysy (GSLB/CDN)
- Status/Hat şablonlary we çap etmek hukugy
- Runbooks we Accessories (SSO/MFA) her aý barlanýar
14. 2 Waka wagtynda
- IC bellendi, açyk otag, karar ýazgylarynyň başlangyjy
- Klassifikasiýa (P1/P2), ssenariýany saýlamak we zaýalanmak
- Tehniki hereketler (feýlower/çäklendirmeler/öçürmeler)
- Ilkinji köpçülige täzelenme ≤ 15 minut
- SLA boýunça kadalaşdyryjy/hyzmatdaş habarnamalary
- Post-mortem üçin artefaktlary ele almak
14. 3 Wakadan soň
- RCA we CAPA bilen post-mortem
- Täzelenen BIA/bosagalar/gündelik amallar
- Training/retest fix, hasabat bordu
- Maliýe/berlen deňeşdirme (reconciliation)
15) Şablonlar (bölekler)
15. 1 Ssenariýa kartoçkasy
yaml scenario: "Region outage: cloud-eu1"
triggers: ["error_rate>5%", "loss of quorum", "cdn health fail"]
degradation: ["disable live-casino", "payments=psp2 only", "payouts=VIP manual"]
rto_target: "30m"
rpo_target: "15m"
contacts: {cloud: "...", isp: "...", regulator: "..."}
comms_templates: ["status_page_v1", "partner_notice_v2"]
15. 2 Status sahypasyna habar
[UTC + 02] We are seeing the degradation of payments through PSP # 1. Transactions are automatically routed through an alternative provider. Player funds are safe. The next update is in 15 minutes.
16) Resminamalary we wersiýalary dolandyrmak
BCP/Runbooks wersiýasy ammarda, change-log, resminamanyň eýesi.
Gaýtadan gözden geçirmegiň möhletleri (Tier-1 üçin çärýekde), oflayn nusgalaryň elýeterliligine gözegçilik etmek.
Maşklaryň/hadysalaryň artefaktlaryny we netijelilik metriklerini saklamak.
17) Durmuşa geçirmegiň ýol kartasy (6-8 hepde)
Hepdeler 1-2: BIA we möhüm prosesler, RTO/RPO maksatlary, ssenarileriň we eýeleriň sanawy.
Hepdeler 3-4: durnuklylygyň we pese gaçmagyň arhitekturasy, runbooks, aragatnaşyk şablonlary, aragatnaşyklar.
Hepdeler 5-6: Wendorlar bilen integrasiýa (PSP/KYC/bulut), synag maşklary (tabletop + bölekleýin DR), düzedişler.
Hepdeler 7-8: Doly DR-synag (mümkin boldugyça), çärýekleýin türgenleşik sikliniň başlamagy, bord hasabaty we kadalaşdyryjy paket (zerur bolsa).
18) Wiki bilen baglanyşykly bölümler
Töwekgelçilikleriň sanawy, Wakalar we syzmalar, DR/BCP synaglary, TPRM we SLA, ISO 27001/27701, SOC 2, PCI DSS, IGA/RBAC/Least Privilege, Regules syýasaty/WORM - durnuklylygyň we subut edilebilirligiň ýeke-täk kontury üçin.
TL; DR
Netijeli BCP = BIA → RTO/RPO → ssenariler we zaýalanmalar → multi-wendor/multi-region + aýdyň Incident Command, aragatnaşyk we maşklar. Resminamany diri saklaň, yzygiderli synagdan geçiriň - hatda uly şowsuzlyk hem işi bes etmez we ygtyýarnamalara zarba urmaz.