व्यापार निरंतरता योजना
1) उद्देश्य, क्षेत्र और सिद्धांत
उद्देश्य: लाइसेंस और अनुबंधों का उल्लंघन किए बिना विफलताओं और त्वरित वसूली के मामले में महत्वपूर्ण सेवाओं (जमा, दांव/खेल, निष्कर्ष, केवाईसी/एएमएल, समर्थन) की निरंतरता सुनिश्चित करना।
क्षेत्र: ऑनलाइन प्लेटफ़ॉर्म, भुगतान लूप, एंटी-फ्रॉड/सीयूएस, डीडब्ल्यूएच/बीआई, समर्थन, परिचालन और कानूनी कार्य, प्रमुख विक्रेता (पीएसपी/केवाईसी/क्लाउड/सीडीएन/स्टूडियो/एग्रेजेटर)।
सिद्धांत: सुरक्षा पहले, खिलाड़ी पहले, नियामक शुद्धता, आरटीओ/आरपीओ न्यूनतम, सरल गिरावट मोड, उत्पादकता और नियमित अभ्यास।
2) बीआईए - व्यापार प्रभाव विश्लेषण
महत्वपूर्ण प्रक्रियाओं, इनपुट/आउटपुट, निर्भरता, मैनुअल विकल्प और लक्ष्य आरटीओ/आरपीओ की पहचान करें।
BIA टुकड़ा (YAML) का उदाहरण:yaml process: payouts owner: head_of_payments criticality: tier1 dependencies: [psp1, psp2, bank_api, kyc_service, ledger_db]
rto: "4h"
rpo: "15m"
manual_workaround: "limited manual VIP payments when the PSP is completely unavailable"
max_tolerable_downtime: "8h"
legal_constraints: ["AML/KYC check before payout," "regulatory notification windows"]
3) जोखिम → प्रभाव → प्रतिक्रिया
वे: क्लाउड क्षेत्र दुर्घटना, डेटाबेस विफलता, क्लस्टर हानि, डीडीओएस हमले, सीडीएन विफलता।
विक्रेता: PSP/KYC गिरावट, गेम एग्रीगेटर के साथ ब्रेक, एंटी-फ्रॉड/स्वीकृति स्क्रीनिंग की दुर्गमता।
साइबर: खाता/कुंजी समझौता, रैंसमवेयर, पीआईआई लीक।
प्रक्रियाएं/लोग: हड़ताल/बीमारियां, प्रमुख विशेषज्ञ प्रस्थान, रिलीज त्रुटि।
जियो/फोर्स मेजर: संचार/ऊर्जा आउटेज, सैन्य/प्रतिबंध जोखिम, डोमेन/ट्रैफिक रुकावटें।
प्रत्येक के लिए: ट्रिगर, वृद्धि सीमा, नियंत्रण उपाय, सेवा गिरावट और संचार टेम्पलेट।
4) स्थिरता वास्तुकला और रणनीतियाँ
क्षेत्र द्वारा सक्रिय-सक्रिय/सक्रिय-स्टैं त्वरित चढ़ाई के लिए कोड के रूप में बुनियादी ढांचा।
गिरावट मोड: रीड-ओनली शोकेस, गैर-महत्वपूर्ण गेम प्रदाताओं का डिस्कनेक्शन, भुगतान सीमा, आस्थगित कैशआउट (यदि कानूनी रूप से अनुमत हो), कम एनालिटिक्स/ईटीएल फ्रीक्वेंसी के साथ "केवल जमा"।
यातायात प्रबंधन: Anycast CDN, भू-संतुलन, स्वास्थ्य-जांच, कैनरी-रूटिंग।
डेटा: PITR बैकअप, लॉग बदलें, अंतर-क्षेत्र प्रतिकृति, क्रिप्टोग्राफिक अखंडता (हैश/WORM)।
कुंजी/रहस्य: स्वतंत्र केएमएस प्रति क्षेत्र, लॉगिंग के साथ "ब्रेक-ग्लास"।
PSP/KYC मल्टी-होमिंग: स्वचालित विफलता, SLA/विलंबता मार्ग।
5) हादसा कमांड सिस्टम
हादसा कमांडर (आईसी) - एक एकल निर्णय बिंदु।
ऑप्स लीड (एसआरई/प्लेटफ़ॉर्म) - तकनीकी स्थिरीकरण, फीलओवर, मैट्रिक्स।
व्यवसाय निरंतरता लीड - प्रक्रियाओं/मैनुअल प्रक्रियाओं का समन्वय।
कम्स लीड - बाहरी/आंतरिक सूचनाएं (खिलाड़ी, भागीदार, नियामक)।
सुरक्षा/डीपीओ - साइबर घटनाएं/गोपनीयता, नियामक विंडो।
भुगतान/केवाईसी लीड - पीएसपी/केवाईसी परिदृश्य।
संपर्क: कानूनी, समर्थन, वीआईपी/सीआरएम, डेटा/बीआई।
नियम: प्रति घटना एक आईसी, स्पष्ट चैनल और निर्णय लॉग।
6) संचार योजना
चैनल: वॉर-रूम (चैट/ब्रिज), बैकअप कनेक्शन (फोन/रेडियो/ऑल-मैसेंजर), प्री-चेक किए गए पीएसपी/केवाईसी/बैंक संपर्क।
बाहरी संदेश टेम्पलेट: स्थिति पृष्ठ, सामाजिक नेटवर्क, ईमेल/पुश; टोन - तथ्य, समय, अगले कदम।
नियामक और भागीदार: प्रीसेट पते, एसएलए सूचनाएं; सहमत शब्द।
खिलाड़ी: गिरावट अवधि के लिए पारदर्शी ईटीए, मुआवजे/बोनस (यदि लागू हो), एफएक्यू।
7) परिचालन योजनाएं (रनबुक)
टुकड़ों के उदाहरण:7. 1 फीलोवर दूसरे क्षेत्र में
yaml trigger: "loss of primary availability> = 5m, p95_latency>threshold"
steps:
- IC approves region_failover
- SRE: flip traffic via GSLB to secondary
- Data: verify replication lag < RPO
- Apps: switch env vars/secrets; warm caches
- QA: smoke tests; Business: announce status rollback: "switch-back on 60m stability"
7. 2 पीएसपी गिरावट
yaml trigger: "auth_rate_psp1 < baseline-3σ 15m"
steps:
- Payments: route X%→psp2, include limits
- Comms: banner at the checkout, status page
- Finance: reconciliation plan for T + 0
- Legal: notification log and SLA letter
7. 3 KYC प्रदाता अनुपलब्ध
yaml trigger: "kyc_sla_breach 30m"
steps:
- Risk: time limits of deposits/rates
- Ops: VIP/High-risk manual check
- Comms: KYC Time Increase Notice
- Vendor: escalation, protection switch
8) आईटी और डेटा रिकवरी (डीआर)
सिस्टम श्रेणियां: टियर -1 (प्लेटफ़ॉर्म/भुगतान/सीसीएम), Tier-2 (गेम/एनालिटिक्स), Tier-3 (आंतरिक)।
उठाने की प्रक्रिया: set→sekrety/KMS→BD→kesh→API→front/CDN→integratsii→analitika।
अखंडता जाँच - चेकसम, लॉग/प्रतिकृति सत्यापन, लेनदेन सामंजस्य।
डीआर परीक्षण: सालाना पूर्ण (स्विच-ओवर), त्रैमासिक आंशिक; वास्तविक आरटीओ/आरपीओ कमिट करें
9) लोग, कार्यालय और रसद
दूरस्थ तैयार: निरर्थक लैपटॉप/मॉडेम, एसएसओ/एमएफए के माध्यम से पहुंच, आईसी के लिए "लाल" पहुंच।
वैकल्पिक स्थान: अतिरिक्त कार्यालय/सहकर्मी स्थान, पास सूची, निकासी योजना।
शिफ्ट का रोटेशन: क्षमता मैट्रिक्स, प्रमुख भूमिकाओं का दोहराव, प्रतिस्थापन योजना।
महत्वपूर्ण संचार/ऊर्जा प्रदाता: संपर्क, एसएलए, जनरेटर/यूपीएस (यदि संबंधित हो)।
10) विक्रेताओं और आपूर्ति श्रृंखला
संविदाओं में बीसीपी/डीआर आवश्यकताएं: आरटीओ/आरपीओ, अनिवार्य परीक्षण, लेखा परीक्षा अधिकार और संयुक्त अभ्यास।
उप-प्रोसेसर का रजिस्टर: संपर्क, आउटेज योजना, ऑफबोर्डिंग के दौरान डेटा विलोपन/निर्यात की पुष्टि।
टियर -1 त्रैमासिक समीक्षा: घटनाएं, डीआर प्रोटोकॉल, प्रमाणन स्थिति, एसएलए।
11) प्रशिक्षण, अभ्यास और परीक्षण
एक बार तिमाही में टेबलटॉप: पीएसपी/केवाईसी/क्लाउड/साइबर परिदृश्य।
टेक अभ्यास: डीआर आंशिक/पूर्ण; DDoS/CDN स्विचिंग; "किल-स्विच" एसडीके प्रदाता।
संचार अभ्यास: प्रेस विज्ञप्ति/स्थिति अद्यतन/नियामक पत्र।
पूर्वव्यापी: समयरेखा, आरसीए, सीएपीए, रनबुक अपडेट और बीआईए।
12) मेट्रिक्स (केपीआई/केआरआई)
आरटीओ/आरपीओ वास्तविक (टियर -1 के अनुसार): लक्ष्यों को पूरा करें ≥ 95%।
MTTD/MTTR: नीचे की ओर रुझान; महत्वपूर्ण घटनाओं के एमटीटीआर - लक्षित।
Feilover सफलता: डेटा/ऑर्डर/दरों के नुकसान के बिना, ≤ X मिनट की गिरावट।
कवरेज अभ्यास: ≥ 2 पूर्ण डीआर परीक्षण/वर्ष + 4 टेबलटॉप।
संचार: पहले अपडेट का समय ≤ 15 मिनट, नीति के अनुसार अपडेट की आवृत्ति।
विक्रेता लचीलापन: 12 महीनों में पुष्टि की गई डीआर परीक्षणों के साथ टियर -1 का हिस्सा 100% है।
13) आरएसीआई (बढ़ाहुआ)
14) चेकलिस्ट
14. 1 रेडी-टू-फेलओवर
- वर्तमान आईसी/विक्रेता/नियामक संपर्क
- प्रतिकृति स्वास्थ्य, नियमित PITR बैकअप
- एसडीके/वेबहुक किल-स्विच सत्यापित
- ट्रैफिक मैनेजर (GSLB/CDN) मान्य स्वास्थ्य-जांच के साथ
- स्थिति/पत्र टेम्पलेट और प्रकाशन अधिकार
- रनबुक और एक्सेस (एसएसओ/एमएफए) ने मासिक समीक्षा की
14. 2 घटना के दौरान
- आईसी सौंपा, युद्ध-कक्ष खुला, निर्णय लॉग शुरू
- वर्गीकरण (P1/P2), परिदृश्य चयन और क्षरण
- तकनीकी क्रियाएं (फीलओवर/लिमिट/डिस्कनेक्शन)
- पहला सार्वजनिक अपडेट ≤ 15 मिनट
- एसएलए नियामक/भागीदार सूचनाएं
- पोस्टमार्टम के लिए कलाकृतियों पर कब्जा
14. 3 घटना के बाद
- आरसीए और सीएपीए के साथ पोस्टमार्टम
- अद्यतन BIA/थ्रेसहोल्ड/रूटीन
- प्रशिक्षण/सेवानिवृत्त सुधार, बोर्ड रिपोर्ट
- वित्तीय/सुलह
15) साँचा (टुकड़े)
15. 1 स्क्रिप्ट कार्
yaml scenario: "Region outage: cloud-eu1"
triggers: ["error_rate>5%", "loss of quorum", "cdn health fail"]
degradation: ["disable live-casino", "payments=psp2 only", "payouts=VIP manual"]
rto_target: "30m"
rpo_target: "15m"
contacts: {cloud: "...", isp: "...", regulator: "..."}
comms_templates: ["status_page_v1", "partner_notice_v2"]
15. 2 स्थिति पृष्ठ पर संदेश
[UTC + 02] We are seeing the degradation of payments through PSP # 1. Transactions are automatically routed through an alternative provider. Player funds are safe. The next update is in 15 minutes.
16) दस्तावेज़ और संस्करण प्रबंधन
भंडार, परिवर्तन-लॉग, दस्तावेज़ स्वामी में BCP/Runbooks का वर्शन।
संशोधन अवधि (टियर -1 के लिए त्रैमासिक), ऑफ़ लाइन प्रतियों की उपलब्धता का नियंत्रण।
ड्रिल/घटना कलाकृतियों और प्रदर्शन मैट्रिक्स का भंडारण।
17) कार्यान्वयन रोडमैप (6-8 सप्ताह)
सप्ताह 1-2: बीआईए और महत्वपूर्ण प्रक्रियाएं, आरटीओ/आरपीओ लक्ष्य, परिदृश्यों और मालिकों की सूची।
सप्ताह 3-4: स्थिरता और गिरावट मोड, रनबुक, संचार टेम्पलेट, संपर्क की वास्तुकला।
सप्ताह 5-6: विक्रेता एकीकरण (पीएसपी/केवाईसी/क्लाउड), पायलट अभ्यास (टेबलटॉप + आंशिक डीआर), समायोजन।
सप्ताह 7-8: पूर्ण डीआर परीक्षण (यदि संभव हो), त्रैमासिक व्यायाम चक्र, बोर्ड रिपोर्ट और नियामक पैकेज (यदि आवश्यक हो) का शुभारंभ।
18) संबंधित विकी खंड
जोखिम रजिस्टर, घटनाएं और लीक, डीआर/बीसीपी परीक्षण, टीपीआरएम और एसएलए, आईएसओ 27001/27701, एसओसी 2, पीसीआई डीएसएस, आईजीए/आरबीएसी/कम से कम विशेषाधिकार, लॉग पॉलिसी/वर्म - एक लूप के लिए और उत्पादकता।
टीएल; डीआर
प्रभावी BCP = BIA→RTO/RPO→stsenarii और degradatsii→multi -vendor/मल्टी-रीजन + क्लियर हादसा कमांड, संचार और अभ्यास। दस्तावेज़ को जीवित रखें, नियमित रूप से परीक्षण करें - और यहां तक कि एक बड़ी दुर्घटना भी व्यवसाय या हिट लाइसेंस को