आपदा वसूली - कोल्ड-बैकअप
संक्षिप्त सारांश
डीआर एक बड़ी आपदा के बाद व्यावसायिक कार्यों को बहाल करने की क्षमता है। कोल्ड-बैकअप - "रक्षा की अंतिम पंक्ति": अपरिवर्तनीय/पृथक प्रतियां साइट के पूर्ण डी-ऊर्जाकरण या समझौता के मामले में वसूली के लिए उपयुक्त हैं। रणनीति आरटीओ/आरपीओ, सिस्टम प्राथमिकता, वार्षिक डीआर अभ्यास और सख्त परिचालन अनुशासन (कैटलॉग, कुंजी, चेक) के आसपास बनाई गई है।
शर्तें और उद्देश्य
RPO (रिकवरी पॉइंट ऑब्जेक्टिव) - अधिकतम स्वीकार्य डेटा हानि (जैसे ≤ 15 मिनट)।
आरटीओ (रिकवरी टाइम ऑब्जेक्टिव) - अधिकतम स्वीकार्य वसूली समय (जैसे ≤ 2 घंटे)।
ब्लैक-स्टार्ट - नंगे धातु की वसूली: हार्डवेयर/क्लस्टर/सीक्रेट/डेटा/डीएनएस।
एयर-गैप - प्रतियों का भौतिक/तार्किक अलगाव (टेप/अक्षम खाता/ऑफ़लाइन मीडिया)।
अपरिवर्तनीयता (WORM) - अपरिवर्तनीय भंडारण (लॉक/रिटेंशन के साथ टेप/ऑब्जेक्ट)।
डीआर उपलब्धता स्तर
शीत स्थल - बुनियादी ढांचा गायब है/जमे हुए है; आरटीओ: घंटे-दिन; सबसे सस्ता CAPEX/OPEX।
गर्म साइट - टेम्पलेट/चित्र/आंशिक रूप से समाप्त सेवाएं; आरटीओ: दसियों मिनट-घंटे।
हॉट साइट - सक्रिय प्रतिकृति; आरटीओ: मिनट; अधिक महंगा और अधिक जटिल।
हाइब्रिड: कर्नेल गर्म/गर्म, बाकी सब - ठंडा (स्टार्टअप में प्राथमिकता के साथ)।
जहां कोल्ड-बैकअप अपरिहार्य हैं
बड़े पैमाने पर क्रिप्टो संक्रमण/डोमेन समझौता।
डेटा भ्रष्टाचार जो सभी प्रतिकृतियों में चला गया।
क्षेत्र/डेटा केंद्र का नुकसान, बल राजसी (अग्नि, बाढ़)।
विशेषाधिकार प्राप्त खातों से जानबूझकर हटाना/तोड़फोड़करना।
कोल्ड-बैकअप टोपोलॉजी
1. मीडिया/भंडारण कक्षाएं
टेप (LTO-8/9): कम लागत, डिफ़ॉल्ट एयर-गैप, उच्च क्षमता, अनुक्रमिक पहुंच।
ऑफ़ लाइन डिस्क/एनएएस: "सुरक्षित मामले", केवल बैकअप/पुनर्स्थापित विंडो से कनेक्ट करें।
संग्रहीत ऑब्जेक्ट कक्षाएं (ग्लेशियर जैसी): कम भंडारण मूल्य, उच्च निष्कर्षण समय।
2. प्लेसमेंट
अन्य साइट/क्षेत्र; अन्य प्रदाता/खाता; व्यक्तिगत कुंजी/प्रशासक।
3. अपरिपक्वता
WORM/ऑब्जेक्ट लॉक (अनुपालन/शासन) प्रतिधारण और कानूनी पकड़ के साथ टेप।
नीति 3-2-1-1-0 (ठंड पर ध्यान केंद्रित करने के साथ)
डेटा की 3 प्रतियां (prod + लोकल बैकअप + ऑफसाइट)।
2 अलग मीडिया (डिस्क/टेप/ऑब्जेक्ट)।
1 ऑफसाइट (अन्य साइट/क्लाउड)।
1 अपरिवर्तनीय (WORM/एयर-गैप)।
0 जांच त्रुटियां (चेकसम/आवधिक परीक्षण वसूली)।
निर्देशिका, मेटाडेटा और अखंडता नियंत्रण
बैकअप कैटलॉग: क्या, कहाँ, कब, संस्करण, कुंजी, मात्रा, प्रतिधारण अवधि की जाँच करें।
एसेट कैटलॉग - सेवा → निर्भरता → वॉल्यूम/बाल्टी → प्राथमिकता।
चेकसम और प्रकट फ़ाइलें: सामंजस्य लिखें और पुनर्स्थापित करें।
कैनरी फ़ाइलें: मीडिया समस्याओं का जल्दी पता लगाने के लिए नियमित रूप से बहाल करें।
गोपन और कुंजियाँ
विश्राम (टेप/वस्तु) और उड़ान (प्रतिलिपि) में एन्क्रिप्शन।
दोहरे नियंत्रण के साथ केएमएस/वॉल्ट, मास्टर कुंजी, रोटेशन के लिए ऑफ़ लाइन सुरक्षित।
बिक्री/बैकअप/अभिलेखागार के लिए अलग कुंजी (विस्फोट त्रिज्या को कम करना)।
डीआर (आवश्यकताओं, भूमिकाओं, लॉग) के दौरान प्रलेखित प्रमुख पहुंच प्रक्रि
डीआर प्लान प्राथमिकता और निरंतरता
प्राथमिकता मानचित्र (उदाहरण):1. पहचान और पहुंच: IdP (न्यूनतम क्षेत्र), तिजोरी/KMS, नेटवर्क कोर।
2. डेटा और नियंत्रण विमान: etcd K8s, कॉन्फ़िग, रहस्य, छवि रजिस्टर, कलाकृतियों को तैनात करें।
3. ट्रांजेक्शन डेटाबेस/वॉलेट: लॉग + नवीनतम पूर्ण/वृद्धिशील।
4. भुगतान/एकीकरण द्वार: कुंजी, प्रमाणपत्र, आईपी/डीएनएस।
5. वेब/एपी मोर्चे: कैनरी लॉन्च, वस्तु से स्थिर सामग्री।
6. एनालिटिक्स/रिपोर्टिंग: कोर पूरा होने पर।
अनुक्रम बहाल करें (ब्लैक-स्टार्ट):1. बुनियादी ढांचा: नेटवर्क, डीएनएस/एनीकास्ट, कर्नेल आईएएम, बेस इमेज/क्लस्टर।
2. रहस्य/प्रमाणपत्र: कोल्ड-बैकअप से वॉल्ट/केएमएस बहाल करें, बूटस्ट्रैप रहस्य वितरित करें।
3. नियंत्रण विमानः etcd/कंट्रोल प्लेन/रजिस्टर/रिपॉजिटरी।
4. डेटा: लॉग (RPO द्वारा) से कोल्ड-बैकअप + PITR से डेटाबेस तैनात करें।
5. अनुप्रयोग: वृक्ष निर्भरता शुरू करना, कैश/सीडीएन वार्मिंग।
6. परीक्षण और सत्यापन: स्वास्थ्य परीक्षण, स्थिरता, चेकसम।
7. ट्रैफिक स्विचिंग: डीएनएस/रूटिंग/बैलेंसर (चरणबद्ध/कैनरी)।
8. पोस्ट-चेक: कोई लीक/ऋण, लॉगिंग और डीआर अधिनियम नहीं।
शीत-बहाल प्रक्रियाएं (विशिष्ट)
टेप: इन्वेंट्री, डाउनलोड, समानांतर धाराएँ, फ़ाइल मानचित्र → निर्देशिका → वसूली कार्य; खोज और रिवाइंड समय के लिए लेखांकन।
पुरालेख कक्षाएं: निष्कर्षण (minutes→hours) के लिए अनुरोध, गर्म भंडारण के लिए मंचन, प्रकट द्वारा बहाल।
ऑफ़ लाइन डिस्क: केवल पढ़ ने के लिए कनेक्शन, चेकसम चेक → नक़ल।
अभ्यास: बहाली के लिए एक अलग सैंडबॉक्स, फिर उत्पादन वातावरण में स्थानांतरित करें।
संचार और org। डीआर में संरचना
Роли: हादसा कमांडर, टेक लीड (इंफ्रा), डीबी लीड, ऐप लीड, कॉम्स, सिक्योरिटी।
चैनल: बैकअप (कॉर्पोरेट डोमेन के बाहर), आवाज/चैट, सिक्योरिटी डॉक्स।
संदेश टेम्पलेट: ग्राहकों/भागीदारों/नियामकों के लिए; अद्यतन आवृत्ति; एक एकल "सत्य का स्रोत"।
एकीकृत घटना लॉग: समयरेखा, समाधान, मालिक।
डीएनएस, नेटवर्क और यातायात
विभाजन-मस्तिष्क-सुरक्षा: कॉन्फ़िगरेशन में "डीआर-मोड" झंडे; सीमित कार्यक्षमता के लिए फीचर-फ्लैग।
DNS रणनीति: अग्रिम में कम TTL, स्वतंत्र DNS प्रदाता; स्टेप चेंज A/AAAA/CNAME, वार्म अप CDN।
रूटिंग: Anycast/Geo, DR साइट से BGP घोषणा; ACLs/firwalls IaC से फिर से इकट्ठा किए जाते हैं।
डीआर के लिए एसएलओ
RPO को ≥ 99% समय मिला (लक्ष्य के भीतर लॉग/वेतन वृद्धि अंतराल)।
आरटीओ ब्लैक-स्टार्ट (पूर्ण परिदृश्य) ≤ एक तिमाही में एक बार परीक्षण पर लक्ष्य (उदाहरण के लिए, 4 घंटे)।
डीआर अभ्यास की सफलता - 100% महत्वपूर्ण कार्य विंडो में पूरे होते हैं।
अपरिवर्तनीयता - रिटेंशन/लॉक = 100% के साथ बैकअप का हिस्सा।
अखंडता जाँच - अनुसूची के अनुसार 100%; मीडिया विफलता - प्रवास टिकट।
परीक्षण और अभ्यास
तालिका-शीर्ष: स्क्रिप्ट, भूमिकाएँ, चेकलिस्ट, संपर्क सूची।
तकनीकी: चेकसम और स्थिरता के सत्यापन के साथ सैंडबॉक्स को डेटाबेस/फ़ाइलों/रहस्यों की चयनात्मक वसूली।
ब्लैक-स्टार्ट-ड्रिल: एक बार/तिमाही (या एक बार/छह महीने) - डीआर साइट में पूर्ण कर्नेल लॉन्च।
पोस्टमार्टम: तथ्य, अड़ चनें, सुधार योजना (एसएलओ/प्रक्रियाएं/स्वचालन)।
स्वचालन और कलाकृतियाँ
IaC: समूह, नेटवर्क, ढेर - कोड में; डीआर शाखाएं/मापदंड।
रनबुक: घटक द्वारा घटक (वॉल्ट/केएमएस, आदि, डीबी, गेटवे, मोर्चे)।
डीआर पैकेज: प्रमुख डॉक की ऑफ़ लाइन कॉपी (संपर्क, योजनाएं, सुरक्षित वाक्यांशों के पासवर्ड), भौतिक पहुंच निर्देश।
कैनरी-रिस्टोर: दैनिक छोटे पुनर्स्थापन और चेकसम सामंजस्य।
टैग/टैग: "डीआर-क्रिटिकल", "वार्म-ओनली", "कोल्ड-ओनली" सेवाओं/वॉल्यूम के लिए।
कार्यान्वयन जाँच सूची
- डेटा कक्षाएं और उनके आरपीओ/आरटीओ व्यवसाय के साथ संरेखित हैं; वसूली प्राथमिकताओं को परिभाषित
- कार्यान्वित कोल्ड-बैकअप: मीडिया, अपरिवर्तनीयता (WORM/ऑब्जेक्ट लॉक), ऑफसाइट/एयर-गैप।
- कैटलॉग: संपत्ति, बैकअप, चाबियाँ; मात्रा और संस्करण नियंत्रण की जाँच क
- ब्लैक-स्टार्ट प्रक्रियाएं: नेटवर्क/डीएनएस, आईडीपी/वॉल्ट/केएमएस, नियंत्रण विमान, डेटा, एप्लेयर।
- अभ्यास: टेबल-टॉप त्रैमासिक; कैनरी दैनिक बहाली; ब्लैक-स्टार्ट एक बार/तिमाही-छह महीने।
- संचार और नियामक टेम्पलेट; अलग संचार चैनल।
- डीआर के लिए एसएलओ/मेट्रिक्स/अलर्ट; प्रबंधन को रिपोर्ट।
- प्रदाताओं (टेप/संग्रह कक्षाएं/डीएनएस/सीडीएन) के साथ समझौते, एसएलए ने पुष्टि की।
- वित्त: मीडिया/संग्रह बजट, रसद, मीडिया प्रतिस्थापन समय के अनुसार।
सामान्य त्रुटियाँ
"एक प्रतिकृति है - किसी भी बैकअप की आवश्यकता नहीं है -" एक तार्किक त्रुटि/रैंसमवेयर हर जगह छोड़ देगा।
सभी प्रतियों से समझौता करने के लिए कोई अपरिवर्तनीयता/वायु-अंतर नहीं है - एक एकल वेक्टर।
कैटलॉग/चेक मात्रा की कमी - "कुछ" बहाल, लेकिन ऐसा नहीं है।
DNS TTL बहुत बड़ा है - मल्टी-डे ट्रैफिक माइग्रेशन।
एक ही डोमेन/खाता में कुंजी/केएमएस - किसी घटना में पहुंच अवरुद्ध करना।
केवल "कागज पर" → आरटीओ/आरपीओ की पुष्टि नहीं की जाती है।
iGaming/fintech विशिष्ट
बटुआ/भुगतान कोर: सख्त आरपीओ (≤ 1-5 मिनट) और आरटीओ (≤ 15-60 मिनट); WORM के साथ किसी वस्तु को लॉग करता है; पारदर्शी संचार के लिए डीआर फंक्शन "रीड-ओनली बैलेंस"।
PSP/सामग्री प्रदाता: पूर्व-सहमत DR-IP/डोमेन, व्हाइटलिस्ट, प्रमाणपत्र, HMAC/mTLS कुंजियाँ - DR पैकेट में प्रतियां।
रिपोर्टिंग/नियामक: अधिसूचना टेम्पलेट, अपरिवर्तनीय अभिलेखागार, सिद्ध अखंडता, गतिविधि लॉग।
चोटियों और घटनाओं: प्रमुख टूर्नामेंट/प्रचार से पहले डीआर तत्परता की जाँच की जाती है; कैनरी रिस्टोर और सीडीएन वार्मिंग।
मिनी रनबुक टेम्पलेट्स
1) तिजोरी/केएमएस ब्लैक-स्टार्ट (अवधारणा):1. डीआर क्लस्टर को आरंभ करना, अनसील (दोहरे नियंत्रण) कुंजियों को लोड करना।
2. भंडारण बैकअप (कोल्ड-कॉपी) बहाल करें।
3. नीतियों की जाँच, CI/CD/K8s के लिए बूटस्ट्रैप रहस्य जारी करना।
2) PostgreSQL DR (PITR из कोल्ड-बैकअप):1. एक खाली उदाहरण फैलाएँ, ठंड से पूर्ण पुनर्स्थापित
2. लक्ष्य क्षण में WAL लॉग (वेतन वृद्धि) अपलोड करें।
3. संगति जाँच, प्रतिकृति सक्षम करें, केवल पढ़ें, फिर पढ़ें।
3) डीएनएस/यातायात:1. नियोजित जोखिमों (या लगातार कम रखने) के लिए 24-72 घंटे में टीटीएल को कम करें।
2. चेकलिस्ट, त्रुटि/विलंबता निगरानी द्वारा A/AAAA/CNAME स्विच करना।
3. क्रमिक यातायात वृद्धि (कैनरी 5% → 25% → 100%)।
परिणाम
कोल्ड-बैकअप पर आधारित एक विश्वसनीय डीआर है: अपरिवर्तनीय पृथक प्रतियां, औपचारिक रूप से ब्लैक-स्टार्ट प्रक्रियाएं, स्पष्ट आरपीओ/आरटीओ, नियमित अभ्यास, एक अच्छी तरह से विचार-विमर्श डीएनएस/नेटरेशन और प्स। IaC और रनबुक के लिए सब कुछ प्रतिबद्ध करें, अखंडता की जांच और कैनरी बहाली स्वचालित करें - और आपके पास हमेशा सबसे खराब स्थिति के बाद भी वसूली के लिए एक नियंत्रित रास्ता होगा।