संचालन और प्रबंधन → परिवर्तन प्रबंधन
प्रबंधन बदलें
1) उद्देश्य और सिद्धांत
लक्ष्य परिवर्तन को जल्दी और सुरक्षित रूप से वितरित करना है, घटनाओं के जोखिम को कम करना, डाउनटाइम और नियामक उल्लंघन।
सिद्धांत:- पूर्वानुमानित और प्रतिवर्ती: प्रत्येक परिवर्तन की योजना बनाई गई है, सत्यापित और प्रतिवर्ती है।
- जोखिम-आधारित: नियंत्रण की गहराई जोखिम (न्यायालय, धन, पीआईआई) पर निर्भर करती है।
- छोटे और लगातार: छोटे वेतन वृद्धि का मूल्यांकन और रोल करना आसान है।
- स्वचालन पहले: कोड, परीक्षण, सत्यापन, ऑटो-चेक के रूप में बुनियादी ढांचा।
- सत्य का एकल स्रोत: एक एकल RFC/टिकट, एक एकल कैलेंडर और क्रियाओं का एक लॉग।
2) स्कोप
उत्पाद कोड (बैकएंड/फ्रंटेंड, मोबाइल एसडीके)।
बुनियादी ढांचा (IaC, Kubernetes/VM/CDN/Edge)।
डेटा (डीबी आरेख, प्रवासन, स्टोरफ्रंट/ईटीएल)।
कॉन्फ़िगरेशन और फ़ीचर फ्लैग।
एकीकरण (PSP, KYC, गेम प्रदाता)।
सुरक्षा और पहुंच नीतियां।
3) भूमिकाएँ और आरएसीआई
मालिक-जिम्मेदार बदलें।
रिलीज क्यूरेटर/रेलेंग - रिलीज ट्रेन समन्वय।
SRE/Ops - ऑपरेशन, SLO/SLA गेट।
सुरक्षा/अनुपालन - जोखिम की समीक्षा और अनुपालन।
सीएबी (परिवर्तन सलाहकार बोर्ड) - सामान्य/उच्च जोखिम वाले परिवर्तनों की मंजूरी।
व्यापार हितधारक/सहायता - सूचित।
4) परिवर्तनों का वर्गीकरण
मानक (विशिष्ट, पूर्व-अनुमोदित): अक्सर, कम जोखिम वाला, तैयार किया गया प्लेबुक (जैसे) फ्लैग अपडेट, कुंजी रोटेशन)।
सामान्य: RFC, मूल्यांकन, संभावित CAB, परीक्षण और रोलबैक योजना की आवश्यकता होती है।
आपातकाल: पी 1 घटनाओं के लिए तत्काल सुधार; न्यूनतम नौकरशाही पथ, पोस्ट-फैक्टम समीक्षा/SAW।
5) जीवनचक्र बदलें
1. ट्रिगर (RFC): उद्देश्य, गुंजाइश, जोखिम, प्रभावित सेवाएं/क्षेत्र, बैकआउट योजना।
2. जोखिम मूल्यांकन: प्रभाव × संभावना मैट्रिक्स, एसएलओ/अनुपालन/मूल्य पर प्रभाव।
3. योजना: विंडो, निर्भरता, पलायन, संचार, सत्यापन परीक्षण।
4. सत्यापन: ऑटोटेस्ट, स्थिर विश्लेषण, सुरक्षा जांच, प्रदर्शन रन।
5. तैनाती: प्रगतिशील रणनीति (देखें) 8), टेलीमेट्री और माली।
6. अवलोकन: बर्न-रेट एसएलओ, अलर्ट, बिजनेस मैट्रिक्स (जीजीआर/एनजीआर, रूपांतरण)।
7. पूर्णता: परिणाम स्वीकृति, प्रलेखन अद्यतन, विचलन के लिए पोस्टमार्टम।
6) RFC: न्यूनतम रचना
संदर्भ: क्यों बदलें, परिकल्पना को प्रभावित करें।
रेंज: सिस्टम, क्षेत्र, ग्राहक संस्करण।
जोखिम: मैट्रिक्स और विफलता परिदृश्य, विस्फोट त्रिज्या।
तैनाती योजना: चरण दर चरण, गो/स्टॉप मानदंड के साथ।
बैकआउट योजना: कमांड/स्टेप्स, स्थितियां शुरू करना, आरटीओ/आरपीओ की उम्मीदें।
परीक्षण योजना: हम पहले/बाद में क्या जांचते हैं (कार्यक्षमता, प्रदर्शन, सुरक्षा)
संचार: जिसे हम सूचित करते हैं, संदेश टेम्पलेट।
ऑडिट: टिकट, कमिट, सीआई/सीडी कलाकृतियों के लिंक।
7) कैलेंडर और विंडो बदलें
एकल कैलेंडर: सभी रिलीज़, माइग्रेशन, टर्न ऑफ फीचर्स, बाहरी इवेंट्स (स्पोर्ट्स/मार्केटिंग/हॉलिडे)।
फ्रीज विंडो: प्रमुख बिक्री/चैंपियनशिप/पीक ऑवर्स, टैक्स रिपोर्टिंग।
हस्तक्षेप नीति: एक ही महत्वपूर्ण रास्तों पर परस्पर विरोधी परिवर्
क्षेत्रीय तरंगें: पहले "गर्म" क्षेत्र/कम यातायात, फिर - मुख्य।
8) तकनीकी तैनाती रणनीतियाँ
कैनरी: ट्रैफिक का छोटा हिस्सा - मेट्रिक्स की तुलना (p95 विलंबता, त्रुटि%, रूपांतरण)।
ब्लू-ग्रीन: समानांतर वातावरण, परमाणु मार्ग स्विचिंग।
प्रगतिशील वितरण: स्वचालित स्टॉप स्थितियों के साथ प्रतिशत रोलआउट।
फ़ीचर फ़्लैग: फ़ंक्शन स्विच, किल-स्विच, ए/बी.
डार्क लॉन्च/शैडो ट्रैफिक: उपयोगकर्ताओं को प्रभावित किए बिना छाया की जाँच।
चरण सीमा: QPS/प्रतिस्पर्धा में क्रमिक वृद्धि।
गार्डरेल: p95/त्रुटि% थ्रेसहोल्ड से अधिक होने पर स्वचालित स्टॉप, रिटर्न/चार्जबैक बढ़ जाते हैं, प्राधिकरण/जमा गिरते हैं।
9) डेटा और स्कीमा परिवर्तन
संगतता: एडिटिव माइग्रेशन - कोड जो पुराने और नए स्कीमा दोनों को पढ़ ता है।
दो-चरण प्रवासन: (1) नए फ़ील्ड/इंडेक्स जोड़ें → (2) स्विच कोड → (3) पुराने को हटाएं।
संविदा संस्करण: एवरो/प्रोटोबुफ योजनाएं रजिस्ट्री के साथ; पीछे/आगे संगत।
बड़ी मात्रा में पलायन: बैच, ठहराव, पहचान, चौकियों और प्रगति।
आपदा सहिष्णुता: आरपीओ/आरटीओ परीक्षण, स्नैपशॉट, रिकवरी रिहर्सल।
BI डेटा: शोकेस/मैट्रिक्स का परिवर्तन - MR/SR और मेट्रिक्स शब्दकोश (ID, सूत्र) के माध्यम से।
10) कॉन्फ़िगरेशन और गुप्त प्रबंधन
डेटा के रूप में कॉन्फ़िग: वर्शन कॉन्फ़िग, योजना द्वारा सत्यापन, पर्यावरण के माध्यम से पदोन्नति।
राज: कुंजी रोटेशन, न्यूनतम विशेषाधिकारों के सिद्धांत, अनुरोधों का ऑडिटिंग।
क्षेत्रीय ओवरराइड: सीमाएं/भागीदार (पीएसपी/केवाईसी) - पैरामीटरीकरण के माध्यम से, कोड के कांटे के माध्यम से नहीं।
11) अनुपालन और लेखा परीक्षा (आईगेमिंग संदर्भ)
परिवर्तनों के निशान: कौन/कब/क्या स्विच किया गया (फ्लैग, कॉन्फ़िग, रूट, माइग्रेशन)।
कर्तव्यों का अलगाव: लेखक, समीक्षक और डिप्लोअर (SOX जैसी) के लिए अलग-अलग भूमिकाएँ।
नियामक रिपोर्ट: निश्चित रिलीज, बस्तियों का संस्करण नियंत्रण (जीजीआर/एनजीआर, बोनस), पीआईआई तक पहुंच का नियंत्रण।
प्रदाता: SDK/प्रदाता प्रमाणपत्र, SLA दायित्वों के निश्चित संस्करण।
12) संचार
अलर्ट टेम्पलेट: रिलीज से पहले (क्या/कब/जोखिम), (स्थिति,% ट्रैफिक, मैट्रिक्स) के दौरान, (योग) के बाद।
बाहरी संदेश: ग्राहकों को प्रभावित करते समय बैनर/स्थिति पृष्ठ।
समन्वय: # रिलीज़ -वार-रूम चैनल, रिलीज़ मालिक, अद्यतन आवृत्ति।
13) प्रदर्शन मैट्रिक्स
डोरा: तैनाती आवृत्ति, परिवर्तन के लिए लीड टाइम, परिवर्तन विफलता दर (सीएफआर), एमटीटीआर।
एसएलओ प्रभाव: रिलीज से पहले/बाद में एसएलओ में समय का हिस्सा।
बैकआउट दर - परिवर्तन श्रेणी द्वारा रोलबैक की आवृत्ति।
रिलीज़ डेट: लंबित माइग्रेशन/फ़ीचर फ्लैग्स इन लिम्बो।
बिजनेस इम्पैक्ट: रूपांतरण, केवाईसी टीटीवी, सफलता दर पीएसपी, जीजीआर/एनजीआर रोलिंग के दौरान बहाव।
14) एंटी-पैटर्न
बिग-बैंग रिलीज़: एक समय में बहुत सारे बदलाव - प्रतिगमन के कारण को समझना मुश्किल है।
असंगत माइग्रेशन: डबल रीडिंग के बिना फ़ील्ड मिटाना/नाम बदलना।
मालिकों के बिना झंडे और हटाने के लिए समय सीमा: तर्क की "शाश्वत" शाखाएं।
टेलीमेट्री के बिना रिलीज़ और मानदंड रोकें: "आंख से" और नुकसान का देर से पता लगाना।
पंचांग की अनदेखी: शिखर घटनाओं/अभियानों के साथ चौराहों।
प्लेबुक और ऑडिटिंग के बिना मैनुअल कदम: उच्च परिवर्तनशीलता और जोखिम।
15) चेकलिस्ट
प्रारंभ होने से पहले (RFC तैयार)
- परिवर्तन उद्देश्य और केपीआई तैयार किए गए हैं
- जोखिम और विस्फोट त्रिज्या का आकलन किया गया, वर्ग को बदलें
- तैनाती योजना और बैकआउट चरण-दर-चरण लिखे गए हैं
- मंच/कैनरी पर एक परीक्षण योजना और परिणाम है
- संचार और कैलेंडर अद्यतन, हितधारकों को सूचित किया
रोलिंग के दौरान
- p95/त्रुटि% metrics, व्यावसायिक संकेतों और लॉग की वास्तविक समय में निगरानी की जाती है
- चेक पॉइंट द्वारा प्रगति चरणों की पुष्टि
- माली के संचालन में - ऑटो-स्टॉप और रोलबैक
के बाद
- रिलीज परिणाम रिकॉर्ड किए गए (चेंजलॉग, संस्करण, कलाकृतियाँ)
- विचलन के लिए पोस्टमार्टम (≤ 5 कार्य दिवस)
- ऋण (ध्वज विलोपन, अंतिम प्रवास) मालिकों के साथ लॉग इन हैं
16) मिनी टेम्पलेट्स
आरएफसी टैम्पलेट (लघु):- उद्देश्य/परिकल्पना
- स्कोप और प्रभाव (सेवाएं, क्षेत्र, डेटा, ग्राहक)
- प्रभाव × संभावना और शमन उपाय
- रोलिंग योजना (चरण,% यातायात, गो/नो-गो मानदंड)
- बैकआउट योजना (चरण, आरटीओ/आरपीओ, डेटा)
- परीक्षण योजना (कार्यात्मक/निष्पादन/सुरक्षा)
- संचार (चैनल, आवृत्ति)
- कलाकृतियाँ (टिकट, पीआर, बिल्ड नंबर)
- परिवर्तन: "भुगतान-सेवा v2। 14 + psp_limits प्रवास"
- विंडो: 2025-11-02 00 00-01: 00 EET
- प्रभावित क्षेत्र: यूरोपीय संघ, लैटम (%)
- जोखिम/माली: त्रुटि%> 2% 10 मिनट - स्टॉप और रोलबैक
- संपर्क: @ Offer, @ SRE-on-call, @ Support-lead
- ट्रिगर्स: p95> + 25% 10 मिनट, PSP सफलता <97%
- चरण: (1) यातायात −→ v2 पर 0%। 14; (2) झंडे को v2 पर स्विच करें। 13; (3) स्नैपशॉट/चेकपॉइंट के माध्यम से माइग्रेशन रोलबैक; (4) धूम्रपान परीक्षण; (5) रिपोर्ट।
17) रिलीज ट्रेन के साथ एकीकरण
रिलीज ट्रेन: फिक्स्ड स्लॉट (जैसे। 2 × प्रति सप्ताह), विलय-कट पर एसएलए।
हॉटफ़िक्स नीति: व्यक्तिगत ट्रेनें/शाखाएँ, तेज़ ट्रैक टू प्रोड।
वर्शनिंग: सेवर, कलाकृतियों और वातावरण में लेबल, SBOM।
18) नीचे की रेखा
परिवर्तन प्रबंधन गति पर ब्रेक नहीं है, बल्कि सुरक्षित त्वरण के लिए एक तंत्र है। जोखिम-आधारित वर्गीकरण, अच्छा आरएफसी, प्रगतिशील रोलिंग, संगत डेटा माइग्रेशन, स्पष्ट संचार और औसत दर्जे का प्रभाव रिलीज को एक प्रबंधनीय, दोहराने योग्य और श्रव्य प्रक्रिया में बदल देता है।