संचालन में संतुलन लोड करें
1) ऑपरेटिंग टीम को संतुलन बनाने की आवश्यकता क्यों है
लोड संतुलन केवल क्वेरी वितरण के बारे में नहीं है। यह जोखिम और प्रदर्शन प्रबंधन की एक परत है: विफलता की त्रिज्या, अनुमानित विलंबता, पैमाने की अर्थव्यवस्थाओं, "शोर पड़ोसियों" के अलगाव, एसएलओ के निष्पादन और घटनाओं की लागत पर सीधा प्रभाव।
2) संतुलन परतें: नेटवर्क टू बिजनेस ऑपरेशंस
L3/L4 (आईपी/पोर्ट): सरल और तेज (डीएसआर, ईसीएमपी, आईपीवीएस, एलवीएस)। टीसीपी/यूडीपी सेवाओं, दलालों, गेट्स के लिए आदर्श।
L7 (HTTP/gRPC/WebSocket): पथ/हेडर/मेटाडेटा रूटिंग; कैनरी, ए/बी, जियो और क्लाइंट-अवेयर पॉलिसी।
GSLB/GeoDNS/Anycast: क्षेत्र/RoR द्वारा वैश्विक वितरण, देरी, निकटता और क्षेत्रीय स्वास्थ्य के लिए लेखांकन।
इंट्रा-सर्विस बैलेंसिंग: सर्विस डिस्कवरी (xDS, कंसुल, यूरेका), क्लाइंट बैलेंसर्स (gRPC pick_first/round_robin), सर्विस मेश के साथ क्लाइंट।
3) वितरण एल्गोरिदम और उन्हें कब लागू करने के लिए
राउंड-रॉबिन (आरआर): सजातीय नोड्स और लघु प्रश्नों के लिए सरल आधार मामला।
कम से कम कनेक्शन (LC): विभिन्न क्वैरी अवधियों के लिए बेहतर।
कम से कम अनुरोध/पीक EWMA: अनुकूली रूप से "लंबे" अनुरोधों और शोर के लिए विलंबता को कम करता है।
भारित आरआर/एलसी: नोड्स की शक्ति या "लागत रेलिंग" को ध्यान में रखता है।
सुसंगत हैशिंग (Rendezvous/Maglev): चिपचिपी कुंजी (उपयोगकर्ता, टेबल/कमरा, टोकरी) के लिए, स्केलिंग करते समय फिर से रूटिंग को कम करता है।
दो विकल्पों की शक्ति: कम टेलीमेट्री के साथ उच्च भार के तहत अच्छा एलसी सन् निकटन।
Hedged/Retry बजट अनुरोध: p99 के लिए रिट्रे बजट के साथ समानांतर कैच-अप अनुरोध।
4) सत्र, स्थिति और चिपचिपाहट
स्टिकी सत्र (कुकी/आईपी/पहचानकर्ता) - जब कैश स्थानीय रूप से आबाद होता है या एक स्टेटफुल संदर्भ होता है (उदाहरण के लिए, आईगेमिंग में एक लाइव टेबल)।
विपक्ष: हॉटस्पॉट प्रभाव, नोड्स को खाली करना अधिक कठिन है।
समाधान: छोटी टीटीएल चिपचिपाहट, बाहरी दुकानों में राज्य स्थानांतरण (रेडिस, सत्र स्टोर), साझा-कुछ भी नहीं और जहां संभव हो घटना-सोर्सिंग।
5) स्वास्थ्य-जांच और फड़फड़ाने से सुरक्षा
L7 सामग्री की जांच (शरीर/हेडर द्वारा मुखर) 200-के-सफलता के बजाय।
संयुक्त नमूने: अलग-अलग समय के साथ TCP + HTTP + आंतरिक '/तैयार '।
Debowns: n विफलताओं - अपवाद; एम सफलता - पूल में लौटना।
बाहरी पहचान - उच्च त्रुटि-दर/विलंबता (इजेक्शन) के साथ नोड्स का स्वचालित बहिष्करण।
6) टाइमआउट, रिट्रे, और बैकप्रेशर नीतियां
बजट-उन्मुख रिट्रेज़: कुल उपयोगकर्ता समय को सीमित करना (उदाहरण के लिए, 800 ms SLA → रिट्रीबल 2 × 200 ms + मार्जिन)।
सर्किट ब्रेकर्स: एक साथ निवेदन/कनेक्शन/त्रुटियों को सीमित करें।
कोटा/दर सीमा: डिफ़ॉल्ट "प्रति-किरायेदार/प्रति-आईपी/प्रति-कुंजी" बहुत किनारे पर सीमा।
सर्वर-साइड कतारबद्ध: स्पष्ट गिरावट के साथ छोटी कतारें या विफलता ताकि विलंबता की पूंछ "ओवरक्लॉक" न हो।
7) वैश्विक संतुलन और दोष सहिष्णुता
भू-मार्ग: विलंबता-आधारित, ग्राहक क्षेत्र, स्वास्थ्य।
Anycast + स्वास्थ्य-जांच: PoP गिरने के रूप में मार्गों का तात्कालिक अभिसरण।
विफल पदानुक्रम: RoR→region→oblako; ठंडा/गर्म/गर्म डीआर।
यातायात विभाजन: उत्पाद/कानूनी अलगाव (देश, भुगतान प्रदाता, वीआईपी खंड)।
8) धागे और वास्तविक समय के लिए संतुलन
वेबसॉकेट/एसएसई/जीआरपीसी-स्ट्रीम: दीर्घकालिक कनेक्शन → कनेक्शन/नोड की निगरानी, स्केल-आउट पर पुनर्वितरण।
लगातार हैशिंग के माध्यम से उपयोगकर्ता द्वारा या कमरे/तालिका द्वारा चिपचिपा।
नाली/प्रीस्टॉप हुक: रिलीज और ऑटोस्केल के दौरान सही ढंग से कनेक्शन बेदखल करें।
9) परिधि पर सुरक्षा
टीएलएस समाप्ति, एचएसटीएस, एएलपीएन; पूर्व-पश्चिम के लिए mTLS।
आवेदन संतुलन के लिए WAF/बॉट प्रबंधन।
DDoS- защита: दर-सीमाएं, चुनौती-/प्रूफ-ऑफ-वर्क, अपस्ट्रीम स्क्रबिंग।
कोड के रूप में नीतियां (OPA/Kyverno/Envoy RBAC)।
10) संतुलन के लिए अवलोकन और एसएलओ
SLI: सफल अनुरोध, त्रुटि/सेकंड, p50/p95/p99 विलंबता, संतृप्ति (CPU/conn/epoll)।
प्रति-बैकेंड मेट्रिक्स: अनुरोध दर, त्रुटि दर, एल्गोरिदम के लिए EWMA-विलंबता → इनपुट।
L7 लॉग: रिलीज (एनोटेशन), फ्लैग, कैनरी के साथ सहसंबंध।
Allerts: त्रुटि बजट की जलन-दर के अनुसार और ग्राहक (बाहरी सिंथेटिक्स) के लक्षणों के अनुसार।
11) ऑटो-स्केलिंग और लागत-दक्षता
HPA/VPA/KEDA: RPS, कतारें, उपयोगकर्ता मैट्रिक्स द्वारा स्केलिंग।
लागत से भारित-मार्ग: सस्ते क्षेत्रों/बादलों को सामान्य भार के तहत अधिक वजन मिलता है।
गर्म पूल/गर्म: पूर्व-गर्म नमूने ताकि ठंड की शुरुआत न हो।
12) परिवर्तन प्रबंधन: कैनरी, छाया, नीला-हरा
कैनरी रूटिंग: SLO गिरावट के तहत ऑटो-स्टॉप के साथ 1%→5%→25%।
छाया यातायात: क्लाइंट (सत्यापन के लिए) के जवाब के बिना नए संस्करण के लिए डुप्लिकेट अनुरोध।
ब्लू-ग्रीन: वीआईपी/रूटिंग टेबल इंस्टेंट स्विचिंग; त्वरित रोलबैक।
13) कॉन्फ़िगरेशन और GitOps
सत्य का एक एकल स्रोत: मार्ग, वजन, समय समाप्ति और नीतियों को सीमित करना - भंडार में।
उसी पाइपलाइन द्वारा बुधवार (dev→stage→prod) को विन्यास का संवर्धन।
सत्यापन और विन्यास परीक्षण: लिंटर्स, ड्राई-रन, ट्रैफिक मैप सिमुलेशन।
14) निजी मामले (विनियमित डोमेन)
भुगतान/सीसीएस प्रदाता: समानांतर चैनल, गुणवत्ता/प्रतिक्रिया समय द्वारा स्विच करना; प्रदाता एसएलओ।
बहु-न्यायालय: देश द्वारा भू-मार्ग, सामग्री/सीमा नीति।
वीआईपी खंड: व्यक्तिगत वजन/चैनल, ऊंचा एसएलओ, यूएक्स गिरावट "हैंडल"।
15) एंटी-पैटर्न
"विफलता के एकल बिंदु" के रूप में एक संतुलन।
NAT के पीछे IP पर चिपचिपा - "चिपचिपा" समूह और ट्रैफिक तिरछा।
भारी/लंबे अनुरोधों के लिए यूनिवर्सल आरआर - p99 पूंछ वृद्धि।
बिना बजट और बिना किसी पहचान के पीछे हटना अनुरोधों का तूफान है।
स्वास्थ्य की जांच केवल टीसीपी - "ग्रीन" जब अनुप्रयोग काम नहीं कर रहा है।
टीटीएल के बिना "अनन्त" चिपकने वाला सत्र - नोड्स को खाली करने में असमर्थता।
कॉन्फ़िग को मैन्युअल रूप से संपादित किया जाता है, बिना समीक्षा और प्रचार - बहाव और घटनाओं
16) कार्यान्वयन चेकलिस्ट
- चयनित स्तर: L4/L7/GSLB, परिभाषित लक्ष्य और जिम्मेदारियां।
- वितरण एल्गोरिथ्म लोड प्रोफाइल (EWMA/LC/Hash) से मेल खाता है।
- सुसंगत हैशिंग जहां राज्य संदर्भ की आवश्यकता है।
- संयुक्त स्वास्थ्य-जांच, बाहरी-इजेक्शन, डिबंक।
- टाइमआउट/रिट्रीट/लिमिट - एक कोड की तरह, समय बजट के साथ।
- प्रति-बैकेंड और ग्राहक सिंथेटिक्स पर अवलोकन; बर्न-रेट अलर्ट।
- कैनरी/नीला-हरा + छाया यातायात; त्वरित रोलबैक।
- कॉन्फ़िग के लिए GitOps; ड्राई-रन और रूट टेस्ट।
- डीआर योजना और असफल पदानुक्रम (RoR→region→oblako)।
- वीआईपी/कानूनी सहकर्मियों और प्रदाताओं का अलगाव।
17) वास्तुशिल्प प्रवाह का उदाहरण
1. जीएसएलबी (विलंबता-आधारित) ग्राहक को निकटतम स्वस्थ क्षेत्र में निर्देशित करता है।
2. Edge/L7 बैलेंसर WAF, TLS, दर-सीमा, 5% कैनरी लागू करता है।
3. सेवा जाल LC + EWMA के साथ आउटलेर्स को छोड़ कर पिचों को वितरित करता है।
4. रियल-टाइम टेबल के लिए - 'टेबल _ आईडी' द्वारा लगातार हैशिंग, चिपचिपा टीटीएल 10 मिनट।
5. एचपीए आरपीएस और कतारों में सामने आता है; गर्म पूल - कोई ठंडी शुरुआत नहीं।
6. अवलोकन: डैशबोर्ड p50/p95/p99, त्रुटि-दर, संतृप्ति, बर्न-रेट।
7. गिरावट के मामले में: ऑटो-इजेक्ट नोड्स, कैनरी कमी, एक स्पेयर प्रदाता पर स्विच करना, संस्करण रोलबैक।
18) नीचे की रेखा
लोड संतुलन एक परिचालन अनुशासन है जो नेटवर्क, अनुप्रयोग, डेटा और व्यवसाय एसएलओ को जोड़ ता है। उचित रूप से चयनित स्तर (L4/L7/GSLB), पर्याप्त एल्गोरिदम, सख्त स्वास्थ्य-जांच, टाइमआउट और रिट्रे नीतियां, अवलोकन और GitOps प्रबंधन सेवाओं की टिकाऊ और किफायती डिलीवरी के लिवरी में "बॉक्स" बॉक्ट "।