संसाधन आबंटन
1) कार्य और सिद्धांत
संसाधन आवंटन लक्ष्य एसएलओ और फिनोप्स प्रतिबंधों के लिए आपूर्ति (सीपीयू/रैम/आईओ/नेटवर्क, लाइसेंस, लोग, बजट) के साथ मांग (लोड, परियोजनाओं, घटनाओं) से मेल खाने का एक व्यवस्थित तरीका है।
बुनियादी सिद्धांत:- एसएलओ-पहला: संसाधन में एक गुणवत्ता लक्ष्य है; चयन इसका सामना करने के लिए एक उपकरण है।
- निष्पक्षता + प्राथमिकता: सभी के लिए एक उचित हिस्सा, लेकिन गारंटी एक प्राथमिक
- अलगाव: विस्फोट-त्रिज्या "ग्लूटोनस" भार को सीमित करें।
- लोच: वास्तविक मांग के लिए स्वचालित विस्तार/संकुचन।
- लागत-जागरूक: प्रत्येक अतिरिक्त संसाधन का SLO/राजस्व पर समझ में आना चाहिए।
- साक्ष्य-आधारित: टेलीमेट्री और प्रयोगों द्वारा पुष्टि किए गए
2) संसाधन वर्गीकरण
कम्प्यूटिंग: सीपीयू/मेमोरी/जीपीयू, कंटेनर पूल, सर्वरलेस कोटा।
भंडारण: IOPS/थ्रूपुट, गर्म/गर्म/ठंडी परतें, कैश।
नेटवर्क: egress/ingress, CDN, निजी चैनल, IP पूल।
डेटा: DWH/स्ट्रीमिंग, बैकफिल विंडो में स्लॉट/विंडो संसाधन।
लोग: ऑन-कॉल स्लॉट, आईसी/रिलीज़, एसआरई/देव समय (घंटे/स्प्रिंट)।
विक्रेता: प्रदाता सीमा (PSP/KYC/CDN), दर-सीमा और कनेक्शन।
3) प्राथमिकता मॉडल (पोर्टफोलियो)
Tier-0: महत्वपूर्ण प्रवाह (लॉगिन, भुगतान)। गारंटीकृत संसाधन, व्यक्तिगत पूल।
टियर -1: व्यापार महत्वपूर्ण (मुख्य उत्पाद, रिपोर्ट डी -1)। पसंदीदा कोटा।
Tier-2/3: सहायक/अनुसंधान। बर्स्टेबल, बजट सीमा।
परियोजनाएं: प्रभाव × अर्जेंटीना × आत्मविश्वास × लागत रेटिंग रैंक; SAV/पोर्टफोलियो में मिलान।
4) आवंटन नीतियां (गारंटी, कोटा, सीमा)
गारंटीकृत (समर्पित): निश्चित शेयर/आरक्षित; Tier-0/1 के लिए।
बर्स्टेबल: आधार कोटा + सीमा तक उधार लेने का अधिकार।
सर्वश्रेष्ठ प्रयास: कोई गारंटी नहीं, अधिगृहीत किया जा सकता है।
कोटा/सीमा-के-कोड: सभी कोटा और सीमाओं को घोषणात्मक रूप से वर्णित किया गया है (नीति भंडार)।
प्रीमेशन/पॉड व्यवधान बजट: किसे बेदखल किया जा सकता है और किस गति से।
नेटवर्क कोटा: एग्रेस/किरायेदार, प्रदाताओं के कनेक्शन पर सीमा।
5) बहु-किरायेदारी और अलगाव
नामस्थान/खाता प्रति किरायेदार: व्यक्तिगत सीमा, बजट, लेखा परीक्षा।
शोर पड़ोसी: cgroups/अनुरोध/सीमा/IO-थ्रॉटलिंग; "भारी" कार्यों के लिए अलग नोड्स।
P95-isolation: एसएलओ की गणना प्रतिशत द्वारा की जाती है, औसत नहीं; फट p95 पड़ोसियों को नहीं तोड़ ना चाहिए।
डेटा किरायेदारी: वीआईपी/क्षेत्रों के लिए अलग भंडारण परतें और कैश।
6) ऑटो-स्केलिंग और लोच
HPA/VPA/Cluster-autoscaler: SLI/SLI प्रॉक्सी (विलंबता p95, कतार गहराई) द्वारा स्केल, न केवल CPU।
अनुसूचित स्केलिंग: शिखर विंडो/घटनाओं के लिए अग्रिम में।
गर्म पूल: तेजी से स्केलेप्स के लिए गर्म-अप नोड्स/कनेक्शन।
नेटवर्क/सीडीएन: RUM/Anycast/POP लोड द्वारा स्वचालित पुनर्संतुलन।
7) कतारें, सेवा कक्षाएं और एसएलए
कक्षाएं: लक्ष्य प्रतीक्षा समय और त्रुटि बजट के साथ 'स्वर्ण/रजत/कांस्य'।
कतारें/बसें: प्राथमिकता, Tier-0 के लिए व्यक्तिगत बैच, डीएलक्यू।
Backpressure: कर्नेल की सुरक्षा के लिए ड्रॉप/आकार/धीमी विषयों।
अनुकूली समय समाप्ति/पुनरावृत्ति: सेवा वर्ग और वर्तमान स्थिति के लिए।
8) मानव संसाधन
शिफ्ट और कवरेज: ट्रैफिक मैच (फॉलो-द-सन), पी 1 + पी 2 युगल चरम पर।
एसआरई/देव फोकस: प्रति अभिकर्मक/सक्रिय समय का प्रतिशत (उदा। 50/50) केपीआई के साथ।
अनुरोध संसाधन: आरएफसी टेम्पलेट घंटों/स्प्रिंट, पारदर्शी प्राथमिकता कतार के लिए।
9) वित्तीय मॉडल (FinOps)
इकाई अर्थव्यवस्था: $/1k अनुरोध, $/सफल भुगतान, $/GiB लॉग।
बजट और अलर्ट: खातों/किरायेदारों के लिए कोटा, ओवरस्पेंडिंग के बारे में चेतावनी।
अनुकूलन: गर्म/गर्म/ठंडा भंडारण, लॉग सैंपलिंग, गैर-महत्वपूर्ण के लिए स्पॉट पूल।
शोबैक/चार्जबैक: टीम/किरायेदार द्वारा लागत रिपोर्ट प्रदर्शन को प्रेरित करती है।
10) प्रदाता प्रबंधन
सीमाएं और खिड़कियां: PSP/KYC/CDN पर अनुबंध TPS और कतारें; पंचांग में निर्धारित विंडो।
फेलओवर प्रोफाइल: कई प्रदाताओं के बीच वजन और मार्ग।
पल्स मेट्रिक्स: प्रतिक्रिया समय, लचीलापन, लागत/सफल ऑपरेशन।
11) वितरण परिपक्वता मैट्रिक्स
ग्रेड द्वारा एसएलओ पालन: % सोने/चांदी/कांस्य में अनुपालन।
संसाधन दक्षता: CPU/RAM/IO उपयोग (मध्य/p95), निष्क्रिय शेयर।
प्रति एसएलओ-बिंदु लागत: एसएलओ लक्ष्य रखने की लागत में परिवर्तन।
थ्रॉटलिंग/प्रीम्पशन दर: कितनी बार और किसे हम विस्थापित करते हैं।
हॉटस्पॉट MTTA: पूल/किरायेदार ओवरहीटिंग प्रतिक्रिया समय।
निष्पक्षता सूचकांक: किरायेदारों (गिनी/भिन्नता) के बीच विलंब/कोटा फैलता है।
12) चेकलिस्ट
वितरण बदलने से पहले
- SLO लक्ष्य और सेवा वर्ग परिभाषित हैं।
- लोड द्वारा टेलीमेट्री है (p95/p99, वृद्धि, मौसमी)।
- कोटा/सीमा का वर्णन गीत में किया गया है और समीक्षा की गई है।
- पड़ोसियों पर प्रभाव (अलगाव परीक्षण) का परीक्षण किया।
- रोलबैक योजना और रेलिंग तैयार।
साप्ताहिक संचालन कक्ष
- पूल निपटान और हॉटस्पॉट रिपोर्ट का हीटमैप।
- FinOps रिपोर्ट: $/इकाई, ओवररन, विसंगतियाँ।
- प्रदाता सीमा और एसएलए पूरे होते हैं।
- कतारें: कक्षाओं के भीतर देरी, कोई उपवास नहीं।
- कार्य में बाधाओं की पहचान करके CAPA।
13) साँचा (विचार)
13. 1 कोटा नीति (YAML)
yaml tenant: vip-eu class: gold compute:
cpu:
request: "8000m"
limit: "12000m"
memory:
request: "16Gi"
limit: "24Gi"
storage:
tier: hot iops_min: 8000 network:
egress_mbps_cap: 500 slo:
latency_p95_ms: 250 preemption:
protected: true burst:
allowed: true max_factor: 1.5
13. 2 ऑटो जूम प्रोफाइल (टुकड़ा)
yaml autoscaling:
metric: "queue_depth" # или biz_sli.payment_latency_p95 target: 200 min_replicas: 6 max_replicas: 60 warm_pool: 4 cooldown_sec: 120
13. 3 सेवा वर्ग और कतारें
yaml class: gold sla:
wait_p95_ms: 150 queue:
partition: "gold-eu"
retry_policy:
attempts: 2 backoff_ms: 200 backpressure: "shape" # иначе drop/slow
13. 4 संसाधन दावा (लोग)
RFC: RES-OPS-2025-11
Цель: усилить on-call P2 на пике ноябрьских промо (EU)
Период: 2025-11-25..2025-12-05
Обоснование: прогноз трафика +30%, прошлогодний p95 MTTA ↑
Запрос: +1 P2 слот/сутки, +IC в prime-time
14) प्रक्रियाएं और स्वचालन
प्लानर बॉट: ट्रैफिक और एसएलओ लक्ष्यों के इतिहास से कोटा की गणना, पीआर से नीति भंडार तक।
गार्ड-बॉट: कोटा/ओवरसब्सक्रिप्शन अपर्याप्त होने पर डिप्लोर्स को सिग्नल बंद करें।
कम्स बॉट: ओवरस्पेंडिंग/प्रीमेप्शन/क्लास चेंज के बारे में टीमों की सूचनाएं।
एनोटेशन: रखरखाव रिलीज/खिड़कियां काम की अवधि के लिए वजन/कोटा बदलती हैं (बाद में दमन को हटाना)।
15) एंटी-पैटर्न
एसएलओ और टेलीमेट्री के बिना "सनसनी से" हाइलाइट करें।
अलगाव के बिना सभी के लिए एक बड़ा पूल "शोर पड़ोसियों"।
एक ऊपरी सीमा के बिना अनियंत्रित फट - "गला घोंट" पड़ोसियों।
बैकप्रेशर/कतारों की कमी - टाइमआउट का एक स्नोबॉल।
लॉग/एग्रेस की लागत को अनदेखा करें - "शांत" बजट रिसाव।
मौसमी/चोटियों के बिना निश्चित कोटा - अनुपलब्धता या ओवरस्पेंडिंग।
16) कार्यान्वयन रोडमैप (4-8 सप्ताह)
1. नेड। 1-2: संसाधनों और सेवाओं की सूची; कक्षा असाइनमेंट (स्वर्ण/रजत/कांस्य) प्राथमिक कोटा; बुनियादी एसएलओ।
2. नेड। 3-4: SLI प्रॉक्सी द्वारा ऑटो-स्केलिंग सक्षम; कतारें और बैकप्रेशर आइसोलेट पूल कॉन्फ़िगर करें।
3. नेड। 5-6: FinOps रिपोर्टिंग ($/इकाई, कोटा, बजट अलर्ट); चरम दिनों के लिए गर्म-पूल और चित्रित स्केल।
4. नेड। 7-8: प्लानर/गार्ड्स ऑटोमेशन, किरायेदार कैबिनेट (कोटा/मूल्य दृश्यता), त्रैमासिक समीक्षा निष्पक्षता और हॉटस्पॉट।
17) नीचे की रेखा
संसाधन आवंटन एक बार का सेटअप नहीं है, लेकिन एसएलओ, टेलीमेट्री और फिनोप्स में निर्मित एक लाइव प्रक्रिया है। जब प्राथमिकताओं को औपचारिक रूप से, कोटा और सीमाएं - जैसे कोड, अलगाव और लोच - डिफ़ॉल्ट रूप से, और निर्णयों की पुष्टि मैट्रिक्स और लागत से होती है, तो सिस्टम लगातार चोटियों से बचता है, महत्वपूर्ण प्रवाह की रक्षा करता है और बजट के माध्न करता है।