क्लाउड लागत अनुकूलन
1) FinOps क्यों और क्या लक्ष्य
इसका लक्ष्य SLO/विकास की गति बनाए रखते हुए COGS को कम करना है। मुख्य मुद्दे:- 1 अनुरोध, 1 सक्रिय उपयोगकर्ता, 1 किरायेदार कितना है?
- नई सुविधा/यातायात का सीमांत प्रभाव क्या है?
- "लीक" (egress, निरर्थक लॉग, CPU/मेमोरी ओवरहेड, निष्क्रिय संसाधन) कहां हैं?
बेसलाइन मैट्रिक्स
लागत/रेक, लागत/मिनट सक्रिय, लागत/किरायेदार/ब्रांड, लागत/जीबी-संग्रहीत, लागत/जीबी-एग्रेस।
COGS%: राजस्व में बिक्री की लागत का हिस्सा।
अपशिष्ट%: (भुगतान लेकिन अप्रयुक्त संसाधन )/( सभी संसाधन)।
2) टाइडिंग अप: टैग, स्वामित्व, बजट
टैग/लेबल: 'एनवी', 'टीम', 'सेवा', 'किरायेदार', 'उत्पाद', 'cost _ center', 'slo _ tier'।
स्वामित्व: प्रत्येक संसाधन में एक मालिक और टीटीएल है।
बजट/अलर्ट: 50/80/100% विसंगति का पता लगाने के थ्रेसहोल्ड के साथ मासिक/साप्ताहिक बजट।
कोड के रूप में नीतियां: निषेध "बिना टैग के", आकार सीमा, डिफ़ॉल्ट क्षेत्र, आवंटित कोटा।
Terraform उदाहरण - अनिवार्य टैग (विचार):hcl module "policy" {
source = "finops/policy/required-tags"
required_tags = ["env","team","service","cost_center","tenant"]
}
3) अर्थव्यवस्था के वास्तुशिल्प लीवर
3. 1 सही आयाम और ऑटो-स्केलिंग
राइटसाइज़िंग: वास्तविक CPU/RAM p95 के लिए चुनिंदा उदाहरण।
स्वतः स्केलिंग: क्षैतिज> ऊर्ध्वाधर; - क्लस्टर ऑटोस्केलर/कारपेंटर, serverless - min/max concurrency।
ठंडे तरीके - लाइन/बची में; दीर्घकालिक कार्य - एक कार्यक्रम पर श्रमिकों को।
3. 2 स्पॉट/खरीदी गई क्षमता
स्टेटलेस/पृष्ठभूमि और सीआई के लिए स्पॉट/प्रस्तावना; ऑन-डिमांड बफर पकड़ो।
आरआई/सीयूडी/बचत योजनाएं: एक स्थिर 50-70% बेसलोड बुक करें, बाकी लोचदार है।
3. 3 डेटा भंडारण और कक्षाएं
अलग: गर्म (एसएसडी), गर्म (मानक), ठंडा/संग्रह (ग्लेशियर/पुरालेख)।
जीवनचक्र नीतियां: शिफ्ट कक्षाएं, शब्द के बाद हटाएं।
जहाँ आवश्यक हो वहाँ संस्करण सक्षम करें और ऑब्जेक्ट लॉक (WORM) केवल ऑडिट के लिए.
3. 4 नेटवर्क और egress
CDN/edge + बासी-जबकि-पुनर्नवीनीकरण अंतर-क्षेत्रीय egress को कम करता है।
"कच्चे" इंटरनेट के बजाय निजी चैनल (PrivesLink/PSC/Direct Connect/Interconnect)।
संपीड़न (Brotli/Zstd), HTTP/3/QUIC - कम RTT/पुनर्संयोजन।
3. 5 डेटाबेस और कैश
द्वि-स्तरीय योजना चुनें: कैश (Redis/Memcatched) + भंडारण।
एनालिटिक्स के लिए प्रतिकृतियाँ पढ़ें, ऑटो-वैक्यूम/कंपैक्शन शामिल करें, pgbouncer/RDS प्रॉक्सी का उपयोग करें।
बड़ी तालिकाओं के लिए - विभाजन/टीटीएल/अभिलेख।
4) कुबर्नेट्स-अर्थशास्त्र
एसएलओ वर्ग द्वारा अनुरोध/सीमाएं; 'लिमिट: नल' प्रोहिबिशन।
वीपीए (सिफारिशें), करपेंटर (चूल्हों के लिए उदाहरणों का चयन), बिन पैकिंग (सहिष्णुता/आत्मीयता)।
क्लस्टर/नोड स्तर (विभिन्न प्रकार और नीतियों) पर पृथक प्रोड/चरण/देव।
नेटवर्क और भंडारण कक्षाएं: लोड प्रोफ़ाइल द्वारा SC/IOPS चुनें, न कि "हर जगह प्रीमियम।"
QoS कक्षाएं और प्राथमिकताएं: पृष्ठभूमि की नौकरियों पर बचत।
लॉग प्रोफाइल: स्थानीय बफर के साथ साइडकार एजेंट, बैच द्वारा भेजना।
5) सर्वरलेस-अर्थशास्त्र
न्यूनतम उदाहरण/प्रावधान संगति - केवल गर्म हैंडल के लिए।
छोटे तैनाती-बंडल, आलसी-इनिट, कनेक्शन साझा करना।
डेडलाइन और भारी कार्यों की कतार।
एक दर्जन यात्राओं के बजाय फंक्शन-एग्रीगेटर्स (फैन-इन) पर निर्भर करता है।
6) अवलोकन: मूल्यवान टेलीमेट्री के लिए भुगतान करें
लॉग: संरचनात्मक, बिना मौखिकता के; वर्ग द्वारा प्रस्तुति (प्रोड त्रुटियां लंबी, डिबग - शॉर्ट)।
ट्रेस सैंपलिंग: पूंछ-आधारित - 100% त्रुटियां/p99, बाकी 1-10%।
मेट्रिक्स: एकत्रीकरण/डाउनसैम्पलिंग, विरल-भेजना।
भेजने से पहले PII फ़िल्टरिंग (कम बाइट्स और जोखिम)।
7) आपूर्तिकर्ता नेटवर्क और बाजार
क्षेत्रों की कीमतों, प्रबंधित सेवाओं की मार्जिनलिटी, बाजार बंडलों की तुलना करें।
वार्ता: वॉल्यूम छूट (आरआई/सीयूडी), प्रतिबद्ध, क्रेडिट कार्यक्रम।
अतिव्यापी कार्यक्षमता के साथ SaaS की नकल करने से बचें।
8) इकाई अर्थशास्त्र और डैशबोर्ड
प्रमुख लागत SLI/SLO
मार्गों द्वारा लागत/Req (लॉगिन, कैटलॉग, जमा)।
लागत/किरायेदार/ब्रांड/क्षेत्र।
Egress/Req, भंडारण/Req, Compute/Req.
अपशिष्ट% и कवरेज आरआई/एसपी%।
डैशबोर्ड (न्यूनतम सेट)
संसाधन के लिए उतरने वाली सेवाओं/टीमों के लिए "लागत मानचित्र"।
दिशा द्वारा "हीट मैप" को बढ़ाएं।
"सेवा → लागत → SLO": p99 और लागत/Req का सहसंबंध।
"आरआई/सीयूडी/स्पॉट" कवरेज और लाइन बचत।
9) फिनोप्स प्रक्रियाएँ
सेवा मालिकों के साथ खातों का साप्ताहिक विश्ले
उत्पादन समावेशन से पहले विशेषताओं की लागत के आकलन के साथ समीक्षा बदलें।
रेलिंग: कोटा सीमा, निष्क्रिय संसाधनों का स्वचालित पूरा होना, परीक्षण वातावरण के लिए टीटीएल।
गेमडेज ऑफ वैल्यू: आर्टिफिशियल हुकुम/फीचर फ्लैग्स, चेकिंग बजट सस्टेनेबिलिटी।
10) एंटीपैटर्न
टीटीएल के बिना "अस्थायी" संसाधन हमेशा के लिए।
`0. 0. 0. 0/0 'egress + कोई CDN → egress खातों में विस्फोट नहीं हुआ।
टैग/लेबल के बिना, लागत आवंटित करना असंभव है।
बिक्री में DEBUG लॉग, 100% निशान - अर्थहीन टेराबाइट्स।
प्रोविजनल/सीवरफुल "सिर्फ मामले में" उपयोग मेट्रिक्स के बिना।
सभी लोड केवल ऑन-डिमांड हैं, कोई आरआई/स्पॉट/कमिट नहीं हैं।
11) आईगेमिंग/वित्त की विशिष्टताएं
PSP/भुगतान शुल्क - COGS का हिस्सा: सस्ते/विश्वसनीय प्रदाताओं के लिए स्मार्ट-रूटिंग का अनुकूलन; कैश स्टेटस, बिना पहचान के पुनरावृत्ति से बचें।
KYC/AML विक्रेता: पैकेज अनुरोध, परिणाम कैश (नीति द्वारा TTL) का उपयोग करें, लागत/KYC को मापें।
"धन के तरीके" (जमा/वापसी): अलग एसएलओ और बजट; शिखर घटनाओं के लिए भंडार, केवल वहां गर्म नमूने।
सामग्री/सीडीएन: स्थानीय किनारे और क्षेत्रीय डोमेन को कम करने और डेटा रेजिडेंसी का अनुपालन करने के लिए।
कानूनी आवश्यकताएं: ऑडिट के लिए WORM भंडारण - सीमा दायरे (एकत्रीकरण, TTL, संपीड़न)।
12) मिनी व्यंजनों
12. 1 लॉग प्रतिधारण नीति
प्रोड त्रुटियां: 30-90 दिन; जानकारी: 7-14; डिबग: 24-72 घंटे।
केवल अनुपालन के अनुरोध पर पुरालेख।
12. 2 कैनरी टेलीमेट्री
एक नई सुविधा के लिए - पहले 24 घंटों के लिए 100% निशान - फिर पूंछ-नमूना।
12. 3 ऑब्जेक्ट लाइफसाइकल
json
[
{"prefix": "raw/", "days_to_warm": 30, "days_to_cold": 90, "days_to_delete": 365},
{"prefix": "audit/", "lock": "WORM-365d"}
]
12. 4 बजट/अलर्ट (विचार)
प्रति टीम मासिक बजट; 50/80/100% अलर्ट; 24 घंटे से अधिक की प्रवृत्ति का 30% विसंगति का पता लगाना>
13) प्रोड रेडीनेस चेकलिस्ट
- 100% संसाधन टैग और मालिक; राजनेता अनटैग किए गए लोगों को रोकते हैं।
- बजट और अलर्ट + विसंगति का पता लगाना; टैनेंट/ब्रांड/क्षेत्रों पर रिपोर्
- आरआई/सीयूडी/स्पॉट कवर बेसलोड; ऑन-डिमांड बफर है।
- K8s: अनुरोध/सीमा निर्धारित; VPA/Karpenter; बिन पैकिंग; अलग भंडारण/आईओपीएस कक्षाएं।
- सर्वरलेस: केवल गर्म रास्तों के लिए प्रावधान/मिनट; ठंड - कतारों के माध्यम से।
- सीडीएन/एज सक्षम; PaaS के लिए निजी चैनल; एग्रेस-डैशबोर्ड।
- लॉग/ट्रेल्स: टेल-सैंपलिंग, क्लास द्वारा प्रतिधारण; PII फ़िल्टरिंग।
- भंडारण जीवनचक्र और संग्रह; बड़ी तालिकाओं का विभाजन।
- वित्तीय डैशबोर्ड लागत/Req, लागत/किरायेदार, अपशिष्ट%, कवरेज RI/SP%।
- iGaming के लिए: PSP/KYC/AML व्यय लेखांकन, SLO और मनी पथ बजट, WORM ऑडिट।
14) टीएल; डीआर
पहले, दृश्यता (टैग, बजट, डैशबोर्ड), फिर संरचनात्मक लीवर: सही आयाम, ऑटो-स्केलिंग, आरआई/स्पॉट/कमिट, सीडीएन/एज और निजी चैनल, भंडारण कक्षाएं और जीवनचक्र। मूल्यवान टेलीमेट्री (पूंछ-नमूना, छोटे प्रतिधारण) और स्वचालित रेलिंग के लिए भुगतान करें। IGaming में, PSP/KYC/AML को COGS का हिस्सा मानें और अलग SLO और बजट के साथ "मनी पथ" को उजागर करें।