साझा कम्प्यूटिंग संसाधन
1) "साझा कंप्यूटिंग संसाधन" क्या हैं
साझा कंप्यूटिंग संसाधन (जीपीयू) सीपीयू/जीपीयू/मेमोरी/डिस्क/नेटवर्क/डीए (डेटा उपलब्धता) का एक तार्किक रूप से एकल पूल है जो कई भूमिकाओं (डेवलपर्स, नोड ऑपरेटर, डेटा/सामग्री प्रदाताओं, विश्लेषकों, एमएल टीमों) को मानहीं। लक्ष्य उपयोग बढ़ाना, लागत कम करना और बहु-पट्टे और अंतर-श्रृंखला परिदृश्यों में अनुमानित प्रदर्शन प्रदान करना है।
2) संसाधन वर्गीकरण
गणना: सीपीयू (सामान्य उद्देश्य), जीपीयू (प्रशिक्षण/निष्कर्ष), एनपीयू/टीपीयू (एमएल त्वरक)।
मेमोरी और डिस्क: रैम, स्थानीय एनवीएमई, ऑब्जेक्ट/ब्लॉक स्टोरेज, कैश (रेडिस/कीडीबी)।
नेटवर्क: बैंडविड्थ, एग्रेस/इंग्रेस, QoS कक्षाएं, निजी चैनल।
डेटा और डीए: प्रकाशनों, प्रतिकृतियों, स्नैपशॉट और सबूतों के भंडारण के लिए कोटा।
सेवा सीमा: फली/कंटेनरों की संख्या, खुली फ़ाइलें, विवरणकर्ता, जीपीयू माइक्रो डिवीजन (एमआईजी)।
3) कार्यभार प्रकार
ऑनलाइन/कम विलंबता: एपीआई, मैचमेकिंग, गेम/फिनटेक सर्किट, क्रॉस-चेन मैसेजिंग।
स्ट्रीमिंग/रियल-टाइम: इवेंट प्रोसेसिंग, एंटी-फ्रॉड, टेलीमेट्री, रियल-टाइम एनालिटिक्स।
बैच: ईटीएल/ईएलटी, रिपोर्टिंग, आवधिक गणना, सुविधाओं की तैयारी।
एमएल/एआई: सीखना (जीपीयू-गहन), निष्कर्ष (कम विलंबता/उच्च रूपांतरण)।
भंडारण और कैश: OLTP/OLAP, लेकहाउस, CDN/edge कैश।
एसएलओ, प्राथमिकताएं, अलगाव और टैरिफ प्रत्येक वर्ग के लिए निर्धारित हैं।
4) ऑर्केस्ट्रेशन और प्लानिंग
प्राथमिकता और QoS वर्ग द्वारा शेड्यूलिंग: "समय सीमा", प्राथमिकता कतारों के लिए EDF/LLF, "न्यूनतम" की गारंटी।
संसाधन अनुरोध: सीपीयू/मेमोरी, जीपीयू कोटा और शेयरों के लिए 'अनुरोध/सीमाएं', बचत के लिए प्रारंभिक/स्पॉट पूल।
एंटी-शोर: cgrup/मुआवजा "शोर पड़ोसी", NUMA पिनिंग, नेटवर्क नीतियां।
टोपोलॉजी और इलाका: डेटा और गणना सह-स्थान, आत्मीयता/विरोधी आत्मीयता, किनारे बाध्यकारी।
ऑटोस्कैलिंग: क्षैतिज (एचपीए), ऊर्ध्वाधर (वीपीए), क्लस्टर (सीए), जीपीयू/डीए बैचों के लिए ऑटोपायलट।
5) बहु-किरायेदारी और अलगाव
: (बजट/कोटा/एसीएल)।
अलगाव: कंटेनर, वीएम, सैंडबॉक्स (gVisor/Firecracker), नेटवर्क (VPC/NetworkPolice), भंडारण (CSI नीतियां)।
शोर में कमी की नीतियां: IOPS/egress सीमा, निष्पक्ष-शेयर योजना, महत्वपूर्ण सेवाओं के लिए समर्पित स्तर।
त्रुटि/संसाधन बजट: प्रति-किरायेदार त्रुटि बजट और ऑटो-गिरावट के साथ संसाधन बजट।
6) QoS, प्राथमिकता और SLO/SLA
QoS कक्षाएं: Q4 (क्रिटिकल-पीलटाइम), Q3 (ऑर्डर), Q2 (एक बार प्रभावी), Q1 (कम से कम-एक बार), Q0 (सर्वश्रेष्ठ प्रयास)।
SLO उदाहरण: p95 विलंबता API ≤ 200 ms (Q4), GPU प्रतीक्षा कतार ≤ 2 मिनट (Q3), खिड़की T ≤ 30 मिनट (Q1) के लिए बैच।
अनुबंध QoS→resursy: गारंटीकृत कोटा और आपातकालीन "स्टॉप क्रेन" प्रत्येक वर्ग को सौंपे जाते हैं।
7) अर्थशास्त्र और मुद्रीकरण (बिलिंग/प्रोत्साहन)
चार्जिंग इकाइयाँ: vCPU-sec, GiB-घंटे रैम, GPU-मिनट, GB-भंडारण-महीना, GB-egress, DA-byte/प्रकाशन।
टैरिफ प्लान: पे-ए-यू-गो, कोटा और ओवरस्पेंडिंग के साथ सदस्यता, आरक्षण (प्रतिबद्धता), छूट के साथ स्पॉट/प्रस्तावना।
हार्डवेयर प्रदाताओं/डेटा केंद्रों के लिए RevShare: टर्नओवर का हिस्सा, SLA बोनस/जुर्माना।
पावर मार्केटप्लेस: नोड/क्लस्टर लिस्टिंग, गुणवत्ता रेटिंग, जीपीयू स्लॉट नीलामी।
टोकन अर्थशास्त्र:- यू-टोकन - कोटा/सीमा, छूट का भुगतान।
- एस-टोकन - एसएलए नोड्स/पूल (डाउनटाइम/उल्लंघन के लिए स्लैशिंग) के लिए प्रतिज्ञा।
- आर-टोकन - प्रदाता/किरायेदार (मूल्य/प्राथमिकता संशोधक) की प्रतिष्ठा।
- आरएनएफटी अनुबंध - व्यक्तिगत अनुबंध "resurs↔obyazatelstvo" (सीमा, मूल्य, शब्द, केपीआई, आउटपुट)।
8) कर्नेल अनुबंध और सेवाएं
संसाधन रजिस्ट्री: संसाधन प्रकार, मशीन/जीपीयू कक्षाएं, सुलभ क्षेत्र/किनारे-पीओपी।
कोटा प्रबंधक: कोटा/किरायेदार/परियोजना प्रति सीमा, बजट निकासी/आईओपीएस/डीए।
शेड्यूलर/प्लेसमेंट: फली/नौकरियां/पूल, प्राथमिकताएं, इलाके, विरोधी शोर।
बिलिंग और मीटरिंग: यूनिट मीटर, टैरिफ, ओवरस्पेंडिंग, बजट अलर्ट।
पुरस्कार राउटर: प्रदाताओं को भुगतान का वितरण, एसएलए के लिए दंड।
अनुपालन द्वार: क्षेत्र, व्यक्तिगत डेटा/व्यक्तिगत डेटा, आयु/सीसीएम प्रतिबंध, निर्यात रिपोर्ट।
ऑब्जर्वेबिलिटी हब: मेट्रिक्स/ट्रेल्स/लॉग्स, जॉब के लिए डीएलक्यू, रिप्ले।
9) सुरक्षा और अनुपालन
प्रमाणीकरण/प्राधिकरण: mTLS/OIDC, ABAC/RBAC, "कम से कम विशेषाधिकार".
नेटवर्क विभाजन: वीपीसी, निजी-लिंक, ट्रैफिक नीतियों के साथ सेवा मैश।
डेटा: at-rest/in-transit एन्क्रिप्शन, कुंजी रोटेशन, परीक्षण के लिए मास्किंग/डमी डेटा।
GPU/CPU अलगाव: प्रत्यक्ष पहुंच अक्षम करना, DMA/IOMMU नियंत्रण, साइड-चैनल सुरक्षा।
अनुपालन: ऑडिट लॉग, डेटा का क्षेत्रीय स्थानीयकरण, प्रतिधारण/विलोपन नीतियां, बिना प्रकटीकरण के ऑडिट के लिए जेडके अंतराल।
10) अवलोकन और प्रदर्शन प्रबंधन
मेट्रिक्स: यूसीपीयू%, जीपीयू-यूटिल, रैम/कैश हिट, आईओपीएस/थ्रूपुट डिस्क, पी 95 आरटीटी/एग्रेस नेटवर्क, जीपीयू/बैच-लैग कतार।
SLO/SLA-डैशबोर्ड: QoS कक्षाओं और किरायेदारों द्वारा "स्वास्थ्य", त्रुटि बजट।
प्रोफाइलिंग: फ्लेमीग्राफ स्नैपशॉट, गर्म पथ विश्लेषण, स्वचालित आकार की सिफारिश।
अलर्ट: लैग्स से अधिक, जीपीयू कतारों का ओवरहीटिंग, विस्फोट, "शोर पड़ोसी" झंडे।
11) धोखाधड़ी और दुरुपयोग
सिबिल/बॉट लोड: एस-प्रतिज्ञा, आर-प्रतिष्ठा, व्यवहार हस्ताक्षर।
एग्रेस दुरुपयोग/नेटवर्क स्कैनिंग: दर सीमा/आईडीएस, संगरोध खंड।
फार्मिंग स्पॉट छूट: एंटी-आर्ब राजनेता, कूलिंग, पूल के बीच "जंपिंग" पर सीमा।
बेईमान प्रदाता: घोषित विनिर्देशों, सिंथेटिक नमूनों, स्लैशिंग और "ब्लैक लिस्ट" आरएनएफटी का नियंत्रण।
12) अंतर-श्रृंखला परिदृश्य (मल्टी-चेन/एज)
अभिगम अधिकारों का स्थानांतरण: आरएनएफटी अधिकार और कोटा तत्काल संदेश के माध्यम से स्थानांतरित किए जाते हैं, प्रतिष्ठा (आर) ट्रस्ट डोमेन में बनी हुई है।
डीए कोटा और प्रकाशन: प्रति बाइट/आवृत्ति, अंतिम/अस्थायी ताले चार्ज करना।
एज कंप्यूटिंग: स्थानीय बफर्स के साथ पॉप नोड्स, उपयोगकर्ता के करीब अनुमान को "धक्का" देते हैं।
एक्स-डोमेन डेडअप और पहचान: वैश्विक 'x _ job _ id', सिरों पर तालिकाओं को देखा, चुनौती अवधि।
13) क्षमता नियोजन और स्थिरता
क्षमता नियोजन: खपत रुझान, मौसमी, एन सप्ताह के स्टॉक, "लाल रेखाएं" p95।
खेल-दिन और तनाव परीक्षण: GPU/egress/DA ओवरलोड, AZ/POP शटडाउन, गिरावट परिदृश्य।
डिजाइन द्वारा गिरावट: सुंदर फॉलबैक (कम सटीक मॉडल/कैश), Q4/Q3 प्राथमिकताएं।
हरी दक्षता: रीसाइक्लिंग, कार्बन-जागरूक शेडलिंग, शीतलन/ऊर्जा लागत, बैच को हरी खिड़कियों में स्थानांतरित करना।
14) ओवीआर पारिस्थितिकी तंत्र के मेट्रिक्स और केपीआई
निपटान: सीपीयू/जीपीयू व्यस्त%, रैम/कैश हिट, आईओपीएस/जीबी भंडारण उपयोग।
दक्षता: लागत-से-सेवा/अनुरोध, स्पॉट निपटान, मार्जिन/मिनट GPU।
गुणवत्ता: वर्ग द्वारा p50/p95 विलंबता, SLA ब्रेक/1000 अनुरोध, कतार/प्रारंभ समय कार्य।
निष्पक्षता: "शोर पड़ोसी" सूचकांक, किरायेदार द्वारा घटनाओं का हिस्सा, कोटा का आवंटन।
अर्थशास्त्र: आय/संसाधन-इकाई, एनआरआर/जीआरआर योजनाओं के अनुसार, बार-बार राजस्व का हिस्सा।
सुरक्षा: अलगाव की आवृत्ति, विसंगतियों को दूर करना, प्रतिष्ठित स्लैश घटनाएं।
15) संसाधनों का 治理 (प्रबंधन)
पैरामीटर-प्रस्ताव: मतदान के माध्यम से टैरिफ/कोटा/गलियारों में परिवर्तन।
आर-संशोधक: प्रतिष्ठा संवेदनशील परिवर्तनों में "कच्ची पूंजी" के प्रभाव को सीमित करती है।
सूर्यास्त खंड: ऑटो-रोलबैक के साथ अस्थायी पदोन्नति/छूट।
सार्वजनिक रिपोर्टिंग: ओवीआर ट्रेजरी, एसएलए ऑडिट की तिमाही रिपोर्ट।
16) प्लेबुक लॉन्च करें
1. मैपिंग की जरूरत है। कार्य कक्षाएं, एसएलओ, डेटा स्थानीयता।
2. पूल डिजाइन। मशीन कक्षाएं, जीपीयू स्तर, भंडारण/नेटवर्क स्तर, किनारे-पीओपी।
3. नीतियां और कोटा। QoS कक्षाएं, बजट, egress/IOPS/DA सीमाएँ।
4. अर्थशास्त्र। टैरिफ, स्पॉट/रिजर्व, प्रदाताओं को प्रोत्साहन, आरएनएफटी अनुबंध।
5. सुरक्षा और अनुपालन। mTLS/OIDC, एन्क्रिप्शन, ऑडिट लॉग, भू-नीतियां।
6. अवलोकन। केपीआई/एसएलओ डैशबोर्ड, अलर्ट, प्रोफाइलिंग।
7. पायलट और स्केलिंग। कार्यों का एक वर्ग (उदाहरण के लिए, अनुमान) - बैच/स्ट्रीमिंग के लिए एक विस्तार।
8. घटनाएं और पोस्टमार्टम। खेल-दिन, रिप्ले, नीति/टैरिफ समायोजन।
17) डिलीवरी चेकलिस्ट
- QoS/SLO सभी कार्य प्रकारों के लिए परिभाषित
- कोटा/सीमा और उचित-शेयर योजना में शामिल हैं
- कॉन्फ़िगर किए गए स्पॉट/पूर्वनिर्धारित पूल और एंटी-आर्ब नीतियां
- लागू RNFT अनुबंध, बिलिंग और रिवार्ड राउटर
- अलगाव, एन्क्रिप्शन और अनुपालन रिपोर्टिंग प्रदान की
- पुनर्चक्रण/गुणवत्ता/अर्थशास्त्र डैशबोर्ड उपलब्ध
- दुर्घटनाओं ने काम किया: क्रेन बंद करो, गिरावट, पोस्टमार्टम
- अधिकार बहु-श्रृंखला संक्रमण, डीए कोटा, बढ़ त वितरण कॉन्फ़िगर
18) शब्दावली
OVR (साझा कंप्यूटिंग संसाधन): एक पारिस्थितिकी तंत्र के लिए क्षमता का एक एकल पूल।
RNFT: संसाधनों/सीमा/समय सीमा के अधिकारों के लिए अनुबंध - "संबंध"।
एस-टोकन: SLA/प्रदाता/नोड दायित्व के खिलाफ संपार्श्विक।
आर-टोकन: गुणवत्ता/विश्वसनीयता के लिए गैर-हस्तांतरणीय प्रतिष्ठा।
डीए: डेटा उपलब्धता परत (साक्ष्य का प्रकाशन/भंडारण)।
स्पॉट/प्रस्तावना: नवीकरण नीतियों के साथ सस्ते लेकिन रुकावट वाले संसाधन।
नीचे की रेखा: साझा कंप्यूटिंग संसाधन पारिस्थितिकी तंत्र को एक स्व-संतुलन कंप्यूटिंग कारखाने में बदल देते हैं, जहां रीसाइक्लिंग उच्च है, गुणवत्ता अनुमानित है, प्रोत्साहन संरेखित हैं, और सुरक्षा और अनुपालन प्रोटोकॉल में बनाए जाते हैं। उचित ऑर्केस्ट्रेशन, i治理 अर्थशास्त्र आपको उत्पादकता और विश्वास खोए बिना बहु-पट्टे भार को पैमाने पर करने की अनु