ऑपरेटिंग लेयर आर्किटेक्चर
1) ऑपरेटिंग परत का कार्य
परिचालन परत एक मंच और प्रथाओं का सेट है जो अनुमानित शोषण प्रदान करता है: तेजी से रिलीज, कम एमटीटीआर, अनुपालन और प्रबंधित लागत। यह उत्पादों और बुनियादी ढांचे के लिए रेलिंग बनाता है: मानक, स्वचालन, अवलोकन, परिवर्तन प्रबंधन और सुरक्षित पहुंच।
2) तार्किक मॉडल (विमान और डोमेन)
┌────────────────────────────────────────────────────────┐
│ Interface Plane (UX) │← ChatOps/Portals/API
└────────────────────────────────────────────────────────┘
┌────────────────────────────────────────────────────────┐
│ Control Plane: Policy, Orchestration, Identity, CMDB │
└────────────────────────────────────────────────────────┘
┌────────────────────────────────────────────────────────┐
│ Data/Execution Plane: CI/CD, Jobs, IaC, Runtime Ops │
└────────────────────────────────────────────────────────┘
┌────────────────────────────────────────────────────────┐
│ Telemetry Plane: Logs, Metrics, Traces, SLO Dashboards │
└────────────────────────────────────────────────────────┘
┌────────────────────────────────────────────────────────┐
│ Security & Compliance Plane: Secrets, RBAC, Audit, IR │
└────────────────────────────────────────────────────────┘
┌────────────────────────────────────────────────────────┐
│ Finance/Cost Plane: Usage, Quotas, Budgets, FinOps │
└────────────────────────────────────────────────────────┘
मुख्य डोमेन:
- सेवा निर्देशिका/सीएमडीबी: सेवाओं का एक रजिस्टर, मालिक, एसएलओ, निर्भरता।
- ऑर्केस्ट्रेशन: पाइपलाइन, कार्य, मुकुट, बैकअप, डीआरआई।
- नीतियां (नीति-जैसे-कोड): अलर्ट, एक्सेस, प्रतिधारण, परिवर्तन-द्वार।
- अवलोकन: मैट्रिक्स/ट्रेल्स/लॉग, एसएलआई/एसएलओ, अलर्ट और स्थिति पृष्ठ।
- पहुँच/रहस्य: JIT/JEA, टोकन, क्रिप्टो, KMS/वॉल्ट।
- घटनाएं/परिवर्तन: ITSM/टिकट, CAB/RFC, पोस्टमार्टम, सिमुलेशन।
- DataOps: डेटा अनुबंध, ताजगी, वंश, गुणवत्ता।
- FinOps: लागत लेखांकन, सीमा, कोटा, अनुकूलन।
3) संदर्भ प्रवाह
3. 1 रिलीज (CI/CD → GitOps)
1. कोड/प्रकट के साथ पीआर - परीक्षण/स्कैन - कलाकृतियों पर हस्ताक्षर करना।
2. SLO-gardrails के साथ प्रगतिशील तैनाती (कैनरी/नीला-हरा)।
3. गिरावट के दौरान ऑटो-रोलबैक; टेलीमेट्री में एनोटेशन जारी करें।
3. 2 का पता लगाएं → जवाब दें → ठीक करें
1. बर्न-रेट/लक्षण + कोरम → पेज + वॉर-रूम।
2. निशान/लॉग द्वारा निदान; प्लेबुक।
3. रोलबैक/फोलबैक/लिमिट्स → AAR/RCA → CAPA।
3. 3 परिवर्तन (RFC/CAB)
1. जोखिम विश्लेषण + रखरखाव विंडो + बैकआउट योजना।
2. गैर-महत्वपूर्ण अलर्ट का दमन, एसएलओ संकेत सक्रिय हैं।
3. साक्ष्य और रिपोर्ट, नीति की समी
4) सेवा कैटलॉग और सीएमडीबी
विशेषताएं: मालिक, एसएलआई/एसएलओ, निर्भरता (आंतरिक/बाहरी), डैशबोर्ड, अलर्ट, रनबुक 'और, डेटा कक्षाएं (पीआईआई/वित्त), क्षेत्र (prod/state/dev)।
स्वतः सामग्री: सीआई/सीडी, टेलीमेट्री और रिपॉजिटरी से।
उपयोग: अलर्ट रूटिंग, वृद्धि, विस्फोट त्रिज्या गणना, परिपक्वता रिपोर्टिंग।
5) नीतियां-जैसे-कोड
श्रेणी: पहुंच (RBAC/ABAC), सुरक्षा (SAST/SCA/DAST), अलर्ट/SLO, अनुदान, परिवर्तन-द्वार, संसाधन/कोटा।
यांत्रिकी: घोषणात्मक नियम (YAML/Rego/CEL), CI में सत्यापन, नियंत्रण विमान में प्रवर्तन।
एक गेट का एक उदाहरण: "तैनाती की अनुमति है यदि सभी एसएलओ हरे हैं, तो कोई सक्रिय नहीं हैं -, परीक्षण पास हो गए हैं, हस्ताक्षर मान्य हैं।"
6) ऑर्केस्ट्रेशन और निष्पादन
सीआई/सीडी: बिल्ड → स्कैन → साइन → प्रोत्साहित करें।
जॉब्स/क्रोनजॉब्स/डीएजी: बैकअप/रोटेशन/बैकफिल; समय सीमा और प्रतियोगिता (निषिद्ध/बदलें)।
पहचान और रोलबैक: चेक-तब-एक्ट, स्टेप मार्कर, सर्किट-ब्रेकर।
लॉन्च अधिकार: जेआईटी खाते, सीमित गुंजाइश; ऑडिट।
7) सिग्नल अवलोकन और गुणवत्ता
डोमेन द्वारा SLI/SLO: उपलब्धता/विलंबता/व्यवसाय संचालन की सफलता, डेटा ताजगी।
अलर्ट: दो खिड़कियों में बर्न-रेट, कोरम, दर-सीमा, रनबुक और मालिक।
लॉग/मैट्रिक्स/ट्रेल्स जुड़े हुए हैं; रेखांकन से लेकर लॉग तक के चैनल।
स्थिति पृष्ठ: टेम्पलेट, अद्यतन आवृत्तियाँ, ऑडिटिंग प्रकाशन।
8) एक्सेस, रहस्य, क्रिप्टो
गुप्त भंडार (केएमएस/वॉल्ट), रोटेशन, रेपो में रहस्यों का निषेध।
ऑपरेशन/शिफ्ट समय के लिए JIT/JEA जारी।
mTLS/OIDC सेवाओं के बीच छवि हस्ताक्षर/SBOM।
ऑडिट: अपरिवर्तनीय लॉग, महत्वपूर्ण कार्यों के लिए WORM।
9) घटनाएं, परिवर्तन, रखरखाव खिड़कियां
घटनाएं: SEV मैट्रिक्स, IC/TL/Comms/Scribe, अद्यतन टेम्पलेट, AAR→RCA→CAPA।
परिवर्तन: RFC/CAB, जोखिम मूल्यांकन, कैनरी, बैकआउट।
रखरखाव खिड़कियां: समय, संचार, नियमों का दमन, सबूत।
10) ऑपरेशन परत में डेटाओप्स
डेटा अनुबंध (स्कीमा, ताजगी/पूर्णता एसएलए)।
प्रत्येक परत (कांस्य/रजत/स्वर्ण) पर डीक्यू परीक्षण।
वंश और कैटलॉग; स्क्रैप के लिए संगरोध।
डेटा एसएलओ और ताजगी/बहाव अलर्ट।
11) फिनोप्स और लागत
इकाई अर्थव्यवस्था: $/1k अनुरोध, $/सफल लेनदेन, $/GiB लॉग, $/SLO बिंदु।
कोटा/सीमाएँ: एग्रेस, लॉग वॉल्यूम, कार्य अवधि।
अनुकूलन: partitsii/cash/materializatsii/arkhivy (गर्म-गर्म-ठंडा)।
रिपोर्ट: सस्ती "महंगी" सेवाएं/अनुरोध, ओवरस्पीडिंग के लिए अलर्ट।
12) इंटरफेस: चैटोप्स/पोर्टल्स/एपीआई
प्लेटफ़ॉर्म पोर्टल: सर्विस कैटलॉग, पुश/पुश बटन, एसएलओ स्थिति, विंडो स्लॉट, नीतियां।
चैटोप्स: '/तैनाती ', '/हैंडओवर स्टार्ट', '/mw क्रिएट ', '/स्टेटस अपडेट' - с аудитом и सबूत।
एपीआई: आईटीएसएम/एचआर/बिलिंग/प्रदाताओं के साथ एकीकरण के लिए।
13) जिम्मेदारी मॉडल (आरएसीआई)
प्लेटफ़ॉर्म/एसआरई: नियंत्रण विमान, नीतियां, अवलोकन, घूर्णन।
उत्पाद/देव: एसएलओ सेवाएं, रिलीज, प्लेबुक।
सुरक्षा: रहस्य, कमजोरियां, आईआर।
डेटा/एनालिटिक्स: DataOps, SLA ताजगी/गुणवत्ता।
अनुपालन/कानूनी: नियामक, साक्ष्य भंडारण।
समर्थन/Comms: स्थिति पृष्ठ, क्लाइंट संदेश।
14) ऑपरेटिंग लेयर परिपक्वता मैट्रिक्स
SLO कवरेज: परिभाषित SLI/SLO और बर्न-रेट वाली% सेवाएं।
अलर्ट स्वच्छता: कार्रवाई योग्य ≥80%, FP ≤5%, अलर्ट/ऑन-कॉल-घंटा (p95)।
DORA: कमी दर, लीड टाइम, MTTR, परिवर्तन-विफलता-दर।
शासन बदलें: % RFC परिवर्तन,% ऑन-टाइम विंडो, रोलबैक।
सुरक्षा: रहस्य/प्रमाणपत्र घुमाने का औसत समय, कमजोरियों को बंद करना।
FinOps: $/इकाई और% QoQ बचत।
डॉक्स: रनबुक/एसओपी कोटिंग, ताजगी (≤90 दिन)।
15) न्यूनतम व्यवहार्य ऑपरेटिंग परत (एमवीपी) चेकलिस्ट
- मालिकों, एसएलओ, निर्भरता और डैशबोर्ड के साथ सेवा निर्देशिका/सीएमडीबी।
- सीआई/सीडी + GitOps, कलाकृति हस्ताक्षर, प्रगतिशील रिलीज, ऑटो-रोलबैक।
- संयुक्त टेलीमेट्री (logs/metrics/traces) trace_id और SLO-alerts (डबल विंडो, कोरम) के साथ।
- नीति-के-कोड: एक्सेस, अलर्ट, प्रतिधारण, परिवर्तन-द्वार।
- गुप्त स्टोर, JIT/JEA, mTLS/SSO, अपरिवर्तनीय ऑडिट।
- ITSM/घटनाएँ: SEV मैट्रिक्स, प्लेबुक, स्टेटस पेज, अपडेट टेम्प्लेट।
- रखरखाव खिड़कियां: कैलेंडर, आरएफसी टेम्पलेट, बैकआउट योजना, सबूत।
- FinOps: लागत दृश्यता, कोटा/सीमा, रिपोर्ट।
- डॉक्स-ए-कोड, एसओपी/रनबुक टेम्पलेट, उत्पादन चेकलिस्ट के लिए तैयार
16) एंटी-पैटर्न
नियंत्रण विमान और नीतियों के बिना "प्लेटफ़ॉर्म = स्क्
अलर्ट, अलर्ट थकान के हिमस्खलन "सब कुछ से" निगरानी।
GitOps/ऑडिट के बिना मैनुअल उत्पादन परिवर्तन।
भंडारण और घुमाव के बिना वातावरण चर में रहस्य।
एसएलओ की कमी: भावनाओं के बारे में बहस करना, गुणवत्ता के लक्ष्य नहीं।
बिखरी हुई निर्देशिका/स्वामी तालिकाएँ - वृद्धि खो गई।
उच्च जोखिम वाले परिवर्तनों में बैकआउट योजना नहीं है।
संरचना/सहसंबंध के बिना लॉग - लंबी जांच।
17) मिनी टेम्पलेट्स
17. 1 सर्विस कार्ड (कैटलॉग)
Service: checkout-api
Owner: @team-checkout
SLO: availability 99. 9% (28d), p95 latency ≤ 250 ms
Dependencies: payments-api, auth, redis, psp-a
Dashboards: SLO, errors, latency, capacity
Runbooks: rb://checkout/5xx, rb://checkout/rollout
Data: PII masked; retention 30d logs, 365d audit
Change gates: canary 1/5/25%, auto-rollback on burn-rate breach
17. 2 राजनीति चेतावनी (विचार)
yaml id: checkout-latency-burn type: burn_rate sli: http_latency_p99 windows:
short: {duration: 1h, threshold: 5%}
long: {duration: 6h, threshold: 2%}
quorum: [ "synthetic:eu,us", "rum:checkout" ]
owner: team-checkout runbook: rb://checkout/latency routing: page:oncall-checkout controls: {dedup_key: "svc=checkout,region={{region}}", rate_limit: "1/15m"}
17. 3 गेट तैनात (छद्म)
yaml allow_deploy_when:
tests: passed signatures: valid active_sev: none_of [SEV-0, SEV-1]
slo_guardrails: green_last_30m rollback_plan: present
18) कार्यान्वयन रोडमैप (8-12 सप्ताह)
1. नेड। 1-2: सेवा सूची → निर्देशिका/सीएमडीबी; बुनियादी SLI/SLO और डैशबोर्ड।
2. नेड। 3-4: GitOps + प्रगतिशील रिलीज; नीति-के-कोड।
3. नेड। 5-6: एकीकृत टेलीमेट्री और स्थिति पृष्ठ; कोरम के साथ बर्न-रेट; रनबुक कवरेज।
4. नेड। 7-8: रहस्य/जेआईटी, अपरिवर्तनीय ऑडिट; RFC/रखरखाव खिड़कियां।
5. नेड। 9-10: FinOps रिपोर्टिंग, कोटा/सीमा; लॉग और भंडारण का अनुकूलन।
6. नेड। 11-12: घटनाओं का सिमुलेशन/डीआर; परिपक्वता मैट्रिक्स; निरंतर सुधार योजना।
19) नीचे की रेखा
ऑपरेटिंग लेयर आर्किटेक्चर एक कंट्रोल प्लेन प्लस मानकीकृत प्रथाएं हैं जो ऑपरेशन को एक दोहराने योग्य, औसत दर्जे की और सुरक्षित प्रक्रि सेवा कैटलॉग, GitOps, टेलीमेट्री, नीतियां, सुरक्षित पहुंच, और प्रबंधित परिवर्तन टिकाऊ रिलीज, तेजी से वसूली और पारदर्शी लागत प्रदान करते हैं - यानी व्यवसाय के लिए परिचालन पूर्वानुमान।