GH GambleHub

Վիրահատությունները և Մոսկովյան վիրահատությունների գրասենյակը որպես կոդ

Վիրահատությունների իրականացումը որպես կոդ

1) Մոտեցման էությունը

Գրանցումը որպես կոդ (Documentation as Code) մի պրակտիկա է, որտեղ վիրահատական գիտելիքները, հրահանգները և գործընթացները պահպանվում են, խմբագրվում և ստուգվում են ինչպես կոդը 'Git, pro-reques.ru, review և CI-valization։

Վիրահատական կոնտեքստում դա ստեղծում է հիմքը թիմերի հուսալիության, թափանցիկության և ինտեգրման համար։

Հիմնական նպատակը

Ստեղծել կենդանի, վերարտադրված և տարբերակված գիտելիքների համակարգ, որտեղ յուրաքանչյուր հրահանգը ենթակառուցվածքի արտեֆակտն է, ոչ թե հնացած PDF-ն։

2) Ինչո՞ ւ է դա անհրաժեշտ

Թափանցելիությունը ցույց է տալիս, թե ով, երբ և ինչու փոխեց ընթացակարգը։

Համաձայնություն 'բոլոր թիմերը աշխատում են համապատասխան տարբերակներով։

CI/CD-ի հետ ինտեգրումը հրահանգների ինքնաբերական ստուգումն է։

Կրկնօրինակումը 'ենթակառուցվածքը և պարամետրերը համաժամեցված են։

Անվտանգությունը 'հասանելիության վերահսկումը և Git-ի միջոցով աուդիտը։

Ուռբորդինգի արագացումը 'նոր վիրահատները տեսնում են ճշգրիտ սցենարներ, որոնք կապված են կոդի հետ։

3) Հիմնական օբյեկտները

ԱրտեֆակտըՁևաչափըՆշանակումը
RunbookMarkdown/YAMLհրահանգներ տրամադրման և ռուտինի գործողությունների համար
SOP (Standard Operating Procedure)Markdownստանդարտացված ընթացակարգերը
PlaybookYAML/JSONավտոմատացված քայլերը CI/CD, DR, նա-կոլայի համար
PostmortemMarkdown + ձևը YAML մետատվյալներվերլուծություն և եզրակացություններ դրանից հետո։
BCP/DRPMarkdown + սխեմաներշարունակականության և վերականգնման պլաններ
PolicyYAMLվիրահատական կանոններ և սահմանափակումներ

4) Ռեպոզորիայի ճարտարապետությունը


ops-docs/
├── README. md # structure description
├── standards/
│  ├── sop-deploy. md
│  ├── sop-oncall. md
│  └── sop-release. md
├── runbooks/
│  ├── payments-latency. md
│  ├── games-cache. md
│  └── kyc-verification. md
├── playbooks/
│  ├── dr-failover. yaml
│  ├── psp-switch. yaml
│  └── safe-mode. yaml
├── postmortems/
│  └── 2025-03-17-bets-lag. md
├── policies/
│  ├── alerting. yaml
│  ├── communication. yaml
│  └── security. yaml
└── templates/
├── postmortem-template. md
├── sop-template. md
└── playbook-template. yaml

Խորհուրդը 'յուրաքանչյուր պանակ' իր Git-reposoration կամ sabmodul-ը, որպեսզի տարբեր թիմեր կարողանան ինքնուրույն կառավարել բովանդակությունը։

5) Ձևաչափը և ստանդարտները

Մեթադները (front-matter YAML)

yaml id: sop-deploy owner: platform-team version: 3. 2 last_review: 2025-10-15 tags: [deployment, ci-cd, rollback]
sla: review-180d

Markdown կառուցվածքը


Purpose
Context
Step sequence
Result check
Risks and rollbacks
Contacts and channels

YAML-playbook (օրինակ)

yaml name: failover-psp triggers:
- alert: PSP downtime steps:
- action: check quota PSP-X
- action: switch PSP-Y
- action: verify payments latency < 200ms rollback:
- action: revert PSP-X

6) GitOps-ը և փոփոխության գործընթացները

Pox Request = RSA փաստաթղթերի փոփոխությունները։

Review: Տիրույթի սեփականատերը և Head of Ops-ը պետք է հաստատեն։

CI-վալիդացիա 'կառուցվածքի, պարտադիր դաշտերի, Markdown/YAML-ի ոսպնյակների ստուգում։

Ավտոմատ հրատարակումը 'merge-ից հետո, HTML/viki/dashbords գեներացիան։

Change log: Auto-պատմությունը ամսաթվերի և հեղինակների հետ։

Alts-հիշեցումները 'փաստաթղթի ստուգումը յուրաքանչյուր N օրվա ընթացքում (SLA)։

7) CI/CD ինտեգրումը

Lint-ստուգումներ ՝ Markdown-սինթակիս, YAML-վալիդիզմ, owner/version դաշտեր։

Link-interk-ը URL-ի և ներքին հղումների ստուգումն է։

Docs-build: փոխակերպումը HTML/Systluence/պորտալ։

Diff-վերլուծություն 'ինչ փոխվեց անցյալ օրինագծից փաստաթղթերի։

System-nc: նորարարություն հղում Grafana, Ops UI, Slack-ում։

Review-bots 'ենթադրություններ հնացած հատվածներով կամ բացակայող սեփականատերերին։

8) Ինտեգրումը վիրահատական գործիքների հետ

Grafana/Kibana 'ծանոթություններ և հղում համապատասխան runbook անմիջապես վահանակից։

Incident Live: «Open Runbook» կոճակը տիկետի ստեղծման ժամանակ։

On-call պորտալը 'համապատասխան SOP-ի և playbook-ի ստանդարտ։

AI-օգնականները 'հետազոտման որոնում, TL գեներացիա; DR-ը և գործողությունների խորհուրդները։

BCP վահանակներ 'DR հրահանգների ավտոմատ բեռնումը սցենարի ակտիվացման ժամանակ։

9) Կյանքի փաստաթղթերի ցիկլի կառավարումը

ՔայլըԳործողությունՊատասխանատուԳործիք
ՍտեղծումChernovic SOP/runbookDomain OwnerGit PR
ՌեբոԿոնտեքստի, ձևաչափի, վալիդիզմի ստուգումHead of OpsPR Review
ՀրապարակումըMerge + պորտալի արտադրությունCI/CDDocs-pipeline
ՄոսկվանSLA Express, տարբերակների ոսպնյOps-botCI
ԱրխիվացումԹարգմանություն «deprecated»SRE/ComplianceGit tag

10) Ավտոմատիզացիա և համաժամացում

Docs-bot-ը ստուգում է, թե որ փաստաթղթերը հնացած են։

Version badge: <<[lenseview: 2025-210]> հենց գլխարկի մեջ։

Runbook-finder-ը 'ալերտով, բացում է թեգի ճիշտ փաստաթուղթը։

Templates-gener.ru-ը ստեղծում է նոր SOP ձևանմուշ ("make new-sop" Deployae ")։

Audit-internc-ը կապում է SOP տարբերակը համակարգի և commit-ID-ի հետ։

11) Անվտանգությունն ու գաղտնիությունը

RBAC-ը վերափոխման վրա 'խմբագրման հասանելիությունը միայն օրինագծերի սեփականատերերի մոտ։

Գաղտնիքները և PII։ Դուք չեք կարող պահել բաց փաստաթղթերում։ միայն հղում պաշտպանված vox.

Աուդիտ 'բոլոր փոփոխությունների, խանդի և հրատարակությունների լոգ։

Քաղաքականությունը նշվում է. Www.SOP-ը յուրաքանչյուր 6 ամսվա ընթացքում։

Backups: Reposoria-ի և պորտալ-քաշայի նկարները DR-գոտում։

12) Հասունության մետրերը

ՄետրիկաՆպատակը
Coverage (1934)Հիմնական գործընթացների 90 տոկոսը ունեն SOP/runbook
Review SLA180 օր փորձարկումների միջև
Broken Links0 CI-ում
Owner CoverageՓաստաթղթերի 100% -ը սեփականատիրոջ հետ
ConsistencyՓաստաթղթերի 95 տոկոսը վադինի կառուցվածքով
Usage MetricsՏնային տնտեսությունների 70% -ը օգտագործում է runbook հղում runbook
AI AccessՓաստաթղթերի 100 տոկոսը հասանելի է RAG ինդեքսի միջոցով RAG ինդեքսով։

13) Anti-patterna

Մոսկվան պահվում է Google Docs-ում առանց տարբերակների և սեփականատերերի։

Runbook չի նորարարվում օրինագծերից հետո։

SOP-ն հիմնված է հնացած թիմերի/գործիքների վրա։

Ոչ CI-վալիդացիա 'Markdown սխալներով և բիթանոց հղումներով։

Նույն հրահանգների կրկնօրինակումը տարբեր վայրերում։

Սեփականատերերի և ակնարկների բացակայությունը։

14) Ներդրման չեկի ցուցակ

  • Որոշեք օրինագծերի սեփականատերերին և փաստաթղթերը։
  • Ստեղծել «ops-docs/» և SOP/runbook/playbook ձևանմուշները։
  • Տեղադրել CI ստուգումներ և ոսպնյակներ (Markdown/YAML)։
  • Տեղադրեք ավտո հրատարակությունը պորտալում կամ Wiki-ում։
  • Ինտեգրվել Grafana/Incident Live-ի հետ։
  • Ավելացնել Ops-bot հիշեցումների և SLA-վերանայման համար։
  • Մարզել թիմերը «docs-as-code workflow»։

15) 30/60/90 - իրականացման պլանը

30 օր

Ստեղծել ռեպոզորիայի կառուցվածքը, ձևանմուշները, CI-լինտերը և PR-revew գործընթացը։

Տեղափոխել հիմնական SOP և 5-10 քննադատական runbook։

Տեղադրել-build-ը պորտալում։

60 օր

Ներդրել Incident Services-ի և Grafana-ի հետ։

Միացրեք Ops-բոտին վերանայման և հաշվետվությունների համար։

Թարմացնել հետմորտը և կապել դաշբորդի պատահարի հետ։

90 օր

Ամբողջական SOP/runbook (3690%)։

Ներդրել KPI: Coverage, Review SLA, Usage։

«Docs-as-code» գործընթացի հարմարավետության և որակի ռետրո անցկացնելը։

16) SOP (Markdown) օրինակը


SOP: Deployment через ArgoCD id: sop-deploy owner: platform-team last_review: 2025-10-15 tags: [deployment, rollback, argo]

Purpose
Ensure secure and managed deployment of services via ArgoCD.

Context
Used for all microservices with Helm v2 + pattern.
Requires an active GitOps loop and enabled health-checks.

Step sequence
1. Check status' argocd app list'
2. Execute'argocd app sync payments-api '
3. Make sure 'status: Healthy'
4. In case of problems - 'argocd app rollback payments-api --to-rev <rev>'

Result check
SLO API availability ≥ 99. 95%, no alerts.

Risks and rollback
- Synchronization error - rollback.
- On repeated errors - Head of Ops escalation.

Contacts
@platform-team / #ops-deploy

17) Ինտեգրումը այլ գործընթացների հետ

Վիրահատական վերլուծությունը 'Coverage-ի և SLA-ի զեկույցները։

Օպերատորների ուսուցումը իրական runbook-ի հիման վրա է։

Հետմորտեմներ 'ավտոմատ հղում SOP-ում և playbook-ում։

Կառավարման էթիկան 'փոփոխությունների թափանցիկությունը և հեղինակությունը։

AI օգնականները 'կոնտեքստային որոնում և TL; DR-ից։

18) FAQ

Q: Ինչու՞ Git, եթե կա Systluence։

A: Git-ը տալիս է տարբերակներ, ակնարկներ, ավտոմատիզացիա և վերարտադրություն։ Syluence-ը կարող է վերջնական պատուհան լինել, բայց ոչ ճշմարտության աղբյուրը։

Q 'Ինչպե՞ ս խուսափել հնացած հրահանգներից։

A: SLA-ն ստուգման (180 օր) + Ops-bot հիշեցումներ + վերջին ստուգման ավտոմատ badge։

Q 'Կարո՞ ղ եք CI-ն միացնել փաստաթղթերին։

Ա 'Այո։ Սինթաքսիսի, պարտադիր դաշտերի և բիթանոց հղումների ստուգումը կատարվում է որպես ստանդարտ pipeline, որը նման է կոդի թեստերին։

Contact

Կապ հաստատեք մեզ հետ

Կապ հաստատեք մեզ հետ ցանկացած հարցի կամ աջակցության համար։Մենք միշտ պատրաստ ենք օգնել։

Սկսել ինտեգրացիան

Email-ը՝ պարտադիր է։ Telegram կամ WhatsApp — ըստ ցանկության։

Ձեր անունը ըստ ցանկության
Email ըստ ցանկության
Թեմա ըստ ցանկության
Նամակի բովանդակություն ըստ ցանկության
Telegram ըստ ցանկության
@
Եթե նշեք Telegram — մենք կպատասխանենք նաև այնտեղ՝ Email-ի дополнение-ով։
WhatsApp ըստ ցանկության
Ձևաչափ՝ երկրի կոդ և համար (օրինակ՝ +374XXXXXXXXX)։

Սեղմելով կոճակը՝ դուք համաձայնում եք տվյալների մշակման հետ։