Борбордук башкаруу дашборд
1) Максаты жана принциптери
Борбордук башкаруу дашборду (мындан ары - ЦДУ) - операцияларда чечим кабыл алуу үчүн бирдиктүү терезе. Ал телеметрия, ITSM, CI/CD, кызматтардын каталогу, иш календары жана провайдерлер сигналдарды бириктирип, аларды активдүү (actionable) виджеттерге айландырат.
Принциптери:- SLO-биринчи: жогорку - максаттуу SLO жана бурн-rate Tier-0/1.
- One-click to action: widget from - playbook/runbook же билет.
- Бирдиктүү сөздүк: бирдей SEV, статустар, түстөр жана босоголор.
- Окуялардын аннотациялары: бардык графиктерде релиздер/конфигалар/терезелер.
- Ролдору жана уруксаттары: жеке көрсөтүүлөр (on-call, IC, менеджмент).
- Төмөнкү ызы-чуу: булактар, де-дупликация жана терезелер боюнча басуу.
2) Ролдору жана негизги жагдайлар
On-call (P1/P2): тез "күйүп жатат" түшүнүү жана playbook ачуу (≤ 1 чыкылдатуу).
IC: SEV жарыялоо, war-room режимин ишке киргизүү, cadence comm-updates көзөмөлдөө.
Release Manager: гейтс көрүп, канарейка прогресс, кайра даяр.
Service Owner/Product: бизнес-SLI (төлөмдөрдүн/катталуулардын ийгилиги), таасири fich.
SRE/Platform: кубаттуулугу, автоскейлер, аномалиялар, DR-даярдыгы.
FinOps: $/бирдиги, ашыкча чыгымдар, бюджеттик алерт.
Security/Legal: posture, негизги күбөлүктөр, айлануу терезелер, WORM аудит шилтемелер.
3) КМУнун маалыматтык архитектурасы
Жогорку текче (hero-panel):- SLO по Tier-0/1 (availability/latency/success) с burn-rate 2-окна.
- SEV-статусу: активдүү окуялар жана алардын таймлайн.
- Релиздердин статусу: канарейка/көк-жашыл, активдүү гейтс.
- "Traffic Lights" провайдерлер (PSP/KYC/CDN).
- Тейлөө терезелери (азыр/24h), suppression-карта.
- Кубаттуулугу: болжолдоо менен CPU/RAM/IO/queue-depth/p95 latency.
- FinOps: $/1k txn, күндүзгү спенд vs бюджет, көлөмдүн аномалиялары.
- DataOps: витриналардын сергектиги, SLA пайплайндары, DQ каталары.
- Security: сертификаттардын мөөнөтү, сырларды айлантуу, маанилүү алсыздыктар (age/SLA).
- Корреляциялар "релиз SLO", "провайдер" ийгиликсиз/жашыруун ".
- Тез шилтемелер: Логи, соода, билеттер, Playbook, SOP, эскалация Matrix.
4) Widget (маалымат топтому)
1. SLO & Burn-rate
Учурдагы SLI, максаты жана бюджеттин чыгашасы каталарды көрсөтөт (1h/6h).
Аракет: кызмат деградация playbook ачуу.
2. Окуялар (SEV панели)
Active/акыркы, Declare/Comms таймерлери, IC/Comms ролдору.
Иш-аракет: war-room ачуу, Ападдын үлгүсү, IC чек тизмеси.
3. Релиздер/Конфиги
Канарейка 1 → 5 → 25%, желектер, артка (SOP баскычы/шилтеме).
Аннотациялар: версия, коммиттер, автор.
4. Тейлөө терезелери
Учурдагы/келечектеги, impacted-кызматтар/региондор; suppression-маска.
Аракет: билдирүүлөрдү макулдашуу, SLO сакчыларын кошуу.
5. кубаттуулугу/Autoscale
Керектөө божомолу (Naive/AR), hotspot карта, warm-pool.
Иш-аракет: квота/скейлинг эрежелери (PR үчүн repo-саясат).
6. FinOps
$/бирдиги, жогорку "кымбат" суроолор/логдор, daily burn vs budget.
Иш-аракет: Отчет жана сунуштарды ачуу (реестрлердин семплинги, архивдер).
7. Провайдерлер
SLA/PSP статусу/KYC/CDN, жолдор салмагы, даярдыгы.
Иш-аракет: салмак которуу, байланыш үлгү өнөктөштөр.
8. Security
Сертификаттар (≤ 30d), кечиктирилген ротациялар, алсыздыктар (age), шектүү окуялар.
Иш-аракет: IR-playbook/билет ачуу.
9. DataOps
Терезелердин сергектиги, өткөрмө пайызы, paypline иштебей калышы, DLQ.
Иш-аракет: арткы/карантин/rollback өзгөртүү.
5) Шарттар/түстөр/босоголор (эталон)
Green: SLI максаттуу ичинде, burn-rate <1 ×.
Amber: SLI начарлап, burn-rate 1-2 ×, өсүш p95, бирок workaround бар.
Red: breach же болжолу burn-out <1h; SEV-1/0 ачуу.
Grey: suppression (терезе), эч кандай телеметрия (булак ката).
6) Аннотациялар жана корреляциялар
Релиз/ /терезе/провайдердик статустар SLO тилкелеринде көрсөтүлөт.
маркер боюнча Click → diff, author, гейтс, баскычы "Артка/Folback/SOP".
Окуяда таймлайн ChatOps аннотацияларынан жана иш-аракеттеринен турат.
7) Маалымат булактары жана текшерүү
Телеметрия: trace_id менен метрика/соода/логи.
ITSM: окуялар/көйгөйлөр/өзгөрүүлөр (статусу/SLA).
CI/CD: релиздер, кол тамгалар, экспонаттар, тесттер.
Кызмат каталогу/CMDB: ээлери, SLO, көз карандылык.
Календарь: тейлөө терезелери.
Провайдерлер: статус-API + кол менен тастыктоо (өзүнчө витринага конуу).
FinOps: биллинг/теги ресурстары, көлөмдөрү, egress.
Quality Control: Quorum, кайталануучу зонддор, SLA сергектик, "үнсүз" булактарга алерт.
8) Көрсөтүү режимдери
War-room: SLO/Incidents/Releases/Comms-таймер.
Executive (28 күн): MTTR/MTTD/SEV mix, $/бирдик, SLO-адгеренс.
On-call: компакт "түнкү" панель (караңгы режим, чоң сандар).
Multitenant/аймак: filters service/region/tenant; presets.
9) багыттоо жана иш-аракеттер (бир-click)
Баскычтар: '/declare sev1 ', '/freeze', '/rollback ', '/status update', "playbook ачуу".
Drill : SLO → графиги → алдын ала толтурулган чыпкалар менен логи/соода ( , .
Шеринг: Тикет/статус-бетке панелдер.
10) Коопсуздук, жеткиликтүүлүк, аудит
SSO/OIDC + RBAC/ABAC: ролдору жана сатып алуулар (view/action).
JIT/JEA: иш-аракет "коркунучтуу" гана убактылуу жогорулатуу менен жеткиликтүү.
Аудит өзгөрүлбөйт: ким эмнени баскан, кандай суроо-талаптар/командалар кетти.
Сырлар: көрсөтүлбөйт, сырлар менеджерине шилтемелер гана.
11) Жетилүү CDU Метрика
Actionability ≥ 90%: чыкылдатуу иш-аракеттерге алып келет, гана эмес, графиктер.
Time-to-First-Action ≤ 2 мүнөт CDU SEV-1/0.
CDU "чындыктын булагы" болгон окуялар үлүшү ≥ 95%.
Freshness widget:% маалыматтар менен "жаңы 5 мин".
Coverage: SLO карталары жана релиз аннотациялары бар маанилүү кызматтардын%.
Zero-blind-spots: жумасына "үнсүз" булактары = 0.
12) Чек-баракчалар
Долбоорлоо
- Ролдор жана сценарийлер сүрөттөлгөн (P1/P2/IC/Exec/FinOps/Security/DataOps).
- Түстөр сөздүгү/SEV/босоголор макулдашылган.
- Quorum жана SLA сергектик менен маалымат булактары.
- макеттер War-room/On-call/Executive.
- ChatOps/ITSM/CI/CD/CMDB интеграциялык планы.
Иштетүү
- Widget Линтер өтөт (милдеттүү талаалар, owner, босоголор).
- Жумасына бир жолу - CDU жакшыртуу менен Escalation/Alert Review.
- Окуя Snapshot AAR/RCA колдонулат.
- Караңгы режим/мобилдик алдын ала эскертүү.
- "Дудук" булактары жана аннотацияларынын тууралыгы боюнча тесттер.
13) Шаблондор (идеялар)
13. 1 Widget аныктамасы (YAML)
yaml id: slo-payments title: "SLO: Success of payments (EU)"
owner: team-payments type: slo_burnrate sli:
metric: "biz. payment_success_ratio"
target_pct: 99. 5 burn_rate:
short_window: "1h"
long_window: "6h"
thresholds:
amber: { burn_rate: 1. 2 }
red: { burn_rate: 2. 0 }
actions:
- label: "Open playbook"
link: "rb://payments/slo-degrade"
- label: "Release rollback"
link: "sop://REL-ROLLBACK-01"
annotations:
release: true change: true filters:
region: "eu"
tier: "0"
13. 2 Окуя карта (JSON)
json
{
"id": "incidents-active",
"type": "incident_board",
"sev": ["SEV-0", "SEV-1", "SEV-2"],
"fields": ["id","sev","service","since","ic","next_comms_at"],
"actions": [{"label":"War-room","cmd":"/declare sev1"}]
}
13. 3 релизи менен байланыш
yaml id: release-canary type: release_progress source: cicd://checkout gates: ["tests","signatures","slo_guardrails"]
canary_steps: [1,5,25]
rollback: "sop://REL-ROLLBACK-01"
annotations: { on_charts: ["slo-latency","slo-success"] }
13. 4 Widget FinOps
yaml id: finops-burn type: cost_unit metrics:
- id: "cost_per_1k_txn"
- id: "logs_daily_gib"
alerts:
- when: "cost_per_1k_txn > target1. 2"
action: "open://finops/reco-logs-sampling"
14) Анти-үлгүлөрү
"Графиктер дубалы" эч кандай иш-аракеттер жана плейбуктар.
командалар боюнча ар кандай түстөр/босоголор → SEV башаламандык.
Эч кандай релиз/терезе аннотациялары - себептердин татаал корреляциясы.
Кворум жок кайталануучу булактар - жалган бет/ызы-чуу.
Сырлар/панелдеги ачкычтар - агып кетүү коркунучу.
Жай рендер (кэшталбаган суроолор/агрегациялар) - панелдер согушта ачылбайт.
15) Жол картасы киргизүү (4-8 жума)
1. Нед. 1: ролдору боюнча талаптарды чогултуу, статус/түстөр сөздүгү, үч режимдер макеттери.
2. Нед. 2: SLO туташуу/Incidents/Releases/Windows, аннотациялар, ChatOps-аракет.
3. Нед. 3: FinOps/Capacity/Providers/DataOps/Security, Quorum булактарын кошуу.
4. Нед. 4: War-room режими, ITSM боюнча snapshots, Tier-0 боюнча учкуч.
5. Нед. 5-6: оптималдаштыруу аткаруу, мобилдик/on-call алдын ала, linter widget.
6. Нед. 7-8: жетилүү өлчөмдөрү, жума сайын карап чыгуу, автоматтык сунуштар (семплинг, квота, фолбэк).
16) Жыйынтык
CDU - бул "кооз сүрөттөр" эмес, чечим панели: SLO жана бурн-rate жогору, окуялар/релиздер/бир контекстте терезелер, ChatOps жана SOP аркылуу заматта иш-аракет, тастыкталган булактары жана аннотациялар. Бул дашборд MTTA/MTTR азайтат, байланышты жөнөкөйлөтөт, FinOps колдойт жана операцияны ачык-айкын жана алдын ала айтууга болот.