Булут чыгымдарын оптималдаштыруу
1) Эмне үчүн FinOps жана кандай максаттар
Максаты - SLO/иштеп чыгуу ылдамдыгын сактоо менен COGS азайтуу. Негизги суроолор:- Канча турат 1 суроо-талап, 1 активдүү колдонуучу, 1 тенант?
- Жаңы Фичер/трафиктин маржиналдык таасири кандай?
- Кайда "агып" (egress, ашыкча Логи, ашыкча CPU/эс, бош ресурстар)?
Негизги метриктер
Cost/Req, Cost/Minute Active, Cost/Tenant/Brand, Cost/GB-stored, Cost/GB-egress.
COGS%: кирешенин өздүк наркынын үлүшү.
Waste%: (төлөнгөн, бирок пайдаланылбаган ресурстар )/( бардык ресурстар).
2) Тартипти орнотуу: тегдер, ээлик кылуу, бюджеттер
Тегиздөө/лейблдер: 'env', 'team', 'service', 'tenant', 'product', 'cost _ center', 'slo _ tier'.
Ээлик кылуу: ар бир ресурстун ээси жана TTL.
Бюджеттер/Алерт: 50/80/100% босого менен айлык/жумалык бюджеттер + anomaly detection.
Код катары саясат: тыюу "тегсиз", өлчөм чектери, демейки аймактар, бөлүнгөн квоталар.
hcl module "policy" {
source = "finops/policy/required-tags"
required_tags = ["env","team","service","cost_center","tenant"]
}
3) архитектуралык сактоо рычагдары
3. 1 Туура өлчөмдөрү жана автоскейлинг
Rightsizing: иш жүзүндө CPU/RAM p95 үчүн бийлик тандоо.
Автоскейлинг: горизонталь> вертикаль; для K8s — Cluster Autoscaler/Karpenter, для serverless — min/max concurrency.
Суук жолдор - кезекте/батчи; узак мөөнөттүү тапшырмалар - график боюнча воркерлерге.
3. 2 Spot/сатып алынган кубаттуулугу
Spot/Preemptible үчүн stattless/арткы жана CI; On-Demand буферин кармап.
RI/CUD/Savings Plans: туруктуу 50-70% базалык жүктү, калган - ийкемдүүлүк.
3. 3 Сактоо жана маалымат класстары
Бөлүшүү: Hot (SSD), warm (стандарт), cold/Archive (Glacier/Archive).
Лайфциклдик саясат: класстарды өзгөртүү, мөөнөттөн кийин алып салуу.
Керек болгон жерде версиялоону жана object lock (WORM) - аудит үчүн гана.
3. 4 Тармак жана egress
CDN/edge + stale-while-revalidate аймактар аралык egress азайтат.
Жеке каналдар (PrivateLink/PSC/Direct Connect/Interconnect) ордуна "чийки" интернет.
Компрессия (Brotli/Zstd), HTTP/3/QUIC - аз RTT/кайра туташтыруу.
3. 5 Маалымат базалары жана кэштер
Эки баскычтуу схеманы тандоо: кэш (Redis/Memcached) + сактоо.
Аналитика үчүн репликаларды окуңуз, унаа акысын/компакцияны күйгүзүңүз, pgBouncer/RDS Proxy колдонуңуз.
Чоң таблицалар үчүн - партиялаштыруу/TTL/архив.
4) Kubernetes-экономика
SLO класстары боюнча Requests/Limits; тыюу салуу 'limits: null'.
VPA (сунуштар), Карпентер (кадамдарды тандоо), Bin packing (tolerations/affinity).
Кластердин/түйүндөрдүн деңгээлинде prod/stage/dev бөлүшүү (ар кандай түрлөрү жана саясаттары).
Network жана Storedge класстар: "бардык жерде премиум" эмес, жүктөө боюнча SC/IOPS тандоо.
QoS класстар жана артыкчылыктар: фон тапшырмаларын үнөмдөө.
Логдордун профилдери: жергиликтүү буфер менен sidecar агенттери, батч менен жөнөтүү.
5) Serverless-экономика
Min instances/provisioned concurrency - ысык калем үчүн гана.
Small deploy-bandl, lazy-init, коннекттерди бөлүшүү.
Оор тапшырмаларды аткаруу жана кезекке коюу мөөнөттөрү.
Функциялар-агрегаторлор (fan-in) ордуна ондогон жүрүштөр көз каранды.
6) обсервация: баалуу телеметрия үчүн төлөө
Логи: структуралык, verboseness жок; класстар боюнча ката (узагыраак prod-ката, debug - кыска).
Traces Sampling: tail-based - 100% ката/p99, калган 1-10%.
Метрика: агрегация/downsampling, sparse-жөнөтүү.
жөнөтүүгө чейин PII чыпкалоо (аз байттар жана тобокелдиктер).
7) Тармак жөнөтүүчүлөр жана Marketplace
Региондордун бааларын, башкарылуучу кызматтардын маржиналдуулугун, базар бандаларын салыштырыңыз.
Сүйлөшүүлөр: көлөмдүү арзандатуулар (RI/CUD), коммит келишимдер, кредиттик программалар.
кесилишкен иш менен SaaS кайталап качуу.
8) Бирдик-экономика жана дашборддор
Негизги SLI/SLO наркы
каттамдар боюнча Cost/Req (login, catalog, deposit).
Cost/Tenant/Brand/Region.
Egress/Req, Storage/Req, Compute/Req.
Waste % и Coverage RI/SP %.
Dashboard (минималдуу топтому)
"Чыгымдар картасы" ресурсту түшүрүү менен кызматтар/командалар боюнча.
"Жылуулук картасы" багыттары боюнча egress.
"Кызмат → наркы → SLO": корреляция p99 жана Cost/Req.
"RI/CUD/Spot" жабуу жана линияларын үнөмдөө.
9) FinOps жараяндар
Сервистердин ээлери менен эсептерди жумалык талдоо.
Change review прод-кошуу чейин fich наркын баалоо менен.
Guardrails: квота чектери, idle-ресурстарды автоматтык түрдө бүтүрүү, сыноо чөйрөлөрүндө TTL.
GameDays наркы: жасалма чокулары/Fich желектери, бюджеттин туруктуулугун текшерүү.
10) Антипаттерндер
"Убактылуу" TTL жок ресурстар → түбөлүккө.
`0. 0. 0. 0/0 'egress + жок CDN → egress эсептери жарылып жатат.
Тегдер/лейблдер жок → чыгымдарды бөлүштүрүү мүмкүн эмес.
DEBUG денгээлде Prod, Traces 100% - маанисиз Terabayt.
Provisioned/serverful "кандай болгон күндө да" метрикасыз колдонуу.
Бардык жүктөр - жөн гана On-Demand, жок RI/Spot/коммиттер.
11) iGaming/Каржы өзгөчөлүктөрү
PSP/төлөм комиссиялары - COGS бөлүгү: арзан/ишенимдүү провайдерлерге smart-маршрутизацияны оптималдаштыруу; статустарды кэш, кайра кайталоодон алыс болуңуз.
KYC/AML сатуучулар: суроо-пакеттөө, натыйжалары кэш колдонуу (TTL саясат), наркы/KYC өлчөө.
"Акча жолдору" (депозит/чыгаруу): өзүнчө SLO жана бюджет; жогорку окуялар үчүн камдар, жылуу нускалар гана бар.
Мазмун/CDN: жергиликтүү edge жана аймактык домендер egress азайтуу жана data residency сактоо.
Юридикалык талаптар: аудит үчүн WORM-сактоо - көлөмүн чектөө (топтоо, TTL, кысуу).
12) Mini Recipes
12. 1 Блог Retenshna саясаты
Prod каталар: 30-90 күн; Info: 7–14; Debug: 24-72 саат.
Архив комплаенс талабы боюнча гана.
12. 2 Канареалык телеметрия
Жаңы чүчүкулак үчүн - 100% traces биринчи 24 саат → андан кийин tail-sampling.
12. 3 Жашоо объектилери
json
[
{"prefix": "raw/", "days_to_warm": 30, "days_to_cold": 90, "days_to_delete": 365},
{"prefix": "audit/", "lock": "WORM-365d"}
]
12. 4 Бюджет/Алерт (идея)
Айлык бюджет per team; alerty 50/80/100%; anomaly detection> 30% 24 саат үчүн тренд
13) Prod-даярдык чек тизмеси
- Тегдер жана 100% ресурстардын ээлери; саясатчылар тоскоолдук кылышпайт.
- Бюджеттер жана тобокелдиктер + anomaly detection; Тэнанттар/бренддер/региондор боюнча отчеттор.
- RI/CUD/Spot негизги жүктү камтыйт; On-Demand буфери бар.
- K8s: requests/limits белгиленген; VPA/Karpenter; bin packing; Storage/IOPS өзүнчө класстар.
- Serverless: provisioned/min ысык жолдор үчүн гана; суук - кезек аркылуу.
- CDN/edge киргизилген; PaaS жеке каналдар; egress-dashboard.
- Logs/Trades: tail-sampling, класстар боюнча retents; PII чыпкалоо.
- жашоо сактоо жана архив; ири таблицаларды партиялаштыруу.
- Финансылык дашборддор Cost/Req, Cost/Tenant, Waste%, Coverage RI/SP%.
- iGaming үчүн: PSP/KYC/AML чыгымдарды эсепке алуу, SLO жана бюджеттер "акча жолдору", WORM аудит.
14) TL; DR
Адегенде көрүү (тегтер, бюджеттер, дашборддор), андан кийин структуралык рычагдар: туура өлчөмдөр, автоскейлинг, RI/Spot/коммиттер, CDN/edge жана жеке каналдар, сактоо класстары жана жашоо. Баалуу телеметрия үчүн төлөңүз (tail-sampling, кыска ретенциялар) жана guardrails автоматташтырыңыз. iGaming PSP/KYC/AML COGS бир бөлүгү катары эске алып, өзүнчө SLO жана бюджеттер менен "акча жолдорун" бөлүп.