Бұлтты шығындарды оңтайландыру
1) FinOps не үшін және қандай мақсаттар
Мақсаты - SLO/әзірлеу жылдамдығын сақтау кезінде COGS төмендету. Негізгі сұрақтар:- 1 сұрау, 1 белсенді пайдаланушы, 1 тэнант қанша тұрады?
- Жаңа фичер/трафиктің маржиналдық әсері қандай?
- «Ағулар» қайда (egress, артық логтар, CPU/жады оверхед, тоқтап тұрған ресурстар)?
Негізгі метриктер
Cost/Req, Cost/Minute Active, Cost/Tenant/Brand, Cost/GB-stored, Cost/GB-egress.
COGS%: түсімдегі өзіндік құнның үлесі.
Waste%: (төленген, бірақ пайдаланылмаған ресурстар )/( барлық ресурстар).
2) Тәртіпті орнату: тегтер, иелену, бюджеттер
Тегтеу/лейблдер: 'env', 'team', 'service', 'tenant', 'product', 'cost _ center', 'slo _ tier'.
Иелену: әрбір ресурста - иесі және TTL.
Бюджеттер/алерттер: 50/80/100% шектерімен айлық/апталық бюджеттер + anomaly detection.
Саясат код ретінде: «тегсіз» тыйым салу, өлшем лимиттері, әдепкі өңірлер, бөлінген квоталар.
hcl module "policy" {
source = "finops/policy/required-tags"
required_tags = ["env","team","service","cost_center","tenant"]
}
3) Үнемдеудің сәулеттік тетіктері
3. 1 Дұрыс өлшемдер және автоскейлинг
Rightsizing: нақты CPU/RAM p95 үшін инстанцияларды таңдаңыз.
Автоскейлинг: көлденең> тік; для K8s — Cluster Autoscaler/Karpenter, для serverless — min/max concurrency.
Суық жолдар - кезекте/батшы; ұзақ мерзімді міндеттер - кесте бойынша воркерлерге.
3. 2 Споттық/сатып алынған қуаттар
Стейтлесс/бэкграундтар және CI үшін Spot/Preemptible; On-Demand буферін сақтаңыз.
RI/CUD/Savings Plans: тұрақты 50-70% негізгі жүктемені, қалғаны - эластикалық брондау.
3. 3 Деректерді сақтау және сыныптары
Бөліңіз: hot (SSD), warm (стандартты), cold/мұрағат (Glacier/Archive).
Лайфциклдер саясаты: сыныптарды жылжыту, мерзімнен кейін жою.
Қажет болған жерде нұсқалауды қосыңыз және object lock (WORM) - тек аудит үшін.
3. 4 Желі және egress
CDN/edge + stale-while-revalidate өңіраралық egress азайтады.
«Шикі» интернеттің орнына жеке арналар (PrivateLink/PSC/Direct Connect/Interconnect).
Компрессия (Brotli/Zstd), HTTP/3/QUIC - RTT/қайта қосылудан аз.
3. 5 Дерекқорлар мен кэштер
Екі деңгейлі схеманы таңдаңыз: кэш (Redis/Memcached) + сақтау орны.
Аналитикаға арналған репликаларды оқыңыз, автовакуумды/компакцияны қосыңыз, pgBouncer/RDS Proxy пайдаланыңыз.
Үлкен кестелер үшін - партиялану/TTL/мұрағат.
4) Kubernetes-экономика
SLO-сыныптары бойынша Requests/Limits; тыйым салу 'limits: null'.
VPA (ұсыныстар), Karpenter (пот үшін инстанцияларды іріктеу), Bin packing (tolerations/affinity).
Кластер/тораптар деңгейінде prod/stage/dev дегенді бөліңіз (түрлері мен саясаттары әртүрлі).
Желілік және сторедж кластары: «премиум барлық жерде» емес, жүктеме бейіні бойынша SC/IOPS таңдаңыз.
QoS сыныптары мен басымдықтары: фондық тапсырмаларды үнемдеу.
Логтардың профильдері: жергілікті буфері бар sidecar-агенттер, батчалармен жіберу.
5) Serverless-экономика
Min instances/provisioned concurrency - тек ыстық қаламсаптар үшін.
Ұсақ деплой-бандл, lazy-init, коннектілердің шарингі.
Ауыр міндеттерді орындау және кезекке қою мерзімдері.
Функциялар-агрегаторлар (fan-in) ондаған жорықтардың орнына.
6) Обсервабилити: құнды телеметрия үшін төлеу
Логтар: құрылымдық, verboseness; сыныптар бойынша ретенциялар (prod-қателер ұзақ, debug - қысқа).
Трэйстердің сэмплингі: tail-based - 100% қате/p99, қалғаны 1-10%.
Метриктер: агрегация/даунсэмплинг, sparse-жіберу.
Жіберілгенге дейін PII сүзгілеу (байттар мен тәуекелдерден аз).
7) Жеткізушілер желісі және Marketplace
Өңірлердің бағаларын, managed-сервистердің маржиналдығын, базарплейс-бандлаларды салыстырыңыз.
Келіссөздер: көлемдік жеңілдіктер (RI/CUD), коммит-келісімдер, кредиттік бағдарламалар.
Қиылысатын функциясы бар SaaS қайталауын болдырмаңыз.
8) Юнит-экономика және дашбордтар
Негізгі SLI/SLO құны
Маршруттар бойынша Cost/Req (login, catalog, deposit).
Cost/Tenant/Brand/Region.
Egress/Req, Storage/Req, Compute/Req.
Waste % и Coverage RI/SP %.
Дашбордтар (ең аз жиынтық)
Ресурстарға дейін төмен түсетін сервистер/командалар бойынша «Шығындар картасы».
Бағыттар бойынша egress «жылу картасы».
«Сервис → құны → SLO»: p99 және Cost/Req корреляциясы.
«RI/CUD/Spot» желілер бойынша жабу және үнемдеу.
9) FinOps процестері
Сервистердің иелерімен апта сайынғы шоттарды талдау.
Өнімді қосуға дейінгі фич құнын бағалаумен Change review.
Guardrails: квота лимиттері, idle-ресурстарды автоматты түрде аяқтау, тест ортасына TTL.
GameDays құны: жасанды шыңдар/фич-жалаулар, бюджеттің тұрақтылығын тексеру.
10) Антипаттерндер
TTL → түбегейлі жоқ «уақытша» ресурстар.
`0. 0. 0. 0/0 'egress + жоқ CDN → egress-шоттар жарылады.
Тегтерсіз/лейблдерсіз → шығыстарды бөлу мүмкін емес.
Өнімдегі DEBUG деңгейінің логтары, 100% трэйстері - мағынасыз терабайттар.
Provisioned/serverful «кез келген жағдайда» пайдалану өлшемдерінсіз.
Барлық жүктемелер - тек On-Demand, RI/Spot/коммиттерсіз.
11) iGaming/Қаржы ерекшелігі
PSP/төлем комиссиялары - COGS бөлігі: арзан/сенімді провайдерлерге smart-routing оңтайландыру; күй күйін кэштеңіз, қайталауды болдырмаңыз.
KYC/AML вендорлары: сұрауларды пакеттеңіз, нәтиже кэшін пайдаланыңыз (TTL), Cost/KYC өлшеңіз.
«Ақша жолдары» (депозит/шығару): жеке SLO және бюджет; ең жоғары оқиғаларға арналған резервтер, тек сол жерде ғана жылы даналар.
Мазмұн/CDN: egress және data residency сақтау үшін жергілікті edge және аймақтық домендер.
Заңды талаптар: Аудит үшін WORM-сақтау орны - көлемді шектеңіз (агрегация, TTL, компрессия).
12) Шағын рецептер
12. 1 Логтардың ретеншн саясаты
Prod-қателер: 30-90 күн; Info: 7–14; Debug: 24-72 сағат.
Мұрағат тек комплаенс талабы бойынша.
12. 2 Канареялық телеметрия
Жаңа фича үшін - 100% трэйс алғашқы 24 сағат → содан кейін tail-sampling.
12. 3 Нысандардың лайфциклдері
json
[
{"prefix": "raw/", "days_to_warm": 30, "days_to_cold": 90, "days_to_delete": 365},
{"prefix": "audit/", "lock": "WORM-365d"}
]
12. 4 Бюджеттер/конкурстар (идея)
Айлық бюджет per team; 50/80/100% алерталар; anomaly detection> 24 сағаттағы трендтен 30%
13) Prod-дайындық чек-парағы
- 100% ресурстардың тегтері мен иелері; саясаткерлер таңдалмағандарды бұғаттайды.
- Бюджеттер мен тәуекелдер + anomaly detection; тэнанттар/брендтер/өңірлер бойынша есептер.
- RI/CUD/Spot негізгі жүктемені жабады; On-Demand буфері бар.
- K8s: requests/limits берілген; VPA/Karpenter; bin packing; Storage/IOPS бөлек сыныптары.
- Serverless: provisioned/min тек ыстық жолдар үшін; суық - кезек арқылы.
- CDN/edge қосылған; PaaS жеке арналар; egress-дашборд.
- Логи/трейстер: tail-sampling, сыныптар бойынша ретенциялар; PII сүзгісі.
- Сақтау лайфциклдері және мұрағат; ірі кестелерді партияландыру.
- Қаржылық дашбордтар Cost/Req, Cost/Tenant, Waste%, Coverage RI/SP%.
- iGaming үшін: PSP/KYC/AML шығыстарын, SLO және «ақша жолдарының» бюджеттерін, WORM-аудитін есепке алу.
14) TL; DR
Алдымен көріну (тегтер, бюджеттер, дашбордтар), содан кейін құрылымдық тетіктер: дұрыс өлшемдер, автоскейлинг, RI/Spot/коммиттер, CDN/edge және жеке арналар, сақтау сыныптары мен лайфциклдер. Құнды телеметрия (tail-sampling, қысқа ретенциялар) үшін төлеңіз және guardrails автоматтандырыңыз. iGaming-те PSP/KYC/AML-ді COGS-тің бір бөлігі ретінде ескеріңіз және жеке SLO мен бюджеттермен «ақша жолдарын» бөліп көрсетіңіз.