GH GambleHub

Оптимізація хмарних витрат

1) Навіщо FinOps і які цілі

Мета - знизити COGS при збереженні SLO/швидкості розробки. Ключові питання:
  • Скільки коштує 1 запит, 1 активний користувач, 1 тенант?
  • Який маржинальний ефект у нового фічера/трафіку?
  • Де «протікання» (egress, надлишкові логи, оверхед CPU/пам'яті, простоюють ресурси)?

Базові метрики

Cost/Req, Cost/Minute Active, Cost/Tenant/Brand, Cost/GB-stored, Cost/GB-egress.
COGS %: частка собівартості у виручці.
Waste %: (оплачені, але невикористані ресурси )/( всі ресурси).


2) Наведення порядку: теги, володіння, бюджети

Тегування/лейбли: `env`, `team`, `service`, `tenant`, `product`, `cost_center`, `slo_tier`.
Володіння: у кожного ресурсу - власник і TTL.
Бюджети/алерти: місячні/тижневі бюджети з порогами 50/80/100% + anomaly detection.
Політики як код: заборона «без тегів», ліміти розмірів, регіони за замовчуванням, виділені квоти.

Приклад Terraform - обов'язкові теги (ідея):
hcl module "policy" {
source = "finops/policy/required-tags"
required_tags = ["env","team","service","cost_center","tenant"]
}

3) Архітектурні важелі економії

3. 1 Правильні розміри і автоскейлінг

Rightsizing: підберіть інстанси під фактичний CPU/RAM p95.
Автоскейлінг: горизонталь> вертикаль; для K8s — Cluster Autoscaler/Karpenter, для serverless — min/max concurrency.
Холодні шляхи - в черзі/батчі; довготривалі завдання - у воркери за розкладом.

3. 2 Спотові/викуплені потужності

Spot/Preemptible для стейтлесс/бекграундів і CI; тримайте буфер On-Demand.
RI/CUD/Savings Plans: бронюйте стабільні 50-70% базового навантаження, решта - еластика.

3. 3 Зберігання і класи даних

Поділяйте: hot (SSD), warm (стандартне), cold/архів (Glacier/Archive).
Політики лайфциклів: зрушення класів, видалення після терміну.
Увімкніть версіонування там, де потрібно, і object lock (WORM) - тільки для аудиту.

3. 4 Мережа та egress

CDN/edge + stale-while-revalidate зменшує міжрегіональний egress.
Приватні канали (PrivateLink/PSC/Direct Connect/Interconnect) замість «сирого» інтернету.
Компресія (Brotli/Zstd), HTTP/3/QUIC - менше RTT/перепідключень.

3. 5 Бази даних і кеші

Підберіть дворівневу схему: кеш (Redis/Memcached) + сховище.
Читайте репліки для аналітики, включайте автовакуум/компакцію, використовуйте pgBouncer/RDS Proxy.
Для великих таблиць - партіонування/TTL/архів.


4) Kubernetes-економіка

Requests/Limits по SLO-класах; заборона'limits: null`.
VPA (рекомендації), Karpenter (підбір інстансів під поди), Bin packing (tolerations/affinity).
Розділяйте prod/stage/dev на рівні кластера/вузлів (різні типи і політики).
Мережеві та сторедж-класи: вибирайте SC/IOPS за профілем навантаження, а не «преміум скрізь».
QoS класи та пріоритети: економія на фонових завданнях.
Профілі логів: sidecar-агенти з локальним буфером, відправка батчами.


5) Serverless-економіка

Min instances/provisioned concurrency - тільки для гарячих ручок.
Дрібний деплой-бандл, lazy-init, шарінг конектів.
Терміни виконання і винесення в чергу важких завдань.
Функції-агрегатори (fan-in) замість десятка походів в залежності.


6) Обсервабіліті: платити за цінну телеметрію

Логи: структурні, без verboseness; ретенції за класами (prod-помилки довше, debug - коротко).
Семплінг трейсів: tail-based - 100% помилок/р99, решта 1-10%.
Метрики: агрегація/даунсемплінг, sparse-відправка.
Фільтрація PII до відправки (менше байтів і ризиків).


7) Мережа постачальників і Marketplace

Порівнюйте ціни регіонів, маржинальність managed-сервісів, маркетплейс-бандли.
Переговори: об'ємні знижки (RI/CUD), коміт-угоди, кредитні програми.
Уникайте дублювання SaaS з пересічним функціоналом.


8) Юніт-економіка і дашборди

Основні SLI/SLO вартості

Cost/Req за маршрутами (login, catalog, deposit).
Cost/Tenant/Brand/Region.
Egress/Req, Storage/Req, Compute/Req.
Waste % и Coverage RI/SP %.

Дашборди (мінімальний набір)

«Карта витрат» за сервісами/командами зі спусками до ресурсу.
«Теплова карта» egress за напрямками.
«Сервіс → вартість → SLO»: кореляція p99 і Cost/Req.
«RI/CUD/Spot» покриття і економія по лініях.


9) Процеси FinOps

Щотижневі розбори рахунків з власниками сервісів.
Change review з оцінкою вартості фіч до прод-включення.
Guardrails: ліміти квот, автоматичне завершення idle-ресурсів, TTL на тестові середовища.
GameDays вартості: штучні піки/фіч-прапори, перевірка стійкості бюджету.


10) Антипатерни

«Тимчасові» ресурси без TTL → назавжди.
`0. 0. 0. 0/0'egress + відсутній CDN → egress-рахунки вибухають.
Без тегів/лейблів → неможливо розподілити витрати.
Логи рівня DEBUG в проді, трейси 100% - безглузді терабайти.
Provisioned/serverful «про всяк випадок» без метрик використання.
Всі навантаження - тільки On-Demand, без RI/Spot/комітів.


11) Специфіка iGaming/фінансів

PSP/платіжні комісії - частина COGS: оптимізуйте smart-routing до дешевих/надійних провайдерів; кешуйте статуси, уникайте повторів без ідемпотентності.
KYC/AML-вендори: пакетуйте запити, використовуйте кеш результатів (TTL з політики), вимірюйте Cost/KYC.
«Шляхи грошей» (депозит/висновок): окремі SLO і бюджет; резерви на пікові події, теплі екземпляри тільки там.
Вміст/CDN: локальні edge і регіональні домени для зниження egress і дотримання data residency.
Юридичні вимоги: WORM-сховище для аудиту - обмежуйте обсяг (агрегація, TTL, компресія).


12) Міні-рецепти

12. 1 Політика ретеншну логів

Prod-помилки: 30-90 днів; Info: 7–14; Debug: 24-72 години.
Архів тільки на вимогу комплаєнсу.

12. 2 Канарська телеметрія

Для нової фічі - 100% трейсів перші 24 год → потім tail-sampling.

12. 3 Лайфцикли об'єктів

json
[
{"prefix": "raw/", "days_to_warm": 30, "days_to_cold": 90, "days_to_delete": 365},
{"prefix": "audit/", "lock": "WORM-365d"}
]

12. 4 Бюджети/алерти (ідея)

Місячний бюджет per team; алерти 50/80/100%; anomaly detection> 30% від тренду за 24 год.


13) Чек-лист prod-готовності

  • Теги і власники на 100% ресурсів; політики блокують нетеговані.
  • Бюджети та алерти + anomaly detection; звіти по тенантам/брендам/регіонам.
  • RI/CUD/Spot покривають базове навантаження; є буфер On-Demand.
  • K8s: requests/limits задані; VPA/Karpenter; bin packing; роздільні класи Storage/IOPS.
  • Serverless: provisioned/min тільки для гарячих шляхів; холодні - через черги.
  • CDN/edge включені; приватні канали до PaaS; egress-дашборд.
  • Логи/трейси: tail-sampling, ретенції за класами; фільтрація PII.
  • Лайфцикли зберігання та архів; Партіонування великих таблиць.
  • Фінансові дашборди Cost/Req, Cost/Tenant, Waste%, Coverage RI/SP%.
  • Для iGaming: облік PSP/KYC/AML витрат, SLO і бюджети «шляхів грошей», WORM-аудит.

14) TL; DR

Спочатку видимість (теги, бюджети, дашборди), потім структурні важелі: правильні розміри, автоскейлінг, RI/Spot/комміти, CDN/edge і приватні канали, класи зберігання і лайфцикли. Платіть за цінну телеметрію (tail-sampling, короткі ретенції) і автоматизуйте guardrails. У iGaming врахуйте PSP/KYC/AML як частину COGS і виділяйте «шляхи грошей» з окремими SLO і бюджетами.

Contact

Зв’яжіться з нами

Звертайтеся з будь-яких питань або за підтримкою.Ми завжди готові допомогти!

Розпочати інтеграцію

Email — обов’язковий. Telegram або WhatsApp — за бажанням.

Ваше ім’я необов’язково
Email необов’язково
Тема необов’язково
Повідомлення необов’язково
Telegram необов’язково
@
Якщо ви вкажете Telegram — ми відповімо й там, додатково до Email.
WhatsApp необов’язково
Формат: +код країни та номер (наприклад, +380XXXXXXXXX).

Натискаючи кнопку, ви погоджуєтесь на обробку даних.