FinOps e orçamento da infraestrutura
1) Alvos de FinOps e área de responsabilidade
FinOps combina engenharia, finanças e produto para gerenciar o custo mantendo o SLO/velocidade de entrega.
Resultados:- Transparência de custos por serviços/comandos/tenantes/regiões.
- Previsibilidade (plano/fato, desvios, reforecast).
- Trade-off consciente: desempenho ↔ custo.
- Produt/Owners - metas de renda/economia unit.
- Eng/Plataforma - alavancas arquitetônicas e SLO.
- Financiamento - orçamentos, empresas, relatórios.
- FinOps Guild - processo, ferramentas, treinamento.
2) Métricas e economia unit
SLI básico de custo:- Costa/Req (valor de 1 solicitação), Cost/ActiveUser/Month, Costa/Tenant/Brand/Region.
- COGS% (custo/receita), Gross Margin.
- Waste% = pago - usado.
- Coverage% (RI/CUD/SP) é a proporção da carga coberta pelos grupos.
- Egress/Req, Storage/Req, Observability/Req.
Cost/Req = (Compute + Storage + Network + Observability + 3rd-party) / #Requests
COGS% = COGS / Revenue
Waste% = (Idle + Over-provision + Unused) / Total
3) Formalização, posse e políticas
Marcas de formatação obrigatórias: "eng", "team", "service", "tenant", "product'," cost _ center "," slo _ tier "," owner "," ttl ".
Propriedade: Cada recurso tem um prazo de revisão responsável.
Políticas como código: não criar recursos sem marcas de formatação, limites de tamanho, regiões válidas, tempo de vida de ambientes de teste.
- Deny «egress público sem proxy/Private Link».
- Exigência de 'descrição/owner/ttl' para firewall SG/NSG.
- Quotas de orçamento per team (liminares suaves/rígidas).
4) Ciclos de orçamento e calendário
Orçamento Anual (AOP): Metas de COGS, margens, empresas junto às nuvens.
Planos trimestrais: ajustes de roadmap/sazonalidade.
Rolling-forecast (mensalmente, 6-9 m): leva em conta o facto e as tendências, repassa o déficit/superávit.
Pool de incidentes: reserva de 3 a 5% para egress/capacidade imprevista.
1. Empresa → 2) Produto/Marca → 3) Comando/Serviço → 4) Ambiente → 5) Classe de recursos.
5) Previsão de carga e custos
Drivers: MAU/DAU, RPS sobre rotas, volume de dados, frequência de batch/ML, sazonalidade, campanhas de marketing.
Modelos, Expon. suavização + eventos. ajustes (lançamentos, regiões, provedores).
Se: crescimento de RPS de X%, migração para outra região, ativação de cachê/edge, mudança de classe de armazenamento.
- Divida os fixos (comits, leasings, AlwaysOn) e variáveis (on-demand/spot, egress).
- Tenha uma «escada» de escala (estágio capex/commit) para picos.
6) Comitas em provedores de nuvem
Reserved Instances/CUD/Savings Plans: Fecham estáveis entre 50% e 70% da carga básica.
Diversifique por prazo (1/3/extensível), por região/tipo de instância.
Tampão On-Demand para picos e falhas.
Spot/Preemptible: stateless/CI/analista de fundo, com fallback seguro.
- Primeiro, rightsizing e skeiling automático, em seguida as comitivas.
- Revenda/mercado (onde disponível) para RI não utilizado.
- Controle as tarifas egress e descontos por canais diretos.
7) Alavancas arquitetônicas de redução de custo
Compute: Skailing automático horizontal, Karpenter/Cluster Autoscaler, class-based QoS, desativação de clusters dave noturnos.
Armazenamento: classes de armazenamento (hot/warm/cold), lifciclos/TTL, particionamento, dedução, compressão.
Rede: CDN/edge + SWR, PrivateLink/PSC, agregação de API, HTTP/3/QUIC.
DB/Cachê: pgBouncer/RDS Proxy, réplicas read, TTL/arquivo, dinheiro de dois passos.
Observabilidade: tail-sampling trailing (100% de erros e p99, o resto 1-10%), retenção por classe, downsampling métricas.
8) Chargeback / Showback
Modelo de faturação interna:- Showback (suave): relatório mensal sem transferência de dinheiro.
- Marceback (severa): cancelamento real do orçamento da equipe.
- Custos diretos → marcas de formatação.
- Geral (egress, plataforma de loging) → proporcional aos controladores (solicitações, logs de GB, armazenamento).
- «Advocacia» de malas controversas, FinOps-guild ajuda os comandos a otimizar.
9) Dashboards e alertas
Mínimo obrigatório:- Mapa de custos por serviços/comandos/tenantes/regiões com drible até o recurso.
- Plano/fato/desvios + previsão (rolling).
- Coverage RI/CUD/Spot e poupança.
- Egress heatmap (direções, provedores, PSP).
- Costa ↔ SLO: correlação p95/p99 com Costa/Req.
- Anomaly detation: sobe> 30% da tendência em 24 h.
- Orçamento: 50/80/100% do período.
- Crescimento súbito do egress, «DEBUG-logs em venda», queda de coverage%.
- Serviços Idle e volumes não utilizados/IPs.
10) Processos e RACI
FinOps-stand-up semanal, desvios, acções, proprietários.
A Mudança Review é uma estimativa do valor do fique antes da inclusão.
GameDays de custo: picos/bandeiras artificiais → teste de sustentabilidade orçamentária.
Runbooks: como aumentar/reduzir comits, como cortar egress/logs com urgência, como estacionar ambientes.
11) Documentos e modelos
11. 1 Modelo de orçamento (fatia)
Rendimentos/MAU/tenentes
COGS: Compute/Storage/Network/Observability/3rd-party
Comitivas RI/CUD/SP (cobertura, prazo)
Reserva de incidentes (3-5%)
Plano de otimização (efeito econômico, proprietário, prazo)
11. 2 Modelo de «se»
ΔRPS = +20% → ΔCompute + ΔEgress
Incluir CDN-SWR → - X% egress, - Y $
Tradução de logs de 30 para 14 dias → - Z $
CUD + 20k $/ano → retorno 7,5 m
12) Gerenciamento de riscos e complacência
Fornecedores: SLA/multas, estratégias de saída, riscos lock-in.
Direito: regiões/prazo de armazenamento, WORM para auditoria.
FX/moeda: sensibilidade à taxa de câmbio, contabilidade mútua.
Capitalização/amortização: Interpretação de commites de longo prazo e conexões privadas.
13) Antipattern
Recursos «temporários» sem TTL → para sempre.
Comits até rightsizing/skeiling automático.
Falta de marcas de formatação → gastos cinzentos.
Um único logo DEBUG em venda/100% trace.
Dave/estágio em 24 x 7 sem pausa automática.
Spot sem tampão on-demand.
Egress público em cada spoke sem CDN/proxy.
14) Especificidades do iGaming/Finanças
PSP/Comissão é parte do COGS: smart-routing para mais barato/confiável, dinheiro de estágio, idempotação de repetições.
KYC/AML: Pacotes de solicitação, armazenamento de política TTL, Metrika Costa/KYC.
«Caminhos de dinheiro» (depósito/retirada): orçamento separado/SLO, provisioned capacity apenas aqui, dashboards «custo-em-tempo-real».
Data residency: contas/projetos regionais, CDN/edge local, canais privados para PSP.
GGR/margem: Alinhamento da Costa/Req a verticais de jogo/provedores; relatórios per marca/jurisdição.
15) Receitas rápidas de economia
Incluir trechos tail-sampling e reduzir o retino de logs por classe.
Elevar SWR para CDN, aquecer origin-shield.
Ir para o pgBouncer/RDS Proxy, remover a tempestade dos conectórios.
Reduzir requests/limits para p95 e incluir Karpenter.
Transferir estática/arquivo para cold-armazenamento com links.
Juntar egress através de PrivateLink/PSC, fixar FQDN-allowlists.
16) Folha de cheque pró-pronta FinOps
- Marcas/proprietários/TTL em 100% dos recursos; os políticos bloqueiam os sem-teto.
- Orçamentos e alertas de 50/80/100%; A anataly detation está ativada.
- O Rightsizing foi executado; scailing automático/pausa dos ambientes uv.
- Coverage RI/CUD/SP ≥ destino (50% a 70% da base); Há um tampão on-demand.
- CDN/edge + SWR; canais privados para a PaaS/PSP; egress-dashboard.
- Logs/trens: tail-sampling, reticências por classe; filtragem PII.
- Políticas de armazenamento: salas de aula, TTL, arquivo; particionamento de grandes tabelas.
- Dashboards Costa/Req, Costa/Tenant/Brand/Region; Heatmap egress; plano/fato/previsão.
- Processos: FinOps-stand-up, mudança-review valor, GameDays.
- Para iGaming: orçamentos de «caminhos de dinheiro», contabilidade PSP/KYC/AML, auditoria WORM.
17) TL; DR
Faça transparência (tags, dashboards, plano/fato), inclua rightsizing + skailing automático, feche a carga básica com as comitivas (RI/CUD/SP), reduza o seu egress/armazenamento com CDN/SWR, PrivateLink, classes e lifciclos, e pague apenas por um valor de telemetria. Gerencie o orçamento através de rolling-forecast, alertas e chargeback, enquanto para iGaming mantenha um circuito e um orçamento de «caminhos de dinheiro» rígidos com PSP/KYC/AML.