Otimização dos custos da nuvem
1) Por que FinOps e quais são os objetivos
O objetivo é reduzir o COGS, mantendo o SLO/velocidade de desenvolvimento. Questões-chave:- Quanto custa 1 consulta, 1 usuário ativo, 1 tanante?
- Qual o efeito marginal do novo fichador/tráfego?
- Onde estão os «vazamentos» (egress, logs redundantes, overhead CPU/memória, recursos inoperantes)?
Métricas básicas
Cost/Req, Cost/Minute Active, Cost/Tenant/Brand, Cost/GB-stored, Cost/GB-egress.
COGS%: fatia do custo da receita.
Waste%: (recursos pagos, mas não usados )/( todos os recursos).
2) Ordem: marcas, posse, orçamentos
Teclagem/editoras: 'eng', 'team', 'service', 'tenant', 'product',' cost _ center ',' slo _ tier '.
Propriedade: Cada recurso tem dono e TTL.
Orçamentos/alertas: orçamentos mensais/semanais com liminares de 50/80/100% + anataly detation.
Políticas como código: proibição de «sem marcas», limites de tamanho, regiões padrão, quotas selecionadas.
hcl module "policy" {
source = "finops/policy/required-tags"
required_tags = ["env","team","service","cost_center","tenant"]
}
3) Alavancas de economia arquitetônicas
3. 1 Tamanho correto e skailing automático
Rightsizing: coloque as instâncias sob o CPU real/RAM p95.
Skeiling automático: horizontal> vertical; для K8s — Cluster Autoscaler/Karpenter, для serverless — min/max concurrency.
Caminhos frios - filas/batches; tarefas de longa duração - para workers agendados.
3. 2 Potência spotov/comprada
Spot/Preemptible para stateless/backgrounds e CI; mantenha o tampão On-Demand.
RI/CUD/Savings Plans: Reserve uma carga básica estável de 50% a 70%, e o resto seja elástico.
3. 3 Armazenamento e classes de dados
Divida: hot (SSD), warm (padrão), cold/arquivo (Glacier/Archive).
Políticas de links: alteração de classes, remoção após o prazo.
Ative a versionização onde você quiser e o object lock (WORM) apenas para a auditoria.
3. 4 Rede e egress
CDN/edge + stale-while-revalidate reduz o egress interregional.
Canais privados (PrivateLink/PSC/Direct Connect/Interconnect) em vez de Internet crua.
Compressão (Brotli/Zstd), HTTP/3/QUIC - menor do que o RPT/recapeamento.
3. 5 Bancos de dados e cachês
Selecione um padrão de dois níveis: dinheiro (Redis/Memcached) + armazenamento.
Leia as réplicas para analistas, inclua a caixa automática/compactação, use o pgBouncer/RDS Proxy.
Para tabelas maiores - particionamento/TTL/arquivo.
4) Economia Kubernetes
Requests/Limits em classes SLO; a proibição de 'limits: null'.
VPA (recomendações), Karpenter (atribuição de instâncias para pod), Bin packing (tolerações/afinidade).
Divida o prod/estágio/dave no nível de cluster/site (diferentes tipos e políticas).
Salas de aula de rede e estilo: selecione SC/IOPS por perfil de carga, em vez de «premium em todos os lugares».
QoS turmas e prioridades: economizar em tarefas de fundo.
Perfis de logs: agentes sidecar com bufê local, envio de batches.
5) Serverless-Economy
Min instances/procurioned concurrency - apenas para canetas quentes.
Pequeno deploy bandl, lazy-init, sharing connect.
O prazo e a fila de tarefas difíceis.
Funcionalidades agregadas (fan-in) em vez de uma dúzia de caminhadas dependentes.
6) Bilheteria: pagar por telemetria valiosa
Logi: estruturais, sem verboseness; Reticências por classe (erros prod por mais tempo, debug - curto).
Sampling trace: tail-based - 100% erros/r99, o resto 1-10%.
Métricas: agregação/downsempling, espars-envio.
Filtrar PII antes de enviar (menos bytes e riscos).
7) Rede de fornecedores e Marketplace
Compare preços regionais, margens de serviços de managed, market bandles.
Negociação: descontos de volume (RI/CUD), convênios de convenções, programas de crédito.
Evite duplicar SaaS com funcionalidades que se cruzam.
8) Economia Unit e dashboards
SLI básico/SLO de custo
Costa/Req sobre rotas (login, catalog, deposit).
Cost/Tenant/Brand/Region.
Egress/Req, Storage/Req, Compute/Req.
Waste % и Coverage RI/SP %.
Dashboards (conjunto mínimo)
Mapa de custo por serviços/comandos com descidas até o recurso.
«Mapa térmico» egress em direção.
«Serviço → Custo → SLO»: correlação p99 e Costa/Req.
«RI/CUD/Spot» revestimento e economia em linhas.
9) Processos de FinOps
Contas semanais com donos de serviços.
Mudança review com estimativa de custo de fique antes da inclusão de prod.
Guardrails: limites de quotas, conclusão automática de recursos idle, TTL para ambientes de teste.
GameDays de custo: picos/bandeiras artificiais, verificação de sustentabilidade orçamentária.
10) Antipattern
Recursos «temporários» sem TTL → para sempre.
`0. 0. 0. 0/0 'egress + falta de CDN e contas egress explodem.
Sem marcas ou editoras, não é possível distribuir os custos.
Logs de nível DEBUG em venda, trace 100% são terabytes sem sentido.
Provisioned/serverful «por precaução» sem métricas de uso.
Todas as cargas são apenas On-Demand, sem RI/Spot/commits.
11) Especificidades do iGaming/Finanças
PSP/comissões de pagamento - parte da COGS: otimize o smart-routing para provedores baratos/confiáveis; esboçar estatais, evitar repetições sem idempotação.
KYC/AML Vendedores: Empacotem as solicitações, usem o cachê de resultados (TTL de política), e medam a Costa/KYC.
«Caminhos do dinheiro» (depósito/retirada): SLO e orçamento individuais; reservas para eventos de pico, espécimes quentes só lá.
Conteúdo/CDN: edge local e domínios regionais para redução do egress e cumprimento de dados residency.
Requisitos legais: armazenamento WORM para auditoria - Limite o volume (agregação, TTL, compressão).
12) Mini-receitas
12. 1 Política de retenção de logs
Erros Prod: 30 a 90 dias; Info: 7–14; Debug: 24-72 horas.
Arquivo somente por exigência de complacência.
12. 2 Telemetria Canário
Para o novo fici, 100% trace as primeiras 24 horas → depois tail-sampling.
12. 3 Links de objetos
json
[
{"prefix": "raw/", "days_to_warm": 30, "days_to_cold": 90, "days_to_delete": 365},
{"prefix": "audit/", "lock": "WORM-365d"}
]
12. 4 Orçamentos/alertas (ideia)
Orçamento mensal per team; alert 50/80/100%; anataly detation> 30% da tendência em 24 h.
13) Folha de cheque pró-prontidão
- Marcas e proprietários em 100% dos recursos; os políticos bloqueiam os não-genidos.
- Orçamentos e alertas + anataly detation; relatórios de tanantes/marcas/regiões.
- RI/CUD/Spot cobrem a carga básica; Há um tampão On-Demand.
- K8s: requests/limits definidos; VPA/Karpenter; bin packing; Classes de armazenamento/IOPS separadas.
- Serverless: provisioned/min apenas para caminhos quentes; Frio, através das filas.
- CDN/edge incluídos; canais privados para a PaaS; egress-dashboard.
- Logs/trens: tail-sampling, reticências por classe; filtragem PII.
- Links de armazenamento e arquivo; particionamento de grandes tabelas.
- Dasbords financeiros da Costa/Req, Costa/Tenant, Waste%, Coverage RI/SP%.
- Para iGaming: contabilidade PSP/KYC/AML gastos, SLO e orçamentos de «caminhos de dinheiro», auditoria WORM.
14) TL; DR
Primeiro, visibilidade (marcas, orçamentos, dashboards), depois alavancas estruturais: dimensões corretas, skeiling automático, RI/Spot/comits, CDN/edge e canais privados, classes de armazenamento e lifciclos. Pague por uma valiosa telemetria (tail-sampling, reticências curtas) e automatize as guardas. Em iGaming, leve em conta o PSP/KYC/AML como parte do COGS e destaque para «caminhos de dinheiro» com SLO e orçamentos individuais.