GH GambleHub

Otimização dos custos da nuvem

1) Por que FinOps e quais são os objetivos

O objetivo é reduzir o COGS, mantendo o SLO/velocidade de desenvolvimento. Questões-chave:
  • Quanto custa 1 consulta, 1 usuário ativo, 1 tanante?
  • Qual o efeito marginal do novo fichador/tráfego?
  • Onde estão os «vazamentos» (egress, logs redundantes, overhead CPU/memória, recursos inoperantes)?

Métricas básicas

Cost/Req, Cost/Minute Active, Cost/Tenant/Brand, Cost/GB-stored, Cost/GB-egress.
COGS%: fatia do custo da receita.
Waste%: (recursos pagos, mas não usados )/( todos os recursos).


2) Ordem: marcas, posse, orçamentos

Teclagem/editoras: 'eng', 'team', 'service', 'tenant', 'product',' cost _ center ',' slo _ tier '.
Propriedade: Cada recurso tem dono e TTL.
Orçamentos/alertas: orçamentos mensais/semanais com liminares de 50/80/100% + anataly detation.
Políticas como código: proibição de «sem marcas», limites de tamanho, regiões padrão, quotas selecionadas.

Exemplo de Terraform - marcas obrigatórias (ideia):
hcl module "policy" {
source = "finops/policy/required-tags"
required_tags = ["env","team","service","cost_center","tenant"]
}

3) Alavancas de economia arquitetônicas

3. 1 Tamanho correto e skailing automático

Rightsizing: coloque as instâncias sob o CPU real/RAM p95.
Skeiling automático: horizontal> vertical; для K8s — Cluster Autoscaler/Karpenter, для serverless — min/max concurrency.
Caminhos frios - filas/batches; tarefas de longa duração - para workers agendados.

3. 2 Potência spotov/comprada

Spot/Preemptible para stateless/backgrounds e CI; mantenha o tampão On-Demand.
RI/CUD/Savings Plans: Reserve uma carga básica estável de 50% a 70%, e o resto seja elástico.

3. 3 Armazenamento e classes de dados

Divida: hot (SSD), warm (padrão), cold/arquivo (Glacier/Archive).
Políticas de links: alteração de classes, remoção após o prazo.
Ative a versionização onde você quiser e o object lock (WORM) apenas para a auditoria.

3. 4 Rede e egress

CDN/edge + stale-while-revalidate reduz o egress interregional.
Canais privados (PrivateLink/PSC/Direct Connect/Interconnect) em vez de Internet crua.
Compressão (Brotli/Zstd), HTTP/3/QUIC - menor do que o RPT/recapeamento.

3. 5 Bancos de dados e cachês

Selecione um padrão de dois níveis: dinheiro (Redis/Memcached) + armazenamento.
Leia as réplicas para analistas, inclua a caixa automática/compactação, use o pgBouncer/RDS Proxy.
Para tabelas maiores - particionamento/TTL/arquivo.


4) Economia Kubernetes

Requests/Limits em classes SLO; a proibição de 'limits: null'.
VPA (recomendações), Karpenter (atribuição de instâncias para pod), Bin packing (tolerações/afinidade).
Divida o prod/estágio/dave no nível de cluster/site (diferentes tipos e políticas).
Salas de aula de rede e estilo: selecione SC/IOPS por perfil de carga, em vez de «premium em todos os lugares».
QoS turmas e prioridades: economizar em tarefas de fundo.
Perfis de logs: agentes sidecar com bufê local, envio de batches.


5) Serverless-Economy

Min instances/procurioned concurrency - apenas para canetas quentes.
Pequeno deploy bandl, lazy-init, sharing connect.
O prazo e a fila de tarefas difíceis.
Funcionalidades agregadas (fan-in) em vez de uma dúzia de caminhadas dependentes.


6) Bilheteria: pagar por telemetria valiosa

Logi: estruturais, sem verboseness; Reticências por classe (erros prod por mais tempo, debug - curto).
Sampling trace: tail-based - 100% erros/r99, o resto 1-10%.
Métricas: agregação/downsempling, espars-envio.
Filtrar PII antes de enviar (menos bytes e riscos).


7) Rede de fornecedores e Marketplace

Compare preços regionais, margens de serviços de managed, market bandles.
Negociação: descontos de volume (RI/CUD), convênios de convenções, programas de crédito.
Evite duplicar SaaS com funcionalidades que se cruzam.


8) Economia Unit e dashboards

SLI básico/SLO de custo

Costa/Req sobre rotas (login, catalog, deposit).
Cost/Tenant/Brand/Region.
Egress/Req, Storage/Req, Compute/Req.
Waste % и Coverage RI/SP %.

Dashboards (conjunto mínimo)

Mapa de custo por serviços/comandos com descidas até o recurso.
«Mapa térmico» egress em direção.
«Serviço → Custo → SLO»: correlação p99 e Costa/Req.
«RI/CUD/Spot» revestimento e economia em linhas.


9) Processos de FinOps

Contas semanais com donos de serviços.
Mudança review com estimativa de custo de fique antes da inclusão de prod.
Guardrails: limites de quotas, conclusão automática de recursos idle, TTL para ambientes de teste.
GameDays de custo: picos/bandeiras artificiais, verificação de sustentabilidade orçamentária.


10) Antipattern

Recursos «temporários» sem TTL → para sempre.
`0. 0. 0. 0/0 'egress + falta de CDN e contas egress explodem.
Sem marcas ou editoras, não é possível distribuir os custos.
Logs de nível DEBUG em venda, trace 100% são terabytes sem sentido.
Provisioned/serverful «por precaução» sem métricas de uso.
Todas as cargas são apenas On-Demand, sem RI/Spot/commits.


11) Especificidades do iGaming/Finanças

PSP/comissões de pagamento - parte da COGS: otimize o smart-routing para provedores baratos/confiáveis; esboçar estatais, evitar repetições sem idempotação.
KYC/AML Vendedores: Empacotem as solicitações, usem o cachê de resultados (TTL de política), e medam a Costa/KYC.
«Caminhos do dinheiro» (depósito/retirada): SLO e orçamento individuais; reservas para eventos de pico, espécimes quentes só lá.
Conteúdo/CDN: edge local e domínios regionais para redução do egress e cumprimento de dados residency.
Requisitos legais: armazenamento WORM para auditoria - Limite o volume (agregação, TTL, compressão).


12) Mini-receitas

12. 1 Política de retenção de logs

Erros Prod: 30 a 90 dias; Info: 7–14; Debug: 24-72 horas.
Arquivo somente por exigência de complacência.

12. 2 Telemetria Canário

Para o novo fici, 100% trace as primeiras 24 horas → depois tail-sampling.

12. 3 Links de objetos

json
[
{"prefix": "raw/", "days_to_warm": 30, "days_to_cold": 90, "days_to_delete": 365},
{"prefix": "audit/", "lock": "WORM-365d"}
]

12. 4 Orçamentos/alertas (ideia)

Orçamento mensal per team; alert 50/80/100%; anataly detation> 30% da tendência em 24 h.


13) Folha de cheque pró-prontidão

  • Marcas e proprietários em 100% dos recursos; os políticos bloqueiam os não-genidos.
  • Orçamentos e alertas + anataly detation; relatórios de tanantes/marcas/regiões.
  • RI/CUD/Spot cobrem a carga básica; Há um tampão On-Demand.
  • K8s: requests/limits definidos; VPA/Karpenter; bin packing; Classes de armazenamento/IOPS separadas.
  • Serverless: provisioned/min apenas para caminhos quentes; Frio, através das filas.
  • CDN/edge incluídos; canais privados para a PaaS; egress-dashboard.
  • Logs/trens: tail-sampling, reticências por classe; filtragem PII.
  • Links de armazenamento e arquivo; particionamento de grandes tabelas.
  • Dasbords financeiros da Costa/Req, Costa/Tenant, Waste%, Coverage RI/SP%.
  • Para iGaming: contabilidade PSP/KYC/AML gastos, SLO e orçamentos de «caminhos de dinheiro», auditoria WORM.

14) TL; DR

Primeiro, visibilidade (marcas, orçamentos, dashboards), depois alavancas estruturais: dimensões corretas, skeiling automático, RI/Spot/comits, CDN/edge e canais privados, classes de armazenamento e lifciclos. Pague por uma valiosa telemetria (tail-sampling, reticências curtas) e automatize as guardas. Em iGaming, leve em conta o PSP/KYC/AML como parte do COGS e destaque para «caminhos de dinheiro» com SLO e orçamentos individuais.

Contact

Entrar em contacto

Contacte-nos para qualquer questão ou necessidade de apoio.Estamos sempre prontos para ajudar!

Iniciar integração

O Email é obrigatório. Telegram ou WhatsApp — opcionais.

O seu nome opcional
Email opcional
Assunto opcional
Mensagem opcional
Telegram opcional
@
Se indicar Telegram — responderemos também por lá.
WhatsApp opcional
Formato: +indicativo e número (ex.: +351XXXXXXXXX).

Ao clicar, concorda com o tratamento dos seus dados.