Balancear carga de trabalho

1) Por que o comando operacional controlaria o equilíbrio

Balancear carga não é apenas distribuir solicitações. É uma camada de gerenciamento de risco e desempenho: limitação do raio de falha, latência previsível, economia de escala, isolamento de «vizinhos ruidosos», impacto direto na execução do SLO e custos de incidentes.

2) Camadas de equilíbrio: da rede às operações empresariais

L3/L4 (IP/porta): simples e rápido (DSR, ECMP, IPVS, LVS). Ideal para serviços TCP/UDP, corretores, gates.
L7 (HTTP/gRPC/WebSocket): roteiro/cabeçalho/metadados; canary, A/B, geo e cliente-aware política.
GSLB/GeoDNS/Anycast: Distribuição global por região/RR, registro de atraso, proximidade e saúde das regiões.
Balanço interno: clientes com serviço discovery (xDS, Consul, Eureka), balanceadores de clientes (gRPC pick _ first/round _ robin), service mesh.

3) Algoritmos de distribuição e quando aplicá-los

Round-Robin (RR): opção de base simples para nódulos homogêneos e solicitações curtas.
Least Connections (LC): Melhor quando as solicitações variam.
Least Request/Peak EWMA: Reduz adaptativamente a latência com «longos» pedidos e ruídos.
Weighted RR/LC: Leva em conta a potência de nódulos ou «coet guardrails».
Consent Hasing (Rendezvous/Maglev): para sticky chaves (usuário, mesa/sala, cesta), reduz a redesenhação ao escalar.
Power of Two Choices: Uma boa aproximação do LC com alta carga de telemetria.
Hedged/Retry Buded Requests: solicitações paralelas de obtenção com orçamento de retais para p99.

4) Sessões, estado e adesividade

Sessão Sticky (cookie/IP/ID) - Quando o dinheiro é habitado localmente ou existe um contexto stateful (por exemplo, mesa ao vivo no iGaming).
Contras: efeito hotspot, mais difícil de evacuar nódulos.
Solução: atributos TTL curtos, status de armazenamento externo (Redis, sessions store), shared-nothing e event-surcing, sempre que possível.

5) Health-checks e proteção contra flapping

Verificações de conteúdo L7 (asssert por corpo/cabeçalho) em vez de «200-como-sucesso».
Amostras combinadas: TSD + NTTR + interna '/ready 'com diversos temporizadores.
Debouns: n fracassos → exceção; m avanços → regresso ao pool.
Outlier detation: Exclusão automática de nódulos com alto-rate/latência.

6) Políticas de temporizadores, retrações e backpressure

Boodget-orientado retrai: limite de tempo total do usuário (por exemplo, 800 ms SLA → retriable 2 x 200 ms + estoque).
Circuito Breakers: limite as consultas/conexões simultâneas/erros.
Cotas/Rate Limits: Limites «para-tenente/para-IP/para-chave» em default junto à borda.
Server-side queueing: filas curtas ou falha com degradação aparente para não «acelerar» a cauda de latência.

7) Balanceamento global e resistência a falhas

Geo-roting: por atraso (latency-based), região cliente, saúde.
Anycast + health-protes: Convergência instantânea de rotas na queda de PoP.
Hierarquia failover: RoR→region→oblako; frio/quente/quente DR.
Traffic Partitioning: isolações alimentares/legais (países, provedores de pagamentos, segmentos VIP).

8) Balanceamento para fluxos e tempo real

WebSocket/SSE/gRPC-stream: conexões de longo prazo → acompanhe as conexões/nó, a redistribuição em scale-out.
Sticky por usuário ou por sala/mesa através de hasteamento consistente.
Hooks: Desocupar as ligações corretamente durante o lançamento e o escopo automático.

9) Segurança no perímetro

Terminação TLS, HSTS, ALPN; mTLS para east-west.
WAF/bot management até o balanceador de aplicativos.
DDoS-защита: rate-limits, challenge-/proof-of-work, upstream scrubbing.
Políticas como código (OPA/Kyverno/Envoy RBAC).

10) Observabilidade e SLO para balanceamento

SLI: solicitações de sucesso, erro/segundo, p50/p95/p99 latência, saturações (CPU/conn/epoll).
Per-backend métricas: request rate, error rate, EWMA-latency → entrada em algoritmos.
L7: Coral com edições (anotações), bandeiras de fich, canários.
Allerts: Pelo orçamento burn-rate de erros e pelos sintomas do cliente (sintético externo).

11) Skeiling automático e custo-eficiência

HPA/VPA/KEDA: Escala RPS, filas, métricas personalizadas.
Weighted-roting de custo: regiões mais baratas/nuvens ganham mais peso com carga normal.
Warm pools/aquecimento: instâncias pré-aquecidas para não «apanhar» início frio.

12) Controle de alterações: canary, shadow, blue-green

Roteiro Canary: 1%→5%→25% com estoque automático em degradação SLO.
Shadow traffic: duplica as solicitações para uma nova versão sem resposta ao cliente (para validação).
Blue-Green: mudança instantânea VIP/tabela de roteiro; um rápido retrocesso.

13) Configuração e GitOps

Uma única fonte de verdade: rotas, peso, políticas de tempo e limites - no repositório.
Promoção de configuração às quartas-feiras (dev→stage→prod) do mesmo piplin.
Validação e testes de configuração: linters, dry-run, simulação de mapas de tráfego.

14) Maletas privadas (domínios regulados)

Provedores de pagamento/CUS: canais paralelos, mudança de qualidade/tempo de resposta; Para o provedor SLO.
Jurisdição multi: geo-rotação, política de conteúdo/limites por país.
Segmentos VIP: peso/canais individuais, SLO elevado, canetas de degradação UX.

15) Anti-pattern

Um balanceador como «único ponto de falha».
Sticky IP por NAT - cluster «pegajoso» e distorção de tráfego.
RR versátil para pedidos pesados/longos - crescimento das caudas p99.
Retraias sem orçamento e sem idempotidade são uma tempestade de pedidos.
O Health-Check é apenas TCP - Verde quando o aplicativo não funciona.
Sessões adesivas «eternas» sem TTL - impossibilidade de evacuação de nós.
Configs são governados manualmente, sem revezamento e promoção - à deriva e incidentes.

16) Folha de cheque de implementação

Nível selecionado: L4/L7/GSLB, metas e áreas de responsabilidade definidas.
O algoritmo de distribuição corresponde ao perfil de carga (EWMA/LC/Hash).
Hasteamento consistente onde você precisa de um contexto stateful.
Health-checks combinados, outlier-ejation, debouns.
Timeouts/retais/limites - como um código, com orçamentos de tempo.
Observabilidade per-backend e sintética cliente; burn-rate alert.
Canary/blue-green + shadow traffic; um rápido retrocesso.
GitOps para configs; dry-run e testes de rotas.
Plano DR. e hierarquia failover (RoR→region→oblako).
Isolamento VIP/empresas e provedores de serviços.

17) Exemplo de fluxo arquitetônico

1. GSLB (latency-based) orienta o cliente para a região mais próxima e saudável.
2. Edge/L7-balanceador aplica WAF, TLS, rate-limits, canário 5%.
3. O Service mesh distribui em aplicativos com LC + EWMA, excluindo outliers.
4. Para as mesas real-time - consent hasing por 'mesa _ id', sticky TTL 10 min.
5. O HPA escala os frontais em RPS e filas; warm pool → sem início frio.
6. Observabilidade: dashboard p50/p95/p99, error-rate, saturações, burn-rate.
7. Em caso de degradação: auto-eject de nós, redução do canário, mudança para o provedor de reposição, reversão da versão.

18) Total

O balanço de carga é uma disciplina operacional que conecta rede, aplicativo, dados e SLO de negócios. Nível adequado (L4/L7/GSLB), algoritmos adequados, health-checks rigorosos, políticas de temporizadores e retrações, observabilidade e gerenciamento GitOps transformam o equilíbrio de «caixa de configuração» em um mecanismo de fornecimento sustentável e econômico de serviços.

Balancear carga de trabalho

Entrar em contacto

Contacto rápido

O vídeo será atualizado em breve

Estamos atualmente muito ocupados com projetos