Insights em tempo real
1) O que é «insight em tempo real»
O Insight em tempo real é uma alegação verificável sobre o status atual do processo/usuário/sistema, que aparece dentro do limite de atraso (latência) do alvo suficiente para tomar uma decisão (segundos a minutos).
Fórmula do circuito: Evento → Enriquecimento/Agregação → Decisão/Recomendação → Ação → Feedback.
Exemplos: antifrode por transação (≤500 ms), alert SLO do serviço (≤60 s), recomendação pessoal na página (≤200 ms), pricing dinâmico (≤5 s), monitoramento de campanhas (≤1 min).
2) Arquitetura na palma da mão
1. Ingest: corretor de eventos (Kafka/Pulsar/NATS/MQTT), contratos de circuito (Avro/Protobuf), chaves de idempotação.
2. Streaming (CEP/Stream): Flink/Spark Estrutured Streaming/ksqlDB; janelas, watermarks, operadoras de stateful.
3. Fici online e estado: Função Store (online) + dinheiro/TSDB (RocksDB/Redis) para join/lookup rápidos.
4. Padrões/regras online: modelos (ONNX/TF-Lite/XGB), rule-engine, contexto.
5. Serving insights: low-latency API, webhooks, pneus de comando (action ônibus), dashboards adaptativos.
6. NTAR/vitrines real-time: materializações incorporativas (ClickHouse/Pinot/Druid/Delta+CDC).
7. Observabilidade e SLO: métricas de latência/laje/erro, rastreamento, alertas.
8. Gerenciamento e segurança: OTA/Flagras Fies, RLS/CLS, camuflagem, auditoria.
3) Modelo temporal: janelas, watermarks, atrasados
Janelas: tumbling/sliding/sessions; para vitrines - híbrido (1s→5s→60s roll-ups).
Watermark: o limite após o qual a janela «fecha»; equilíbrio entre frescura e cumplicidade.
Late data: Política de Supriem 'DF _ late' (por exemplo, 2 min), repasses de compensação.
Out-of-order: Agregamos por 'event _ time', armazenando 'ingested _ at' para forense.
4) Exactly-once por sentido e idempotidade
O transporte é frequente at-least-once, por isso obtemos exactly-once no sentido:- global 'event _ id', tabelas de idempotency keys;
- upsert/merge-sinks;
- state snapshots + commodities de transação (2-phase/transation jobs);
- transformações determinadas e swap atômico quando as vitrines são publicadas.
5) Fortuna e enriquecimento
Operadoras stateful: key-by (user/device/merchant), unidades, top-K, distinct.
Join online: tabelas de lookup rápidas (por exemplo, perfil do cliente, limites de risco).
LRU/TTL, fici quentes, versionização de guias.
Coerência online/offline fic: especificação unificada na Função Store.
6) Insight ≠ apenas uma métrica
Adicionamos um cartão de solução ao insight: hipótese/contexto alternativa ação recomendada . efeito → risco/guard → proprietário/canal de entrega.
Zero-click insight: texto curto + botões prontos (aplied automaticamente se low-risk).
7) Anomalias, causalidade e experiências
Detecção: robust z-score/ESD, seasonal-decompose, mudar-point (CUSUM/BOCPD), desenhos (TDigest/HLL) para grandes fluxos.
Causalidade: Evitamos a «resposta ao ruído» - confirmando o efeito através de quadros-experimentos/segmentos de controle.
Experimentos on-line: bendits/UCB/TS para selecionar ações com tempo limitado, métricas de guerrail (SLA, queixas, devoluções).
8) SLO para real-time insights
Latency p95/pen99 end-to-end (ingest→deystviye).
Vitrines Freshness (máxima).
Completeness dentro da janela (proporção de contabilidade tardia).
Action Rate/Sucess Rate (quantos insights se transformaram em ação/efeito).
Costa-to-Insight (CPU/IO/GPU/$, 1 insight).
Exemplo de matriz de destino: antifrode, . 5%, vale/1k sobyty≤$Kh.
9) Entrega de insights e priorização
Para onde: webhooks, mensagens de ônibus "acções. ", API dashboards, push/bate-papo, CRM/CDP.
Prioridades: Gold/Silver/Bronze; Gold - balas e canais individuais.
Deadline: Se 'deadline' expirou, baixa de classe ou cancelamento.
10) Economia e degradação
A estratégia da costa-aware é de modelos simplificados, janelas maiores, sampling ao pico.
Graceful degradation: fallback para unidades/regras ruins, «quentes» snapshots.
Backpressure & shed-load: Redefinir temas best-effort, salvar Gold.
11) Segurança e privacidade
RLS/CLS nas vitrines estrim; divisão por tenante/região.
Edição PII na borda: Toquenização ao centro.
Segredos e acesso: mTLS, tokens curtos, auditorias de pedidos/exportação.
Políticas de exportação: proibição do real-time PII «cru» para fora sem fundamento.
12) Observabilidade real-time do circuito
Laje por topics/chaves, queue depth, watermark skew.
p95/p99 em cada camada, erro rate, reprocess count.
Data-quality online: Duplicado, null-rate, anomalias de distribuição.
Tracing: trace-id de passagem desde o evento até a ação.
13) Antipattern
«Tudo é real-time». Gastos e ruídos desnecessários; parte das tarefas é melhor batch/near-real-time.
SELECT e esquemas «livres» sem contratos.
Janelas sem watermarks. Ou as janelas eternas ou as perdas tardias.
Não há idempotidade. Ações duplas/spam.
Sem guardrails. Reagir a «falsa positivo» gera danos.
OLTP sob o fogo dos analistas. Sem isolamento - degradação de transações de prod.
14) Mapa de trânsito de implementação
1. Discovery: eventos, soluções de destino, deadline, riscos; classifique Gold/Silver/Bronze.
2. Contratos de dados: esquemas (Avro/Protobuf), chaves, políticas de idempotação.
3. Fluxo MVP: uma solução crítica, janela/WM, regras simples + fici online.
4. Vitrines e Serving: Materializações incorporativas, low-latency API.
5. Observabilidade: painéis de laje/latency/SLO, alertas; Rastreamento.
6. Modelos e experiências: monitoramento on-line, bandits/guardrails.
7. Hardening: backpressure, degradação, perfil de custo; auditoria e privacidade.
8. Scale: região multi, análise edge, priorização de fluxos.
15) Folha de cheque antes do lançamento
- Definido por SLO (latency, freshness, completeness) e proprietário.
- Os circuitos são versionizados; Não é permitido 'SELECT'; há idempotency-keys.
- As janelas e watermarks foram configuradas, a política de late data/redefinição.
- Exactly-once no sentido upsert/merge-sinks, atômico publish.
- Os fichas online estão alinhados com offline; cases com TTL e versões.
- Guardrails para ações; os canais são priorizados; os deadline são indicados.
- Monitoramento de lajes/latency/SLO; O rastreamento está ativado; alertas à ameaça do SLO.
- As políticas de privacidade (RLS/CLS/PII) e as auditorias de exportação estão incluídas.
- As degradações e incidentes de runbooks estão prontas (rollback/slow-path).
16) Mini-modelos (pseudo-YAML/SQL)
Política de janela/atrasados
yaml windowing:
type: sliding size: 60s slide: 5s watermark:
lateness: 120s late_data:
accept_until: 90s recompute: true
Idempotent sink (esboço SQL)
sql merge into rt_fact as t using incoming as s on t. event_id = s. event_id when not matched then insert (...)
when matched and t. hash <> s. hash then update set...
Regras para ações
yaml action_policy:
name: promo_offer_rt constraints:
- metric: churn_risk_score; op: ">="; value: 0. 7
- metric: complaint_rate_24h; op: "<"; value: 0. 02 cooldown_s: 3600 owner: "growth-team"
Alertas SLO
yaml alerts:
- name: e2e_latency_p95 threshold_ms: 1500 for: 5m severity: high
- name: freshness_lag threshold_s: 60 severity: high
17) Resultado
Os insights em tempo real não são apenas «gráficos rápidos», mas um circuito de soluções de engenharia: contratos de eventos rigorosos, uma lógica de tempo correta (janelas/watermarks), publicações idempotativas, fies on-line alinhados, entrega prioritária de ações e observabilidade com SLO. Quando este circuito funciona, a organização reage a tempo, de forma segura e previsível, convertendo o fluxo de eventos em valor de negócio mensurável.