Inteligência de decisão
Inteligência de decisão
A inteligência decisória é uma disciplina que transforma os dados em soluções controláveis e efeitos mensuráveis. DI reúne causalidade, previsão, economia de soluções, design de políticas e MLOs/operações em um único ciclo de vida.
1) Esqueleto DI: OODA/SSDL
Observe (Sinal): Eventos normalizados, qualidade/frescor, dedução e contexto.
Oriente (Sense): interpretação: cômodos, segmentos, gráficos causais, perfis de risco.
Decide: política (regras/modelos/bandidos), contendo limitações e custos de erros.
Act: Orquestração, canais, Idempotação, prioridades.
Learn: avaliação de efeito causal, atualização de liminares/políticas/modelos.
2) Economia de soluções
Valor: receita/danos salvos/retenção/qualidade do serviço.
Custo do erro: FP/FN em dinheiro e riscos (RG/complacência/reputação).
[
EV = p _\\text\êxito de aquela que está a ser lançada por este grupo de pessoas
]
A ação é válida se 'EV≥0' e 'guardrails' estiverem normais.
Risco-apetite: limites de FPR, frequência de intervenções, orçamento de dano/queixa, erro budet.
3) Causalidade e previsões
Quando há previsão suficiente, alocações de baixo risco, classificação por probabilidade.
Quando você precisa de causalidade, ROMI, política de preços/limites, segurança/complacência. Use A/B, DiD, RDD, IV, controle sintético; na meta de uplift e CATE.
Counterfactual loop: previsão → efeito → efeito → recontagem uplift/liminares.
4) Tipos de políticas
Regras (policy-as-código): determinadas, explicáveis; base e fail-safe.
Score-based: probabilidade/screen, histerese, eixo-sensorial.
Contextuais (bandidos): £-greedy/Thompson para selecionar off/canais.
RL: estratégias multifacetadas limitadas (safe RL).
Composto: cascata - segurança/complacência → economia → UX.
5) Arquitetura DI
Dados: eventos canônicos (UTC, versões), fichestor (online/offline parity), catálogo.
Modelos: registro/versão, calibração, monitoramento draft (PSI/KL), PR- AUC/Recall@FPR≤x%.
Semântica e métricas: dicionário único KPI/guardrails, SLO frescura.
Policy Engine: definição tables, contextos AVAS/contextos, histerese, rate-limits, prioridades.
Orquestrador de ação: entrega garantida, retraí, idempotidade 'action _ id', DLQ.
Observabilidade: traçado 'correlation _ id', vórtice 'signal→decision→action→outcome'.
Segurança: RLS/CLS, camuflagem PII, registro de acesso e soluções.
6) Métricas DI
Qualidade das soluções
Decision Precision/Recall: pelo verdadeiro sucesso das ações.
Regret/Operunity Loss: atraso na política ideal.
Coverage: proporção de objetos que foram acionados.
Latency p95: Signal→Decision/Decision→Action.
Fairness/Harms: diferença entre erros de segmentos, queixas, apelações.
Efeito empresarial
Ações ROMI/ROY, uplift @ k, Qini/AUUC.
Net Benefit: efeito - custo - prejuízo.
Time-to-Impacto: Tempo entre o sinal e o resultado medível.
7) Desenho de solução (definição design)
1. Faça a pergunta como um efeito: «Qual é o aumento da retenção de X para Y por T?»
2. Desenhe o DAG, identifique os confounders/colisores.
3. Escolha A/B, quociente ou previsão pura + ex-post.
4. Defina a ação e as alternativas, limitações e guichês.
5. Especifique o valor e o orçamento de risco.
6. Descreva a política na definição da tabela: condições → acções → canais → cooldown.
7. Selecione a pontuação: métricas de efeito, duração, segmentos CATE.
8. Identifique os incidentes de runbook e as regras fallback.
8) Histerese, frequência e conflitos
Histeresis: liminares de entrada/saída são diferentes; impede que intervenções sejam piscadas.
Cooldown: pausas entre os contatos/restrições do mesmo objeto.
Conflitos de políticas: matriz de prioridades; «a segurança tem prioridade».
Quotas/Rate-limit: por canal, segmento, usuário; distribuição justa.
9) Níveis de autonomia
1. Um homem decide, os dados são escassos.
2. Assisted: o sistema oferece uma solução + explicação.
3. Automated: Soluções automáticas dentro de uma guard.
4. Adaptativo: liminares de sintonização automático/escolha de off (bandidos).
5. Safe-Autonomia: autonomia sob restrições formais e áudio.
10) Decisões sob incerteza
Scenario planning: básico/estresse/extremo; faixas de efeito.
Robustness é uma estratégia resistente a erros paramétricos.
Intuição POMDP: aja com informações incompletas; valorize o custo da informação (que experiência realizar).
Bayesian updating: junte conhecimentos históricos e dados atuais.
11) Diálogo de «modelo ↔ política»
O modelo exibe a tecla/distribuição de resultados.
A política considera o custo de erros, limitações e fairness.
A linha de seção está em uma definição explícita de threshold policy com uma revista de versões.
A revisão do limite é por EV, não apenas por ROC/PR.
12) Documentos e artefactos
Passaporte de política (template)
Código/versão, alvo e efeito KPI
Condições/fici/modelo, histerese/cooldown
Ações e canais, prioridades e exclusões mútuas
Guardrails (FPR≤x%, latency p95≤y, RG/complance)
Avaliação: design de teste, métricas, duração
Auditoria/explicação para o usuário, proprietários
Resolução da tabela (exemplo)
Esquema de loging de solução «translúcida»
`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).
13) Governança e conformidade
Um único dicionário de métricas e versões de fórmulas.
Comité de Política, Oficial de Risco, Produto, Dados, Complacência.
Auditoria de decisões: explicações, razões de rejeição, canais de recurso.
Ética e Justiça: monitoramento de erros por grupo; excluir os sinais protetores das regras onde a lei o exige.
14) Erros frequentes
Otimiza as métricas proxy em vez do efeito empresarial (Goodhart).
Mistura de previsões e causalidade; ROMI «por correlação».
Falta de histerese e cooldowns → spam/piscar.
Custo de erro não contabilizado e danos ao usuário.
Edições silenciosas de liminares/fórmulas sem versões e changelog.
Ações sem avaliar o efeito e «curto-circuito».
15) Folha de cheque antes do lançamento da política/sistema DI
- O objetivo é definido como um efeito de causa, a função de valor e o orçamento de risco definidos
- Desenhado por DAG; design de avaliação selecionado (A/B/DiD/SC) e métricas
- A política é descrita na definição da tabela; há histerese/cooldown/prioridades
- Os modelos estão calibrados; liminares fora do custo de erro (EV)
- O orquestrador de ação é idepotente; Registro de signal→decision→action→outcome incluído
- Guardrails e alertas estão configurados; runbooks e regras fallback prontas
- Dashboards: vórtice de soluções, efeito (uplift/ROY), dano/queixa, fairness
- Versões/proprietários/permissões/complacências documentadas
Resultado
A inteligência de decisão é um sistema, não um conjunto de modelos: dados e métricas unificados, uma visão causal e econômica dos efeitos políticas claras e uma orquestração segura uma avaliação rigorosa e um aprendizado contínuo. Esse sistema reduz o risco, aumenta o ROY e torna as soluções reproduzíveis, explicáveis e controláveis.