Inteligência de decisão

A inteligência decisória é uma disciplina que transforma os dados em soluções controláveis e efeitos mensuráveis. DI reúne causalidade, previsão, economia de soluções, design de políticas e MLOs/operações em um único ciclo de vida.

1) Esqueleto DI: OODA/SSDL

Observe (Sinal): Eventos normalizados, qualidade/frescor, dedução e contexto.
Oriente (Sense): interpretação: cômodos, segmentos, gráficos causais, perfis de risco.
Decide: política (regras/modelos/bandidos), contendo limitações e custos de erros.
Act: Orquestração, canais, Idempotação, prioridades.
Learn: avaliação de efeito causal, atualização de liminares/políticas/modelos.

2) Economia de soluções

Valor: receita/danos salvos/retenção/qualidade do serviço.
Custo do erro: FP/FN em dinheiro e riscos (RG/complacência/reputação).

Valor esperado (EV):

[
EV = p _\\text\êxito de aquela que está a ser lançada por este grupo de pessoas
]

A ação é válida se 'EV≥0' e 'guardrails' estiverem normais.
Risco-apetite: limites de FPR, frequência de intervenções, orçamento de dano/queixa, erro budet.

3) Causalidade e previsões

Quando há previsão suficiente, alocações de baixo risco, classificação por probabilidade.
Quando você precisa de causalidade, ROMI, política de preços/limites, segurança/complacência. Use A/B, DiD, RDD, IV, controle sintético; na meta de uplift e CATE.
Counterfactual loop: previsão → efeito → efeito → recontagem uplift/liminares.

4) Tipos de políticas

Regras (policy-as-código): determinadas, explicáveis; base e fail-safe.
Score-based: probabilidade/screen, histerese, eixo-sensorial.
Contextuais (bandidos): £-greedy/Thompson para selecionar off/canais.
RL: estratégias multifacetadas limitadas (safe RL).
Composto: cascata - segurança/complacência → economia → UX.

5) Arquitetura DI

Dados: eventos canônicos (UTC, versões), fichestor (online/offline parity), catálogo.
Modelos: registro/versão, calibração, monitoramento draft (PSI/KL), PR- AUC/Recall@FPR≤x%.
Semântica e métricas: dicionário único KPI/guardrails, SLO frescura.
Policy Engine: definição tables, contextos AVAS/contextos, histerese, rate-limits, prioridades.
Orquestrador de ação: entrega garantida, retraí, idempotidade 'action _ id', DLQ.
Observabilidade: traçado 'correlation _ id', vórtice 'signal→decision→action→outcome'.
Segurança: RLS/CLS, camuflagem PII, registro de acesso e soluções.

6) Métricas DI

Qualidade das soluções

Decision Precision/Recall: pelo verdadeiro sucesso das ações.
Regret/Operunity Loss: atraso na política ideal.
Coverage: proporção de objetos que foram acionados.
Latency p95: Signal→Decision/Decision→Action.
Fairness/Harms: diferença entre erros de segmentos, queixas, apelações.

Efeito empresarial

Ações ROMI/ROY, uplift @ k, Qini/AUUC.
Net Benefit: efeito - custo - prejuízo.
Time-to-Impacto: Tempo entre o sinal e o resultado medível.

7) Desenho de solução (definição design)

1. Faça a pergunta como um efeito: «Qual é o aumento da retenção de X para Y por T?»

2. Desenhe o DAG, identifique os confounders/colisores.
3. Escolha A/B, quociente ou previsão pura + ex-post.
4. Defina a ação e as alternativas, limitações e guichês.
5. Especifique o valor e o orçamento de risco.
6. Descreva a política na definição da tabela: condições → acções → canais → cooldown.
7. Selecione a pontuação: métricas de efeito, duração, segmentos CATE.
8. Identifique os incidentes de runbook e as regras fallback.

8) Histerese, frequência e conflitos

Histeresis: liminares de entrada/saída são diferentes; impede que intervenções sejam piscadas.
Cooldown: pausas entre os contatos/restrições do mesmo objeto.
Conflitos de políticas: matriz de prioridades; «a segurança tem prioridade».
Quotas/Rate-limit: por canal, segmento, usuário; distribuição justa.

9) Níveis de autonomia

1. Um homem decide, os dados são escassos.
2. Assisted: o sistema oferece uma solução + explicação.
3. Automated: Soluções automáticas dentro de uma guard.
4. Adaptativo: liminares de sintonização automático/escolha de off (bandidos).
5. Safe-Autonomia: autonomia sob restrições formais e áudio.

10) Decisões sob incerteza

Scenario planning: básico/estresse/extremo; faixas de efeito.
Robustness é uma estratégia resistente a erros paramétricos.
Intuição POMDP: aja com informações incompletas; valorize o custo da informação (que experiência realizar).
Bayesian updating: junte conhecimentos históricos e dados atuais.

11) Diálogo de «modelo ↔ política»

O modelo exibe a tecla/distribuição de resultados.
A política considera o custo de erros, limitações e fairness.
A linha de seção está em uma definição explícita de threshold policy com uma revista de versões.
A revisão do limite é por EV, não apenas por ROC/PR.

12) Documentos e artefactos

Passaporte de política (template)

Código/versão, alvo e efeito KPI

Condições/fici/modelo, histerese/cooldown

Ações e canais, prioridades e exclusões mútuas

Guardrails (FPR≤x%, latency p95≤y, RG/complance)

Avaliação: design de teste, métricas, duração

Auditoria/explicação para o usuário, proprietários

Resolução da tabela (exemplo)

Condição	Contexto	Ação	Cooldown	Guardrails
`churn_uplift ≥ 0. 08` & `value_q ≥ 0. 8`	Retensem	off L	7d	ROMI≥0, cap=1
`rg_risk ≥ τ` & `night`	RG	pausa + conselho	1d	FPR≤1%
`fraud_score∈[τ1,τ2]`	pagamento	verificação manual	—	SLA 2h

Esquema de loging de solução «translúcida»

`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).

13) Governança e conformidade

Um único dicionário de métricas e versões de fórmulas.
Comité de Política, Oficial de Risco, Produto, Dados, Complacência.
Auditoria de decisões: explicações, razões de rejeição, canais de recurso.
Ética e Justiça: monitoramento de erros por grupo; excluir os sinais protetores das regras onde a lei o exige.

14) Erros frequentes

Otimiza as métricas proxy em vez do efeito empresarial (Goodhart).
Mistura de previsões e causalidade; ROMI «por correlação».
Falta de histerese e cooldowns → spam/piscar.
Custo de erro não contabilizado e danos ao usuário.
Edições silenciosas de liminares/fórmulas sem versões e changelog.
Ações sem avaliar o efeito e «curto-circuito».

15) Folha de cheque antes do lançamento da política/sistema DI

O objetivo é definido como um efeito de causa, a função de valor e o orçamento de risco definidos
Desenhado por DAG; design de avaliação selecionado (A/B/DiD/SC) e métricas
A política é descrita na definição da tabela; há histerese/cooldown/prioridades
Os modelos estão calibrados; liminares fora do custo de erro (EV)
O orquestrador de ação é idepotente; Registro de signal→decision→action→outcome incluído
Guardrails e alertas estão configurados; runbooks e regras fallback prontas
Dashboards: vórtice de soluções, efeito (uplift/ROY), dano/queixa, fairness
Versões/proprietários/permissões/complacências documentadas

Resultado

A inteligência de decisão é um sistema, não um conjunto de modelos: dados e métricas unificados, uma visão causal e econômica dos efeitos políticas claras e uma orquestração segura uma avaliação rigorosa e um aprendizado contínuo. Esse sistema reduz o risco, aumenta o ROY e torna as soluções reproduzíveis, explicáveis e controláveis.

Inteligência de decisão