Correlação e causalidade
Correlação e causalidade
A correlação registra alterações conjuntas de variáveis. A causalidade responde à pergunta: Em análise, produto e gerenciamento de risco, o valor produz exatamente um efeito causal, que permite avaliar a incorporação da decisão, e não apenas uma associação.
1) Conceitos básicos
Correlação (associação): ligação estatística sem interpretação de porquê. Pode ser causada por causa geral, causa invertida ou acidente.
Efeito causal (treatment effect): a diferença prevista entre o mundo «com intervenção» e «sem interferência».
Contrafacção: Observação impossível «o que seria com este mesmo objeto sem impacto».
Confounder: uma variável que afeta tanto a causa quanto o resultado → cria uma falsa ligação.
Colisor: variável afetada tanto pela causa como pelo resultado; a condição de colisor distorce a associação.
O paradoxo de Simpson é que a direção do efeito muda após a variável/segmento oculta.
2) Quando a correlação é suficiente e quando não
Análise descriptiva, monitoramento, EDA: correlações/classificação/heatmap → detectar hipóteses e riscos.
Tomar decisões e avaliar o impacto: são necessários métodos de causalidade (experimentos ou quase).
Modelos de previsão: As correlações são úteis, mas para as políticas RI - transição para avaliações causais ou modelos uplift.
3) Experiências: padrão dourado
Testes A/B (randomização): eliminam o confounding, tornam os grupos comparáveis.
Guardrails: duração ≥ um ciclo de comportamento, exposição estável, controle de sazonalidade e interdição (spillover).
Métricas: efeito, espaçamento de confiança, MDE/power, variedade de efeito por segmento (Heterogeneous Treatment Effect).
Prática: lançamentos canários, rolout gradual, CUPED/controle de covaria para reduzir a dispersão.
4) Se a experiência não for possível: quase exportação
Variação de variação «antes/depois» entre «teste» e «controle». O pressuposto chave são tendências paralelas antes da intervenção.
Controle sintético: Construímos o controle «sintético» como uma mistura ponderada de grupos de doadores. Resistente a diferentes dinâmicas de tendência.
Regressão Discontinuity (RDD): regra liminar de destino de exposição; comparações em ambos os lados do limiar. O importante é que não há «manipulação» do limiar.
Variáveis de ferramentas (IV): a variável afeta o «tratamento», mas não afeta diretamente o resultado (exceto através do tratamento). Necessário: relevância e validade da ferramenta.
Mapeamento (PSM/Matching): teste e controle com cobiçados semelhantes; é útil como um pretexto, mas não elimina confounders ocultos.
Interupted Time Series (ITS): avalia o corte de tendência no momento da política quando não há outros choques.
5) Causal Graphs e critérios de «buracos»
DAG é um mapa visual das relações causais. Ajuda a escolher quais variáveis são controladas.
Back-door criterion: bloqueamos todos os caminhos traseiros (confounders) - obtendo uma avaliação do efeito.
Frente-door criterion: Usamos um intermediário com influência total para contornar confounders ocultos.
Não controle os colisores e os descendentes dos resultados, criando deslocamentos.
Prática: Primeiro desenhamos um DAG com especialistas em domínios, depois selecionamos um conjunto mínimo de cobiçados.
6) Potenciais resultados e avaliação do efeito
ATE/ATT/ATC: Efeito médio em todos os controles/processados.
CATE/HTE: efeito por segmento (país, canal, classe de risco).
Simulação Uplift: Ensinando o modelo a classificar os objetos de acordo com o aumento esperado da intervenção, em vez da probabilidade original do evento.
7) Armadilhas frequentes
Causalidade invertida: «aumento dos descontos ↔ queda da demanda» - os descontos respondem à queda, não ao contrário.
Variáveis omitidas: promoções não contabilizadas/sazonalidade/alterações regionais.
Sobreviventes (survivorship bias): analisa apenas os restantes.
Leakage: Uso de informações futuras para treinamento/avaliação.
Mistura de métricas: otimiza as métricas proxy em vez do efeito empresarial (Goodhart).
Regressão ao médio: Os retornos naturais à tendência camuflam os «efeitos».
8) Causalidade no produto, marketing e riscos
Marketing/campanhas: uplift-targeting, frequências de contato diferenciadas, avaliações LTV causais, ROMI DiD/controle sintético.
Preços/promoção: RDD (liminares), experiências em amostra de SKU/região.
Recomendações: avaliação off-policy (IPS/DR) e bandits; contabilidade de interferência.
Políticas antifrod/RG: cuidado com a causabilidade - bloqueios alteram o comportamento e os dados; use quocientes e guard em FPR e recursos.
Gerenciamento: ITS para lançamentos e incidentes; gráficos causais para RCA.
9) Procedimento de análise: de hipótese a decisão
1. «Qual é o efeito X em Y no horizonte T?»
2. Desenhar DAG: alinhar com o domínio, assinalar confounders/mediadores/colisores.
3. Escolha RCT/A-B, DiD, RDD, IV, controle sintético, matching.
4. Definir métricas: principal (efeito), guorrails (qualidade/ética/operação), segmentos CATE.
5. Preparar dados: point-in-time, cobiçados «antes» impacto, calendário e sazonalidade.
6. Avaliar o efeito: Modelos de base + Robast-Teste (testes de placebo, sensibilidade).
7. Verificar estabilidade: especificações alternativas, exclusão de cobiçados suspeitos, leave-one-out.
8. Traduzir política/rollout, SLO, monitoramento e retesto à deriva.
10) Práticas robustas e verificação
Pré-trend checks (para DiD): as tendências de teste/controle são semelhantes antes da intervenção.
Placebo/mudanças: «datas fictícias» ou «grupos fictícios» - o efeito deve desaparecer.
Sensivity analisis: O quanto um confounder oculto distorce o resultado.
Bounds/espaçamento pi: modelos parcialmente identificados → limites de confiança.
Multiple testing: ajustes (BH/Holm) em vários segmentos.
External validity: portabilidade do efeito para outros mercados/canais (meta-analísis).
11) Métricas de relatórios de efeitos
Efeito absoluto: Em unidades (p.p., i.e., minutos).
Efeito relativo:% para a linha de base.
NNT/NNH: Quantos objetos devem ser processados para atingir um resultado/dano.
Costa-Efetiveness: efeito/custo; prioridades dos orçamentos.
Uplift @ k/Qini/AUUC: para intervenções programadas.
12) Causalidade na prática ML
Causal Featuras: Nem sempre melhoram a precisão da previsão, mas são melhores para as políticas.
Causal Forest/Meta-learners (T/X/S-Learner): avaliação CATE e uplift pessoal.
Counterfactual fairness: justiça de modelos considerando caminhos causais; bloquear caminhos «injustos».
Do-op vs predict: Distingue entre «prever» e «o que fazer». O segundo precisa de modelos/emuladores.
13) Folha de cheque da análise de causa
- A questão foi definida como um efeito de intervenção/política
- Construído e negociado pelo DAG; o conjunto mínimo de cobiçados selecionado (back-door)
- Design selecionado (RCT/quase-experiência) e suposições-chave testadas
- Dados do point-in-time; excluídos os leques; calendário/sazonalidade
- Os efeitos e os intervalos de confiança foram calculados; verificações robásticas realizadas
- Avaliação da heterogeneidade dos efeitos (CATE) e dos riscos (guardrails)
- Valor digitalizado (ROY, NNT/NNH, custo do erro)
- Plano de implementação e monitorização; critérios de novo teste
14) Mini-glossário
Back-door/Front-door: critérios de seleção de cobiçados para identificar o efeito.
IV (variável de ferramentas): «alavanca» que altera o tratamento, mas não o resultado diretamente.
DiD: diferença de alterações antes/depois entre os grupos.
RDD: avaliação do efeito perto do limite da regra.
Controle de Sintético como uma combinação ponderada de doadores.
HTE/CATE: efeito heterogéneo/condicional por segmento.
Uplift: aumento de exposição previsto, não possibilidade de evento.
Resultado
As correlações ajudam a encontrar hipóteses, a causalidade, a tomar decisões. Construa o DAG, selecione o design apropriado (experimento ou quase-experimento), teste de suposições e resistência, mede os efeitos heterodoxos e transforme as conclusões em políticas com guard e monitorização. Assim, o analista deixa de ser sobre ligações e torna-se o motor das mudanças.