GH GambleHub

Correlación y causalidad

Correlación y causalidad

La correlación captura los cambios conjuntos de las variables. La causalidad responde a la pregunta: ¿qué pasa si intervenimos? En analítica, producto y gestión de riesgos, el valor trae precisamente un efecto causal: permite valorar el incremento a partir de una solución y no sólo de una asociación.

1) Conceptos básicos

Correlación (asociación): relación estadística sin interpretación de «por qué». Puede deberse a una causa común, a una causalidad inversa o a un accidente.
Efecto causal (treatment effect): la diferencia esperada entre un mundo «con intervención» y «sin intervención».
Contrafacto: una observación imposible «de lo que sería con este mismo objeto sin impacto».
Confaunder: una variable que afecta tanto a la causa como al resultado → crea una relación falsa.
Colisionador: variable que se ve afectada tanto por la causa como por el resultado; la condición de colisionador distorsiona la asociación.
Paradoja de Simpson: la dirección del efecto cambia después de tener en cuenta una variable/segmento oculto.

2) Cuando la correlación es suficiente, y cuando - no

Análisis descriptivo, monitoreo, EDA: correlaciones/rangos/heatmap → detectar hipótesis y riesgos.
Toma de decisiones y evaluación de la influencia: se requieren métodos causales (experimentos o cuasi experimentos).
Modelos de predicción: las correlaciones son útiles, pero para ROI/políticas es la transición a las estimaciones causales o modelos uplift.

3) Experimentos: estándar de oro

Pruebas A/B (aleatorización): eliminan el confunding, hacen que los grupos sean comparables.
Guardrails: duración ≥ un ciclo de comportamiento, exposición estable, control de estacionalidad e interferencia (spillover).
Métricas: efecto, intervalos de confianza, MDE/power, heterogeneidad del efecto por segmentos (Efecto de tratamiento heterogéneo).
Práctica: lanzamientos canarios, rollout por etapas, CUPED/control covariable para reducir la dispersión.

4) Si el experimento no es posible: cuasiexperimentos

Difference-in-Differences (DiD): diferencia de cambios «antes/después» entre «test» y «control». Un supuesto clave son las tendencias paralelas antes de la intervención.
Control sintético: construimos el control «sintético» como una mezcla ponderada de grupos donantes. Resistente a diferentes dinámicas de tendencias.
Descuento de regresión (RDD): regla de umbral de asignación de exposición; comparación a ambos lados del umbral. Importante: la falta de «manipulación» del umbral.
Variables instrumentales (IV): la variable afecta al «tratamiento», pero no afecta directamente al resultado (excepto a través del tratamiento). Se requiere: relevancia y validez de la herramienta.
Coincidencia (PSM/Matching): prueba y control con covariables similares; útil como preprocesamiento, pero no elimina confaunders ocultos.
Interrupted Time Series (ITS): evalúa el cambio de tendencia en el momento de la política en ausencia de otros shocks.

5) Gráficos de Causal y criterios de «agujeros»

DAG (gráfico acíclico orientado): mapa visual de relaciones causales. Ayuda a seleccionar qué variables controlar.
Crition back-door: bloqueamos todas las vías traseras (confaunders) - obtenemos una puntuación de efecto no alineada.
Front-door criterion: utiliza un intermediario que lleva completamente la influencia para eludir confaunders ocultos.
No controle los colisionadores y los descendientes del resultado: esto crea desplazamientos.
Práctica: primero dibujamos DAG con expertos en dominios, luego elegimos un conjunto mínimo de covariables.

6) Resultados potenciales y evaluación de efectos

ATE/ATT/ATC: efecto medio sobre todo/procesado/controlado.
CATE/HTE: efecto por segmentos (país, canal, clase de riesgo).
Modelado por Uplift: enseña a un modelo a clasificar los objetos por el aumento esperado de la intervención, no por la probabilidad original del evento.

7) Trampas frecuentes

Causalidad inversa: «aumento de descuentos ↔ caída de la demanda» - los descuentos responden a una caída y no al revés.
Variables omitidas: promociones no contabilizadas/estacionalidad/cambios regionales.
Supervivientes (survivorship bias): análisis solo de los «restantes».
Leakage: uso de información futura en la formación/evaluación.
Mezclar métricas: optimizar métricas proxy en lugar de un efecto empresarial (Goodhart).
Regresión a la media: los retornos naturales a la tendencia enmascaran los «efectos».

8) Causalidad en producto, comercialización y riesgos

Marketing/campañas: orientación uplift, frecuencias de contacto diferenciadas, evaluaciones LTV causales, ROMI por DiD/control sintético.
Precios/promociones: RDD (reglas de umbral), experimentos en una muestra de SKU/regiones.
Recomendaciones: evaluación de políticas (IPS/DR) y bandits; Contabilidad de interferencia.
Políticas antifraude/RG: cuidado con la causalidad: los bloqueos cambian el comportamiento y los datos; use cuasiexperios y guardrails para FPR y apelaciones.
Control de plumaje: ITS para lanzamientos e incidentes; grafos causales para RCA.

9) Procedimiento de análisis: de la hipótesis a la solución

1. Formular la pregunta como causal: «¿Cuál es el efecto X sobre Y en el horizonte T?»

2. Dibujar DAG: alinear con el dominio, marcar confaunders/mediadores/colisionadores.
3. Elegir diseño: RCT/A-B, DiD, RDD, IV, control sintético, matching.
4. Definir métricas: principal (efecto), guardrails (calidad/ética/operaciones), segmentos CATE.
5. Preparar los datos: punto en tiempo, covariables «antes» del impacto, calendario y estacionalidad.
6. Evaluar el efecto: modelos básicos + comprobaciones de robustez (pruebas de placebo, sensibilidad).
7. Comprobar la sostenibilidad: especificaciones alternativas, exclusión de covariables sospechosos, leave-one-out.
8. Poner en acción: política/rollout, SLO, monitoreo y retest en la deriva.

10) Prácticas robustas y verificación

Comprobaciones previas a la tendencia (para DiD): las tendencias de prueba/control son similares antes de la intervención.
Placebo/permutaciones: «fechas ficticias» o «grupos ficticios» - el efecto debe desaparecer.
Sensitivity analysis: cuánto un confaunter oculto distorsionaría el resultado.
Bounds/pi-intervalos: modelos parcialmente identificables → límites de confianza.
Prueba múltiple: ajustes (BH/Holm) en múltiples segmentos.
Valor externo: portabilidad del efecto a otros mercados/canales (meta-análisis).

11) Métricas de informes de efectos

Efecto absoluto: Δ en unidades (p.p., u.e., minutos).
Efecto relativo:% a la línea de base.
NNT/NNH: cuántos objetos necesitan ser procesados para alcanzar un único resultado/daño.
Costo-Effectiveness: efecto/costo; prioridades de los presupuestos.
Uplift @ k/Qini/AUUC: para intervenciones dirigidas.

12) Causalidad en la práctica ML

Características de Causal: no siempre mejoran la precisión del pronóstico, sino que se adaptan mejor a los políticos.
Causal Forest/Meta-learners (T/X/S-Learner): evaluación de CATE y uplift personal.
Fairness counterfactual: justicia de modelos teniendo en cuenta las vías causales; bloquear los caminos «injustos».
Do-op vs predict: discernir entre «predecir» y «qué si se hace». El segundo necesita modelos/emuladores causales.

13) Check-list del análisis causal

  • La pregunta se formula como un efecto de intervención/política
  • Construido y acordado por DAG; se seleccionó un conjunto mínimo de covarianzas (back-door)
  • Se seleccionó el diseño (RCT/cuasi experimento) y se comprobaron los supuestos clave
  • Datos de punto en tiempo; se excluyen las caras; calendario/estacionalidad se tienen en cuenta
  • Se calculan el efecto y los intervalos de confianza; Se llevaron a cabo inspecciones robustas
  • Se evaluó la heterogeneidad del efecto (CATE) y los riesgos (guardrails)
  • Valor digitalizado (ROI, NNT/NNH, costo de error)
  • Plan de implementación y seguimiento; criterios de prueba repetida

14) Mini glosario

Back-door/Front-door: criterios de selección de covariables para identificar el efecto.
IV (variable instrumental): «palanca» que cambia el tratamiento, pero no el resultado directamente.
DiD: diferencia de cambios «antes/después» entre grupos.
RDD: evaluación del efecto cerca del umbral de la regla.
Control sintético: control como una combinación ponderada de donantes.
HTE/CATE: efecto no uniforme/condicional por segmentos.
Uplift: aumento esperado de la exposición, no la probabilidad de un evento.


Resultado

Las correlaciones ayudan a encontrar hipótesis, la causalidad es tomar decisiones. Construya un DAG, elija un diseño apropiado (experimento o cuasi experimento), compruebe los supuestos y la sostenibilidad, mida los efectos heterogéneos y traduzca las conclusiones en políticas con guardrails y monitoreo. Así que la analítica deja de ser «sobre las conexiones» y se convierte en el motor del cambio.

Contact

Póngase en contacto

Escríbanos ante cualquier duda o necesidad de soporte.¡Siempre estamos listos para ayudarle!

Iniciar integración

El Email es obligatorio. Telegram o WhatsApp — opcionales.

Su nombre opcional
Email opcional
Asunto opcional
Mensaje opcional
Telegram opcional
@
Si indica Telegram, también le responderemos allí además del Email.
WhatsApp opcional
Formato: +código de país y número (por ejemplo, +34XXXXXXXXX).

Al hacer clic en el botón, usted acepta el tratamiento de sus datos.