Inteligencia para la toma de decisiones
Inteligencia de toma de decisiones
La inteligencia para la toma de decisiones (Decision Intelligence, DI) es una disciplina que transforma los datos en soluciones manejables y un efecto medible. DI combina causalidad, predicción, economía de soluciones, diseño de políticas y MLOps/operaciones en un solo ciclo de vida.
1) Marco DI: OODA/SSDL
Observe (Signal): eventos estandarizados, calidad/frescura, dedoup y contexto.
Oriente (Sense): interpretación: cohortes, segmentos, grafos causales, perfiles de riesgo.
Decide: política (reglas/modelos/bandidos), teniendo en cuenta las limitaciones y el costo de los errores.
Acto: orquestación de acciones, canales, idempotencia, prioridades.
Aprender: evaluación causal del efecto, actualización de umbrales/políticas/modelos.
2) Economía de soluciones
Función de valor: ingresos/daños guardados/retención/calidad del servicio.
Costo del error: FP/FN en dinero y riesgos (RG/cumplimiento/reputación).
[
EV = p_{\text{uspekh} }\cdot Valor - p_{\text{vred} }\cdot Harm - Costo
]
La acción es válida si 'EV≥0' y 'guardrails' son normales.
Apetito de riesgo: límites en FPR, frecuencia de intervención, presupuesto de daños/quejas, error budget.
3) Causalidad y predicciones
Cuando el pronóstico es suficiente: alocaciones de bajo riesgo, clasificación por probabilidad.
Cuando se necesita causalidad: ROMI, política de precios/límites, seguridad/cumplimiento. Utilice A/B, DiD, RDD, IV, control sintético; cuando se dirige - uplift y CATE.
loop counterfactual: pronóstico → acción → efecto → recuento de uplift/umbrales.
4) Tipos de políticas
Reglas (policy-as-code): determinista, explicable; base y fail-safe.
Score-based: probabilidades/score, histéresis, umbrales de costa-sensitive.
Contextual (bandidos): ε -greedy/Thompson para seleccionar offers/canales.
Serial (RL): estrategias de varios pasos con restricciones (safe RL).
Compuesto: cascada - seguridad/cumplimiento → economía → UX.
5) Arquitectura DI
Datos: eventos canónicos (UTC, versiones), ficha (paridad online/offline), directorio.
Modelos: registro/versiones, calibración, monitoreo de drift (PSI/KL), PR- AUC/Recall@FPR≤x%.
Semántica y métricas: un solo diccionario KPI/guardrails, SLO de frescura.
Motor de políticas: tablas de decisión, AVAS/contextos, histéresis, rate-limits, prioridades.
Orquestador de acciones: entrega garantizada, retraídas, idempotencia 'action _ id', DLQ.
Observabilidad: seguimiento de 'correlation _ id', embudo de 'signal→decision→action→outcome'.
Seguridad: RLS/CLS, enmascaramiento PII, registro de acceso y soluciones.
6) Métricas DI
Calidad de las soluciones
Decisión Precision/Recall: sobre los verdaderos éxitos de las acciones.
Regret/Opportunity Loss: rezago de la política óptima.
Coverage: proporción de objetos que han recibido una acción.
Latency p95: Signal→Decision/Decision→Action.
Fairness/Harms: diferencia de errores por segmentos, quejas, apelaciones.
Efecto
ROMI/ROI de acción, uplift @ k, Qini/AUUC.
Net Benefit: efecto − costo − daño.
Tiempo-a-Impacto: tiempo desde la señal hasta el resultado medible.
7) Diseño de la solución (diseño de la decisión)
1. Formula la pregunta como un efecto: «¿Cuál es la ganancia de retención de X en Y por T?»
2. Dibuje un DAG, defina los confounders/colisionadores.
3. Elija un diseño: A/B, cuasiexperimento o pronóstico neto + estimación ex-post.
4. Identificar acciones y alternativas, restricciones y guardrails.
5. Establezca la función de valor y el presupuesto de riesgo.
6. Describa la política en la tabla de decisión: condiciones → acción → canales → couldown.
7. Planifique la evaluación: métricas de efecto, duración, segmentos CATE.
8. Identifique el runbook de incidentes y las reglas fallback.
8) Histéresis, frecuencia y conflictos
Histéresis: los umbrales «entrada/salida» son diferentes; previene el «parpadeo» de las intervenciones.
Cooldown: pausas entre contactos/restricciones en el mismo objeto.
Conflictos políticos: matriz de prioridades; «la seguridad tiene prioridad».
Cuotas/Rate-limit: por canal, segmento, usuario; Distribución equitativa.
9) Niveles de autonomía
1. Ad-hoc: la persona decide, no hay datos suficientes.
2. Assisted: el sistema ofrece una solución + explicación.
3. Automated: auto-soluciones dentro de guardrails.
4. Adaptativo: ajuste automático de umbrales/selección de offers (bandidos).
5. Safe-Autonomy: autonomía bajo restricciones formales y auditoría.
10) Decisiones bajo incertidumbre
Planificación escénica: básica/estrés/extremum; rangos de efecto.
Robustness: estrategia resistente a errores paramétricos.
intuición POMDP: actúe con información incompleta; valora el costo de la información (qué experimento realizar).
Actualización bayesiana: combina el conocimiento histórico y los datos actuales.
11) Diálogo sobre «modelos de política ↔»
El modelo produce un score/distribución de resultados.
La política tiene en cuenta el costo de los errores, restricciones y fairness.
La línea de partición está en la política explícita de decisión de threshold con el registro de versiones.
La revisión del umbral es por EV, no sólo por ROC/PR.
12) Documentos y artefactos
Pasaporte de política (template)
Código/versión, destino y KPI del efecto
Condiciones/fichas/modelo, histéresis/couldown
Acciones y canales, prioridades y excepciones mutuas
Guardrails (FPR≤x%, latency p95≤y, RG/cumplimiento)
Evaluación: diseño de la prueba, métricas, duración
Auditoría/explicación para el usuario, propietarios
Mesa de decisión (ejemplo)
Esquema de lógica de soluciones «de extremo a extremo»
`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).
13) Gobierno y cumplimiento
Diccionario único de métricas y versionalidad de fórmulas.
Comité de Políticas: Oficial de Riesgo, Producto, Datos, Cumplimiento.
Auditoría de decisiones: explicaciones, motivos de denegación, canales de apelación.
Ética y equidad: monitoreo de errores por grupos; la exclusión de los signos protegidos de las normas cuando así lo requiera la ley.
14) Errores frecuentes
Optimizar las métricas proxy en lugar del efecto empresarial (Goodhart).
Mezcla de predicciones y causalidad; ROMI «por correlación».
Falta de histéresis y couldowns → spam/« parpadeo ».
Costo de error no contabilizado y daño al usuario.
Edición silenciosa de umbrales/fórmulas sin versiones y changelog.
Acciones sin evaluación del efecto y «cierre de ciclo».
15) Lista de verificación antes del lanzamiento de la política/sistema DI
- El objetivo se formula como efecto causal, se establece la función de valor y el presupuesto de riesgo
- Dibujado por DAG; diseño de evaluación seleccionado (A/B/DiD/SC) y métricas
- La política se describe en la tabla de decisión; hay histéresis/couldown/prioridades
- Los modelos están calibrados; umbrales deducidos del valor de error (EV)
- El orquestador de acción es idempotente; el registro «signal→decision→action→outcome» está habilitado
- Guardrails y alertas están configuradas; runbooks y fallback reglas están listas
- Dashboards: soluciones de embudo, efecto (uplift/ROI), daños/quejas, fairness
- Versiones/propietarios/derechos de acceso/cumplimiento documentados
Resultado
La inteligencia de la toma de decisiones es un sistema, no un conjunto de modelos: datos y métricas uniformes → una visión causal y económica del efecto → políticas explícitas y orquestación segura → evaluación rigurosa y aprendizaje continuo. Este sistema reduce el riesgo, aumenta el ROI y hace que las soluciones sean reproducibles, explicables y manejables.