Inteligencia para la toma de decisiones

Inteligencia de toma de decisiones

La inteligencia para la toma de decisiones (Decision Intelligence, DI) es una disciplina que transforma los datos en soluciones manejables y un efecto medible. DI combina causalidad, predicción, economía de soluciones, diseño de políticas y MLOps/operaciones en un solo ciclo de vida.

1) Marco DI: OODA/SSDL

Observe (Signal): eventos estandarizados, calidad/frescura, dedoup y contexto.
Oriente (Sense): interpretación: cohortes, segmentos, grafos causales, perfiles de riesgo.
Decide: política (reglas/modelos/bandidos), teniendo en cuenta las limitaciones y el costo de los errores.
Acto: orquestación de acciones, canales, idempotencia, prioridades.
Aprender: evaluación causal del efecto, actualización de umbrales/políticas/modelos.

2) Economía de soluciones

Función de valor: ingresos/daños guardados/retención/calidad del servicio.
Costo del error: FP/FN en dinero y riesgos (RG/cumplimiento/reputación).

Valor esperado (EV):

[
EV = p_{\text{uspekh} }\cdot Valor - p_{\text{vred} }\cdot Harm - Costo
]

La acción es válida si 'EV≥0' y 'guardrails' son normales.
Apetito de riesgo: límites en FPR, frecuencia de intervención, presupuesto de daños/quejas, error budget.

3) Causalidad y predicciones

Cuando el pronóstico es suficiente: alocaciones de bajo riesgo, clasificación por probabilidad.
Cuando se necesita causalidad: ROMI, política de precios/límites, seguridad/cumplimiento. Utilice A/B, DiD, RDD, IV, control sintético; cuando se dirige - uplift y CATE.
loop counterfactual: pronóstico → acción → efecto → recuento de uplift/umbrales.

4) Tipos de políticas

Reglas (policy-as-code): determinista, explicable; base y fail-safe.
Score-based: probabilidades/score, histéresis, umbrales de costa-sensitive.
Contextual (bandidos): ε -greedy/Thompson para seleccionar offers/canales.
Serial (RL): estrategias de varios pasos con restricciones (safe RL).
Compuesto: cascada - seguridad/cumplimiento → economía → UX.

5) Arquitectura DI

Datos: eventos canónicos (UTC, versiones), ficha (paridad online/offline), directorio.
Modelos: registro/versiones, calibración, monitoreo de drift (PSI/KL), PR- AUC/Recall@FPR≤x%.
Semántica y métricas: un solo diccionario KPI/guardrails, SLO de frescura.
Motor de políticas: tablas de decisión, AVAS/contextos, histéresis, rate-limits, prioridades.
Orquestador de acciones: entrega garantizada, retraídas, idempotencia 'action _ id', DLQ.
Observabilidad: seguimiento de 'correlation _ id', embudo de 'signal→decision→action→outcome'.
Seguridad: RLS/CLS, enmascaramiento PII, registro de acceso y soluciones.

6) Métricas DI

Calidad de las soluciones

Decisión Precision/Recall: sobre los verdaderos éxitos de las acciones.
Regret/Opportunity Loss: rezago de la política óptima.
Coverage: proporción de objetos que han recibido una acción.
Latency p95: Signal→Decision/Decision→Action.
Fairness/Harms: diferencia de errores por segmentos, quejas, apelaciones.

Efecto

ROMI/ROI de acción, uplift @ k, Qini/AUUC.
Net Benefit: efecto − costo − daño.
Tiempo-a-Impacto: tiempo desde la señal hasta el resultado medible.

7) Diseño de la solución (diseño de la decisión)

1. Formula la pregunta como un efecto: «¿Cuál es la ganancia de retención de X en Y por T?»

2. Dibuje un DAG, defina los confounders/colisionadores.
3. Elija un diseño: A/B, cuasiexperimento o pronóstico neto + estimación ex-post.
4. Identificar acciones y alternativas, restricciones y guardrails.
5. Establezca la función de valor y el presupuesto de riesgo.
6. Describa la política en la tabla de decisión: condiciones → acción → canales → couldown.
7. Planifique la evaluación: métricas de efecto, duración, segmentos CATE.
8. Identifique el runbook de incidentes y las reglas fallback.

8) Histéresis, frecuencia y conflictos

Histéresis: los umbrales «entrada/salida» son diferentes; previene el «parpadeo» de las intervenciones.
Cooldown: pausas entre contactos/restricciones en el mismo objeto.
Conflictos políticos: matriz de prioridades; «la seguridad tiene prioridad».
Cuotas/Rate-limit: por canal, segmento, usuario; Distribución equitativa.

9) Niveles de autonomía

1. Ad-hoc: la persona decide, no hay datos suficientes.
2. Assisted: el sistema ofrece una solución + explicación.
3. Automated: auto-soluciones dentro de guardrails.
4. Adaptativo: ajuste automático de umbrales/selección de offers (bandidos).
5. Safe-Autonomy: autonomía bajo restricciones formales y auditoría.

10) Decisiones bajo incertidumbre

Planificación escénica: básica/estrés/extremum; rangos de efecto.
Robustness: estrategia resistente a errores paramétricos.
intuición POMDP: actúe con información incompleta; valora el costo de la información (qué experimento realizar).
Actualización bayesiana: combina el conocimiento histórico y los datos actuales.

11) Diálogo sobre «modelos de política ↔»

El modelo produce un score/distribución de resultados.
La política tiene en cuenta el costo de los errores, restricciones y fairness.
La línea de partición está en la política explícita de decisión de threshold con el registro de versiones.
La revisión del umbral es por EV, no sólo por ROC/PR.

12) Documentos y artefactos

Pasaporte de política (template)

Código/versión, destino y KPI del efecto

Condiciones/fichas/modelo, histéresis/couldown

Acciones y canales, prioridades y excepciones mutuas

Guardrails (FPR≤x%, latency p95≤y, RG/cumplimiento)

Evaluación: diseño de la prueba, métricas, duración

Auditoría/explicación para el usuario, propietarios

Mesa de decisión (ejemplo)

Condición	Contexto	Acción	Kuldaun	Guardrails
`churn_uplift ≥ 0. 08` & `value_q ≥ 0. 8`	retenshn	offer L	7д	ROMI≥0, cap=1
`rg_risk ≥ τ` & `night`	RG	pausa + consejo	1д	FPR≤1%
`fraud_score∈[τ1,τ2]`	Pago	comprobación manual	—	SLA 2h

Esquema de lógica de soluciones «de extremo a extremo»

`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).

13) Gobierno y cumplimiento

Diccionario único de métricas y versionalidad de fórmulas.
Comité de Políticas: Oficial de Riesgo, Producto, Datos, Cumplimiento.
Auditoría de decisiones: explicaciones, motivos de denegación, canales de apelación.
Ética y equidad: monitoreo de errores por grupos; la exclusión de los signos protegidos de las normas cuando así lo requiera la ley.

14) Errores frecuentes

Optimizar las métricas proxy en lugar del efecto empresarial (Goodhart).
Mezcla de predicciones y causalidad; ROMI «por correlación».
Falta de histéresis y couldowns → spam/« parpadeo ».
Costo de error no contabilizado y daño al usuario.
Edición silenciosa de umbrales/fórmulas sin versiones y changelog.
Acciones sin evaluación del efecto y «cierre de ciclo».

15) Lista de verificación antes del lanzamiento de la política/sistema DI

El objetivo se formula como efecto causal, se establece la función de valor y el presupuesto de riesgo
Dibujado por DAG; diseño de evaluación seleccionado (A/B/DiD/SC) y métricas
La política se describe en la tabla de decisión; hay histéresis/couldown/prioridades
Los modelos están calibrados; umbrales deducidos del valor de error (EV)
El orquestador de acción es idempotente; el registro «signal→decision→action→outcome» está habilitado
Guardrails y alertas están configuradas; runbooks y fallback reglas están listas
Dashboards: soluciones de embudo, efecto (uplift/ROI), daños/quejas, fairness
Versiones/propietarios/derechos de acceso/cumplimiento documentados

Resultado

La inteligencia de la toma de decisiones es un sistema, no un conjunto de modelos: datos y métricas uniformes → una visión causal y económica del efecto → políticas explícitas y orquestación segura → evaluación rigurosa y aprendizaje continuo. Este sistema reduce el riesgo, aumenta el ROI y hace que las soluciones sean reproducibles, explicables y manejables.

Inteligencia para la toma de decisiones

Inteligencia de toma de decisiones

Efecto

Código/versión, destino y KPI del efecto

Mesa de decisión (ejemplo)

Esquema de lógica de soluciones «de extremo a extremo»

Resultado

Póngase en contacto

Contacto rápido

El vídeo se actualizará pronto

Estamos actualmente muy ocupados con proyectos