决策智能

决策智能（Decision Intelligence，DI）是将数据转化为托管决策和可测量效果的学科。DI在一个生命周期中结合了因果关系，预测，决策经济学，策略设计和MLOps/操作。

1）框架DI： OODA/SSDL

Observe （Signal）：标准化事件、质量/新鲜度、滞后和背景。
东方（Sense）：解释：队列、段、因果图、风险配置文件。
Decide：政策（规则/模型/强盗）,考虑限制和错误成本。
法案：行动编排，渠道，相等性，优先级。
学习：对效果进行低温评估，更新阈值/策略/模型。

2）决策经济学

价值功能：收益/保存损坏/保留/服务质量。
错误成本：货币和风险的FP/FN（RG/合规/声誉）。

预期价值（EV）：

[
EV=p_{\text{uspekh} }\cdot Value-p_{\text{vred} }\cdot Harm-成本
]

如果"EV≥0"和guardrails是正常的，则允许该动作。
风险胃口：FPR限制，干预频率，伤害/投诉预算，错误预算。

3）因果关系和预测

当预测足够时：低风险的异位，按概率排名。
当需要因果关系时：ROMI，价格/限额政策，安全/合规性。使用A/B，DiD，RDD，IV，合成控制；定向-uplift和CATE。
Counterfactual loop：预测→动作→效果→重新计算uplift/阈值。

4）策略类型

规则（政策即代码）：确定性，可解释；底座和故障安全。
基于得分：概率/争吵，滞后，成本感应阈值。
上下文（土匪）：ε-greedy/Thompson用于选择离场/频道。
串行（RL）：多阶段约束策略（安全RL）。
复合：级联-安全/合规性→经济→ UX。

5） DI架构

数据：规范事件（UTC,版本）,fichestor （online/offline parity）,目录。
型号：注册表/版本，校准，漂移监控（PSI/KL），PR- AUC/Recall@FPR≤x％。
语义和度量：单个KPI/guardrails字典，SLO新鲜度。
策略引擎：决策台、AWAS/上下文、滞后、限制、优先级。
动作编排器：保证交付，转发，"action_id"等效性，DLQ。
可观察性：跟踪"correlation_id"，漏斗"signal→decision→action→outcome"。
安全性：RLS/CLS，PII掩码，访问和解决方案日志。

6）DI度量

解决方桉质量

Decision Precision/Recall：关于真正的行动成功。
Regret/Opportunity Loss：落后于最佳策略。
覆盖：接受操作的对象的百分比。

Latency p95: Signal→Decision/Decision→Action.

Fairness/Harms：按细分、投诉、上诉划分的错误差异。

业务效果

ROMI/ROI行动，uplift@k，Qini/AUUC。
Net Benefit：影响−成本−伤害。
时间到影响：时间从信号到可测量的结果。

7）解决方桉设计（决策设计）

1.将问题表述为效果： "Y的X保持在T上的增加是多少？"

2.绘制DAG，定义confounders/对撞机。
3.选择设计：A/B、准实验或净预测+事后评估。
4.定义操作和替代方案、约束和guardrails。
5.设置价值函数和风险预算。
6.在决策表中描述策略：条件→操作→通道→冷却。
7.分解估计值：效果度量、持续时间、CATE段。
8.定义事件运行手册和倒退规则。

8）滞后、频率和冲突

滞后：进出阈值不同；防止干预的"闪烁"。
Cooldown：在同一对象的接触/约束之间暂停。
政策冲突：优先级矩阵；"安全优先"。
配额/限额：每个频道，部分，用户；公平分配。

9）自治水平

1.Ad-hoc：人决定数据不足。
2.助手：系统提供解决方桉+解释。
3.自动化：guardrails内的自动解决方案。
4.Adaptive：自动调谐阈值/选择离线（强盗）。
5.Safe-Autonomy：受正式限制和审核的自治。

10）不确定性下的解决方案

场景规划：基本/压力/极端；效果范围。
Robustness：抗参数误差的策略。
POMDP直觉：处理信息不完整；重视信息的成本（进行什么实验）。
Bayesian升级：结合历史知识和当前数据。

11） "↔政策模式"对话"

模型产生结果/分布。
该政策考虑了错误，限制和公平的成本。
分区线-在带有版本日志的显式decision threshold策略中。
修订阈值是电动汽车，而不仅仅是ROC/PR。

12）文件和文物

政策护照（template）

效果代码/版本、目标和KPI

条件/fici/模型，滞后/culdown

行动和渠道、优先事项和相互排斥

Guardrails （FPR≤x%, latency p95≤y, RG/合规）

评分： 测试设计、指标、持续时间

用户审核/解释,所有者

决策表（示例）

条件是	上下文	行动	库尔当	Guardrails
`churn_uplift ≥ 0.08` & `value_q ≥ 0.8`	重组	offer L	7 d	ROMI≥0, cap=1
`rg_risk ≥ τ` & `night`	RG	暂停+建议	1 d	FPR≤1%
`fraud_score∈[τ1,τ2]`	付款	手动检查	—	SLA 2h

"端到端"解决方案的构造方案

`signal_id` → `decision_id` → `action_id` → `outcome_id` (+ `correlation_id`).

13）Howernance和合规性

统一度量词典和公式的忠诚度。
政策委员会：风险官员，产品，数据，合规性。
决定审计：解释，拒绝的原因，上诉渠道。
道德与公平：按组监控错误；从法律要求的规则中排除受保护的特征。

14）常见错误

优化代理度量而不是业务效果（Goodhart）。
预测和因果关系的混合；ROMI"通过相关性"。
缺乏滞后和拳头→垃圾邮件/"闪烁"。
错误成本和用户伤害不计其数。
静静地编辑阈值/公式，没有版本和changelog。
不评估效果和"循环闭合"的动作。

15）政策/系统DI发布前的支票清单

目标被表述为因果关系，设定了价值函数和风险预算
由DAG绘制；评分设计（A/B/DiD/SC）和指标
政策在决策表中描述；有滞后/kuldown/优先级
模型经过校准；从错误成本（EV）中推断出阈值)
行动管弦乐队是偶然的；包含"signal→decision→action→outcome"日志
Guardrails和Alertes定制；runbooks和fallback规则准备就绪
Dashbords：解决方案漏斗，效果（uplift/ROI），伤害/投诉，公平性
版本/所有者/访问权/合规性已记录

底线

决策智能是一个系统而不是一组模型：统一的数据和指标→对影响的因果和经济观点→明确的政策和安全的编排→严格的评估和持续的学习。这样的系统可以降低风险，提高ROI，并使解决方案可复制，可解释和可管理。

决策智能

决策智能

业务效果

效果代码/版本、目标和KPI

决策表（示例）

"端到端"解决方案的构造方案

底线

联系我们

快速联系

视频即将更新

我们目前正忙于各项项目