KPI预测
KPI预测
KPI预测不是"图形猜测",而是受控的轮廓:正确的数据→适当的模型→场景和解释→操作监控。下方是系统支票清单和体系结构,可从简单系列扩展到投资组合,层次和概率预测。
1)任务设置
我们预测什么?级别,delta,quantil,间隔,事件(spike)。
地平线/步骤:小时/天/周/月;滚动窗口用于短期控制。
单位:产品/品牌/国家/平台/渠道。
业务背景:可管理的杠杆(促销、价格、发行版)和限制(SLA、RG/合规性)。
价值和风险:羽毛/低风险的成本,虚假变种的罚款。
2)数据和准备
谷物和日历:统一日历(假期/周末/工资日),时间点(UTC+本地表示)。
聚合和一致性:DAU/WAU/MAU,GGR/Net,ARPPU,保留(D7/D30),漏斗转换,latency p95-作为带有明确公式的单独店面存储。
回报(X):促销/奖金,活动,价格变化,内容发布,体育赛事,货币汇率,天气(如果相关)。
异常和遗漏:标记,不要盲目移除;对于事件-单击标志。
电路稳定性:将产品/测量版本转换点捕获为事件。
3)KPI类型和建模功能
累加量(收入、存款):ETS/ARIMA/GBM/Temporal-NN运作良好。
分数和转换:logit标尺、beta二项式模型、约束回归[0.1]。
系数和关系(ARPPU):分别对分子和分母进行建模,然后进行合成。
互换行(罕见事件,chargeback):Croston/SBA/TSB,零注入方法。
层次结构(strana→brend→kanal): 重建:Bottom-Up, Top-Down, MinT.
复合KPI(如GGR):不汇总驱动程序:流量×转换×频率×平均支票。
4)型号: 从基本到高级
Beizlines: Naive, Seasonal Naive, Drift-需要诚实评估。
系列经典:ETS/ARIMA/SARIMA;Prophet用于快速季节和假期。
回归器:ARIMAX/ETS+X,动态回归,TBATS用于多个季节。
梯度增强/表格NN: LightGBM/XGBoost/TabNet带有差分、窗口统计、日历和促销。
Temporal NN:N-Beats,TFT(Temporal Fusion Transformer)-用于多系列和富有X。
概率:量子回归(pinball loss),Gaussian/Student-t,量子森林/GBM。
因果关系和情景:DiD/SC评估促销效果;uplift用于规划"如果我们打开会发生什么"。
5)解剖和体征
T+S+R:趋势+季节(周日/月/小时)+余额。
泻湖和窗户:'y_{t-1.. t-28}',滑动中间/std,•。平滑化;"节日的尾巴"。
分类:国家/频道/OS为embeddings/单一热门。
事件:版本/促销活动/横幅-二进制/强度。
泄漏控制:只有"来自过去"的信息。
6)评分和背景测试
拆分:滚动/扩展起源;我们阻止季节性(周/月的倍数)。
级别度量:MAE,RMSE,MAPE/sMAPE,WAPE(在零值下更可靠)。
概率度量:pinball loss(q=0。1/0.5/0.9),CRPS,间隔校准(覆盖,SHARP)。
事件/尖峰度量:通过"弹出"检测进行精度/回收。
Baseline规则:模特应该战胜Seasonal Naive。
稳定性:按段/假期划分的误差方差;超时(最后N周)。
7)层次预测和匹配
Bottom-Up:总结"非传染性";很简单,但很吵。
Top-Down:我们按历史份额分配。
MinT (optimal reconciliation):最大限度地减少误差协方差-在丰富的"底层"下的最佳权衡。
实践:在每个级别教授基本模型,然后协商。
8)概率预测和解释
Quantili: q10/q50/q90 →计划"悲观主义者/基地/乐观主义者"。
间隔:目标覆盖率(例如80%/95%);我们检查校准。
风险成本:按有条件的VaR/expected shortfall规划,用于非对称损失的KPI(需求低负荷比过量成本高,反之亦然)。
9)场景模拟
外来场景:"无促销/无促销","± 10%的课程","足球决赛"。
如果是:我们改变X(活动强度,限制,价格)→ KPI预测和置信区间。
计划事实:桥梁(桥梁)因素:季节贡献,促销,价格,趋势,冲击/事件。
10)操作电路和MLOps
再培训频率:短期KPI-每天/每周;每月-T+1/T+3。
图层/工件:fichestor(联机/离线平价),模型注册表,KPI数据版本/公式。
监视:WAPE/SMAPE通过滑动窗口,间隔覆盖,特征漂移(PSI),接头延迟,生成SLA。
Alerts:错误激增>阈值、未校准间隔、季节性破坏。
失灵安全:降解→回滚至季节性Naive/ETS;假日高峰期的freeze模型。
磁滞:不同的开关阈值"promo repressors"以免闪烁。
11)杂货店和iGaming-KPI的细节(大致地图)
流量/活动:DAU/WAU/MAU,包括比赛日/游戏发布。
货币化:GGR/Net,存款,ARPU/ARPPU-强烈的季节性"晚上/周末/假期"。
保留:D1/D7/D30-最好用日历预测概率(logit)。
风险:chargeback比率(互换),RG指标(政策/假期),反性别信号。
操作:latency p95/p99,事务错误-与发行版的异常/因果关系影响兼容。
12)工件模板
A. KPI预测护照
KPI/代码: "GGR_EUR"(公式版本)
地平线/步骤: 8周,每天
层次结构: brend→strana→platforma
回归者: "promo_spend","fixtures_flag","holiday","fx_rate"
模型: "TFT_v4"(q10/q50/q90)+MinT重组
度量: WAPE(目标≤ 8%),覆盖率为90%-interal ≥ 85%
SLO: 06:00 lock后产生≤ 10分钟;数据差≤ 1小时
所有者: Monetization Analytics;审计日期:2025-10-15
B.决策就绪报告(骨架)
标题: "GGR:预测8周,q10/q50/q90"
关键: 第三周出现低血压的风险22% (ES=-X)
驱动程序: +周末季节性,+促销效果,− FX
建议: 将预算改为低风险周,提高A/B通道的限制
python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train) # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))
13)频繁的错误和反模式
空白时的MAPE:使用WAPE/sMAPE。
平均平均值:分别聚合分子/分母。
忽略假期/发行版:添加回归和"回放"日期。
Liki:具有未来信息的fichi(目标泄漏)。
太聪明了,没有徽章:首先击败Seasonal Naive。
未校准的间隔:"美丽但空虚"-检查覆盖范围。
层次结构不一致:没有重新连接,总体计划就会崩溃。
缺失安全:在假期高峰期,模式"挂起",计划崩溃。
14)销售监控
质量:WAPE滚动,分量弹球,覆盖80/95%。
稳定性:PSI的关键特征,季节性漂移。
操作:生成时间,数据差,百分比后退。
Alerts:错误"3 σ"规则、违反SLO、层次结构不一致。
Runibuck:freeze模式,关闭"嘈杂"的回归器,强化。
15)发行前的支票清单
- KPI定义和验证(语义层)
- 日历/假期/回归者同意和测试
- Beislines(Naive/Seasonal)在背靠背测试中被击败
- 选择指标(WAPE/pinball)和目标阈值
- 校准间距;"悲观主义者/基数/乐观主义者"情景
- 层次结构一致(MinT/Top-Down)
- MLOps:训练时间表、监测、警报、失败安全
- 文档:预测护照,SQL/fiche处方,runibook事件
底线
KPI预测是一种解决方案体系结构:清晰的定义,丰富的日历和回归器,诚实的徽章,概率预测,分层匹配,稳定的MLOps和场景规划。这样的轮廓提供了合理的期望,可管理的风险和"决策就绪"报告,这些报告直接为计划,营销,运营和合规性提供了动力。