KPI預測
KPI預測
KPI預測不是「圖形猜測」,而是受控的輪廓:正確的數據→適當的模型→場景和解釋→操作監控。下方是系統支票清單和體系結構,可從簡單系列擴展到投資組合,層次和概率預測。
1)任務設置
我們預測什麼?級別,delta,quantil,間隔,事件(spike)。
地平線/步驟:小時/天/周/月;滾動窗口用於短期控制。
單位:產品/品牌/國家/平臺/渠道。
業務背景:可管理的杠桿(促銷、價格、發行版)和限制(SLA、RG/合規性)。
價值和風險:羽毛/低風險的成本,虛假變種的罰款。
2)數據和準備
谷物和日歷:統一日歷(假期/周末/工資日),時間點(UTC+本地表示)。
聚合和一致性:DAU/WAU/MAU,GGR/Net,ARPPU,保留(D7/D30),漏鬥轉換,latency p95-作為帶有明確公式的單獨店面存儲。
回報(X):促銷/獎金,活動,價格變化,內容發布,體育賽事,貨幣匯率,天氣(如果相關)。
異常和遺漏:標記,不要盲目移除;對於事件-單擊標誌。
電路穩定性:將產品/測量版本轉換點捕獲為事件。
3)KPI類型和建模功能
累加量(收入、存款):ETS/ARIMA/GBM/Temporal-NN運作良好。
分數和轉換:logit標尺、beta二項式模型、約束回歸[0.1]。
系數和關系(ARPPU):分別對分子和分母進行建模,然後進行合成。
互換行(罕見事件,chargeback):Croston/SBA/TSB,零註入方法。
層次結構(strana→brend→kanal): 重建:Bottom-Up, Top-Down, MinT.
復合KPI(如GGR):不匯總驅動程序:流量×轉換×頻率×平均支票。
4)型號: 從基本到高級
Beizlines: Naive, Seasonal Naive, Drift-需要誠實評估。
系列經典:ETS/ARIMA/SARIMA;Prophet用於快速季節和假期。
回歸器:ARIMAX/ETS+X,動態回歸,TBATS用於多個季節。
梯度增強/表格NN: LightGBM/XGBoost/TabNet帶有差分、窗口統計、日歷和促銷。
Temporal NN:N-Beats,TFT(Temporal Fusion Transformer)-用於多系列和富有X。
概率:量子回歸(pinball loss),Gaussian/Student-t,量子森林/GBM。
因果關系和情景:DiD/SC評估促銷效果;uplift用於規劃「如果我們打開會發生什麼」。
5)解剖和體征
T+S+R:趨勢+季節(周日/月/小時)+余額。
瀉湖和窗戶:'y_{t-1.. t-28}',滑動中間/std,•。平滑化;「節日的尾巴」。
分類:國家/頻道/OS為embeddings/單一熱門。
事件:版本/促銷活動/橫幅-二進制/強度。
泄漏控制:只有「來自過去」的信息。
6)評分和背景測試
拆分:滾動/擴展起源;我們阻止季節性(周/月的倍數)。
級別度量:MAE,RMSE,MAPE/sMAPE,WAPE(在零值下更可靠)。
概率度量:pinball loss(q=0。1/0.5/0.9),CRPS,間隔校準(覆蓋,SHARP)。
事件/尖峰度量:通過「彈出」檢測進行精度/回收。
Baseline規則:模特應該戰勝Seasonal Naive。
穩定性:按段/假期劃分的誤差方差;超時(最後N周)。
7)層次預測和匹配
Bottom-Up:總結「非傳染性」;很簡單,但很吵。
Top-Down:我們按歷史份額分配。
MinT (optimal reconciliation):最大限度地減少誤差協方差-在豐富的「底層」下的最佳權衡。
實踐:在每個級別教授基本模型,然後協商。
8)概率預測和解釋
Quantili: q10/q50/q90 →計劃「悲觀主義者/基地/樂觀主義者」。
間隔:目標覆蓋率(例如80%/95%);我們檢查校準。
風險成本:按有條件的VaR/expected shortfall規劃,用於非對稱損失的KPI(需求低負荷比過量成本高,反之亦然)。
9)場景模擬
外來場景:「無促銷/無促銷」,「± 10%的課程」,「足球決賽」。
如果是:我們改變X(活動強度,限制,價格)→ KPI預測和置信區間。
計劃事實:橋梁(橋梁)因素:季節貢獻,促銷,價格,趨勢,沖擊/事件。
10)操作電路和MLOps
再培訓頻率:短期KPI-每天/每周;每月-T+1/T+3。
圖層/工件:fichestor(聯機/離線平價),模型註冊表,KPI數據版本/公式。
監視:WAPE/SMAPE通過滑動窗口,間隔覆蓋,特征漂移(PSI),接頭延遲,生成SLA。
Alerts:錯誤激增>閾值、未校準間隔、季節性破壞。
失靈安全:降解→回滾至季節性Naive/ETS;假日高峰期的freeze模型。
磁滯:不同的開關閾值「promo repressors」以免閃爍。
11)雜貨店和iGaming-KPI的細節(大致地圖)
流量/活動:DAU/WAU/MAU,包括比賽日/遊戲發布。
貨幣化:GGR/Net,存款,ARPU/ARPPU-強烈的季節性「晚上/周末/假期」。
保留:D1/D7/D30-最好用日歷預測概率(logit)。
風險:chargeback比率(互換),RG指標(政策/假期),反性別信號。
操作:latency p95/p99,事務錯誤-與發行版的異常/因果關系影響兼容。
12)工件模板
A. KPI預測護照
KPI/代碼: 「GGR_EUR」(公式版本)
地平線/步驟: 8周,每天
層次結構: brend→strana→platforma
回歸者: 「promo_spend」,「fixtures_flag」,「holiday」,「fx_rate」
模型: 「TFT_v4」(q10/q50/q90)+MinT重組
度量: WAPE(目標≤ 8%),覆蓋率為90%-interal ≥ 85%
SLO: 06:00 lock後產生≤ 10分鐘;數據差≤ 1小時
所有者: Monetization Analytics;審計日期:2025-10-15
B.決策就緒報告(骨架)
標題: 「GGR:預測8周,q10/q50/q90」
關鍵: 第三周出現低血壓的風險22% (ES=-X)
驅動程序: +周末季節性,+促銷效果,− FX
建議: 將預算改為低風險周,提高A/B通道的限制
python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train) # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))
13)頻繁的錯誤和反模式
空白時的MAPE:使用WAPE/sMAPE。
平均平均值:分別聚合分子/分母。
忽略假期/發行版:添加回歸和「回放」日期。
Liki:具有未來信息的fichi(目標泄漏)。
太聰明了,沒有徽章:首先擊敗Seasonal Naive。
未校準的間隔:「美麗但空虛」-檢查覆蓋範圍。
層次結構不一致:沒有重新連接,總體計劃就會崩潰。
缺失安全:在假期高峰期,模式「掛起」,計劃崩潰。
14)銷售監控
質量:WAPE滾動,分量彈球,覆蓋80/95%。
穩定性:PSI的關鍵特征,季節性漂移。
操作:生成時間,數據差,百分比後退。
Alerts:錯誤「3 σ」規則、違反SLO、層次結構不一致。
Runibuck:freeze模式,關閉「嘈雜」的回歸器,強化。
15)發行前的支票清單
- KPI定義和驗證(語義層)
- 日歷/假期/回歸者同意和測試
- Beislines(Naive/Seasonal)在背靠背測試中被擊敗
- 選擇指標(WAPE/pinball)和目標閾值
- 校準間距;「悲觀主義者/基數/樂觀主義者」情景
- 層次結構一致(MinT/Top-Down)
- MLOps:訓練時間表、監測、警報、失敗安全
- 文檔:預測護照,SQL/fiche處方,runibook事件
底線
KPI預測是一種解決方案體系結構:清晰的定義,豐富的日歷和回歸器,誠實的徽章,概率預測,分層匹配,穩定的MLOps和場景規劃。這樣的輪廓提供了合理的期望,可管理的風險和「決策就緒」報告,這些報告直接為計劃,營銷,運營和合規性提供了動力。