KPI予測
KPI予測
KPI予測は「グラフの推測」ではなく、制御されたループです。正しいデータ→適切なモデル→シナリオと解釈→運用監視。以下は、シンプルなシリーズからポートフォリオ、階層予測、確率予測にスケーリングするシステムチェックリストとアーキテクチャです。
1)タスクステートメント
私たちは何を予測しますか?レベル、デルタ、quantile、間隔、でき事(スパイク)。
地平線/ステップ:時間/日/週/月;短期制御のための圧延窓。
単位:プロダクト/ブランド/国/プラットホーム/チャネル。
ビジネスコンテキスト:制御レバー(プロモーション、価格、リリース)と制限(SLA、 RG/コンプライアンス)。
値とリスク:再予測/未予測のコスト、偽のアラートには問題ありません。
2)データと準備
穀物とカレンダー:単一のカレンダー(休日/週末/給与日)、時間ロケール(UTC+ローカルビュー)。
集計と整合性:DAU/WAU/MAU、 GGR/Net、 ARPPU、リテンション(D7/D30)、ファネル変換、レイテンシp95-明示的な数式を持つ個別のショーケースとして保存します。
Regressors (X):プロモーション/ボーナス、キャンペーン、価格変更、コンテンツリリース、スポーツイベント、為替レート、天気(関連する場合)。
異常および省略:私達は、盲目的に取除かないで分類します;イベントの場合-「one-off」フラグ。
スキームの安定性:製品バージョン/寸法の変更点をイベントとして記録します。
3) KPIタイプとモデリング機能
付加的な容積(収入、沈殿物):ETS/ARIMA/GBM/Temporal-NNはよく機能します。
分数と変換:ロジットライン、ベータ二項モデル、制限回帰[0,1]。
係数と比率(ARPPU):分子と分母を別々にモデル化し、次に組成をモデル化します。
断続シリーズ(レアイベント、チャージバック):クロストン/SBA/TSB、ゼロインフレーテッドアプローチ。
階層(strana→brend→kanal):和解:ボトムアップ、トップダウン、MinT。
複合KPI(例えば、GGR):分散ドライバ:トラフィック×変換×周波数×平均チェック。
4)モデル: 基本から高度へ
ベースライン:ナイーブ、季節のナイーブ、ドリフト-正直な評価に必要です。
シリーズクラシック:ETS/ARIMA/SARIMA;早い季節と休日のための預言者。
リグレッサー:ARIMAX/ETS+X、動的回帰、複数の季節のTBATS。
グラデーションブースト/表形式NN: LightGBM/XGBoost/TabNet、ラグ機能、ウィンドウ統計、カレンダー、プロモーション。
Temporal NN: Nビート、TFT (Temporal Fusion Transformer)-マルチシリーズおよびリッチX用。
確率:クオンタイル回帰(ピンボール損失)、ガウス/学生t、クオンタイル森林/GBM。
因果関係とシナリオ:プロモーション効果を評価するDiD/SC;「私たちが含めるとどうなるか」をスケジュールするためのアップリフト。
5)分解および印
T+S+R:トレンド+季節性(曜日/月/時間)+バランス。
ラグとウィンドウ:'y_{t-1。。t-28}'、移動平均/std、 exp。平滑化;「休日の尾」。
カテゴリー:埋め込み/ワンホットとしての国/チャネル/OS。
イベント:リリース/プロモーション/バナー-バイナリ/強度。
リークコントロール:過去からの情報のみ。
6)スコアリングとバックテスト
分割:転がり/拡大の原点;季節性(複数週/月)をブロックします。
レベルメトリック:MAE、 RMSE、 MAPE/sMAPE、 WAPE(ゼロでより信頼性の高い)。
確率的指標:ピンボール損失(q=0。1/0.5/0.9)、 CRPSの間隔の口径測定(適用範囲、SHARP)。
イベント/スパイクメトリクス:「イジェクション」検出器の精度/リコール。
ベースラインルール:モデルはSeasonal Naiveに勝つ必要があります。
安定性:区分/休日による誤差;時間外(最後のN週間)。
7)階層的予測と和解
ボトムアップ:「ボトム」を要約します。シンプルだが騒々しい。
トップダウン:歴史的な株式に広がる。
MinT(最適な和解):エラーの共分散を最小限に抑えます。
練習:各レベルで基本的なモデルを訓練し、同意します。
8)確率的な予測と解釈
Quantiles: q10/q50/q90→planning 「pessimist/base/optimist」。
間隔:ターゲットカバレッジ(例:80 %/95%);キャリブレーションのチェック。
リスクのコスト:非対称損失のあるKPIの条件付きVaR/予想不足に応じて計画する(需要予測は予測よりも高価であり、その逆もあります)。
9)シナリオモデリング
外因性シナリオ:「no promo/s promo」、 「course ± 10%」、 「football final」。
What-if: change X(キャンペーンの強度、限度、価格)→KPI予測と信頼区間。
プランファクト:ブリッジファクター:季節の貢献、プロモーション、価格、トレンド、ショック/インシデント。
10)生産ループおよびMLOps
再トレーニング頻度:短期KPI-毎日/毎週;毎月-T+1/T+3。
レイヤー/アーティファクト:fichestor(オンライン/オフラインのパリティ)、モデルレジスタ、KPIデータ/数式バージョン。
モニタリング:WAPE/SMAPEスライディングウィンドウ、インターバルカバレッジ、フィーチャードリフト(PSI)、フィード遅延、SLA生成。
アラート:error spike> threshold、 uncalibrated intervals、 seasonality breakdown。
フェイルセーフ:劣化→季節のナイーブ/ETSへのロールバック;休日のピークに凍結モデル。
ヒステリシス:「点滅」を避けるために「プロモリグレッサー」の異なるオン/オフしきい値。
11)製品およびiGaming-KPIの特異性(おおよその地図)
トラフィック/アクティビティ:試合日/ゲームリリースを含むDAU/WAU/MAU。
収益化:GGR/ネット、預金、ARPU/ARPPU-強い夜/週末/休日の季節性。
保持:D1/D7/D30-カレンダーで確率(ロジット)として予測することをお勧めします。
リスク:チャージバック率(断続的)、RG指標(ポリシー/休日)、不正防止信号。
操作:遅延p95/p99、トランザクションエラー-リリースの異常/因果関係と互換性があります。
12)アーティファクトパターン
A。 KPI予報パスポート
KPI/コード: 'GGR_EUR'(数式バージョン)
地平線/ステップ: 8週間、日
階層: brend→strana→platforma
Regressors: 'promo_spay'、 'fixtures_flag'、 'holiday'、 'fx_rate'
モデル: 'TFT_v4' (q10/q50/q90)+MinT和解
メトリクス: WAPE(絶対ターゲット≤ 8%)、カバレッジ90%-間隔≥ 85%
SLO: 06:00の後の生成≤ 10分;データログ≤ 1時間
所有者: 収益化アナリティクス;リビジョンの日付:2025-10-15
B。 Decision-readyレポート(スケルトン)
見出し: 「GGR:予測8週間、q10/q50/q90」
キー: 週3 22%で予後不良のリスク(ES=-€X)
ドライバー: +週末の季節性、+プロモーションエフェクト、FX −
推奨事項: 低リスク週間のシフト予算、A/Bチャネルの上限を引き上げる
パイプラインの疑似コード(トランジェント)
python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train) # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))
13)頻繁な間違いおよび反パターン
0のMAPE: WAPE/sMAPEを使用します。
平均:集計数値/分母を別々に意味します。
休日/リリースを無視する:リグレッサーと「後味」の日付を追加します。
顔:将来の情報(ターゲット漏洩)を持つ機能。
ベースラインなしであまりにも「スマート」モデル:最初の敗北Seasonal Naive。
改ざんされていない間隔:「美しいが空」-カバレッジをチェックしてください。
階層の矛盾:和解がなければ、全体の計画は散らばっています。
フェイルセーフの欠如:休日のピーク時に、モデルは「ハング」、計画が崩壊します。
14)販売におけるモニタリング
質:WAPEの圧延、quantileによるピンボール、適用範囲80/95%。
安定性:主な属性によるPSI、季節性ドリフト。
操作:生成時間、データラグ、フォールバックの%。
アラート:エラーの「3 σ」ルール、SLO違反、階層の内訳。
Runibook:フリーズモード、「騒々しい」リグレッサー、フォースオーバードーンをオフにします。
15)プレリリースのチェックリスト
- KPI定義とバージョン管理(セマンティックレイヤー)
- カレンダー/休日/リグレッサーの整列とテスト
- ベースライン(ナイーブ/季節)バックテストで敗れた
- 選択したメトリック(WAPE/ピンボール)とターゲットのしきい値
- 間隔は目盛りが付いています;悲観的/ベース/楽観的なシナリオを収集
- 階層が同意する(MinT/トップダウン)
- MLOps:ワークアウトスケジュール、モニタリング、アラート、フェイルセーフ
- ドキュメンテーション:予測パスポート、SQL/フィーチャーレシピ、 インシデントrunibook
合計
KPI予測は、明確な定義、豊富なカレンダーとリグレッサー、正直なベースライン、確率的予測、階層的アライメント、安定したMLOps、シナリオ計画などのソリューションアーキテクチャです。このようなアウトラインは、計画、マーケティング、運用、コンプライアンスを直接提供する、妥当な期待、管理可能なリスク、および「意思決定の準備ができた」レポートを提供します。