Vorhersage von KPIs
KPI-Prognose
Bei der KPI-Prognose geht es nicht um „Chart-Raten“, sondern um eine überschaubare Kontur: korrekte Daten → ein adäquates Modell → Szenarien und Interpretation → Betriebsüberwachung. Im Folgenden finden Sie eine System-Checkliste und eine Architektur, die von einfachen Reihen bis hin zu Portfolio-, Hierarchie- und probabilistischen Prognosen skaliert.
1) Aufgabenstellung
Was prognostizieren wir? Ebene, Delta, Quantil, Intervall, Ereignis (Spike).
Horizont/Schritt: Stunden/Tage/Wochen/Monate; Rollfenster zur kurzfristigen Kontrolle.
Einheit: Produkt/Marke/Land/Plattform/Kanal.
Geschäftskontext: steuerbare Hebelwirkung (Promo, Preise, Freigaben) und Einschränkungen (SLA, RG/Compliance).
Werte und Risiken: Kosten für Pere/Unterprognose, Strafe für falsche Warnungen.
2) Daten und Vorbereitung
Getreide und Kalender: Einheitlicher Kalender (Feiertage/Wochenenden/Gehaltstage), lokale Zeit (UTC + lokale Ansichten).
Aggregate und Konsistenz: DAU/WAU/MAU, GGR/Net, ARPPU, Retention (D7/D30), Trichterumbauten, Latency p95 - als separate Vitrinen mit expliziten Formeln aufbewahren.
Regressoren (X): Promo/Boni, Kampagnen, Preisänderungen, Content Releases, Sportveranstaltungen, Wechselkurse, Wetter (wenn relevant).
Anomalien und Lücken: markieren, nicht blind entfernen; für Ereignisse: One-Off-Flags.
Schaltungsstabilität: Wir erfassen die Schaltpunkte der Produktversionen/Messungen als Ereignisse.
3) KPI-Typen und Simulationsmerkmale
Additive Volumes (Umsatz, Einlagen): ETS/ARIMA/GBM/Temporal-NN funktionieren gut.
Anteile und Konversionen: Logit-Linien, Beta-Binomialmodelle, Regression mit Einschränkungen [0,1].
Koeffizienten und Verhältnisse (ARPPU): Wir modellieren Zähler und Nenner getrennt, dann die Zusammensetzung.
Intermittierende Reihen (seltene Ereignisse, Chargeback): Croston/SBA/TSB, zero-inflated Ansätze.
Hierarchien (strana→brend→kanal): reconciliation: Bottom-Up, Top-Down, MinT.
Composite-KPIs (z. B. GGR): Disaggregieren von Treibern: Traffic × Conversion × Häufigkeit × durchschnittlicher Check.
4) Modelle: von Grund auf fortgeschritten
Baselines: Naive, Seasonal Naive, Drift - benötigt für eine ehrliche Bewertung.
Klassiker der Reihen: ETS/ARIMA/SARIMA; Prophet für schnelle Jahreszeiten und Feiertage.
Regressoren: ARIMAX/ETS + X, dynamische Regressionen, TBATS für multiple Saisonalitäten.
Gradientenverstärkung/tabellarische NN: LightGBM/XGBoost/TabNet mit Lag-Fich, Fensterstatistiken, Kalender und Promo.
Temporal NN: N-Beats, TFT (Temporal Fusion Transformer) - für Multi-Serien und Rich X.
Probabilistisch: quantile regression (pinball loss), Gaussian/Student-t, quantile forests/GBM.
Kausalität und Szenarien: DiD/SC zur Bewertung der Werbewirkung; uplift für Planung „was passiert, wenn wir einschalten“.
5) Zerlegung und Merkmale
T + S + R: Trend + Saisonalität (Wochentag/Monat/Stunde) + Saldo.
Die Loge und die Fenster: ' y _ {t-1. t-28} ', gleitend mittler/std, den Expunkt Glätten; „Feiertagsschwänze“.
Kategorisch: Land/Kanal/OS als Embedding/one-hot.
Veranstaltungen: Releases/Promotions/Banner - Binär/Intensitäten.
Leakage-Kontrolle: nur Informationen „aus der Vergangenheit“.
6) Bewertung und Backtesting
Splits: rolling/expanding origin; Saisonalität blockieren (Vielfache von Wochen/Monaten).
Füllstandsmetriken: MAE, RMSE, MAPE/sMAPE, WAPE (zuverlässiger bei Nullen).
Wahrscheinlichkeitsmetriken: Pinballverlust (q = 0. 1/0. 5/0. 9), CRPS, Intervallkalibrierung (Abdeckung, SHARP).
Ereignis-/Spike-Metriken: Präzision/Rückruf durch den „Ausreißer“ -Detekt.
Die Baseline-Regel: Das Model muss gegen Seasonal Naive gewinnen.
Stabilität: Fehlervarianzen nach Segment/Urlaub; out-of-time (letzte N Wochen).
7) Hierarchische Prognose und Ausrichtung
Bottom-Up: Wir fassen „unten“ zusammen; einfach, aber laut.
Top-Down: nach historischen Anteilen verteilen.
MinT (optimal reconciliation): Minimiert die Kovarianz von Fehlern - der beste Kompromiss mit einer reichen „Unterseite“.
Praxis: Wir trainieren die Grundmodelle auf jeder Ebene, dann vereinbaren wir.
8) Wahrscheinlichkeitsvorhersagen und Interpretation
Quantili: q10/q50/q90 → Planung „Pessimist/Basis/Optimist“.
Intervalle: Zielabdeckung (z.B. 80 %/95%); Wir überprüfen die Kalibrierung.
Risikokosten: Planen Sie nach bedingtem VaR/Expected Shortfall für KPIs mit asymmetrischen Verlusten (Nachfrageunterschwelligkeit ist teurer als Reprognose und umgekehrt).
9) Szenariomodellierung
Exogene Szenarien: „ohne Promo/mit Promo“, „Kurs ± 10%“, „Fußballfinale“.
What-if: Wir ändern X (Kampagnenintensität, Limits, Preise) → KPI-Prognose und Konfidenzintervalle.
Ist-Plan: Die Brücke der Faktoren: Beitrag der Jahreszeiten, Promo, Preis, Trend, Schock/Vorfall.
10) Betriebsschaltung und MLOps
Häufigkeit der Umschulung: kurzfristige KPIs - täglich/wöchentlich; monatlich - T + 1/T + 3.
Schichten/Artefakte: Fichester (Online-/Offline-Parität), Modellregister, KPI-Daten-/Formelversionen.
Überwachung: WAPE/SMAPE über Schiebefenster, Intervallabdeckung, Merkmalsdrift (PSI), Rücklaufverzögerung, SLA-Erzeugung.
Alertas: Anstieg des Fehlers> Schwelle, unkalibrierte Intervalle, Zerstörung der Saisonalität.
Fail-safe: Degradierung → Rollback zu Seasonal Naive/ETS; Freeze-Modelle in Feiertagsspitzen.
Hysterese: Unterschiedliche Ein-/Ausschaltschwellen der „Promo-Regressoren“, um nicht zu „blinken“.
11) Besonderheiten der Produkt- und iGaming-KPIs (Beispielkarte)
Verkehr/Aktivität: DAU/WAU/MAU, unter Berücksichtigung der Spieltage/Spielfreigaben.
Monetarisierung: GGR/Net, Einlagen, ARPU/ARPPU - starke Saisonalität „Abend/Wochenende/Feiertage“.
Halten: D1/D7/D30 - es ist besser, als Wahrscheinlichkeit (Logit) mit einem Kalender vorherzusagen.
Risiken: Chargeback-Rate (intermittierend), RG-Indikatoren (Richtlinien/Feiertage), Anti-Fraud-Signale.
Operationen: Latenz p95/p99, Transaktionsfehler - kompatibel mit Anomalien/kausalen Einflüssen von Releases.
12) Artefaktmuster
A. Datenblatt zur KPI-Prognose
KPI/Code: 'GGR _ EUR' (Formelversion)
Horizont/Schritt: 8 Wochen, Tag
Hierarchie: brend→strana→platforma
Regressoren: 'promo _ spend', 'fixtures _ flag', 'holiday', 'fx _ rate'
Modell: 'TFT _ v4' (q10/q50/q90) + MinT-Rückgewinnung
Metriken: WAPE (abs. target ≤ 8%), Coverage 90% -Intervall ≥ 85%
SLO: Erzeugung ≤ 10 Minuten nach 06:00 Uhr; Datenlag ≤ 1 h
Eigentümer: Monetization Analytics; Revisionsdatum: 2025-10-15
B. Entscheidungsfertiger Bericht (Skelett)
Headline: „GGR: Prognose 8 Wochen, q10/q50/q90“
Schlüssel: Risiko einer Unterschwellung in Woche 3 22% (ES = - € X)
Treiber: + Wochenende Saisonalität, + Promo-Effekt, − FX
Empfehlungen: Budget um risikoarme Wochen verschieben, Limits für A/B-Kanäle anheben
C. Pseudo-Pipelinecode (flüchtig)
python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train) # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))
13) Häufige Fehler und Anti-Muster
MAPE bei Nullen: Verwenden Sie WAPE/sMAPE.
Durchschnitt der Mittelwerte: Aggregieren Sie die Zähler/Nenner separat.
Ignorieren Sie Feiertage/Veröffentlichungen: Fügen Sie Regressoren und einen „Nachgeschmack“ des Datums hinzu.
Likes: Fichi mit zukünftigen Informationen (Target Leakage).
Zu „intelligente“ Modelle ohne Base-Line: Gewinnen Sie zuerst die Seasonal Naive.
Nicht kalibrierte Intervalle: „schön, aber leer“ - überprüfen Sie die Abdeckung.
Inkonsistenz der Hierarchien: Ohne Reconciliation bröckelt der Gesamtplan.
Fehlendes Fail-Safe: In der Hochphase der Ferien „hängt“ das Modell, die Pläne bröckeln.
14) Überwachung in der Produktion
Qualität: WAPE Rolling, Pinball durch Quantile, Abdeckung 80/95%.
Stabilität: PSI durch Schlüsselmerkmale, saisonale Drift.
Operationen: Generierungszeit, Datenlag,% Folbacks.
Alerta: Regel „3 σ“ auf Fehler, Verletzung von SLO, Uneinigkeit von Hierarchien.
Runybook: Freeze-Modus, Ausschalten von „lauten“ Regressoren, Force-Overdrive.
15) Checkliste vor Veröffentlichung
- KPI definiert und versioniert (Semantic Layer)
- Kalender/Feiertage/Regressoren abgestimmt und getestet
- Baselines (Naive/Seasonal) im Backtesting besiegt
- Metriken (WAPE/Pinball) und Zielschwellen ausgewählt
- Die Intervalle sind kalibriert; Szenarien „Pessimist/Basis/Optimist“ gesammelt
- Hierarchien sind konsistent (MinT/Top-Down)
- MLOps: Trainingsplan, Überwachung, Alerts, Fail-Safe
- Dokumentation: Prognosepass, SQL/fiche-Rezepte, Runybook der Vorfälle
Summe
KPI-Vorhersage ist eine Architektur der Lösungen: klare Definitionen, reichhaltige Kalender und Regressoren, ehrliche Baselines, probabilistische Vorhersagen, hierarchische Anpassung, stabile MLOps und Szenarioplanung. Eine solche Gliederung liefert plausible Erwartungen, beherrschbare Risiken und „entscheidungsreife“ Berichte, die Planung, Marketing, Betrieb und Compliance direkt speisen.