Vorhersage von KPIs

KPI-Prognose

Bei der KPI-Prognose geht es nicht um „Chart-Raten“, sondern um eine überschaubare Kontur: korrekte Daten → ein adäquates Modell → Szenarien und Interpretation → Betriebsüberwachung. Im Folgenden finden Sie eine System-Checkliste und eine Architektur, die von einfachen Reihen bis hin zu Portfolio-, Hierarchie- und probabilistischen Prognosen skaliert.

1) Aufgabenstellung

Was prognostizieren wir? Ebene, Delta, Quantil, Intervall, Ereignis (Spike).
Horizont/Schritt: Stunden/Tage/Wochen/Monate; Rollfenster zur kurzfristigen Kontrolle.
Einheit: Produkt/Marke/Land/Plattform/Kanal.
Geschäftskontext: steuerbare Hebelwirkung (Promo, Preise, Freigaben) und Einschränkungen (SLA, RG/Compliance).
Werte und Risiken: Kosten für Pere/Unterprognose, Strafe für falsche Warnungen.

2) Daten und Vorbereitung

Getreide und Kalender: Einheitlicher Kalender (Feiertage/Wochenenden/Gehaltstage), lokale Zeit (UTC + lokale Ansichten).
Aggregate und Konsistenz: DAU/WAU/MAU, GGR/Net, ARPPU, Retention (D7/D30), Trichterumbauten, Latency p95 - als separate Vitrinen mit expliziten Formeln aufbewahren.
Regressoren (X): Promo/Boni, Kampagnen, Preisänderungen, Content Releases, Sportveranstaltungen, Wechselkurse, Wetter (wenn relevant).
Anomalien und Lücken: markieren, nicht blind entfernen; für Ereignisse: One-Off-Flags.
Schaltungsstabilität: Wir erfassen die Schaltpunkte der Produktversionen/Messungen als Ereignisse.

3) KPI-Typen und Simulationsmerkmale

Additive Volumes (Umsatz, Einlagen): ETS/ARIMA/GBM/Temporal-NN funktionieren gut.
Anteile und Konversionen: Logit-Linien, Beta-Binomialmodelle, Regression mit Einschränkungen [0,1].
Koeffizienten und Verhältnisse (ARPPU): Wir modellieren Zähler und Nenner getrennt, dann die Zusammensetzung.
Intermittierende Reihen (seltene Ereignisse, Chargeback): Croston/SBA/TSB, zero-inflated Ansätze.
Hierarchien (strana→brend→kanal): reconciliation: Bottom-Up, Top-Down, MinT.
Composite-KPIs (z. B. GGR): Disaggregieren von Treibern: Traffic × Conversion × Häufigkeit × durchschnittlicher Check.

4) Modelle: von Grund auf fortgeschritten

Baselines: Naive, Seasonal Naive, Drift - benötigt für eine ehrliche Bewertung.
Klassiker der Reihen: ETS/ARIMA/SARIMA; Prophet für schnelle Jahreszeiten und Feiertage.
Regressoren: ARIMAX/ETS + X, dynamische Regressionen, TBATS für multiple Saisonalitäten.
Gradientenverstärkung/tabellarische NN: LightGBM/XGBoost/TabNet mit Lag-Fich, Fensterstatistiken, Kalender und Promo.
Temporal NN: N-Beats, TFT (Temporal Fusion Transformer) - für Multi-Serien und Rich X.
Probabilistisch: quantile regression (pinball loss), Gaussian/Student-t, quantile forests/GBM.
Kausalität und Szenarien: DiD/SC zur Bewertung der Werbewirkung; uplift für Planung „was passiert, wenn wir einschalten“.

5) Zerlegung und Merkmale

T + S + R: Trend + Saisonalität (Wochentag/Monat/Stunde) + Saldo.
Die Loge und die Fenster: ' y _ {t-1. t-28} ', gleitend mittler/std, den Expunkt Glätten; „Feiertagsschwänze“.
Kategorisch: Land/Kanal/OS als Embedding/one-hot.
Veranstaltungen: Releases/Promotions/Banner - Binär/Intensitäten.
Leakage-Kontrolle: nur Informationen „aus der Vergangenheit“.

6) Bewertung und Backtesting

Splits: rolling/expanding origin; Saisonalität blockieren (Vielfache von Wochen/Monaten).
Füllstandsmetriken: MAE, RMSE, MAPE/sMAPE, WAPE (zuverlässiger bei Nullen).
Wahrscheinlichkeitsmetriken: Pinballverlust (q = 0. 1/0. 5/0. 9), CRPS, Intervallkalibrierung (Abdeckung, SHARP).
Ereignis-/Spike-Metriken: Präzision/Rückruf durch den „Ausreißer“ -Detekt.
Die Baseline-Regel: Das Model muss gegen Seasonal Naive gewinnen.
Stabilität: Fehlervarianzen nach Segment/Urlaub; out-of-time (letzte N Wochen).

7) Hierarchische Prognose und Ausrichtung

Bottom-Up: Wir fassen „unten“ zusammen; einfach, aber laut.
Top-Down: nach historischen Anteilen verteilen.
MinT (optimal reconciliation): Minimiert die Kovarianz von Fehlern - der beste Kompromiss mit einer reichen „Unterseite“.
Praxis: Wir trainieren die Grundmodelle auf jeder Ebene, dann vereinbaren wir.

8) Wahrscheinlichkeitsvorhersagen und Interpretation

Quantili: q10/q50/q90 → Planung „Pessimist/Basis/Optimist“.
Intervalle: Zielabdeckung (z.B. 80 %/95%); Wir überprüfen die Kalibrierung.
Risikokosten: Planen Sie nach bedingtem VaR/Expected Shortfall für KPIs mit asymmetrischen Verlusten (Nachfrageunterschwelligkeit ist teurer als Reprognose und umgekehrt).

9) Szenariomodellierung

Exogene Szenarien: „ohne Promo/mit Promo“, „Kurs ± 10%“, „Fußballfinale“.
What-if: Wir ändern X (Kampagnenintensität, Limits, Preise) → KPI-Prognose und Konfidenzintervalle.
Ist-Plan: Die Brücke der Faktoren: Beitrag der Jahreszeiten, Promo, Preis, Trend, Schock/Vorfall.

10) Betriebsschaltung und MLOps

Häufigkeit der Umschulung: kurzfristige KPIs - täglich/wöchentlich; monatlich - T + 1/T + 3.
Schichten/Artefakte: Fichester (Online-/Offline-Parität), Modellregister, KPI-Daten-/Formelversionen.
Überwachung: WAPE/SMAPE über Schiebefenster, Intervallabdeckung, Merkmalsdrift (PSI), Rücklaufverzögerung, SLA-Erzeugung.
Alertas: Anstieg des Fehlers> Schwelle, unkalibrierte Intervalle, Zerstörung der Saisonalität.
Fail-safe: Degradierung → Rollback zu Seasonal Naive/ETS; Freeze-Modelle in Feiertagsspitzen.
Hysterese: Unterschiedliche Ein-/Ausschaltschwellen der „Promo-Regressoren“, um nicht zu „blinken“.

11) Besonderheiten der Produkt- und iGaming-KPIs (Beispielkarte)

Verkehr/Aktivität: DAU/WAU/MAU, unter Berücksichtigung der Spieltage/Spielfreigaben.
Monetarisierung: GGR/Net, Einlagen, ARPU/ARPPU - starke Saisonalität „Abend/Wochenende/Feiertage“.
Halten: D1/D7/D30 - es ist besser, als Wahrscheinlichkeit (Logit) mit einem Kalender vorherzusagen.
Risiken: Chargeback-Rate (intermittierend), RG-Indikatoren (Richtlinien/Feiertage), Anti-Fraud-Signale.
Operationen: Latenz p95/p99, Transaktionsfehler - kompatibel mit Anomalien/kausalen Einflüssen von Releases.

12) Artefaktmuster

A. Datenblatt zur KPI-Prognose

KPI/Code: 'GGR _ EUR' (Formelversion)

Horizont/Schritt: 8 Wochen, Tag

Hierarchie: brend→strana→platforma

Regressoren: 'promo _ spend', 'fixtures _ flag', 'holiday', 'fx _ rate'

Modell: 'TFT _ v4' (q10/q50/q90) + MinT-Rückgewinnung

Metriken: WAPE (abs. target ≤ 8%), Coverage 90% -Intervall ≥ 85%

SLO: Erzeugung ≤ 10 Minuten nach 06:00 Uhr; Datenlag ≤ 1 h

Eigentümer: Monetization Analytics; Revisionsdatum: 2025-10-15

B. Entscheidungsfertiger Bericht (Skelett)

Headline: „GGR: Prognose 8 Wochen, q10/q50/q90“

Schlüssel: Risiko einer Unterschwellung in Woche 3 22% (ES = - € X)

Treiber: + Wochenende Saisonalität, + Promo-Effekt, − FX

Empfehlungen: Budget um risikoarme Wochen verschieben, Limits für A/B-Kanäle anheben

C. Pseudo-Pipelinecode (flüchtig)

python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train)         # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))

13) Häufige Fehler und Anti-Muster

MAPE bei Nullen: Verwenden Sie WAPE/sMAPE.
Durchschnitt der Mittelwerte: Aggregieren Sie die Zähler/Nenner separat.
Ignorieren Sie Feiertage/Veröffentlichungen: Fügen Sie Regressoren und einen „Nachgeschmack“ des Datums hinzu.
Likes: Fichi mit zukünftigen Informationen (Target Leakage).
Zu „intelligente“ Modelle ohne Base-Line: Gewinnen Sie zuerst die Seasonal Naive.
Nicht kalibrierte Intervalle: „schön, aber leer“ - überprüfen Sie die Abdeckung.
Inkonsistenz der Hierarchien: Ohne Reconciliation bröckelt der Gesamtplan.
Fehlendes Fail-Safe: In der Hochphase der Ferien „hängt“ das Modell, die Pläne bröckeln.

14) Überwachung in der Produktion

Qualität: WAPE Rolling, Pinball durch Quantile, Abdeckung 80/95%.
Stabilität: PSI durch Schlüsselmerkmale, saisonale Drift.
Operationen: Generierungszeit, Datenlag,% Folbacks.
Alerta: Regel „3 σ“ auf Fehler, Verletzung von SLO, Uneinigkeit von Hierarchien.
Runybook: Freeze-Modus, Ausschalten von „lauten“ Regressoren, Force-Overdrive.

15) Checkliste vor Veröffentlichung

KPI definiert und versioniert (Semantic Layer)
Kalender/Feiertage/Regressoren abgestimmt und getestet
Baselines (Naive/Seasonal) im Backtesting besiegt
Metriken (WAPE/Pinball) und Zielschwellen ausgewählt
Die Intervalle sind kalibriert; Szenarien „Pessimist/Basis/Optimist“ gesammelt
Hierarchien sind konsistent (MinT/Top-Down)
MLOps: Trainingsplan, Überwachung, Alerts, Fail-Safe
Dokumentation: Prognosepass, SQL/fiche-Rezepte, Runybook der Vorfälle

Summe

KPI-Vorhersage ist eine Architektur der Lösungen: klare Definitionen, reichhaltige Kalender und Regressoren, ehrliche Baselines, probabilistische Vorhersagen, hierarchische Anpassung, stabile MLOps und Szenarioplanung. Eine solche Gliederung liefert plausible Erwartungen, beherrschbare Risiken und „entscheidungsreife“ Berichte, die Planung, Marketing, Betrieb und Compliance direkt speisen.

Vorhersage von KPIs

KPI-Prognose

B. Entscheidungsfertiger Bericht (Skelett)

C. Pseudo-Pipelinecode (flüchtig)

Summe

Kontakt aufnehmen

Schneller Kontakt

Das Video wird bald aktualisiert

Wir sind derzeit sehr stark ausgelastet