Prédiction KPI

La prévision KPI n'est pas « deviner le graphique », mais une boucle gérée : des données correctes → un modèle adéquat → des scénarios et une interprétation → une surveillance opérationnelle. Ci-dessous, une chèque système et une architecture qui s'étendent des séries simples aux prévisions de portefeuille, hiérarchiques et probabilistes.

1) Définition de la tâche

Que prévoyons-nous ? niveau, delta, quantile, intervalle, événement (spike).
Horizon/étape : heures/jours/semaines/mois ; fenêtres rolling pour le contrôle à court terme.
Unité : produit/marque/pays/plateforme/canal.
Contexte d'affaires : leviers managés (promotions, prix, sorties) et contraintes (SLA, RG/conformité).
Valeurs et risques : coût de la plume/sous-cotisation, amende pour faux alerts.

2) Données et préparation

Grain et calendrier : calendrier unique (jours fériés/week-ends/salaires), heure locale (UTC + représentations locales).
Agrégats et consistance : DAU/WAU/MAU, GGR/Net, ARPPU, rétention (D7/D30), conversions d'entonnoir, p95 latence - stocker comme vitrines individuelles avec des formules explicites.
Régresseurs (X) : promotions/bonus, campagnes, variations des prix, communiqués de contenu, événements sportifs, taux de change, météo (si pertinent).
Anomalies et omissions : on marque, on ne retire pas aveuglément ; pour les événements, les drapeaux « one-off ».
Stabilité des schémas : nous enregistrons les points de remplacement des versions du produit/des mesures comme des événements.

3) Types de KPI et caractéristiques de modélisation

Volumes additifs (chiffre d'affaires, dépôts) : ETS/ARIMA/GBM/Temporal-NN fonctionne bien.
Parts et conversions : règles de logit, modèles bêta-binomiaux, régression avec restrictions [0,1].
Coefficients et relations (ARPPU) : simulons le numérateur et le dénominateur séparément, puis la composition.
Séries intermittentes (événements rares, chargeback) : Croston/SBA/TSB, approches zero-inflatées.
Hiérarchies (strana→brend→kanal) : reconnaissance : Bottom-Up, Top-Down, MinT.
KPI composites (par exemple GGR) : Disagrégez les pilotes : trafic × conversion × fréquence × chèque moyen.

4) Modèles : De base à avancé

Basilines : Naive, Seasonal Naive, Drift - sont nécessaires pour une évaluation honnête.
Série classique : ETS/ARIMA/SARIMA ; Prophet pour les saisons rapides et les vacances.
Régresseurs : ARIMAX/ETS + X, régressions dynamiques, TBATS pour les saisons multiples.
Boosting en gradient/NN tabulaires : LightGBM/XGBoost/TabNet avec tiges, statistiques de fenêtre, calendrier et promo.
NN : N-Beats, TFT (Temporal Fusion Transformer) - pour les multi-séries et les riches X.
Probabilités : régression quantile (pinball loss), Gaussienne/Student-t, forêt quantile/GBM.
Causalité et scénarios : DiD/SC pour évaluer l'effet promo ; uplift pour la planification « ce qui se passera si nous l'activons ».

5) Décomposition et caractéristiques

T + S + R : tendance + saisonnalité (jour de la semaine/mois/heure) + solde.
Lages et fenêtres : 'y _ {t-1.. t-28}', moyenne glissante/std, t'. Lissage ; « queues de vacances ».
Catégorique : pays/canal/OS comme embedding/one-hot.
Événements : Sorties/promotions/bannières - binaires/intenses.
Leakage-control : uniquement des informations « du passé ».

6) Évaluation et backtesting

Split : rolling/expanding origin ; on bloque la saisonnalité (multiples semaines/mois).
Métriques de niveau : MAE, RMSE, MAPE/sMAPE, WAPE (plus fiable pour les zéros).
Métriques probabilistes : pinball loss (q = 0. 1/0. 5/0. 9), CRPS, étalonnage des intervalles (coverage, SHARP).
Métriques d'événements/spikes : precision/recall par le détecteur « éjection ».
Règle Basline : le modèle doit gagner contre Seasonal Naive.
Stabilité : variances d'erreurs par segments/vacances ; out-of-time (dernières N semaines).

7) Prévision hiérarchique et harmonisation

Bottom-Up : résumer « bas » ; simple, mais bruyant.
Top-Down : nous répartissons en parts historiques.
MinT (reconnaissance optimale) : minimise la covariance des erreurs - le meilleur compromis avec un « bas » riche.
Pratique : nous enseignons les modèles de base à chaque niveau, puis nous convenons.

8) Prévisions probabilistes et interprétation

Quantili : q10/q50/q90 → planification « pessimiste/base/optimiste ».
Intervalles : couverture cible (p. ex. 80 %/95 %) ; on vérifie l'étalonnage.
Coût du risque : prévoir un shortfall conditionnel VaR/expected pour les KPI avec des pertes asymétriques (la non-prognose de la demande est plus coûteuse que la surprognose, et vice versa).

9) Simulation de scénarios

Scénarios exogènes : « sans promo/s promo », « taux de change ± 10 % », « finale de football ».
What-if : Nous changeons X (intensité des campagnes, limites, prix) → la prévision KPI et les intervalles de confiance.
Plan-fait : pont (pont) des facteurs : contribution des saisons, promotions, prix, tendance, choc/incident.

10) Circuit d'exploitation et MLOps

Fréquence de réapprentissage : KPI à court terme - quotidien/hebdomadaire ; les mensuels sont T + 1/T + 3.
Couches/artefacts : fichestor (parité en ligne/hors ligne), registre de modèles, versions de données/formules KPI.
Surveillance : WAPE/SMAPE le long de la fenêtre glissante, couverture des intervalles, dérive des caractéristiques (PSI), retard des fides, génération SLA.
Alertes : sursaut d'erreur> seuil, intervalles non calibrés, destruction de la saisonnalité.
Fail-safe : dégradation → retour à Seasonal Naive/ETS ; les modèles freeze aux pics festifs.
Hystérésis : différents seuils d'activation/désactivation des « régresseurs promotionnels » pour ne pas « clignoter ».

11) Spécificités des produits et iGaming-KPI (carte approximative)

Trafic/activité : DAU/WAU/MAU, compte tenu des jours de match/sorties des jeux.
Monétisation : GGR/Net, dépôts, ARPU/ARPPU - forte saisonnalité « soirée/week-end/vacances ».
Rétention : D1/D7/D30 - Il est préférable de prédire comme probabilité (logit) avec un calendrier.
Risques : taux de charge (intermittent), indicateurs RG (politiques/vacances), signaux antifrod.
Opérations : latency p95/p99, erreurs de transaction - compatibles avec les anomalies/influences causales des versions.

12) Modèles d'artefacts

A. Passeport de prévision KPI

KPI/code : 'GGR _ EUR' (version formule)

Horizon/étape : 8 semaines, jour

Hiérarchie : brend→strana→platforma

Régresseurs : 'promo _ spend', 'fixtures _ flag', 'holiday', 'fx _ rate'

Modèle : 'TFT _ v4' (q10/q50/q90) + reconnaissance MinT

Métriques : WAPE (ab. cible ≤ 8 %), coverage 90 % -interval ≥ 85 %

SLO : génération ≤ 10 min après 06:00 lok. ; Données ≤ 1 h

Propriétaires : Monetization Analytics ; date de vérification : 2025-10-15

B. Rapport de décision-lecture (squelette)

Titre : « GGR : pronostic 8 semaines, q10/q50/q90 »

Clé : risque de sous-pronostic à la 3ème semaine 22 % (ES = - € X)

Pilotes : + saison week-end, + effet promo, − FX

Recommandations : Déplacer le budget pour les semaines à faible risque, augmenter les limites pour les canaux A/B

C. Pseudo-code pipline (rapide)

python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train)         # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))

13) Erreurs fréquentes et anti-modèles

MAPE pour les zéros : utilisez WAPE/sMAPE.
Moyennes moyennes : agrégez les nombres/dénominateurs séparément.
Ignorez les vacances/sorties : ajoutez des régresseurs et un « arrière-goût » de la date.
Visage : fiches avec informations futures (target leakage).
Modèles trop « intelligents » sans baseline : d'abord gagner Seasonal Naive.
Intervalles non calibrés : « beaux mais vides » - vérifiez le coverage.
Incohérence des hiérarchies : sans reconciliation, le plan global s'effondre.
Pas de fail-safe : au pic des vacances, le modèle est « accroché », les plans s'effondrent.

14) Surveillance à la vente

Qualité : WAPE rolling, pinball par quantiles, coverage 80/95 %.
Stabilité : PSI par des signes clés, dérive de la saisonnalité.
Opérations : temps de génération, données, % folbacks.
Alertie : règle « 3 σ » sur l'erreur, violation du SLO, discorde des hiérarchies.
Runibook : mode freeze, désactivation des régresseurs « bruyants », forçage.

15) Chèque-liste avant la sortie

KPI défini et inversé (couche sémantique)
Calendrier/vacances/régresseurs harmonisés et testés
Les Basilines (Naive/Seasonal) sont vaincues en backtesting
Paramètres sélectionnés (WAPE/pinball) et seuils cibles
Les intervalles sont calibrés ; scripts « pessimiste/base/optimiste » réunis
Les hiérarchies sont cohérentes (MinT/Top-Down)
MLOps : horaire d'entraînement, surveillance, alertes, fail-safe
Documentation : Fiche de données sur les prévisions, recettes SQL/fiche, incidents runibook

Résultat

La prévision KPI est une architecture de solutions : définitions claires, calendrier et régresseurs riches, baselines honnêtes, prévisions probabilistes, alignement hiérarchique, MLOps stables et planification scénique. Un tel circuit fournit des attentes plausibles, des risques gérables et des rapports « decision-ready » qui alimentent directement la planification, le marketing, les opérations et la conformité.

Prédiction KPI

Prédiction KPI

B. Rapport de décision-lecture (squelette)

C. Pseudo-code pipline (rapide)

Résultat

Prendre contact

Contact rapide

La vidéo sera bientôt mise à jour

Nous sommes actuellement très occupés par des projets