Prévision du revenu

Le revenu est le résultat de l'interaction de nombreux facteurs : offre de contenu/produit, comportement des utilisateurs, prix et promotions, conditions extérieures (vacances, sports, taux de change, changements réglementaires). Une prévision robuste n'est pas un seul « modèle », mais une boucle gérée : définitions → données → modèle → scénarios → exploitation → rapprochement → amélioration.

1) Définition de la tâche

Ce que nous prévoyons : recettes brutes (GGR), nettes (Net), recettes après bonus/commissions, en monnaie de base et en monnaie locale.
Horizon/étape : journalière/hebdomadaire/mensuelle ; pour la planification des écarts de trésorerie - journaliers, pour le budget - mensuels/trimestriels.
Unité de prévision : marque × pays × plate-forme × canal (minimum) suivi d'une harmonisation hiérarchique.
Objectif : budgétisation, achat de trafic/contenu, limites d'infrastructure, covenants financiers.
Prix de l'erreur : sous-prognose (demande manquée/sous-demande) vs prognose (achats excédentaires/surexploitations).

2) Définition et alignement avec la boucle financière

Formules : GGR, Net, déductions (taxes, bonus, commissions aphyliates) - versioné dans la couche sémantique.
Calendrier : Stockage UTC + vues locales ; jours fériés/jours de salaire ; horaires sportifs (si pertinents).
Politique FX : source des cours, date de conversion (date de l'opération/cours moyen de la période), monnaie unique de base.
Rapprochement : procédure obligatoire de reconnaissance avec comptabilité (divergence dans les limites autorisées).

3) Décomposition des revenus sur les conducteurs

Formule de base :

[
\ text {Revenu} =\text {Trafic }\times\text {Conversion }\times\text {Fréquence }\times\text {Moyen chèque}
]

Trafic/actif : utilisateurs/sessions/entrées.
Conversion : part des payeurs, CR dans les événements ciblés.
Fréquence : nombre de transactions par payeur/période.
Chèque moyen : montant moyen de la transaction (prendre en compte les bonus/rabais).

Il est recommandé de prévoir les conducteurs séparément, puis d'assembler le composite pour voir la contribution des facteurs (pont plan-fait).

4) Données et régresseurs

Séries chronologiques : agrégats journaliers/hebdomadaires par unité de prévision.

Régresseurs X :

promotions/bonus (intensité, type, couverture) ;
dépenses de marketing/impressions/clics ;
les événements de contenu (sorties, tournois, grands matchs) ;
les variations de prix/limites/catalogue ;
FX/inflation, météo/calendrier (si affecté) ;
événements réglementaires (restrictions/décongélations).
Anomalies/one-off : marquer, ne pas « lisser » silencieusement.
Aucun visage : n'utiliser que les informations disponibles au moment de la prévision.

5) Modélisation

5. 1 Basilines

Naive/Seasonal Naive/Drift - sont obligatoires pour une évaluation honnête.

5. 2 rangées classiques

ETS/ARIMA/SARIMA, TBATS (saisons multiples), Prophet (démarrage rapide avec vacances).

5. 3 Régresseurs

ARIMAX/ETS + X, régression dynamique avec calendrier et promo/FX.

5. 4 Multi-syrien/tabulaire

LightGBM/XGBoost/linéaire avec lagas/fenêtres/calendrier ;

Temps NN (TFT, N-Beats) pour les portefeuilles et les longs X.

5. 5 Probabilistes

Régression quantile (pinball), prédiction Student-t/Gaussienne, ensembles de quantiles pour les intervalles (q10/q50/q90).

5. 6 Hiérarchies et alignement

Bottom-Up/Top-Down/MinT (correspondance optimale des erreurs) pour la structure des strana→brend→kanal→platforma.

6) Spécificité des mesures du revenu

Parts/relations (marge, commission) : modélisez le numérateur/dénominateur séparément, puis composez.
Composants intermittents (chargeback, high-roller) : Croston/TSB, zero-inflated, composants séparés avec quantiles.
Cannibalisation : lorsque vous lancez une nouvelle promotion/produit, simulez les débordements entre les segments (modèles multi-flux ou régresseurs limités).
Élasticité par prix/bonus : logging model/causal devis (DiD/SC) pour estimer les coefficients, puis what-if.

7) Évaluation de la qualité et backtesting

Split : rolling/expanding origin avec multiplicité de saisonnalité (semaines/mois).
Métriques de niveau : WAPE/sMAPE (résistant aux zéros), MAE/RMSE.
Probabilités : pinball loss, coverage 80/95 % -intervals.
Stabilité : erreurs par segments/vacances/canaux ; out-of-time.
Règle de base-line : le modèle doit dépasser Seasonal Naive sur les horizons clés.

8) Scénarios et incertitudes

Quantili : q10/q50/q90 → « pessimiste/base/optimiste ».
Scénarios X : « promo sans promo », « FX ± 10 % », « grand événement », « restrictions réglementaires ».
Risque de métaparamètres : tests de résistance pour les variations d'élasticité et de saisonnalité.
Coût du risque : prévoir avec un shortfall conditionnel (la sanction pour la sous-prognose/prognose est asymétrique).

9) Plan-fait et contribution des facteurs (pont à revenu)

Montrez le pont : tendance + saisonnalité + promo + prix/limites + FX + chocs/incidents → déviation finale. Cela renforce la confiance et vous aide à prendre des mesures (ajouter un budget, déplacer une promo, changer de prix).

10) MLOps et fonctionnement

Horaire : prévisions de jour - T + 1 à 06:00 lok. ; semaine - N une fois par semaine ; les mensuels sont T + 1/T + 3.
Artefacts : fichestor (parité en ligne/hors ligne), registre des modèles, versions des formules de revenu.
Surveillance : WAPE/coverage par fenêtre, dérive PSI des caractéristiques, retard des fides, génération SLA.
Alerts : augmentation de l'erreur> seuil, intervalles non calibrés, divergence des hiérarchies.
Fail-safe : retour à ETS/Seasonal Naive ; mode freeze pendant les vacances de pointe.
Hystérésis : différents seuils d'activation/désactivation des régresseurs promotionnels pour ne pas « clignoter ».
Rapprochement : reconciliation quotidienne/hebdomadaire avec rapports financiers.

11) Modèles d'artefacts

A. Passeport de prévision de revenu

KPI: `NET_REVENUE_EUR_v3`

Horizon/étape : 8 semaines/jour

Unités : marque × pays × plate-forme × canal ; reconciliation: MinT

Регрессоры: `promo_spend`, `content_event_flag`, `price_index`, `fx_rate`, `holiday`

Modèles : 'ARIMAX _ v2' + 'LightGBM _ Quantiles _ v4' (ensemble, q10/50/90)

Objectifs : WAPE ≤ 8 % (jour), coverage 90 % -interval ≥ 85 %

SLO : génération ≤ 10 min après 06:00 ; Données ≤ 1 h

Propriétaires : Finance & Growth Analytics ; date de révision, version

B. Rapport de décision-lecture (squelette)

Titre : « Revenu, pronostic 8 semaines : q10/q50/q90 »

Risques : Non prognose dans la semaine 3 - 21 % (shortfall attendu € X- € Y)

Contribution des facteurs : + vacances, + contenu, − FX, retrait − promo

Recommandations : augmenter la promo dans les pays A/B, déplacer l'action, hedge FX

C. Pseudo-code pipline

python
1) load y = load_revenue_series(grain=['brand','country','platform','channel'], step='D')
X = load_regressors(['promo_spend','content_event','price_idx','fx_rate','holiday'])
2) features ds = make_lags(y, lags=[1,7,14,28])
ds = add_rolling_stats(ds, windows=[7,14,28])
ds = join_regressors(ds, X)
3) cv cv = rolling_backtest(ds, folds=6, horizon=28, step=7)
4) models m_baseline = ETS(). fit(ds. train)
m_gbm = LGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
m_arimax = ARIMAX(). fit(ds. train)
5) evaluate & ensemble scores = evaluate([m_baseline,m_gbm,m_arimax], cv, metrics=['WAPE','pinball'])
best = ensemble_quantiles([m_gbm,m_arimax])
6) reconcile & publish f = reconcile_minT(forecast(best), hierarchy=['country','brand','platform','channel'])
publish(f, sla='06:10', owners=['Finance','Growth'])

12) Erreurs fréquentes et anti-modèles

MAPE aux zéros/faibles valeurs : utiliser WAPE/sMAPE.
Moyennes moyennes : agrégez le numérateur/dénominateur plutôt que de calculer la moyenne des pourcentages par segment.
Ignorer le calendrier/contenu/FX : Sans régresseurs, la prévision est « aveugle ».
Visage : fiches du futur ou ajustement post-factuel dans le train.
Incohérence des hiérarchies : les totaux ne convergent pas → appliquez la reconnaissance.
Pas de fail-safe : le modèle « nage » en vacances.
L'absence de sverok : les prévisions ne sont pas collées avec la gestion/comptabilité.

13) Chèque avant la sortie

Les définitions de revenu et les déductions sont harmonisées et inversées
Calendrier/FX/régresseurs connectés et testés
Les Baselins sont vaincus sur le backtesting ; les objectifs de WAPE/coverage ont été atteints
Les intervalles sont calibrés ; scripts « pessimiste/base/optimiste » réunis
Prévision hiérarchique harmonisée (MinT/Top-Down)
MLOps : calendrier, surveillance, alertes, fail-safe, runibook
Mise en place de rapprochements quotidiens/hebdomadaires avec finnadzor/comptabilité
Rapport « decision-ready » avec un pont de facteurs et de recommandations

Résultat

La prévision du revenu est une définition cohérente + décomposition pilote + régresseurs + modèles probabilistes et hiérarchiques + scénarios et intervalles + MLOps disciplinés et rapprochements. Ce circuit transforme la « devination programmée » en un outil de planification budgétaire, de marketing et d'opérations avec un coût de risque compréhensible et des actions transparentes.

Prévision du revenu