Previziuni KPI
Prognoza KPI
Prognoza KPI nu este „ghicirea graficului”, ci o buclă controlată: date corecte → un model adecvat → scenarii și interpretare → monitorizare operațională. Mai jos este o listă de verificare a sistemului și o arhitectură care scalează de la serii simple la portofolii, previziuni ierarhice și probabilistice.
1) Declarație de sarcină
Ce previzionăm? nivel, delta, cantitate, interval, eveniment (spike).
Orizont/pas: ore/zile/săptămâni/luni; ferestre de rulare pentru control pe termen scurt.
Unitate: Produs/Marcă/Țară/Platformă/Canal.
Context de afaceri: pârghii controlate (promo, prețuri, versiuni) și restricții (SLA, RG/conformitate).
Valori și riscuri: costul re/sub-prognozei, amendă pentru alerte false.
2) Date și pregătire
Cereale și calendar: calendar unic (sărbători/weekend/zile de salarizare), ora locală (UTC + vederi locale).
Agregate și consistență: DA/WAU/MAU, GGR/Net, ARPPU, retenție (D7/D30), conversii de pâlnie, latență p95 - stocați ca vitrine separate cu formule explicite.
Regresori (X): promoții/bonusuri, campanii, modificări de preț, comunicate de conținut, evenimente sportive, rate de schimb, vreme (dacă este cazul).
Anomalii și omisiuni: etichetăm, nu îndepărtăm orbește; pentru evenimente - steaguri „one-off”.
Stabilitatea schemelor: înregistrăm punctele de schimbare ale versiunilor/dimensiunilor produselor ca evenimente.
3) Tipuri KPI și caracteristici de modelare
Volumele aditive (venituri, depozite): ETS/ARIMA/GBM/Temporal-NN funcționează bine.
Fracții și conversii: linii logit, modele beta-binomiale, regresie limitată [0,1].
Coeficienți și raporturi (ARPPU): modelați numărătorul și numitorul separat, apoi compoziția.
Serii intermitente (evenimente rare, chargeback): Croston/SBA/TSB, abordări zero-umflate.
Ierarhii (strana→brend→kanal): reconciliere: Bottom-Up, Top-Down, MinT.
KPI-uri compozite (de exemplu, GGR): drivere dezagregate: trafic × conversie × frecvență × verificare medie.
4) Modele: de la bază la avansat
Linii de bază: Naiv, Sezonier Naive, Drift - necesare pentru o evaluare onestă.
Seria Clasice: ETS/ARIMA/SARIMA; Profet pentru sezonalitate rapidă și sărbători.
Regresoare: ARIMAX/ETS + X, regresii dinamice, TBATS pentru mai multe sezonalități.
Creșterea gradientului/NN tabular: LightGBM/XGBoost/TabNet cu caracteristici de lag, statistici de ferestre, calendar și promo.
Temporal NN: N-Beats, TFT (Transformator de fuziune temporală) - pentru mai multe serii și bogat X.
Probabilistic: regresie cantitate (pierdere pinball), gaussian/student-t, cantitate păduri/GBM.
Cauzalitate și scenarii: DiD/SC pentru evaluarea efectului promoțional; ridicați pentru a programa „ce se întâmplă dacă includem”.
5) Descompunerea și semnele
T + S + R: tendință + sezonalitate (ziua săptămânii/lunii/orei) + echilibru.
Lag-uri și ferestre: 'y _ {t-1.. t-28} ', medii în mișcare/std, exp. netezire; „cozi de sărbători”.
Categoric: tara/canal/sistem de operare ca embeddings/one-hot.
Evenimente: Lansari/Promotii/Bannere - Binare/Intensitati.
Controlul scurgerilor: numai informații „din trecut”.
6) Scoring și backtesting
Divizare: rulare/extindere origine; blocăm sezonalitatea (mai multe săptămâni/luni).
Valori de nivel: MAE, RMSE, MAPE/sMAPE, WAPE (mai fiabile la zero).
Metrica probabilistică: pierderea pinball (q = 0. 1/0. 5/0. 9), CRPS, calibrarea intervalului (acoperire, SHARP).
Măsurători eveniment/vârf: precizie/rechemare pe detectorul de „ejecție”.
Regula de bază: modelul trebuie să bată sezonieri naivi.
Stabilitate: variații de eroare pe segment/vacanță; out-of-time (ultimele N săptămâni).
7) Prognoză ierarhică și reconciliere
Bottom-Up: rezumați „partea de jos”; simplu, dar zgomotos.
Sus în jos: Spread peste acțiuni istorice.
MinT (reconciliere optimă): minimizează covarianța erorilor - cel mai bun compromis cu un fund bogat.
Practică: antrenăm modele de bază la fiecare nivel, apoi suntem de acord.
8) Predicții și interpretări probabilistice
Cantități: q10/q50/q90 → planificarea „pesimist/bază/optimist”.
Intervale: acoperire țintă (ex. 80 %/95%); verificarea calibrării.
Costul riscului: planul în funcție de deficitul condiționat VaR/preconizat pentru KPI-uri cu pierderi asimetrice (prognoza cererii este mai scumpă decât cea prognozată și invers).
9) Modelarea scenariilor
Scenarii exogene: „no promo/s promo”, „course ± 10%”, „football final”.
What-if: schimbarea X (intensitatea campaniei, limite, prețuri) → prognoza KPI și intervale de încredere.
Plan-fapt: factori de punte: contribuția sezoanelor, promo, prețuri, tendință, șoc/incident.
10) Bucla de producție și MLOps
Frecvența de recalificare: KPI pe termen scurt - zilnic/săptămânal; lunar - T + 1/T + 3.
Straturi/artefacte: fichestor (paritate online/offline), registru model, versiuni KPI date/formulă.
Monitorizare: fereastră glisantă WAPE/SMAPE, acoperire interval, drift caracteristică (PSI), întârziere alimentare, generare SLA.
Alerte: eroare spike> prag, intervale necalibrate, defalcare sezonalitate.
Fail-safe: degradare → revenire la Seasonal Naive/ETS; modelele înghețate în vârfurile de vacanță.
Histerezis: diferite praguri on/off de „regresori promo” pentru a evita „clipind”.
11) Specificitatea produsului și iGaming-KPI (hartă aproximativă)
Trafic/activitate: DA/WAU/MAU, inclusiv zile de meci/lansări de joc.
Monetizare: GGR/Net, depozite, ARPU/ARPPU - sezon puternic de seară/weekend/vacanță.
Retenție: D1/D7/D30 - este mai bine să preziceți ca probabilitate (logit) cu un calendar.
Riscuri: rata de chargeback (intermitent), indicatori RG (politici/sărbători), semnale antifraudă.
Operațiuni: latență p95/p99, erori de tranzacție - compatibile cu anomalii/influențe cauzale ale versiunilor.
12) Modele artefact
A. Pașaport prognozat KPI
KPI/Cod: 'GGR _ EUR' (versiune formulă)
Orizont/pas: 8 săptămâni, zi
Ierarhie: brend→strana→platforma
Regresori: 'promo _ cheltui', 'fixtures _ flag', 'holiday', 'fx _ ratee'
Model: 'TFT _ v4' (q10/q50/q90) + reconciliere MinT
Valori: WAPE (țintă absolută ≤ 8%), acoperire 90% - interval ≥ 85%
SLO: generație ≤ 10 min după ora 06:00; jurnalul de date ≤ 1 oră
Proprietari: Monetization Analytics; data revizuirii: 2025-10-15
B. Raport gata de decizie (schelet)
Titlu: „RGG: Prognoza 8 săptămâni, q10/q50/q90”
Cheie: risc de subprognostic în săptămâna 3 22% (ES = - € X)
Șoferi: + sezonalitate week-end, + efect promoțional, FX −
Recomandări: transferați bugetul pentru săptămâni cu risc scăzut, ridicați limitele pe canalele A/B
C. Pseudo-codul conductei (tranzitoriu)
python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train) # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))
13) Erori frecvente și anti-modele
MAPE la zero: utilizați WAPE/sMAPE.
Mijloace medii: numărători/numitori agregaţi separat.
Ignorați sărbătorile/versiunile: Adăugați regresoare și datele „aftertaste”.
Fețe: caracteristici cu informații viitoare (scurgere țintă).
Modele prea „inteligente” fără referință: prima înfrângere sezonieră naivă.
Intervale necalibrate: „frumos, dar gol” - verifica acoperirea.
Inconsecvența ierarhică: Fără reconciliere, planul general este împrăștiat.
Lipsa siguranței: la vârful sărbătorilor, modelul „atârnă”, planurile se prăbușesc.
14) Monitorizarea vânzărilor
Calitate: laminare WAPE, pinball cu cantitate, acoperire 80/95%.
Stabilitate: PSI după atribute cheie, derivă de sezonalitate.
Operațiuni: timp de generare, decalaj de date,% din folback-uri.
Alerte: regula „3 σ” privind eroarea, încălcarea SLO, defalcarea ierarhiei.
Runibook: modul congela, oprirea „zgomotos” regresoare, forța-overdone.
15) Lista de verificare pre-eliberare
- KPI definit și versionat (strat semantic)
- Calendar/sărbători/regresoare aliniate și testate
- Baselines (Naive/Sezonier) învins de backtesting
- Măsurători selectate (WAPE/pinball) și praguri țintă
- Intervalele sunt calibrate; scenarii pesimiste/de bază/optimiste colectate
- Ierarhiile sunt de acord (MinT/Top-Down)
- MLOps: program de antrenament, monitorizare, alerte, fail-safe
- Documentație: pașaport prognoză, rețete SQL/caracteristică, runibook incident
Total
Prognoza KPI este o arhitectură de soluție: definiții clare, calendar bogat și regresoare, linii de bază oneste, predicții probabilistice, aliniere ierarhică, MLOps stabile și planificarea scenariilor. O astfel de schiță oferă așteptări plauzibile, riscuri care pot fi gestionate și rapoarte „gata de decizie” care alimentează direct planificarea, marketingul, operațiunile și conformitatea.