Predicción de KPI

La predicción de KPI no es una «adivinación de gráficos», sino un bucle controlado: datos correctos → un modelo adecuado de → de escenarios e interpretación → monitoreo operativo. A continuación, una lista de comprobación del sistema y una arquitectura que escalan desde series simples hasta predicciones de cartera, jerárquicas y probabilísticas.

1) Establecer una tarea

¿Qué pronosticamos? nivel, delta, cuantil, intervalo, evento (spike).
Horizonte/paso: horas/días/semanas/meses; una ventana rolling para el control a corto plazo.
Unidad: producto/marca/país/plataforma/canal.
Contexto empresarial: apalancamiento controlado (promociones, precios, lanzamientos) y restricciones (SLA, RG/cumplimiento).
Valores y riesgos: valor de la pluma/subprognosis, penalización por alertas falsas.

2) Datos y preparación

Grano y calendario: calendario único (días festivos/fines de semana/días salariales), hora local (vistas UTC + locales).
Unidades y consistencia: DAU/WAU/MAU, GGR/Net, ARPPU, retención (D7/D30), conversiones de embudo, latency p95 - almacenar como escaparates separados con fórmulas explícitas.
Regresiones (X): promociones/bonificaciones, campañas, cambios de precios, lanzamientos de contenido, eventos deportivos, tipos de cambio, clima (si es relevante).
Anomalías y omisiones: etiquetamos, no quitamos ciegamente; para eventos - banderas «one-off».
Estabilidad de los circuitos: los puntos de cambio de las versiones de producto/medición se fijan como eventos.

3) Tipos de KPI y características de modelado

Volúmenes aditivos (ingresos, depósitos): ETS/ARIMA/GBM/Temporal-NN funcionan bien.
Participaciones y conversiones: reglas de logit, modelos binomiales beta, regresión con limitaciones [0,1].
Coeficientes y relaciones (ARPPU): modelamos el numerador y el denominador por separado, luego la composición.
Series interpretativas (eventos raros, chargeback): Croston/SBA/TSB, enfoques zero-inflados.
Jerarquías (strana→brend→kanal): reconciliation: Bottom-Up, Top-Down, MinT.
KPI compuestos (por ejemplo, GGR): desagregar los controladores: tráfico × conversión × frecuencia × cheque medio.

4) Modelos: de básico a avanzado

Baizline: Naive, Seasonal Naive, Drift - son necesarios para una evaluación honesta.
Clásicos de las filas: ETS/ARIMA/SARIMA; Prophet para temporadas rápidas y vacaciones.
Regresiones: ARIMAX/ETS + X, regresiones dinámicas, TBATS para estacionalidades múltiples.
Boosting degradado/tabla NN: LightGBM/XGBoost/NatNet con fichas, estadísticas de ventanas, calendario y promociones.
Temporal NN: N-Beats, TFT (Temporal Fusion Transformer) es para multi-serie y rico X.
Probabilística: regresión cuantil (pinball loss), Gaussian/Student-t, forests quantile/GBM.
Causalidad y escenarios: DiD/SC para evaluar el efecto de la promoción; uplift para planificar «qué sucederá si estamos habilitados».

5) Descomposición y signos

T + S + R: tendencia + estacionalidad (día de la semana/mes/hora) + resto.
Lags y ventanas: 'y _ {t-1.. t-28}', medio móvil/std, exp. suavizado; «colas de fiesta».
Categóricos: país/canal/OS como embeddings/one-hot.
Eventos: lanzamientos/promociones/pancartas - binarias/intensidades.
Control Leakage: sólo información «del pasado».

6) Evaluación y retroalimentación

Splits: rolling/expanding origin; bloqueamos la estacionalidad (múltiples semanas/meses).
Métricas de nivel: MAE, RMSE, MAPE/sMAPE, WAPE (más fiable en ceros).
Métricas probabilísticas: pinball loss (q = 0. 1/0. 5/0. 9), CRPS, calibración de intervalos (coverage, SHARP).
Métricas de eventos/spikes: precision/recall por detector de «eyección».
Regla Beisline: el modelo debe ganar contra Seasonal Naive.
Estabilidad: variaciones de errores por segmentos/vacaciones; fuera de tiempo (últimas semanas N).

7) Predicción jerárquica y armonización

Bottom-Up: sumamos «abajo»; simple, pero ruidoso.
Top-Down: Distribuimos en cuotas históricas.
MinT (reconciliación óptima): minimiza la covarianza de errores - el mejor compromiso con un rico «abajo».
Práctica: enseñamos modelos básicos en cada nivel, luego acordamos.

8) Predicciones probabilísticas e interpretación

Cuantili: q10/q50/q90 → planificación «pesimista/base/optimista».
Intervalos: cobertura objetivo (por ejemplo, 80 %/95%); verificamos la calibración.
Costo del riesgo: Planifique de acuerdo con el shortfall de VaR/expected condicional para KPI con pérdidas asimétricas (la infravivienda de la demanda es más costosa que la sobreprotección, y viceversa).

9) Simulación de escenarios

Escenarios exógenos: «sin promo/s promo», «tasa ± 10%», «final de fútbol».
What-if: cambiar X (intensidad de las campañas, límites, precios) → pronóstico de KPI e intervalos de confianza.
Plan-hecho: puente (puente) factores: contribución de las estaciones, promo, precios, tendencia, shock/incidente.

10) Circuito operativo y MLOps

Frecuencia de readiestramiento: KPI a corto plazo - diario/semanal; mensual - T + 1/T + 3.
Capas/artefactos: fichastor (paridad online/offline), registro de modelos, versiones de datos/fórmulas KPI.
Monitoreo: WAPE/SMAPE por ventana deslizante, recubrimiento de intervalos, derivación de rasgos (PSI), retención de feeds, generación de SLA.
Alertas: estallido de error> umbrales, intervalos no calibrados, destrucción de estacionalidad.
Fail-safe: degradación → retroceso a Seasonal Naive/ETS; modelos freeze en picos festivos.
Histéresis: diferentes umbrales de encendido/apagado de los «regresores promocionales» para no «parpadear».

11) Especificidad del producto e iGaming-KPI (mapa aproximado)

Tráfico/actividad: DAU/WAU/MAU, teniendo en cuenta los partidos-días/lanzamientos de los juegos.
Monetización: GGR/Net, depósitos, ARPU/ARPPU - fuerte estacionalidad «tarde/fin de semana/vacaciones».
Retención: D1/D7/D30 - predecir mejor como probabilidad (logit) con el calendario.
Riesgos: tasa de chargeback (intermitente), indicadores RG (políticas/vacaciones), señales antifraude.
Operaciones: latency p95/p99, errores de transacción - compatible con anomalías/efectos causales de las versiones.

12) Patrones de artefactos

A. Pasaporte de pronóstico de KPI

KPI/código: 'GGR _ EUR' (versión de fórmula)

Horizonte/paso: 8 semanas, día

Jerarquía: brend→strana→platforma

Regresiones: 'promo _ spend', 'fixtures _ flag', 'holiday', 'fx _ rate'

Modelo: 'TFT _ v4' (q10/q50/q90) + reconciliación MinT

Métricas: WAPE (abs objetivo ≤ 8%), coverage 90% - entrevista ≥ 85%

SLO: generación ≤ 10 min después de 06:00 lock.; registro de datos ≤ 1 hora

Propietarios: Monetization Analytics; Fecha de la auditoría: 2025-10-15

B. Informe de decisión (esqueleto)

Titular: «GGR: pronóstico de 8 semanas, q10/q50/q90»

Clave: riesgo de infraprognosis en la 3ª semana 22% (ES = - € X)

Controladores: + temporada de fin de semana, + efecto promocional, − FX

Recomendaciones: cambiar el presupuesto por semanas de bajo riesgo, elevar los límites a los canales A/B

C. Pseudo-código paipline (fugaz)

python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train)         # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))

13) Errores frecuentes y anti-patrones

MAPE con ceros: utilice WAPE/sMAPE.
Promedios medios: agregue los numeradores/denominadores por separado.
Ignora las vacaciones/lanzamientos: agrega regresiones y «regresión» de fechas.
Looks: fichas con información futura (target leakage).
Modelos demasiado «inteligentes» sin beisline: primero gana Seasonal Naive.
Intervalos no calibrados: «hermosos, pero vacíos» - compruebe el coverage.
Incoherencia de jerarquías: sin reconciliación, el plan general se desmorona.
Falta de fail-safe: en el pico de las vacaciones, el modelo «cuelga», los planes se desploman.

14) Monitoreo en venta

Calidad: WAPE rolling, pinball por cuantiles, coverage 80/95%.
Estabilidad: PSI por signos clave, deriva de la estacionalidad.
Operaciones: tiempo de generación, archivo de datos,% folbacks.
Alertas: regla de «3 σ» sobre error, violación de SLO, desorden de jerarquías.
Rubibuk: modo freeze, desactivación de los regresores «ruidosos», por fuerza.

15) Lista de verificación antes del lanzamiento

KPI definido y versionado (capa semántica)
Calendario/vacaciones/regresivos acordados y probados
Los beislines (Naive/Seasonal) son derrotados en el backtesting
Métricas seleccionadas (WAPE/pinball) y umbrales de destino
Intervalos calibrados; escenarios «pesimista/base/optimista» recogidos
Las jerarquías son consistentes (MinT/Top-Down)
MLOps: horario de entrenamiento, monitoreo, alertas, fail-safe
Documentación: pasaporte de pronóstico, SQL/recetas de fichas, incidentes de ruina

Resultado

La predicción de KPI es una arquitectura de soluciones: definiciones claras, calendarios y retrocesos ricos, beislines honestos, predicciones probabilísticas, alineación jerárquica, MLOps estables y planificación de escenarios. Este circuito ofrece expectativas plausibles, riesgos manejables e informes de «decisión-lectura» que alimentan directamente la planificación, el marketing, las operaciones y el cumplimiento.

Predicción de KPI