Predicción de KPI
Predicción de KPI
La predicción de KPI no es una «adivinación de gráficos», sino un bucle controlado: datos correctos → un modelo adecuado de → de escenarios e interpretación → monitoreo operativo. A continuación, una lista de comprobación del sistema y una arquitectura que escalan desde series simples hasta predicciones de cartera, jerárquicas y probabilísticas.
1) Establecer una tarea
¿Qué pronosticamos? nivel, delta, cuantil, intervalo, evento (spike).
Horizonte/paso: horas/días/semanas/meses; una ventana rolling para el control a corto plazo.
Unidad: producto/marca/país/plataforma/canal.
Contexto empresarial: apalancamiento controlado (promociones, precios, lanzamientos) y restricciones (SLA, RG/cumplimiento).
Valores y riesgos: valor de la pluma/subprognosis, penalización por alertas falsas.
2) Datos y preparación
Grano y calendario: calendario único (días festivos/fines de semana/días salariales), hora local (vistas UTC + locales).
Unidades y consistencia: DAU/WAU/MAU, GGR/Net, ARPPU, retención (D7/D30), conversiones de embudo, latency p95 - almacenar como escaparates separados con fórmulas explícitas.
Regresiones (X): promociones/bonificaciones, campañas, cambios de precios, lanzamientos de contenido, eventos deportivos, tipos de cambio, clima (si es relevante).
Anomalías y omisiones: etiquetamos, no quitamos ciegamente; para eventos - banderas «one-off».
Estabilidad de los circuitos: los puntos de cambio de las versiones de producto/medición se fijan como eventos.
3) Tipos de KPI y características de modelado
Volúmenes aditivos (ingresos, depósitos): ETS/ARIMA/GBM/Temporal-NN funcionan bien.
Participaciones y conversiones: reglas de logit, modelos binomiales beta, regresión con limitaciones [0,1].
Coeficientes y relaciones (ARPPU): modelamos el numerador y el denominador por separado, luego la composición.
Series interpretativas (eventos raros, chargeback): Croston/SBA/TSB, enfoques zero-inflados.
Jerarquías (strana→brend→kanal): reconciliation: Bottom-Up, Top-Down, MinT.
KPI compuestos (por ejemplo, GGR): desagregar los controladores: tráfico × conversión × frecuencia × cheque medio.
4) Modelos: de básico a avanzado
Baizline: Naive, Seasonal Naive, Drift - son necesarios para una evaluación honesta.
Clásicos de las filas: ETS/ARIMA/SARIMA; Prophet para temporadas rápidas y vacaciones.
Regresiones: ARIMAX/ETS + X, regresiones dinámicas, TBATS para estacionalidades múltiples.
Boosting degradado/tabla NN: LightGBM/XGBoost/NatNet con fichas, estadísticas de ventanas, calendario y promociones.
Temporal NN: N-Beats, TFT (Temporal Fusion Transformer) es para multi-serie y rico X.
Probabilística: regresión cuantil (pinball loss), Gaussian/Student-t, forests quantile/GBM.
Causalidad y escenarios: DiD/SC para evaluar el efecto de la promoción; uplift para planificar «qué sucederá si estamos habilitados».
5) Descomposición y signos
T + S + R: tendencia + estacionalidad (día de la semana/mes/hora) + resto.
Lags y ventanas: 'y _ {t-1.. t-28}', medio móvil/std, exp. suavizado; «colas de fiesta».
Categóricos: país/canal/OS como embeddings/one-hot.
Eventos: lanzamientos/promociones/pancartas - binarias/intensidades.
Control Leakage: sólo información «del pasado».
6) Evaluación y retroalimentación
Splits: rolling/expanding origin; bloqueamos la estacionalidad (múltiples semanas/meses).
Métricas de nivel: MAE, RMSE, MAPE/sMAPE, WAPE (más fiable en ceros).
Métricas probabilísticas: pinball loss (q = 0. 1/0. 5/0. 9), CRPS, calibración de intervalos (coverage, SHARP).
Métricas de eventos/spikes: precision/recall por detector de «eyección».
Regla Beisline: el modelo debe ganar contra Seasonal Naive.
Estabilidad: variaciones de errores por segmentos/vacaciones; fuera de tiempo (últimas semanas N).
7) Predicción jerárquica y armonización
Bottom-Up: sumamos «abajo»; simple, pero ruidoso.
Top-Down: Distribuimos en cuotas históricas.
MinT (reconciliación óptima): minimiza la covarianza de errores - el mejor compromiso con un rico «abajo».
Práctica: enseñamos modelos básicos en cada nivel, luego acordamos.
8) Predicciones probabilísticas e interpretación
Cuantili: q10/q50/q90 → planificación «pesimista/base/optimista».
Intervalos: cobertura objetivo (por ejemplo, 80 %/95%); verificamos la calibración.
Costo del riesgo: Planifique de acuerdo con el shortfall de VaR/expected condicional para KPI con pérdidas asimétricas (la infravivienda de la demanda es más costosa que la sobreprotección, y viceversa).
9) Simulación de escenarios
Escenarios exógenos: «sin promo/s promo», «tasa ± 10%», «final de fútbol».
What-if: cambiar X (intensidad de las campañas, límites, precios) → pronóstico de KPI e intervalos de confianza.
Plan-hecho: puente (puente) factores: contribución de las estaciones, promo, precios, tendencia, shock/incidente.
10) Circuito operativo y MLOps
Frecuencia de readiestramiento: KPI a corto plazo - diario/semanal; mensual - T + 1/T + 3.
Capas/artefactos: fichastor (paridad online/offline), registro de modelos, versiones de datos/fórmulas KPI.
Monitoreo: WAPE/SMAPE por ventana deslizante, recubrimiento de intervalos, derivación de rasgos (PSI), retención de feeds, generación de SLA.
Alertas: estallido de error> umbrales, intervalos no calibrados, destrucción de estacionalidad.
Fail-safe: degradación → retroceso a Seasonal Naive/ETS; modelos freeze en picos festivos.
Histéresis: diferentes umbrales de encendido/apagado de los «regresores promocionales» para no «parpadear».
11) Especificidad del producto e iGaming-KPI (mapa aproximado)
Tráfico/actividad: DAU/WAU/MAU, teniendo en cuenta los partidos-días/lanzamientos de los juegos.
Monetización: GGR/Net, depósitos, ARPU/ARPPU - fuerte estacionalidad «tarde/fin de semana/vacaciones».
Retención: D1/D7/D30 - predecir mejor como probabilidad (logit) con el calendario.
Riesgos: tasa de chargeback (intermitente), indicadores RG (políticas/vacaciones), señales antifraude.
Operaciones: latency p95/p99, errores de transacción - compatible con anomalías/efectos causales de las versiones.
12) Patrones de artefactos
A. Pasaporte de pronóstico de KPI
KPI/código: 'GGR _ EUR' (versión de fórmula)
Horizonte/paso: 8 semanas, día
Jerarquía: brend→strana→platforma
Regresiones: 'promo _ spend', 'fixtures _ flag', 'holiday', 'fx _ rate'
Modelo: 'TFT _ v4' (q10/q50/q90) + reconciliación MinT
Métricas: WAPE (abs objetivo ≤ 8%), coverage 90% - entrevista ≥ 85%
SLO: generación ≤ 10 min después de 06:00 lock.; registro de datos ≤ 1 hora
Propietarios: Monetization Analytics; Fecha de la auditoría: 2025-10-15
B. Informe de decisión (esqueleto)
Titular: «GGR: pronóstico de 8 semanas, q10/q50/q90»
Clave: riesgo de infraprognosis en la 3ª semana 22% (ES = - € X)
Controladores: + temporada de fin de semana, + efecto promocional, − FX
Recomendaciones: cambiar el presupuesto por semanas de bajo riesgo, elevar los límites a los canales A/B
C. Pseudo-código paipline (fugaz)
python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train) # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))
13) Errores frecuentes y anti-patrones
MAPE con ceros: utilice WAPE/sMAPE.
Promedios medios: agregue los numeradores/denominadores por separado.
Ignora las vacaciones/lanzamientos: agrega regresiones y «regresión» de fechas.
Looks: fichas con información futura (target leakage).
Modelos demasiado «inteligentes» sin beisline: primero gana Seasonal Naive.
Intervalos no calibrados: «hermosos, pero vacíos» - compruebe el coverage.
Incoherencia de jerarquías: sin reconciliación, el plan general se desmorona.
Falta de fail-safe: en el pico de las vacaciones, el modelo «cuelga», los planes se desploman.
14) Monitoreo en venta
Calidad: WAPE rolling, pinball por cuantiles, coverage 80/95%.
Estabilidad: PSI por signos clave, deriva de la estacionalidad.
Operaciones: tiempo de generación, archivo de datos,% folbacks.
Alertas: regla de «3 σ» sobre error, violación de SLO, desorden de jerarquías.
Rubibuk: modo freeze, desactivación de los regresores «ruidosos», por fuerza.
15) Lista de verificación antes del lanzamiento
- KPI definido y versionado (capa semántica)
- Calendario/vacaciones/regresivos acordados y probados
- Los beislines (Naive/Seasonal) son derrotados en el backtesting
- Métricas seleccionadas (WAPE/pinball) y umbrales de destino
- Intervalos calibrados; escenarios «pesimista/base/optimista» recogidos
- Las jerarquías son consistentes (MinT/Top-Down)
- MLOps: horario de entrenamiento, monitoreo, alertas, fail-safe
- Documentación: pasaporte de pronóstico, SQL/recetas de fichas, incidentes de ruina
Resultado
La predicción de KPI es una arquitectura de soluciones: definiciones claras, calendarios y retrocesos ricos, beislines honestos, predicciones probabilísticas, alineación jerárquica, MLOps estables y planificación de escenarios. Este circuito ofrece expectativas plausibles, riesgos manejables e informes de «decisión-lectura» que alimentan directamente la planificación, el marketing, las operaciones y el cumplimiento.