KPI tahmini
KPI tahmini
KPI tahmini "grafiği tahmin etmek'değil, kontrollü bir döngüdür: doğru veriler - yeterli bir model - senaryolar ve yorumlama - operasyonel izleme. Aşağıda basit serilerden portföye, hiyerarşik ve olasılıksal tahminlere kadar ölçeklendirilen bir sistem kontrol listesi ve mimarisi bulunmaktadır.
1) Görev deyimi
Ne öngörüyoruz? Seviye, delta, quantile, aralık, olay (spike).
Ufuk/adım: saat/gün/hafta/ay; Kısa süreli kontrol için yuvarlanan pencereler.
Ünite: Ürün/Marka/Ülke/Platform/Kanal.
İş bağlamı: kontrollü kaldıraçlar (promosyon, fiyatlar, sürümler) ve kısıtlamalar (SLA, RG/uyumluluk).
Değerler ve riskler: yeniden/düşük tahmin maliyeti, yanlış uyarılar için para cezası.
2) Veri ve hazırlık
Tahıl ve takvim: tek takvim (tatiller/hafta sonları/bordro günleri), zaman yerel ayarı (UTC + yerel görünümler).
Agregatlar ve tutarlılık: DAU/WAU/MAU, GGR/Net, ARPPU, tutma (D7/D30), huni dönüşümleri, gecikme p95 - açık formüllerle ayrı vitrinler olarak saklayın.
Regresörler (X): promosyonlar/bonuslar, kampanyalar, fiyat değişiklikleri, içerik sürümleri, spor etkinlikleri, döviz kurları, hava durumu (ilgili ise).
Anormallikler ve ihmaller: etiketliyoruz, körü körüne çıkarmıyoruz; Etkinlikler için -'tek seferlik "bayraklar.
Düzenlerin kararlılığı: Ürün sürümlerinin/boyutlarının değişim noktalarını olaylar olarak kaydediyoruz.
3) KPI türleri ve modelleme özellikleri
Katkı hacimleri (gelir, mevduat): ETS/ARIMA/GBM/Temporal-NN iyi performans gösterir.
Kesirler ve dönüşümler: logit çizgileri, beta-binom modelleri, sınırlı regresyon [0,1].
Katsayılar ve oranlar (ARPPU): Pay ve paydayı ayrı ayrı, daha sonra kompozisyonu modelleyin.
Aralıklı seriler (nadir olaylar, ters ibraz): Croston/SBA/TSB, sıfır şişirilmiş yaklaşımlar.
Hiyerarşiler (strana - brend - kanal): uzlaşma: Aşağıdan Yukarıya, Yukarıdan Aşağıya, MinT.
Bileşik KPI'lar (örneğin, GGR): sürücüleri ayrıştırın: trafik × dönüşümü × frekans × ortalama kontrol.
4) Modeller: temelden ileri seviyeye
Temel Çizgiler: Naif, Mevsimsel Naif, Sürüklenme - dürüst bir değerlendirme için gerekli.
Seri Klasikleri: ETS/ARIMA/SARIMA; Hızlı mevsimsellik ve tatiller için Peygamber.
Regresörler: ARIMAX/ETS + X, dinamik regresyonlar, çoklu mevsimlikler için TBATS.
Degrade artırma/tablo NN: Gecikme özellikleri, pencere istatistikleri, takvim ve promosyon ile LightGBM/XGBoost/TabNet.
Temporal NN: N-Beats, TFT (Temporal Fusion Transformer) - çoklu seri ve zengin X için.
Olasılıksal: kuantil regresyon (langırt kaybı), Gaussian/Student-t, kuantil ormanlar/GBM.
Nedensellik ve senaryolar: Promosyon etkisini değerlendirmek için DiD/SC; "Dahil edersek ne olacağını" planlamak için yükseltin.
5) Ayrışma ve işaretler
T + S + R: trend + mevsimsellik (haftanın/ayın/saatin günü) + denge.
Gecikmeler ve pencereler:'y _ {t-1.. t-28} ', hareketli ortalamalar/std, ex. smoothing; "Tatil kuyrukları".
Kategorik: embedding/one-hot olarak ülke/kanal/OS.
Etkinlikler: Bültenler/Promosyonlar/Afişler - İkili/Yoğunluklar.
Sızıntı kontrolü: sadece "geçmişten" gelen bilgiler.
6) Puanlama ve geri test etme
Bölünmeler: orijini yuvarlama/genişletme; Mevsimselliği engelliyoruz (birkaç hafta/ay).
Seviye metrikleri: MAE, RMSE, MAPE/sMAPE, WAPE (sıfırlarda daha güvenilir).
Olasılıksal metrikler: Langırt kaybı (q = 0. 1/0. 5/0. 9), CRPS, aralık kalibrasyonu (kapsama, SHARP).
Olay/spike metrikleri: "ejeksiyon" dedektöründe hassasiyet/hatırlama.
Temel kural: model Seasonal Naive'i geçmelidir.
Kararlılık: segmente/tatile göre hata farklılıkları; Zaman dışı (son N hafta).
7) Hiyerarşik tahmin ve uzlaşma
Aşağıdan Yukarıya: "Alt'ı özetleyin; basit ama gürültülü.
Top-Down: Tarihsel paylaşımlar üzerine yayılır.
MinT (optimal uzlaşma): hata kovaryansını en aza indirir - zengin bir taban ile en iyi uzlaşma.
Uygulama: Her seviyede temel modelleri eğitiyoruz, sonra anlaşıyoruz.
8) Olasılıksal tahminler ve yorumlama
Quantiles: Q10/q50/q90 - planlama "kötümser/temel/iyimser".
Aralıklar: hedef kapsama alanı (örn. 80 %/95%); Kalibrasyonu kontrol ediyorum.
Risk maliyeti: Asimetrik kayıplı KPI'lar için koşullu VaR/beklenen eksikliğe göre plan yapın (talep tahmini tahmin edilenden daha pahalıdır ve bunun tersi de geçerlidir).
9) Senaryo modelleme
Dışsal senaryolar: "promo/s promo yok", "kurs ± %10", "futbol finali".
What-if: değişim X (kampanya yoğunluğu, limitler, fiyatlar) - KPI tahmini ve güven aralıkları.
Plan-gerçek: köprü faktörleri: mevsimlerin katkısı, promosyon, fiyatlar, trend, şok/olay.
10) Üretim döngüsü ve MLOps
Yeniden eğitim sıklığı: kısa süreli KPI'lar - günlük/haftalık; Aylık - T + 1/T + 3.
Katmanlar/eserler: fichestor (çevrimiçi/çevrimdışı eşlik), model kaydı, KPI veri/formül sürümleri.
İzleme: WAPE/SMAPE kayar pencere, aralık kapsamı, özellik kayması (PSI), besleme gecikmesi, SLA üretimi.
Uyarılar: hata spike> eşik, kalibre edilmemiş aralıklar, mevsimsellik dökümü.
Fail-safe: degradation - Seasonal Naive/ETS'ye geri dönüş; Modelleri tatil zirvelerine dondurun.
Histerezis: "Yanıp sönmeyi" önlemek için "promo regresörleri'nin farklı açma/kapama eşikleri.
11) Ürün ve iGaming-KPI'nın özgüllüğü (yaklaşık harita)
Trafik/etkinlik: Maç günleri/oyun sürümleri dahil olmak üzere DAU/WAU/MAU.
Para kazanma: GGR/Net, mevduat, ARPU/ARPPU - güçlü akşam/hafta sonu/tatil mevsimsellik.
Tutma: D1/D7/D30 - bir takvim ile bir olasılık (logit) olarak tahmin etmek daha iyidir.
Riskler: Ters ibraz oranı (aralıklı), RG göstergeleri (politikalar/tatiller), dolandırıcılık karşıtı sinyaller.
İşlemler: gecikme p95/p99, işlem hataları - anormallikler/sürümlerin nedensel etkileri ile uyumludur.
12) Eser desenleri
A. KPI Tahmin Pasaportu
KPI/Kod: 'GGR _ EUR' (formül sürümü)
Ufuk/adım: 8 hafta, gün
Hiyerarşi: brend ^ strana ^ platform
Gerileyiciler: 'promo _ spend', 'fikstür _ flag', 'holiday', 'fx _ rate'
Model: 'TFT _ v4' (q10/q50/q90) + MinT mutabakatı
Metrikler: WAPE (mutlak hedef ≤ %8), kapsama %90 - aralık ≥ %85
SLO: 06:00'dan sonra 10 dakika ≤ nesil; Veri günlüğü ≤ 1 saat
Sahipler: Para Kazanma Analitiği; Revizyon tarihi: 2025-10-15
B. Karara hazır rapor (iskelet)
Başlık: "GGR: Tahmin 8 hafta, q10/q50/q90"
Anahtar: 3 22%. Haftada düşük prognoz riski (ES = - € X)
Sürücüler: + hafta sonu mevsimsellik, + promosyon etkisi, FX −
Öneriler: Düşük riskli haftalar için bütçeyi değiştirmek, A/B kanallarındaki limitleri yükseltmek
C. Boru hattının sözde kodu (geçici)
python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train) # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))
13) Sık hatalar ve anti-desenler
Sıfırlarda MAPE: WAPE/sMAPE kullanın.
Ortalama: Sayıları/paydaları ayrı ayrı toplamak.
Tatilleri/sürümleri görmezden gelin: Gerileyiciler ve "aftertaste" tarihleri ekleyin.
Yüzler: Gelecekteki bilgilere sahip özellikler (hedef sızıntısı).
Taban çizgisi olmayan çok "akıllı" modeller: ilk yenilgi Seasonal Naive.
Kalibre edilmemiş aralıklar: "güzel ama boş" - kapsama alanını kontrol edin.
Hiyerarşi tutarsızlığı: Uzlaşma olmadan, genel plan dağılır.
Arıza güvenliği eksikliği: Tatillerin zirvesinde, model "asılı", planlar çöküyor.
14) Satışlarda izleme
Kalite: WAPE haddeleme, kuantüle göre langırt, kapsama %80/95.
Kararlılık: Temel niteliklere göre PSI, mevsimsellik kayması.
İşlemler: üretim süresi, veri gecikmesi, geri dönüşlerin %'si.
Uyarılar: Hata, SLO ihlali, hiyerarşi bozulmasında "3 σ" kuralı.
Runibook: donma modu, "gürültülü" regresörleri kapatma, aşırı zorlama.
15) Yayın öncesi kontrol listesi
- KPI tanımlı ve sürümlü (semantik katman)
- Takvim/tatiller/gerileyiciler hizalanmış ve test edilmiştir
- Baselines (Naive/Seasonal) backtesting tarafından yenildi
- Seçilen metrikler (WAPE/langırt) ve hedef eşikleri
- Aralıklar kalibre edilir; Toplanan kötümser/temel/iyimser senaryolar
- Hiyerarşiler katılıyorum (MinT/Top-Down)
- MLOps: egzersiz programı, izleme, uyarılar, güvenli
- Belgeler: tahmini pasaport, SQL/özellik tarifleri, olay runibook
Toplam
KPI tahmini bir çözüm mimarisidir: açık tanımlar, zengin takvim ve gerileyiciler, dürüst temel çizgiler, olasılıksal tahminler, hiyerarşik hizalama, istikrarlı MLOps ve senaryo planlama. Böyle bir taslak, makul beklentiler, yönetilebilir riskler ve planlama, pazarlama, operasyonlar ve uyumluluğu doğrudan besleyen "karara hazır" raporlar sağlar.