केपीआई पूर्वानुमान

केपीआई पूर्वानुमान "ग्राफ का अनुमान नहीं लगा रहा है", लेकिन एक नियंत्रित लूप: सही डेटा - एक पर्याप्त मॉडल परिदृश्य और व्याख्या - परिचालन निगरानी। नीचे एक सिस्टम चेकलिस्ट और आर्किटेक्चर है जो सरल श्रृंखला से पोर्टफोलियो, पदानुक्रमित और संभाव्य पूर्वानुमान तक तराजू करता है।

1) कार्य विवरण

हम क्या भविष्यवाणी करते हैं? स्तर, डेल्टा, मात्रा, अंतराल, घटना (स्पाइक)।

क्षितिज/चरण: घंटे/दिन/सप्ताह/महीने; अल्पकालिक नियंत्रण के लिए रोलिंग खिड़कियां

इकाई: उत्पाद/ब्रांड/देश/मंच/चैनल।

व्यापार संदर्भ: नियंत्रित लीवर (प्रोमो, कीमतें, रिलीज़) और प्रतिबंध (एसएलए, आरजी/अनुपालन)।

मूल्य और जोखिम: पुन :/अंडर-पूर्वानुमान की लागत, झूठे अलर्ट के लिए जुर्माना।

2) डेटा और तैयारी

अनाज और कैलेंडर: एकल कैलेंडर (छुट्टियां/सप्ताहांत/पेरोल दिन), समय स्थान (UTC + स्थानीय दृश्य)।

समुच्चय और स्थिरता: DAU/WAU/MAU, GGR/Net, ARPPU, प्रतिधारण (D7/D30), फ़नल रूपांतरण, विलंबता p95 - स्पष्ट सूत्रों के साथ अलग शो के रूप में।

Regessors (X): प्रचार/बोनस, अभियान, मूल्य परिवर्तन, सामग्री रिलीज, खेल की घटनाएं, विनिमय दर, मौसम (यदि प्रासंगिक हो)।

विसंगतियाँ और चूक: हम लेबल करते हैं, अंधा नहीं हटाते हैं; घटनाओं के लिए - "वन-ऑफ" झंडे।

योजनाओं की स्थिरता: हम घटनाओं के रूप में उत्पाद संस्करणों/आयामों के परिवर्तन बिंदुओं को रिकॉर्ड करते हैं।

3) केपीआई प्रकार और मॉडलिंग सुविधाएँ

एडिटिव वॉल्यूम (राजस्व, जमा): ईटीएस/एआरआईएमए/जीबीएम/टेम्पोरल-एनएन अच्छा प्रदर्शन करते हैं।

अंश और रूपांतरण: लॉगिट लाइनें, बीटा-द्विपद मॉडल, सीमित प्रतिगमन [0,1]।

गुणांक और अनुपात (ARPPU): अंश और भाजक को अलग से मॉडल करें, फिर रचना।

आंतरायिक श्रृंखला (दुर्लभ घटनाएं, चार्जबैक): क्रॉस्टन/एसबीए/टीएसबी, शून्य-फुलाया दृष्टिकोण।

पदानुक्रम (strana→brend→kanal): सामंजस्य: नीचे-ऊपर, टॉप-डाउन, मिंट।

समग्र केपीआई (उदाहरण के लिए, जीजीआर): असंगत ड्राइवर: ट्रैफिक × रूपांतरण × आवृत्ति × औसत जांच।

4) मॉडल: मूल से उन्नत तक

आधारभूत: Naive, मौसमी Naive, बहाव - एक ईमानदार मूल्यांकन के लिए आवश्यक है।

श्रृंखला क्लासिक्स: ETS/ARIMA/SARIMA; त्वरित मौसमी और छुट्टियों के लिए पैगंबर।

Regressors: ARIMAX/ETS + X, गतिशील प्रतिगमन, कई मौसमी के लिए TBATS।

ग्रेडिएंट बूस्टिंग/टैबुलर एनएन: LightGBM/XGBoost/TabNet के साथ लैग फीचर्स, विंडो स्टेटिस्टिक्स, कैलेंडर और प्रोमो।

टेम्पोरल एनएन: एन-बीट्स, टीएफटी (टेम्पोरल फ्यूजन ट्रांसफॉर्मर) - मल्टी-सीरीज़और रिच एक्स के लिए।

संभाव्यतावादी: मात्रा प्रतिगमन (पिनबॉल हानि), गॉसियन/छात्र-टी, मात्रा वनों/जीबीएम।

कारण और परिदृश्य: प्रोमो प्रभाव का आकलन करने के लिए डीआईडी/एससी; शेड्यूल में उत्थान करें "अगर हम शामिल हैं तो क्या होता है।"

5) अपघटन और संकेत

T + S + R: ट्रेंड + मौसमी (सप्ताह का दिन/महीना/घंटा) + बैलेंस।

लैग्स और विंडो: 'y _ {t-1.. t-28} ', चलती औसत/std, exp। चिकना; "छुट्टी की पूंछ"।

श्रेणीबद्ध: देश/चैनल/ओएस एम्बेडिंग/वन-हॉट के रूप में।

घटनाएँ: रिलीज/प्रमोशन/बैनर - द्विआधारी/तीव्रता।

रिसाव नियंत्रण: केवल जानकारी "अतीत से।"

6) स्कोरिंग और बैकटेस्टिंग

विभाजन: रोलिंग/विस्तार मूल; हम मौसमी (कई सप्ताह/महीने) को अवरुद्ध करते हैं।

स्तर मैट्रिक्स: MAE, RMSE, MAPE/sMAPE, WAPE (शून्य पर अधिक विश्वसनीय)।

संभाव्य मैट्रिक्स: पिनबॉल हानि (q = 0) 1/0. 5/0. 9), CRPS, अंतराल अंशांकन (कवरेज, SHARP)।

घटना/स्पाइक मैट्रिक्स: "इजेक्शन" डिटेक्टर पर सटीक/रिकॉल करें।

बेसलाइन नियम: मॉडल को मौसमी नाइव को हराना चाहिए।

स्थिरता: खंड/अवकाश द्वारा त्रुटि भिन्नता; आउट-ऑफ-टाइम (पिछले एन सप्ताह)।

7) पदानुक्रमित पूर्वानुमान और सुलह

नीचे-ऊपर: "नीचे" को संक्षेप में प्रस्तुत करें; सरल लेकिन शोर।

टॉप-डाउन: ऐतिहासिक शेयरों में फैल गया।

MinT (इष्टतम सामंजस्य): त्रुटि सहसंयोजक को कम करता है - एक समृद्ध तल के साथ सबसे अच्छा समझौता।

अभ्यास: हम प्रत्येक स्तर पर बुनियादी मॉडल प्रशिक्षित

8) संभाव्य भविष्यवाणियां और व्याख्या

मात्रा: q10/q50/q90 → योजना "निराशावादी/आधार/आशावादी"।

अंतराल: लक्ष्य कवरेज (जैसे। 80 %/95%); अंशांकन की जाँच कर रहा है।

जोखिम की लागत: असममित नुकसान के साथ केपीआई के लिए सशर्त वीएआर/अपेक्षित कमी के अनुसार योजना (पूर्वानुमान की तुलना में मांग अधिक महंगी है, और इसके विपरीत)।

9) परिदृश्य मॉडलिंग

बहिर्जात परिदृश्य: "कोई प्रोमो/एस प्रोमो", "कोर्स" 10% "," फुटबॉल फाइनल "।

क्या-यदि: X (अभियान की तीव्रता, सीमा, कीमतें) बदलें → KPI पूर्वानुमान और विश्वास अंतराल।

योजना-तथ्य: पुल कारक: मौसम, प्रोमो, कीमतों, प्रवृत्ति, सदमे/घटना का योगदान।

10) प्रोडक्शन लूप और MLOps

पुनर्प्राप्ति आवृत्ति: अल्पकालिक केपीआई - दैनिक/साप्ताहिक; मासिक - T + 1/T + 3।

परतें/कलाकृतियाँ: फिचस्टर (ऑनलाइन/ऑफ़लाइन समता), मॉडल रजिस्टर, केपीआई डेटा/सूत्र संस्करण।

निगरानी: WAPE/SMAPE स्लाइडिंग विंडो, अंतराल कवरेज, सुविधा बहाव (PSI), फ़ीड देरी, SLA पीढ़ी।

अलर्ट: त्रुटि स्पाइक> थ्रेशोल्ड, अनकैलिब्रेटेड अंतराल, मौसमी टूटना।

विफल-सुरक्षित: गिरावट - मौसमी Naive/ETS के लिए रोलबैक; छुट्टी की चोटियों में फ्रीज-मॉडल।

हिस्टेरिसिस: "पलक झपकते" से बचने के लिए "प्रोमो रेजिस्टर्स" के थ्रेसहोल्ड पर अलग।

11) उत्पाद और आईगेमिंग-केपीआई की विशिष्टता (अनुमानित नक्शा)

ट्रैफ़िक/गतिविधि: DAU/WAU/MAU, मैच के दिन/गेम रिलीज़ सहित।

मुद्रीकरण: GGR/Net, जमा, ARPU/ARPPU - मजबूत शाम/सप्ताहांत/छुट्टी मौसमी।

प्रतिधारण: D1/D7/D30 - कैलेंडर के साथ एक संभावना (लॉगिट) के रूप में भविष्यवाणी करना बेहतर है।

जोखिम: चार्जबैक दर (रुक-रुक कर), आरजी संकेतक (नीतियां/छुट्टियां), धोखाधड़ी विरोधी संकेत।

संचालन: विलंबता p95/p99, लेनदेन त्रुटियां - रिलीज के विसंगतियों/कारण प्रभावों के साथ संगत।

12) कलाकृतियाँ पैटर्न

ए। केपीआई पूर्वानुमान पासपोर्ट

केपीआई/कोड: 'जीजीआर _ ईयूआर' (सूत्र संस्करण)

क्षितिज/चरण: 8 सप्ताह, दिन

पदानुक्रम: brend→strana→platforma

Regressors: 'promo _ spart', 'fixtures _ flag', 'हॉलिडे', 'fx _ rate'

मॉडल: 'TFT _ v4' (q10/q50/q90) + MinT सामंजस्य

मेट्रिक्स: WAPE (पूर्ण लक्ष्य ≤ 8%), कवरेज 90% - अंतराल ≥ 85%

SLO: 06:00 के बाद पीढ़ी ≤ 10 मिनट; डेटा लॉग ≤ 1 घंटा

मालिक: मुद्रीकरण विश्लेषण; संशोधन तिथि: 2025-10-15

बी। निर्णय के लिए तैयार रिपोर्ट (कंकाल)

शीर्षक: "जीजीआर: पूर्वानुमान 8 सप्ताह, q10/q50/q90"

कुंजी: सप्ताह 3 22% (ES = - X) पर अंडर-प्रैग्नेंसी का जोखिम

ड्राइवर: + सप्ताहांत मौसमी, + प्रोमो प्रभाव, FX −

सिफारिशें: कम जोखिम वाले हफ्तों के लिए बजट शिफ्ट करें, ए/बी चैनलों पर सीमा बढ़ाएं

सी। पाइपलाइन का छद्म कोड (क्षणिक)

python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train)         # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))

13) लगातार त्रुटियां और विरोधी पैटर्न

शून्य पर MAPE: WAPE/sMAPE का उपयोग करें।

मीन का अर्थ है: कुल अंश/भाजक अलग से।

छुट्टियों/रिलीज़को अनदेखा करें: regressors और "aftertaste" तिथियां जोड़ें।

चेहरे: भविष्य की जानकारी (लक्ष्य रिसाव) के साथ सुविधाएँ।

बेसलाइन के बिना बहुत "स्मार्ट" मॉडल: पहले मौसमी Naive को हराएं।

असंबद्ध अंतराल: "सुंदर लेकिन खाली" - कवरेज की जाँच करें।

पदानुक्रम असंगति: सुलह के बिना, समग्र योजना बिखरी हुई है।

असफल-सुरक्षित की कमी: छुट्टियों के चरम पर, मॉडल "लटका हुआ", योजनाएं ढह गईं।

14) बिक्री में निगरानी

गुणवत्ता: WAPE रोलिंग, मात्रा द्वारा पिनबॉल, कवरेज 80/95%।

स्थिरता: प्रमुख विशेषताओं, मौसमी बहाव द्वारा पीएसआई।

संचालन: पीढ़ी का समय, डेटा अंतराल,% फोलबैक।

अलर्ट: त्रुटि, एसएलओ उल्लंघन, पदानुक्रम टूटने पर "3" नियम।

Runibook: फ्रीज मोड, "शोर" रजिस्टर, बल-ओवरडोन बंद।

15) प्री-रिलीज़चेकलिस्ट

केपीआई परिभाषित और वर्सित (अर्थ परत)
पंचांग/छुट्टियां/पुनर्गठित संरेखित और परीक्षण
बेसलाइन (नाइव/मौसमी) बैकटेस्टिंग द्वारा हराया
चयनित मैट्रिक्स (WAPE/पिनबॉल) और लक्ष्य थ्रेसहोल्ड
अंतराल कैलिब्रेटेड हैं; निराशावादी/आधार/आशावादी परिदृश्य एकत्र किए गए
पदानुक्रम सहमत हैं (MinT/टॉप-डाउन)
MLOps: कसरत अनुसूची, निगरानी, अलर्ट, विफल-सुरक्षित
प्रलेखन: पूर्वानुमान पासपोर्ट, एसक्यूएल/सुविधा व्यंजनों, घटना रनिबुक

कुल

केपीआई पूर्वानुमान एक समाधान वास्तुकला है: स्पष्ट परिभाषाएं, समृद्ध कैलेंडर और रजिस्टर, ईमानदार बेसलाइन, संभाव्य भविष्यवाणियां, पदानुक्रमित संरेखण, स्थिर एमएलओपी और परिदृश्य योजना। इस तरह की रूपरेखा प्रशंसनीय अपेक्षाएं, प्रबंधनीय जोखिम और "निर्णय-तैयार" रिपोर्ट प्रदान करती है जो सीधे योजना, विपणन, संचालन और अनुपा

केपीआई पूर्वानुमान