केपीआई पूर्वानुमान
केपीआई पूर्वानुमान
केपीआई पूर्वानुमान "ग्राफ का अनुमान नहीं लगा रहा है", लेकिन एक नियंत्रित लूप: सही डेटा - एक पर्याप्त मॉडल परिदृश्य और व्याख्या - परिचालन निगरानी। नीचे एक सिस्टम चेकलिस्ट और आर्किटेक्चर है जो सरल श्रृंखला से पोर्टफोलियो, पदानुक्रमित और संभाव्य पूर्वानुमान तक तराजू करता है।
1) कार्य विवरण
हम क्या भविष्यवाणी करते हैं? स्तर, डेल्टा, मात्रा, अंतराल, घटना (स्पाइक)।
क्षितिज/चरण: घंटे/दिन/सप्ताह/महीने; अल्पकालिक नियंत्रण के लिए रोलिंग खिड़कियां
इकाई: उत्पाद/ब्रांड/देश/मंच/चैनल।
व्यापार संदर्भ: नियंत्रित लीवर (प्रोमो, कीमतें, रिलीज़) और प्रतिबंध (एसएलए, आरजी/अनुपालन)।
मूल्य और जोखिम: पुन :/अंडर-पूर्वानुमान की लागत, झूठे अलर्ट के लिए जुर्माना।
2) डेटा और तैयारी
अनाज और कैलेंडर: एकल कैलेंडर (छुट्टियां/सप्ताहांत/पेरोल दिन), समय स्थान (UTC + स्थानीय दृश्य)।
समुच्चय और स्थिरता: DAU/WAU/MAU, GGR/Net, ARPPU, प्रतिधारण (D7/D30), फ़नल रूपांतरण, विलंबता p95 - स्पष्ट सूत्रों के साथ अलग शो के रूप में।
Regessors (X): प्रचार/बोनस, अभियान, मूल्य परिवर्तन, सामग्री रिलीज, खेल की घटनाएं, विनिमय दर, मौसम (यदि प्रासंगिक हो)।
विसंगतियाँ और चूक: हम लेबल करते हैं, अंधा नहीं हटाते हैं; घटनाओं के लिए - "वन-ऑफ" झंडे।
योजनाओं की स्थिरता: हम घटनाओं के रूप में उत्पाद संस्करणों/आयामों के परिवर्तन बिंदुओं को रिकॉर्ड करते हैं।
3) केपीआई प्रकार और मॉडलिंग सुविधाएँ
एडिटिव वॉल्यूम (राजस्व, जमा): ईटीएस/एआरआईएमए/जीबीएम/टेम्पोरल-एनएन अच्छा प्रदर्शन करते हैं।
अंश और रूपांतरण: लॉगिट लाइनें, बीटा-द्विपद मॉडल, सीमित प्रतिगमन [0,1]।
गुणांक और अनुपात (ARPPU): अंश और भाजक को अलग से मॉडल करें, फिर रचना।
आंतरायिक श्रृंखला (दुर्लभ घटनाएं, चार्जबैक): क्रॉस्टन/एसबीए/टीएसबी, शून्य-फुलाया दृष्टिकोण।
पदानुक्रम (strana→brend→kanal): सामंजस्य: नीचे-ऊपर, टॉप-डाउन, मिंट।
समग्र केपीआई (उदाहरण के लिए, जीजीआर): असंगत ड्राइवर: ट्रैफिक × रूपांतरण × आवृत्ति × औसत जांच।
4) मॉडल: मूल से उन्नत तक
आधारभूत: Naive, मौसमी Naive, बहाव - एक ईमानदार मूल्यांकन के लिए आवश्यक है।
श्रृंखला क्लासिक्स: ETS/ARIMA/SARIMA; त्वरित मौसमी और छुट्टियों के लिए पैगंबर।
Regressors: ARIMAX/ETS + X, गतिशील प्रतिगमन, कई मौसमी के लिए TBATS।
ग्रेडिएंट बूस्टिंग/टैबुलर एनएन: LightGBM/XGBoost/TabNet के साथ लैग फीचर्स, विंडो स्टेटिस्टिक्स, कैलेंडर और प्रोमो।
टेम्पोरल एनएन: एन-बीट्स, टीएफटी (टेम्पोरल फ्यूजन ट्रांसफॉर्मर) - मल्टी-सीरीज़और रिच एक्स के लिए।
संभाव्यतावादी: मात्रा प्रतिगमन (पिनबॉल हानि), गॉसियन/छात्र-टी, मात्रा वनों/जीबीएम।
कारण और परिदृश्य: प्रोमो प्रभाव का आकलन करने के लिए डीआईडी/एससी; शेड्यूल में उत्थान करें "अगर हम शामिल हैं तो क्या होता है।"
5) अपघटन और संकेत
T + S + R: ट्रेंड + मौसमी (सप्ताह का दिन/महीना/घंटा) + बैलेंस।
लैग्स और विंडो: 'y _ {t-1.. t-28} ', चलती औसत/std, exp। चिकना; "छुट्टी की पूंछ"।
श्रेणीबद्ध: देश/चैनल/ओएस एम्बेडिंग/वन-हॉट के रूप में।
घटनाएँ: रिलीज/प्रमोशन/बैनर - द्विआधारी/तीव्रता।
रिसाव नियंत्रण: केवल जानकारी "अतीत से।"
6) स्कोरिंग और बैकटेस्टिंग
विभाजन: रोलिंग/विस्तार मूल; हम मौसमी (कई सप्ताह/महीने) को अवरुद्ध करते हैं।
स्तर मैट्रिक्स: MAE, RMSE, MAPE/sMAPE, WAPE (शून्य पर अधिक विश्वसनीय)।
संभाव्य मैट्रिक्स: पिनबॉल हानि (q = 0) 1/0. 5/0. 9), CRPS, अंतराल अंशांकन (कवरेज, SHARP)।
घटना/स्पाइक मैट्रिक्स: "इजेक्शन" डिटेक्टर पर सटीक/रिकॉल करें।
बेसलाइन नियम: मॉडल को मौसमी नाइव को हराना चाहिए।
स्थिरता: खंड/अवकाश द्वारा त्रुटि भिन्नता; आउट-ऑफ-टाइम (पिछले एन सप्ताह)।
7) पदानुक्रमित पूर्वानुमान और सुलह
नीचे-ऊपर: "नीचे" को संक्षेप में प्रस्तुत करें; सरल लेकिन शोर।
टॉप-डाउन: ऐतिहासिक शेयरों में फैल गया।
MinT (इष्टतम सामंजस्य): त्रुटि सहसंयोजक को कम करता है - एक समृद्ध तल के साथ सबसे अच्छा समझौता।
अभ्यास: हम प्रत्येक स्तर पर बुनियादी मॉडल प्रशिक्षित
8) संभाव्य भविष्यवाणियां और व्याख्या
मात्रा: q10/q50/q90 → योजना "निराशावादी/आधार/आशावादी"।
अंतराल: लक्ष्य कवरेज (जैसे। 80 %/95%); अंशांकन की जाँच कर रहा है।
जोखिम की लागत: असममित नुकसान के साथ केपीआई के लिए सशर्त वीएआर/अपेक्षित कमी के अनुसार योजना (पूर्वानुमान की तुलना में मांग अधिक महंगी है, और इसके विपरीत)।
9) परिदृश्य मॉडलिंग
बहिर्जात परिदृश्य: "कोई प्रोमो/एस प्रोमो", "कोर्स" 10% "," फुटबॉल फाइनल "।
क्या-यदि: X (अभियान की तीव्रता, सीमा, कीमतें) बदलें → KPI पूर्वानुमान और विश्वास अंतराल।
योजना-तथ्य: पुल कारक: मौसम, प्रोमो, कीमतों, प्रवृत्ति, सदमे/घटना का योगदान।
10) प्रोडक्शन लूप और MLOps
पुनर्प्राप्ति आवृत्ति: अल्पकालिक केपीआई - दैनिक/साप्ताहिक; मासिक - T + 1/T + 3।
परतें/कलाकृतियाँ: फिचस्टर (ऑनलाइन/ऑफ़लाइन समता), मॉडल रजिस्टर, केपीआई डेटा/सूत्र संस्करण।
निगरानी: WAPE/SMAPE स्लाइडिंग विंडो, अंतराल कवरेज, सुविधा बहाव (PSI), फ़ीड देरी, SLA पीढ़ी।
अलर्ट: त्रुटि स्पाइक> थ्रेशोल्ड, अनकैलिब्रेटेड अंतराल, मौसमी टूटना।
विफल-सुरक्षित: गिरावट - मौसमी Naive/ETS के लिए रोलबैक; छुट्टी की चोटियों में फ्रीज-मॉडल।
हिस्टेरिसिस: "पलक झपकते" से बचने के लिए "प्रोमो रेजिस्टर्स" के थ्रेसहोल्ड पर अलग।
11) उत्पाद और आईगेमिंग-केपीआई की विशिष्टता (अनुमानित नक्शा)
ट्रैफ़िक/गतिविधि: DAU/WAU/MAU, मैच के दिन/गेम रिलीज़ सहित।
मुद्रीकरण: GGR/Net, जमा, ARPU/ARPPU - मजबूत शाम/सप्ताहांत/छुट्टी मौसमी।
प्रतिधारण: D1/D7/D30 - कैलेंडर के साथ एक संभावना (लॉगिट) के रूप में भविष्यवाणी करना बेहतर है।
जोखिम: चार्जबैक दर (रुक-रुक कर), आरजी संकेतक (नीतियां/छुट्टियां), धोखाधड़ी विरोधी संकेत।
संचालन: विलंबता p95/p99, लेनदेन त्रुटियां - रिलीज के विसंगतियों/कारण प्रभावों के साथ संगत।
12) कलाकृतियाँ पैटर्न
ए। केपीआई पूर्वानुमान पासपोर्ट
केपीआई/कोड: 'जीजीआर _ ईयूआर' (सूत्र संस्करण)
क्षितिज/चरण: 8 सप्ताह, दिन
पदानुक्रम: brend→strana→platforma
Regressors: 'promo _ spart', 'fixtures _ flag', 'हॉलिडे', 'fx _ rate'
मॉडल: 'TFT _ v4' (q10/q50/q90) + MinT सामंजस्य
मेट्रिक्स: WAPE (पूर्ण लक्ष्य ≤ 8%), कवरेज 90% - अंतराल ≥ 85%
SLO: 06:00 के बाद पीढ़ी ≤ 10 मिनट; डेटा लॉग ≤ 1 घंटा
मालिक: मुद्रीकरण विश्लेषण; संशोधन तिथि: 2025-10-15
बी। निर्णय के लिए तैयार रिपोर्ट (कंकाल)
शीर्षक: "जीजीआर: पूर्वानुमान 8 सप्ताह, q10/q50/q90"
कुंजी: सप्ताह 3 22% (ES = - X) पर अंडर-प्रैग्नेंसी का जोखिम
ड्राइवर: + सप्ताहांत मौसमी, + प्रोमो प्रभाव, FX −
सिफारिशें: कम जोखिम वाले हफ्तों के लिए बजट शिफ्ट करें, ए/बी चैनलों पर सीमा बढ़ाएं
सी। पाइपलाइन का छद्म कोड (क्षणिक)
python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train) # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))
13) लगातार त्रुटियां और विरोधी पैटर्न
शून्य पर MAPE: WAPE/sMAPE का उपयोग करें।
मीन का अर्थ है: कुल अंश/भाजक अलग से।
छुट्टियों/रिलीज़को अनदेखा करें: regressors और "aftertaste" तिथियां जोड़ें।
चेहरे: भविष्य की जानकारी (लक्ष्य रिसाव) के साथ सुविधाएँ।
बेसलाइन के बिना बहुत "स्मार्ट" मॉडल: पहले मौसमी Naive को हराएं।
असंबद्ध अंतराल: "सुंदर लेकिन खाली" - कवरेज की जाँच करें।
पदानुक्रम असंगति: सुलह के बिना, समग्र योजना बिखरी हुई है।
असफल-सुरक्षित की कमी: छुट्टियों के चरम पर, मॉडल "लटका हुआ", योजनाएं ढह गईं।
14) बिक्री में निगरानी
गुणवत्ता: WAPE रोलिंग, मात्रा द्वारा पिनबॉल, कवरेज 80/95%।
स्थिरता: प्रमुख विशेषताओं, मौसमी बहाव द्वारा पीएसआई।
संचालन: पीढ़ी का समय, डेटा अंतराल,% फोलबैक।
अलर्ट: त्रुटि, एसएलओ उल्लंघन, पदानुक्रम टूटने पर "3" नियम।
Runibook: फ्रीज मोड, "शोर" रजिस्टर, बल-ओवरडोन बंद।
15) प्री-रिलीज़चेकलिस्ट
- केपीआई परिभाषित और वर्सित (अर्थ परत)
- पंचांग/छुट्टियां/पुनर्गठित संरेखित और परीक्षण
- बेसलाइन (नाइव/मौसमी) बैकटेस्टिंग द्वारा हराया
- चयनित मैट्रिक्स (WAPE/पिनबॉल) और लक्ष्य थ्रेसहोल्ड
- अंतराल कैलिब्रेटेड हैं; निराशावादी/आधार/आशावादी परिदृश्य एकत्र किए गए
- पदानुक्रम सहमत हैं (MinT/टॉप-डाउन)
- MLOps: कसरत अनुसूची, निगरानी, अलर्ट, विफल-सुरक्षित
- प्रलेखन: पूर्वानुमान पासपोर्ट, एसक्यूएल/सुविधा व्यंजनों, घटना रनिबुक
कुल
केपीआई पूर्वानुमान एक समाधान वास्तुकला है: स्पष्ट परिभाषाएं, समृद्ध कैलेंडर और रजिस्टर, ईमानदार बेसलाइन, संभाव्य भविष्यवाणियां, पदानुक्रमित संरेखण, स्थिर एमएलओपी और परिदृश्य योजना। इस तरह की रूपरेखा प्रशंसनीय अपेक्षाएं, प्रबंधनीय जोखिम और "निर्णय-तैयार" रिपोर्ट प्रदान करती है जो सीधे योजना, विपणन, संचालन और अनुपा