KPI կանխատեսումը
KPI կանխատեսումը
KPI կանխատեսումը ոչ թե «գրաֆիկի առևանգումն» է, այլ կառավարվող բանաձևը. Ճիշտ տվյալները բացատրվում են ռուսական սցենարի համարժեք մոդելը և ռուսական վիրահատական կոդավորման մեկնաբանությունը։ Ներքևում համակարգային չեկի ցուցակն է և ճարտարապետությունը, որոնք մեծանում են պարզ շարքերից մինչև պորտֆելի, հիերարխիկ և հավանական կանխատեսումներ։
1) Առաջադրանքի արտադրումը
Ի՞ նչ ենք կանխատեսում։ , դելտա, քվանտիլ, ռուսական, իրադարձություն (սպայկ)։
Հորիզոն/քայլ 'ժամացույց/օրեր/շաբաթ/ամիս; rolling-պատուհանները կարճաժամկետ վերահսկման համար։
Միավորը 'ապրանք/բրենդ/երկիր/պլատֆորմ/ջրանցք։
Բիզնես կոնտեքստը 'կառավարվող լծակներ (պրոմո, գներ, ածխաջրածիններ) և սահմանափակումներ (SLA, RG/complaens)։
Արժեքներն ու ռիսկերը 'փետուրի/չնախատեսված արժեքը, տուգանքը կեղծ ալերտերի համար։
2) Տվյալները և պատրաստումը
Հացահատիկը և օրացույցը 'մեկ օրացույց (արձակուրդներ/հանգստյան/աշխատավարձային օրեր), ժամանակի բարձրացումը (UTC + տեղական ներկայացումներ)։
Ագրեգատները և կոնսիստենտալությունը ՝ DAU/WAU/MAU, GGR/Net, ARPU, պահպանումը (D7/D30), ձագերի կոնվերսիան, latency p95 - պահեք որպես առանձին վիտրիններ ակնհայտ բանաձևերով։
Ռեգրեսորները (X) 'պրոմո/բոնուսներ, քարոզարշավներ, գնի փոփոխությունը, բովանդակությունը, սպորտային իրադարձությունները, արժեթղթերի դասընթացները, եղանակը (եթե revanto)։
Աննոմալիաներ և բացթողումներ ՝ մարկիրու, չենք հեռացնի կույր։ իրադարձությունների համար '«one-off» դրոշները։
Սխեմաների իրականացումը 'ապրանքի տարբերակների փոփոխման կետերը/գրանցում ենք որպես իրադարձություններ։
3) KPI տեսակները և մոդելավորման հատկությունները
Ադիտիվ ծավալները (եկամուտներ, ավանդներ) 'լավ աշխատում են EFC/ARIMA/GBM/Temensal-NN։
Մասնաբաժիններ և փոխարկումներ 'լոգիթ գծեր, բետա-բինոմալ մոդելներ, ռեգրեսիա սահմանափակումներով [0,1]։
Գործակիցները և հարաբերությունները (ARPPU) 'մոդելավորում ենք թվանշանը և դրոշը առանձին, հետո' 108։
Ինտերակտիվ շարքերը (հազվադեպ իրադարձություններ, chargeback) ՝ Croston/SBA/TSB, zero-inflated մոտեցումներ։
Հիերարխիան (երկիրը ռուսական բրենդը) 'reconciliation: Bottom-Up, Top-Down, MinT։
Կոմպոզիտորական KPI (օրինակ, GGR) 'դիսագրեգիրային վարորդներ' ռուսական հակադարձման հաճախականությունը միջին ստուգում է։
4) Մոդելներ ՝ բազայից մինչև առաջադեմ
Բեյզլիններ ՝ Naive, Seasonal Naive, Drift-ը անհրաժեշտ է ազնիվ գնահատման համար։
Շարքերի դասական 'EFC/ARIMA/SARIMA; Prophet արագ սեզոնային և արձակուրդների համար։
Ռեգրեսորները ՝ ARIMAX/EFC + X, դինամիկ ռեգրեսիաներ, TBATS բազմաթիվ սեզոնների համար։
Gradient Busting/պլանշետային NN: Last GBM/XGBoost/TabNet Lag-Fi, պատուհանների վիճակագրությունները, օրացույցը և պրոմո։
Temporal NN: N-Beats, TFT (Temensal Fusion Transformer) - մուլտֆիլմի շարքի և հարուստ X- ի համար։
Հավանական է 'քվանտային ռեգրեսիա (pinball loss), Gaussian/Student-t, quantile fores.ru/GBM։
Պատճառն ու սցենարները ՝ DiD/SC, պրոմո էֆեկտը գնահատելու համար։ uplift պլանավորման համար «ինչ կլինի, եթե միացնենք»։
5) Դեկոմոզիցիա և նշաններ
T + S + R: միտումը + սեզոնայնությունը (շաբաթվա/ամիս/ժամ) + մնացորդը։
Բայերն ու պատուհանները '"y _ _ e t-1.. t-28 +, որոնք սայթաքում են միջին/std, ռուսական։ հարթեցում; «տոնական պոչեր»։
Կատեգորիկ ՝ երկիր/ջրանցք/OS որպես էմբեդինգներ/one-hot։
Իրադարձությունները 'ֆորումներ/ակցիաներ/բաններ - երկուական/ինտենսիվություն։
Leakage-վերահսկումը 'միայն տեղեկատվությունը «անցյալից»։
6) Գնահատումը և backtesting-ը
Սպլիտներ ՝ rolling/expanding origin; արգելափակում ենք սեզոնայնությունը (կարճ շաբաթներ/ամիսներ)։
Մակարդակների չափումները ՝ MAE, RMSE, MAPE/sMAPE, WAPE (ավելի հուսալի է նրբությունների դեպքում)։
Հավանականության մետրերը ՝ pinball loss (q = 0։ 1/0. 5/0. 9), CRPS, ընդմիջումների տրամաչափը (coverage, SHARP)։
Իրադարձությունների/սպայկների չափումները 'precision/recall «նետման» օրինակով։
Բեյզլին կանոնը 'մոդելը պետք է հաղթի Seasonal Naive-ում։
Մոսկվա 'սեգմենտների/արձակուրդների սխալների ցրումը։ out-of-time (վերջին N շաբաթ)։
7) Հիերարխիկ կանխատեսում և կայունություն
Bottium-Up: Մենք հավաքում ենք «112»; պարզ է, բայց աղմկոտ։
Top-Down: Մենք բաժանում ենք պատմական։
MinT (optimal reconciliation): նվազեցնում է սխալների կովարիզացիան 'լավագույն փոխզիջումը հարուստ «ներքևում»։
Պրակտիկա 'մենք յուրաքանչյուր մակարդակում հիմնական մոդելներ ենք սովորեցնում, ապա կհամաձայնենք։
8) Հավանականության կանխատեսումները և մեկնաբանությունը
Quanali: q10/q50/q90 պլանավորվում է «պեսիմիստ/բազա/լավատես» պլանավորումը։
Ընդմիջումներ 'նպատակային ծածկույթ (օրինակ ՝ 80 %/95%); ստուգում ենք տրամաչափումը։
Ռիսկի արժեքը 'պլանավորեք պայմանական VaR/expected shortfall-ը KPI-ի համար ասիմետրիկ կորուստներով (պահանջարկի անհասանելիությունը ավելի թանկ է, և հակառակը)։
9) Բեմական մոդելավորում
Էկզոգեն սցենարները ՝ «առանց պրոմո/s պրոմո», «դասընթացը 10 տոկոս», «ֆուտբոլային ավարտը»։
What-if: Մենք փոխում ենք X-ը (քարոզարշավների ինտենսիվությունը, լիմիտները, գները) կանխատեսում է KPI կանխատեսումը և վստահելի ընդմիջումները։
Պլանը փաստ է 'կամուրջը (bridge) գործոններ' սեզոնների ներդրումը, պրոմո, գինը, միտումը, ցնցումը/2019։
10) Վիրահատական համակարգը և MLOps-ը
Վերապատրաստման հաճախականությունը 'կարճաժամկետ KPI' ամեն օր/շաբաթ; Ամսական 'T + 1/T + 3։
Շերտեր/արտեֆակտներ ՝ ֆիչաստոր (առցանց/օֆլայնային հավասարություն), մոդելներ, տվյալների տարբերակներ/KPI բանաձևեր։
Տե՛ ս ՝ WAPE/SMAPE սայթաքուն պատուհանի, ընդմիջումների ծածկույթի, նշանների (PSI), ֆիդների ձերբակալման, SLA-ի վրա։
Ալերտներ 'սխալների ավելացում> շեմն է, ոչ ալիբրացված ընդմիջումները, սեզոնայնության ոչնչացումը։
Fail-safe: դեգրադացիան հակադարձվում է Seasonal Naive/ELS-ին։ freeze մոդելները տոնական պիկի մեջ։
Հիստերեևսկին 'տարբեր շեմեր ներառել/անջատել «պրոմո-ռեգրեսորներ», որպեսզի չփորձեն «գաղթել»։
11) Ապրանքային և iGaming-KPI հատկությունները (մոտավոր քարտեզը)
Իսպանիան/ակտիվությունը ՝ DAU/WAU/MAU, հաշվի առնելով խաղերի/խաղերի խաղային օրերը։
Մոնետիզացիա ՝ GGR/Net, դեպոզիտներ, ARPU/ARPPU - ուժեղ սեզոնային «երեկո/հանգստյան/արձակուրդներ»։
Պահպանումը 'D1/D7/D30 - ավելի լավ կանխատեսել որպես հավանականություն (լոգիթ) օրացույցի հետ։
Ռիսկերը ՝ chargeback rate (international), RG-ազդանշաններ (քաղաքականություն/արձակուրդներ), հակաֆրոդ ազդանշաններ։
Վիրահատություններ ՝ latency p95/p99, գործարքների սխալները համատեղելի են անոմալիաների/ածխաջրերի քաուզային ազդեցությունների հետ։
12) Արտեֆակտների օրինակները
A. անձնագիր կանխատեսման KPI
KPI/կոդը ՝ «GGR _ MSR» (բանաձևի տարբերակը)
Հորիզոն/քայլ ՝ 8 շաբաթ, օր
Հիերարխիա ՝ բրենդը ռուսական երկիր ռուսական պլատֆորմը
Ռեգրեսորները ՝ «promo _ spend», «fixtures _ flag», «holiday», «fx _ rate»
Մոդել '«TFT _ v4» (q10/q50/q90) + MinT reconciliation
Մետրիկները ՝ WAPE (Abs 368%), coverage 90% -interval 3685%
SLO 'գեներացիան 10 րոպե հետո 06: 00 լոկից հետո։ տվյալների լագը 241 ժամ է
Սեփականատերերը ՝ Monetization Analytics; ամսաթիվը ՝ 2025-10-15
B. Decision-ready զեկույցը (կմախք)
Վերնագիր ՝ «GGR: Կանխատեսում 8 շաբաթ, q10/q50/q90»
Բանալին այն է, որ 3-րդ շաբաթվա ընթացքում թերագնահատման ռիսկը 22% է (ES = - 24X)
Վարորդներ ՝ + սեզոնային հանգստյան օր, + էֆեկտը պրոմո, www.FX
Առաջարկություններ ՝ բյուջեն վերադարձնել ցածր բյուջեով, բարձրացնել սահմանները A/B ալիքների վրա
: Կեղծ կոդը www.pline (շուտով)
python
1) load data y, X, calendar = load_series_and_regressors()
2) build features ds = make_lags_and_windows(y, X, lags=[1,7,14,28], roll=[7,14,28])
ds = add_calendar_features(ds, calendar) # holidays, dow, month_end
3) split cv = rolling_backtest(ds, folds=6, horizon=28)
4) models m1 = ETSx(). fit(ds. train) # baseline m2 = LightGBMQuantiles(q=[0. 1,0. 5,0. 9]). fit(ds. train)
5) evaluate scores = evaluate([m1,m2], cv, metrics=['WAPE','pinball'])
6) retrain full + reconcile forecasts = reconcile_minT(train_and_forecast([m2], hierarchy))
7) report + push publish(forecasts, scores, sla=timedelta(minutes=10))
13) Հաճախակի սխալներ և հակատիպեր
MAPE-ը նրբությունների ժամանակ 'օգտագործեք WAPE/sMAPE-ը։
Միջին 'համախմբեք թվանշանները/դրոշակակիրները առանձին։
Արձակուրդների/ֆորումների անտեսումը 'ավելացրեք ռեգրեսորները և «հետպատերազմյան» ամսաթվերը։
Աղվեսներ 'ֆիչին համապատասխան տեղեկատվությամբ (target leakage)։
Չափազանց խելացի մոդելներ առանց բեյսլեյնի. Նախ հաղթեք Seasonal Naive-ին։
Ոչ ալիբրացված ընդմիջումները '«գեղեցիկ, բայց դատարկ», ստուգեք coverage-ը։
Հիերարխիաների անհամաձայնությունը 'առանց reconciliation-ի ընդհանուր պլանը քանդվում է։
Fail-safe-ի բացակայությունը 'արձակուրդների գագաթնակետին մոդելը «կախված է», պլանները փլուզվում են։
14) Եվգենիան վաճառքում է
Որակը 'WAPE rolling, pinball քվանտներով, coverage 80/95 տոկոսը։
Մոսկվա: PSI-ը հիմնական նշաններով, սեզոնայնության դրեյֆը։
Վիրահատություններ ՝ մրցույթի ժամանակը, տվյալների լագը, ֆոլբեկների տոկոսը։
Ալերտներ ՝ «3.8» կանոնը սխալմամբ, SLO խախտումը, հիերարխիաների բաժանումը։
Ռունիբուկ ՝ freeze-ռեժիմը, «աղմկոտ» ռեգրեսորների անջատումը, fors-pertren։
15) Չեկի թուղթը նախքան թողարկումը
- KPI կոդավորումը և տարբերակը (սեմանտիկ շերտ)
- Օրացույցը/արձակուրդները/ռեգրեսորները համաձայնեցված և փորձարկվել են
- Բեյզլայնները (Naive/Seasonal) հաղթում են backtesting-ին։
- Ընտրվել են մետրերը (WAPE/pinball) և ռուսական շեմերը։
- Ընդմիջումները տրամաչափված են. «պեսիմիստ/բազա/լավատես» սցենարները հավաքվել են
- Հիերարխիաները համաձայնվում են (MinT/Top-Down) (MinT/Top-Down)
- MLOps: Ռուսական դասընթացներ, կոմպոզիցիաներ, ալերտներ, fail-safe
- Express: Կանխատեսման անձնագիր, SQL/fice բաղադրատոմսեր, runibuk 2019
Արդյունքը
KPI կանխատեսումը որոշումների ճարտարապետությունն է 'հստակ սահմանումներ, հարուստ օրացույց և ռեգրեսիաներ, ազնիվ բեյզլիններ, հավանական կանխատեսումներ, հիերարխիկ, կայուն MLOps և բեմական պլանավորումներ։ Այս նախաձեռնությունը տալիս է վստահելի սպասումներ, կառավարվող ռիսկեր և «decision-ready» զեկույցներ, որոնք ուղղակիորեն սնուցում են պլանավորումը, մարքեթինգը, վիրահատությունը և ընկերությունը։