IGaming-ի նախնական վերլուծությունը

(Բաժին ՝ Տեխնոլոգիաներ և ենթակառուցվածքներ)

Live ռեզյումե

Նախնական վերլուծաբանը վերածում է իրադարձական տվյալների (դրույքաչափեր, դեպոզիտներ, նստաշրջաններ, խաղեր, KYC/PSA-իրադարձություններ) կանխատեսումների և լուծումների. Ո՞ վ կթողնի LTV-ը, ով սահմանափակելու է RG-ով, ինչպես շտապել հակաֆրոդը, ինչ օֆեր ցույց տալ և երբ։ Հաջողությունը պահվում է հինգ կետերում 'ճիշտ նպատակներ, որակավոր ֆիչեր, կայուն մոդելներ, վիրահատական առաքում (իրական-time) և որակի/էթիկայի վերահսկում։

1) Հիմնական խնդիրները և որտեղ օգտագործվում են մոդելները

Օտտոկը (Churn Propensity) '«հանգիստ» խաղացողների վաղ հայտնաբերումը, որպեսզի պահպանեն (առաքելություններ, ֆրիսպիններ, CRM արշավներ)։

LTV/ARPPU կանխատեսումը 'մարքեթինգի պլանավորումը, բիդները performant-ալիքներում, VIP հատվածները։

Uplift-մոդելավորումը 'ո՞ վ է իրականում խթանելու (ֆերի քաուզալ էֆեկտը)։

Անտիֆրոդը և բոնուսային աբյուզը 'գրանցման, ավանդների, պաթոգենների, մուլտիկաունտինգի։

Պատասխանատու խաղը (RG Risk) 'խնդրահարույց վարքագծի վաղ ազդանշաններ, անձնական լիմիտներ/դադարներ։

Կերպարացում և առաջարկություններ 'խաղերի/պրովայդերների/պրոմո համատեքստով։

Սպորտբուկ 'ելույթի/մարժայի կանխատեսումը, տոկոսադրույքների անոմալիայի մանկությունը, գործակիցների դինամիկան։

Վիրահատական օպտիմիզացիա 'բեռի կանխատեսում, պարամետրերի հերթեր, ստաֆինգ սապորտում։

2) Տվյալները և ֆիչին. Որից «տատանումները» նախատիպն են։

Աղբյուրները

Գործարքներ ՝ դեպոզիտներ/եզրակացություններ, հիբրիդային արձաններ, chargeback/refund։

Բեթ իրադարձություններ 'տոկոսադրույքներ/հաղթանակներ/գործակիցներ, նստաշրջանների տևողությունը։

Մարթին 'խաղեր/պրովայդերներ/կատեգորիաներ, ջեքպոտներ, մրցավարներ։

Մարքեթինգը 'մրցույթի աղբյուրը, քարոզարշավը, պրոմոկոդները, վիտրինները/բանները։

Account/KYC/RG 'տարիքային սահմանափակումներ, լիմիտներ, բողոքներ/ինքնազարգացում։

Տեխելեմետրիա 'տեսահոլովակներ, վեբ/app իրադարձություններ, սարքեր/IP/geo։

Հիմնական ֆիչին (օրինակներ)

RFM: recency/frequency/monetary պատուհանի համար 1/7/30/90 օր։

Տոկոսադրույքները ՝ միջին/միջին գործակիցը, սթեյքերի ցրումը, 2019-2019 տոկոսը։

Վճարումները 'փոխակերպում ռուսական դեպոզիտը, միջին չեկը, PSD2 ազդանշանները։

Խաղացողները ՝ top-N, «լիպիկ» խաղեր, նոր vs retro։

Ժամանակավոր 'սեզոնային շաբաթ/ժամ, կիսագնդեր, սպորտային օրացույց։

Ռիսկ/հակաֆրոդ 'սարքի/IP/քարտեզի համընկնումները, գործողությունների արագությունը, հայտնի չարաշահման կլաստերի հետ հարաբերությունը։

RG-ազդանշաններ 'երկար նստարաններ առանց սարդերի, «դոգոն» կորստի, աճի։

Ֆիչինգինինգի պրակտիկան

Պատուհանները 1/7/30/90 + էքսպոնենցիալ հարթություններ (EWMA)։

Նորմալացում եվրոպական/տարածաշրջանի; հազվագյուտ կատեգորիաների ծեծկռտուք։

Leakage 'fichi ձևավորվում են մինչև target-resa։

Ֆիչեստորը ՝ www.ru/on.ru-paritet, TTL արագության նշանների համար։

3) Թարգետների և հորիզոնների արտադրությունը

Churn @ 30: ոչ մի նստաշրջան չի արել դիտվող պատուհանից 30 օր հետո։

LTV @ 180: կուտակային մարժան/ներդրումը 180 օրվա ընթացքում։

RG Risk @ 14: RG քաղաքական գործչի հավանականությունը հաջորդ 14 օրվա ընթացքում։

Uplift: արձագանքի տարբերությունը offer vs-ի հետ առանց (A/B-գծագիր, Qini/112-risk)։

4) Մոդելներ ՝ պարզ մինչև բարդ։

Հիմնականը լոգիստիկ/գծային ռեգրեսիա է (արագ, բացատրական, լավ ինչպես բեյզլինը)։

Ծառեր/անսամբլի ՝ XGBoost/Last GBM/CatBoost - iGaming-ի պլաստիկ տվյալների համար (դիմացկուն են տարբեր ֆիթների համար)։

Survival-մոդելները ՝ Cox, Weibox, GBM-survival, ժամանակի կանխատեսումը մինչև իրադարձությունը (արտահոսք, կրկնվող դեպոզիտ)։

Հաջորդականությունները ՝ RNN/Transformer-ը 2019/տոկոսադրույքների վրա վարքի արտոնագրեր են, next-best-action։

Կաուզալ/uplift: T-learner, S-learner, DR-learner, meta-learners, causal fores.ru։

Անոմալիա ՝ Isolation Forest/One-Class SVM/AE/Gaussove-ը ֆրոդի և տեխնիկայի համար է։

Ժամանակավոր շարքերը/հիերարխիկ ֆորքաստը 'EFC/ARIMA/Prophet/GBM/DeepAR/TFT - մարջա/2019/պահանջարկ։

5) Տրամաբանություն և մեկնաբանություն

Հավանականության տրամաբանությունը 'Platt/Isotonic; Brier score, Expected Calibration Error-ը։

Մեկնաբանությունը 'SHAP/feature imult.ru, մասնակի կախվածությունը հատկապես կարևոր է RG/complaens համար։

Մոսկվա: PSI/JS-divergence-ը պատուհանների միջև։

6) Հատկության մետրերը

Դասակարգումը ՝ AUC/ROC, PR-AUC, LogLoss, F1 @ k, Recall @ k։

Ռանգինգ/առաջարկություններ ՝ NDCG @ k, MAP @ k, HitRate։

Uplift/causal: Qini, AUUC, uplift @ k, policy gain։

Ռեգրեսիա/LTV: RMSE/MAPE/MAPE, Poisson/J-devians «ճիշտ» բաշխման համար։

Survival: C-index, IBS (Integrated Brier Score).

7) MedicalOnline 'փոխակրիչ և SLO

Գործընթացը

1. Տվյալների ընտրությունը/պատրաստումը կատարվում է քրոսս-վալիդացիայի միջոցով 'արտեֆակտների (քաշի/փոխակերպման/չափման/տրամաչափման) ամրագրումը։

2. Փաթեթային սկորինգը 'գիշերային/ժամ (օրինակ, churn-սկորը բոլոր ակտիվ)։

3. Online corping: Microsofrood (Triton/KServe) SLO p95-100-150 ms (հակաֆրոդ/կերպարացում)։

4. Ֆիչեստորը 'համաձայնություն No./online; SLA ms կարդալու համար։

Տեխնոպոդները

ONNX/TronorRT արագացման համար, INT8/FP8 քվանտացիան 'որակի ստուգմամբ։

Քեշը կարբինգներ և պրեֆեթր տաք խաղացողների համար։

Մոդելների իրականացումը և տարբերակումը (semver, արտեֆակտների թեգերը)։

8) Փորձարկում և վերահսկում պատճառները

A/B/n ռանդոմիզացիայով խաղացողի/նստաշրջանի մակարդակում; կոգորթի ստրատիֆիկացիան։

Գեյտները խթանում են մոդելը 'ոչ ավելի վատ, քան AUC/LogLoss + բիզնես մետրը (մարջա/պահելը) վստահելի մակարդակում։

Shadow-good: նոր մոդելը կարծում է «ստվերում», offfline/առցանց համեմատություն։

9) Դրեյֆը և վերապատրաստումը

Deldrift: PSI-ը, ալերտները բաշխման փոփոխության համար։

Concept drift-ը առցանց որակի մեթրիկի վերահսկումն է, որը համապատասխանում է «policy gain» -ին։

Ռետրենինգը ՝ 108 + իրադարձություններ (դրեյֆի/նոր սեզոնի շեմին հասնելը)։

Անվտանգ նորարարություն 'կանարի 1-5-25-100 տոկոսը ավտոմատ արձագանքով։

10) Պատասխանատու խաղը և էթիկան

Կանոնները և «մարդկային կոնտեքստում» 'ավտոմատ նախազգուշացում, բայց վերջնական լուծումը' RG օպերատորի մոտ։

Fairness-chek 'պաշտպանված հիմքերով խտրականության բացակայություն։ bias հաշվետվությունները։

Գաղտնիությունը 'PII-ի նվազեցումը, թունայնացումը, զգայուն դաշտերի համար առանձին շերտերը։

Թափանցելիությունը 'պատճառների լոգ (SHAP փաստեր) վիճահարույց դեպքերի համար։

11) Տվյալների ճարտարապետությունը և պլատֆորմային տարրերը

Слои Lake/Lakehouse: Bronze→Silver→Gold, CDC из OLTP.

Ֆիչեստորը ՝ www.ru/on.ru, backfill, ճշմարտության աղբյուրներ, TTL։

Սերվինգ 'API սահմանափակումներով RPS/Time բյուջե; Կանարի/բլյու-գրին։

Դիտարկումը 'p50/p95/p99, հերթ, hit-rate, drift, բիզնես մետրիկներ։

12) Օրինակներ (ընդհանրացված հատվածներ)

SQL: target churn @ 30

sql
-- player churned if there was no session in the 30 days after the observation window
SELECT p. player_id,
CASE WHEN MAX(s. session_ts) < DATE_TRUNC('day',:obs_end) + INTERVAL '30 day'
THEN 1 ELSE 0 END AS churn30
FROM players p
LEFT JOIN sessions s ON s. player_id = p. player_id
WHERE s. session_ts <=:obs_end
GROUP BY p. player_id;

Uplift-կշռում (կեղծ)

python
T - received an offer, Y - converted uplift = model. predict(X, treat=T) - model. predict(X, treat=1-T)
top_k = select_top_percent(uplift, k=0. 2) # target the top 20%

Survival-fici (գաղափար)

sql
-- time to next deposit: censored observations
SELECT player_id, deposit_gap_days, censored
FROM gaps_agg; -- for Cox/GBM-survival

13) Ներդրման չեկի ցուցակ

1. Նպատակների և հորիզոնների իրականացումը (churn @ 30, LTV @ 180, RG @ 14)։

2. Դուք կկառուցեք ֆիեստորը 'թիվ 105/onts։

3. Բեյսլայնները (լոգրեգ/GBM) և հավանականության տրամաբանությունը։

4. Մուտքագրեք մետրերը և խաղացողները (AUC/LogLoss/Brier/uplift)։

5. Կազմակերպեք փորձարկումներ (A/B, shadow, kanari)։

6. Պարարտեք դիտարկումը/դրեյֆը (PSI, առցանց մետրեր)։

7. Ապահովեք PII/էթիկան/RG և լուծումների բացատրությունը։

8. Պատրաստեք runbooks 'p99 անկում, որակի քայքայում, ձախողումների աճ։

9. Պլանավորեք ռետրենինգը ժամանակացույցով և իրադարձություններով։

10. Միացրեք բիզնես KPI (GGR, պահել, NGR) մոդելների մետրերի հետ։

14) Անտիպատերնի

Տվյալների աղվեսները 'ֆիգուրներում/targets տեղեկատվության օգտագործումը։

Գնահատումը միայն AUC-ն է, բացառությամբ տրամաբանության և policy gain-ի։

Windows/onite-paritet fich-ի բացակայությունը բացատրում է որակի տարբերությունը։

«Ընդմիշտ» գրված մոդելը առանց dreaf մոնիտորինգի։

Բոլոր «բարձր ռիսկի արտահոսքի» խթանումը առանց uplift-international-ի ավելացման։

Էթիկայի/RG անտեսումը և բացատրությունը զգայուն լուծումներում։

Արդյունքները

iGaming-ի նախնական վերլուծաբանը համակարգային կարգապահություն է 'ճիշտ սահմանված առաջադրանքներ (churn/LTV/uplift/anti-fraud/RG), մտածված ֆիգուրներ և կայուն մոդելներ, churn/LTV/uplift/unti-ը և տրամաչափությունը, փորձարկումներ և dreef-2019, գումարած կոմպլեքս և էթիկա։ Այս մոտեցման դեպքում մոդելները ոչ միայն «գուշակում են», այլ կայուն բարելավում են պահպանումը և մարժուն, նվազեցնելով ռիսկերը և խթանման արժեքը։

IGaming-ի նախնական վերլուծությունը

Live ռեզյումե

Հիմնական ֆիչին (օրինակներ)

Ֆիչինգինինգի պրակտիկան

Uplift-կշռում (կեղծ)

Survival-fici (գաղափար)

Արդյունքները

Կապ հաստատեք մեզ հետ

Արագ կապ

Տեսանյութը շուտով կթարմացվի

Այս պահին մենք ծանրաբեռնված ենք նախագծերով