მოთამაშეთა შეკავების ანალიზი
მოთამაშეთა შეკავების ანალიზი
შენარჩუნება პროდუქტის ეკონომიკის ბირთვია: რაც უფრო გრძელი მოთამაშე რჩება აქტიური, მით უფრო მაღალია LTV, მით უფრო სტაბილურია შემოსავალი და პროგნოზირებადი დაგეგმვა. ქვემოთ მოცემულია სრული ჩარჩო: სწორი განმარტებებიდან გადარჩენის მოდელებამდე და re- გააქტიურების მიკროსქემამდე.
1) განსაზღვრება და აღრიცხვის ერთეულები
ერთეული: მოთამაშე (user/master _ id) - ნაგულისხმევი; მოკლევადიანი დავალებებისთვის, ჩვენ დავუშვებთ „ანგარიშს/მოწყობილობას“, მაგრამ ჩაწერეთ ეს მეტრიკის პასპორტში.
აქტივობა: დაბრუნების კრიტერიუმი (1 სესიის/1 კურსი/1 ანაბარი) - დაფიქსირდა.
Retenschn Dn: კოჰორტის წილი, რომელიც დაბრუნდა რეფერენტის თარიღის N- ზე.
Rolling/Bracket: Rolling D7 (1-7 დღის ნებისმიერ დღეს) vs Exact D7 (ზუსტად მე -7 დღეს).
Churn (გადინება): საქმიანობის არარსებობა T დღის განმავლობაში (მაგალითად, 14/30); როგორც წესი, მითითებულია პროდუქტი.
კოჰორტები: რეგისტრაციის თარიღის მიხედვით/პირველი ანაბარი/პირველი თამაში - შეარჩიეთ მარკეტინგის/პროდუქტის ამოცანა.
2) ძირითადი ანალიტიკა: კოჰორტები და retention მრუდი
კოჰორტული სითბოს ბარათები: D1/D3/D7/D14/D30/D60; დიაგონალები შედარებულია გამოშვებებსა და კამპანიებს შორის.
გადარჩენის მრუდი: აქტიურობის წილი დღიდან 0-დან N-მდე (ძლიერი წრე).
მრუდი გეომეტრია: არდადეგების/გამოცემების „ნაბიჯები“; ადრეული „დაშლა“ - ონბორდინგის პრობლემები, „გრძელი კუდი“ - ერთგულების ბირთვი.
ფსევდო-SQL: კოჰორტული D7
sql
WITH regs AS (
SELECT user_id, DATE_TRUNC('day', ts) AS cohort_day
FROM event_register
),
act AS (
SELECT user_id, DATE_TRUNC('day', ts) AS act_day
FROM event_activity
),
d7 AS (
SELECT r. cohort_day,
COUNT(DISTINCT r. user_id) AS cohort_size,
COUNT(DISTINCT CASE WHEN a. act_day = r. cohort_day + INTERVAL '7 day'
THEN r. user_id END) AS retained_d7
FROM regs r
LEFT JOIN act a ON a. user_id = r. user_id
GROUP BY 1
)
SELECT cohort_day, cohort_size,
retained_d7::decimal / NULLIF(cohort_size,0) AS cr_d7
FROM d7
ORDER BY cohort_day;
3) გადარჩენა და ჰაზარდის მოდელები
Kaplan-Meier: survival (S (t)) უნებართვო შეფასება; სასარგებლოა მრუდისა და საშუალო ცხოვრების „ფორმის ამოღებისთვის“.
Cox PH/Accelerated Failure Time: ნიშნის გავლენის აშკარა მოდელები (ქვეყანა, არხი, პლატფორმა, პრემია, შინაარსი) ჰაზარდზე (გადინების რისკი).
Discrete time hazard (დღისით ლოგინი): მოქნილი სასურსათო ანალიტიკისთვის და კალენდრის თარიღებისთვის.
R- გააქტიურების მოვლენა: მოდელირება ცალკე ან როგორც გადასვლა მარკოვის ჯაჭვზე.
4) მარკოვსკის და ნახევარ მარკოვის მოდელები
სახელმწიფოები: New Actival Dormant და Churned Reactivated.
გადასვლები: ალბათობა პერიოდისთვის (დღე/კვირა).
ღირებულება: გამოიყენეთ Active- ში დარჩენის ალბათობა საშუალო შემოწმების/სიხშირისთვის - მიიღებთ მოსალოდნელ წვლილს LTV- ში.
5) შეკავება და LTV
LTV (Retention _ t × ARPU _ t × ფასდაკლება).
ელასტიურობა: D7 ზრდა X პროცენტით. LTV- ს ზრდა Y% -ით (ისტორიული მონაცემებიდან/მოდელებიდან).
პრიორიტეტიზაცია: გაუმჯობესებები, რომლებიც გავლენას ახდენს ადრეულ შენარჩუნებაზე (D1-D7), თითქმის ყოველთვის ყველაზე მომგებიანია.
6) შენარჩუნების სეგმენტი
Onbording კოჰორტები: პირველი შინაარსი/თამაშის კატეგორია/ქცევითი შაბლონი 0.
გეო/პლატფორმა/არხი: UX განსხვავებები და მოლოდინები; შეცვალეთ კალენდარი/არდადეგები.
ქცევა/ღირებულება: RFM (ჩანაწერების-უფასო-მონეტა), გადინების რისკი, მომგებიანობა.
პასუხი სტიმულებზე: სეგმენტები uplift რეაქციებზე ოფშორულ/ნოტიფიკაციაზე.
7) გამომწვევი მიზეზები და ექსპერიმენტები
A/B: Onboarding, tutorials, country სტრატეგიები; მთავარი მეტრიკა - D7/D14/D30 retenshny, guardrails - საჩივრები, პასუხის დრო, RG.
კვაზიექსპერიმენტები: DiD/სინთეზური კონტროლი, როდესაც რანდომიზაცია შეუძლებელია (მაგალითად, რეგიონალური გამონადენი).
Uplift მოდელები: ისინი მიზნად ისახავს დაბრუნების ზრდას და არა საქმიანობის ალბათობას; შეაფასეთ Qini/AUUC.
8) R- გააქტიურება: გამომწვევები და პოლიტიკა
სიგნალები: სიხშირის ვარდნა, N დღის დეპოზიტების არარსებობა, არანორმალურად დაბალი შემოწმება, დასრულებული ონბორდი მე -2 სესიის გარეშე.
Decision table (მაგალითი)
ჰისტერეზი: სხვადასხვა ბარიერი შესასვლელი/სიგნალის გასასვლელი ისე, რომ არ მოხდეს „მოციმციმე“.
არხები: in-app, foot, el-mail, SMS, ქოლ-ცენტრი - საბაზო-ლიმიტით და პრიორიტეტებით.
9) შემაკავებელი მეტრიკა
D1/D7/D30 (Rolling/Exact), WAU/MAU, Stickiness (DAU/MAU).
Survival საშუალო/კვანტური; ჰაზარდი ინტერვალებით.
Reactivation rate (R30), Dormancy share.
ROMI re- გააქტიურება, NNT (რამდენი კონტაქტი 1 დაბრუნებისთვის).
Fairness: მეტრიკის განსხვავებები ქვეყნის/პლატფორმების მიხედვით; გამორიცხეთ პოლიტიკოსის მიუღებელი ნიშნები.
10) დაშბორდები
კოჰორტული გათბობის ბარათი + ტენდენციური ხაზები D1/D7/D30.
Survival/hazard გრაფიკა სეგმენტებში.
ადრეული ცხოვრების ძაბრი: install - reg - KYC - პირველი თამაში - 1 ანაბარი.
მოქმედების რუკა: სიგნალი - გამოსავალი არხის შედეგს.
Guardrails: მონაცემების სიახლის, მოვლენების შესახებ, საჩივრები, RG ინდიკატორები.
11) მონაცემები და ხარისხი
მოვლენები: კანონიკური სქემა (UTC, ვერსიები), იდემპოტენტობა, დედაპლატი.
იდენტურობა: user/device/e-mail/ტელეფონი - ხიდები და ოქროს ჩანაწერი.
ფანჯრები და TZ: შენახვა UTC + ადგილობრივ წარმოდგენებში; ერთი არდადეგების კალენდარი.
ფილტრები: ბოტები/QA/frode - გამორიცხეთ კოჰორტი და საქმიანობა.
მეტრიკის ვერსია: 'RET _ D7 _ vN' changelog.
12) ფსევდო-SQL/პითონის რეცეპტები
Rolling D30 კოჰორტებზე
sql
WITH base AS (
SELECT user_id, DATE_TRUNC('day', MIN(ts)) AS cohort_day
FROM event_register GROUP BY 1
),
act AS (
SELECT user_id, DATE_TRUNC('day', ts) AS d
FROM event_activity
),
roll30 AS (
SELECT b. cohort_day,
COUNT(DISTINCT b. user_id) AS cohort_size,
COUNT(DISTINCT CASE WHEN a. d BETWEEN b. cohort_day AND b. cohort_day + INTERVAL '30 day'
THEN b. user_id END) AS any_1_30
FROM base b LEFT JOIN act a ON a. user_id = b. user_id
GROUP BY 1
)
SELECT cohort_day, any_1_30::decimal/cohort_size AS rolling_d30
FROM roll30;
კაპლან-მეიერი (ესკიზი)
python t_i - time to outflow or censorship; e_i - event indicator
S(t) = Π_{t_i ≤ t} (1 - d_i / n_i)
discrete-hazard (დღის ლოგიტი)
python
For each user, create records before the event/censorship by day:
target = 1 if there was an outflow on that day; characteristics: calendar, activity, promo, etc.
Training logistic regression/GBM; forecast p_t - probability of outflow on day t.
13) შეფერხება
ზონები: Persuadables (ჩვენ დავუბრუნდებით კონტაქტს), Sure things (ასე დაბრუნდება), Lost causes, Do-not-disturb (კონტაქტი ზიანს აყენებს).
მეტრიკი: uplift @ k, Qini/AUUC; პოლიტიკა - ჩვენ დაუკავშირდით ტოპ k- ს ბიუჯეტისთვის.
Guardrails: cap კონტაქტების სიხშირეზე, RG/ეთიკა, კონტაქტის მიზეზის ახსნა.
14) ოპერაციული ოპერაცია
SLO: ჭრელი დაშბორდის განახლება 06:00 სთ.; რისკის შემცირების შეზღუდვა 300 ms; Decision→Action ≤ 5 с.
მონიტორინგი: მრუდის ცვლა სეგმენტებში, PSI ნიშნების დრიფტი, „მოვლენების კლდე“.
Runibuki: D1 ვარდნა (onboarding/გამოშვება), D7 ვარდნა (შინაარსი/სიხშირე), საკომუნიკაციო არხების ადგილობრივი გაუმართაობა.
15) ხშირი შეცდომები
ერთეულების (სესიების მომხმარებლები), TZ, საქმიანობის ფანჯრების ნაზავი.
Rolling და Exact- ის შედარება თანაბარი იყო.
ბოტების/ფროდის უგულებელყოფა, გადაჭარბებული D1/D7.
დასკვნები კორელაციის შესახებ მიზეზობრივი შემოწმების გარეშე.
ჰისტერეზის/კულდუნის არარსებობა კონტაქტების დაღლილობა.
LTV- სთან არანაირი კავშირი არ არსებობს - ჩვენ ოპტიმიზაციას უწევს CR- ს, მაგრამ არა ღირებულებას.
16) ჩეკის სია შეფერხების მიკროსქემის გამოსვლამდე
- მეტრიკის პასპორტი (მოქმედების გამომწვევი, ფანჯარა, TZ, ვერსია)
- კოჰორტის მოხსენებები და სუვერენული/ჰაზარდი სეგმენტებზე
- გადინების და გადინების რისკის მოდელები, ქუდები და guardrails არხები
- გეგმა A/B და/ან კვაზი-ექსპერიმენტები ინტერვენციისთვის
- Dashbords ახალი/coverage/საჩივრები/RG
- რუნიბუკის ინციდენტები, ჰისტესეზი და სახელმწიფო-ლიმიტები პოლიტიკაში
- LTV და ROMI შეკავება; პრიორიტეტიზაცია მოსალოდნელი ღირებულებისთვის
შედეგი
შეკავების ანალიზი არა მხოლოდ „კოჰორტის სითბოს კარტია“, არამედ კონტროლირებადი სისტემა: სწორი განმარტებები, survival/hazard მოდელები, კომუნიკაცია ღირებულებასთან, მიზნობრივი და ეთიკური ინტერვენციები, ეფექტის მკაცრი შეფასება და ოპერაციული guardrails. თქვენ ააშენეთ ციკლი „დააკვირდით, გააცნობიერეთ, გადაწყვიტეთ მოქმედება და ისწავლეთ“, რაც სტაბილურად ზრდის LTV- ს და ამცირებს გადინებას.