खिलाड़ी प्रतिधारण विश्लेषण
खिलाड़ी प्रतिधारण विश्लेषण
प्रतिधारण उत्पाद अर्थव्यवस्था का मूल है: जितना अधिक समय तक एक खिलाड़ी सक्रिय रहता है, एलटीवी उतना ही अधिक स्थिर रहता है, आय उतनी ही अधिक स्थिर होती है और योजना का अनुमान अधिक होता है। नीचे एक पूर्ण ढांचा है: सही परिभाषाओं से लेकर उत्तरजीविता मॉडल और पुन: सक्रियण सर्किट तक।
1) परिभाषाएं और लेखा इकाइयाँ
इकाई: खिलाड़ी (user/master_id) - डिफ़ॉल्ट रूप से; अल्पकालिक कार्यों के लिए, एक "खाता/उपकरण" की अनुमति है, लेकिन इसे मीट्रिक पासपोर्ट में रिकॉर्ड करें।
गतिविधि: वापसी मानदंड (≥1 सत्र/ ≥1 दर/ ≥1 जमा) - रिकॉर्ड।
प्रतिधारण डीएन: संदर्भ तिथि के बाद दिन एन पर लौटने वाले कोहोर्ट का अनुपात।
रोलिंग/ब्रैकेट: रोलिंग डी 7 (किसी भी दिन 1-7) बनाम सटीक डी 7 (7 दिन)।
मंथन: ≥T दिनों के लिए कोई गतिविधि नहीं (जैसे, 14/30); एक उत्पाद नियम के रूप में निर्दिष्ट है।
सहकर्मी: पंजीकरण/पहला जमा/पहला गेम की तारीख तक - विपणन/उत्पाद कार्य के लिए चुनें।
2) बेसिक एनालिटिक्स: कॉहोर्ट्स और रिटेंशन कर्व्स
कोहोर्ट हीट मैप्स: D1/D3/D7/D14/D30/D60; विकर्ण रिलीज और अभियानों के बीच तुलनीय हैं।
उत्तरजीविता घटता: दिन 0 से एन (उत्तरजीविता वक्र) तक सक्रिय का अनुपात।
वक्र ज्यामिति: छुट्टियों/रिलीज़के "चरण"; प्रारंभिक "पतन " ऑन बोर्डिंग समस्याएं, "लंबी पूंछ" - कोर वफादार।
छद्म-एसक्यूएल: कोहोर्ट डी 7
sql
WITH regs AS (
SELECT user_id, DATE_TRUNC('day', ts) AS cohort_day
FROM event_register
),
act AS (
SELECT user_id, DATE_TRUNC('day', ts) AS act_day
FROM event_activity
),
d7 AS (
SELECT r. cohort_day,
COUNT(DISTINCT r. user_id) AS cohort_size,
COUNT(DISTINCT CASE WHEN a. act_day = r. cohort_day + INTERVAL '7 day'
THEN r. user_id END) AS retained_d7
FROM regs r
LEFT JOIN act a ON a. user_id = r. user_id
GROUP BY 1
)
SELECT cohort_day, cohort_size,
retained_d7::decimal / NULLIF(cohort_size,0) AS cr_d7
FROM d7
ORDER BY cohort_day;
3) अस्तित्व और खतरे वाले मॉडल
कपलान-मीयर: गैर-मॉडल उत्तरजीविता स्कोर (एस (टी)); वक्र और जीवन माध्यिका के "आकार स्ट्रिपिंग" के लिए उपयोगी।
कॉक्स पीएच/त्वरित विफलता समय: खतरे पर विशेषताओं (देश, चैनल, मंच, बोनस, सामग्री) के प्रभाव के व्याख्यात्मक मॉडल (बहिर्वाह का जोखिम)।
असतत समय खतरा (दिन के हिसाब से लॉग): उत्पाद एनालिटिक्स और कैलेंडर सुविधाओं के लिए लचीला।
री-एक्टिवेशन इवेंट-मॉडल अलग से (प्रतिस्पर्धी जोखिम) या मार्कोव श्रृंखला में संक्रमण के रूप में।
4) मार्कोव और अर्ध-मार्कोव मॉडल
नया → सक्रिय → निष्क्रिय → चुरनेड → पुन: सक्रिय।
संक्रमण: प्रति अवधि (दिन/सप्ताह) संभावनाएं।
मूल्य: औसत जांच/आवृत्ति द्वारा "सक्रिय" में रहने की संभावनाओं को गुणा करें - एलटीवी के लिए अपेक्षित योगदान प्राप्त करें।
5) बंडल रिटेंशन और एलटीवी
LTV ( × × छूट)।
लोच: एक्स पीपी → एलटीवी द्वारा वाई% (ऐतिहासिक डेटा/मॉडल से) द्वारा डी 7 वृद्धि।
प्राथमिकता: प्रारंभिक प्रतिधारण (D1-D7) को प्रभावित करने वाले सुधार लगभग हमेशा सबसे अधिक लाभदायक होते हैं।
6) प्रतिधारण विभाजन
ऑनबोर्डिंग cohorts: दिन 0 पर पहली सामग्री/प्ले श्रेणी/व्यवहार पैटर्न।
जियो/प्लेटफॉर्म/चैनल: यूएक्स और अपेक्षाओं के अंतर; कैलेंडर/छुट्टियों के लिए समायोजित करें।
व्यवहार/मूल्य: RFM (पुनरावृत्ति-आवृत्ति-मौद्रिक), बहिर्वाह जोखिम, लाभप्रदता।
प्रोत्साहन की प्रतिक्रिया: ऑफ़ र/सूचनाओं के उत्थान-प्रतिक्रिया पर खंड।
7) कारण और प्रयोग
A/B: ऑनबोर्डिंग, ट्यूटोरियल, पुश रणनीतियां; मुख्य मीट्रिक - D7/D14/D30 प्रतिधारण, रेलिंग - शिकायत, प्रतिक्रिया समय, आरजी।
अर्ध-प्रयोग: यादृच्छिक नियंत्रण संभव नहीं होने पर DiD/सिंथेटिक नियंत्रण (उदा। क्षेत्रीय किकआउट)।
उत्थान मॉडल: लक्ष्य वापसी लाभ, गतिविधि संभावनाएं नहीं; Qini/AUUC का मूल्यांकन करें।
8) पुन: सक्रियण: ट्रिगर और नीति
संकेत: आवृत्ति ड्रॉप, कोई जमा एन दिन, असामान्य रूप से कम जांच, 2 सत्र के बिना ऑनबोर्डिंग पूरी।
निर्णय तालिका (उदाहरण)
हिस्टेरिसिस: सिग्नल के लिए अलग-अलग इनपुट/आउटपुट थ्रेसहोल्ड ताकि "पलक" न हो।
चैनल: इन-ऐप, पुश, ई-मेल, एसएमएस, कॉल सेंटर - दर-सीमा और प्राथमिकताओं के साथ।
9) प्रतिधारण मेट्रिक्स
D1/D7/D30 (रोलिंग/सटीक), WAU/MAU, स्टिकनेस (DAU/MAU)।
उत्तरजीविता माध्य/मात्रा; अंतराल पर खतरा।
पुनर्सक्रियण दर (R30), डॉर्मेंसी शेयर।
ROMI री-एक्टिवेशन, NNT (प्रति 1 रिटर्न में कितने संपर्क)।
निष्पक्षता: देश/मंच द्वारा मीट्रिक अंतर; नीतियों से अमान्य विशेषताओं को बाहर करें।
10) प्रतिधारण डैशबोर्ड
Cohort हीट मैप + ट्रेंड लाइनें D1/D7/D30।
खंड द्वारा अस्तित्व/खतरा रेखांकन।
प्रारंभिक जीवन फ़नल: install→reg→KYC→1 igra→1 th जमा।
एक्शन मैप: signal→resheniye→kanal→iskhod (रिटर्न में रूपांतरण)।
गार्ड: डेटा की ताजगी, घटनाओं का कवरेज, शिकायतें, आरजी संकेतक।
11) डेटा और गुणवत्ता
घटनाएँ: विहित योजना (यूटीसी, संस्करण), पहचान, डेडअप।
पहचान: उपयोगकर्ता/उपकरण/ई-मेल/फोन - पुल और सोने की प्रविष्टि।
विंडोज और TZ: UTC + स्थानीय दृश्यों में भंडारण; छुट्टियों का एकल कैलेंडर।
फिल्टर: बॉट्स/क्यूए/धोखाधड़ी - सहवास और गतिविधियों से बाहर।
Versioning metrics: 'RET _ D7 _ vN' चेंजलॉग के साथ।
12) छद्म-एसक्यूएल/अजगर व्यंजनों
रोलिंग cohort द्वारा
sql
WITH base AS (
SELECT user_id, DATE_TRUNC('day', MIN(ts)) AS cohort_day
FROM event_register GROUP BY 1
),
act AS (
SELECT user_id, DATE_TRUNC('day', ts) AS d
FROM event_activity
),
roll30 AS (
SELECT b. cohort_day,
COUNT(DISTINCT b. user_id) AS cohort_size,
COUNT(DISTINCT CASE WHEN a. d BETWEEN b. cohort_day AND b. cohort_day + INTERVAL '30 day'
THEN b. user_id END) AS any_1_30
FROM base b LEFT JOIN act a ON a. user_id = b. user_id
GROUP BY 1
)
SELECT cohort_day, any_1_30::decimal/cohort_size AS rolling_d30
FROM roll30;
कपलान-मीयर (स्केच)
python t_i - time to outflow or censorship; e_i - event indicator
S(t) = Π_{t_i ≤ t} (1 - d_i / n_i)
असतत-खतरा (दिन के अनुसार लॉग इन करें)
python
For each user, create records before the event/censorship by day:
target = 1 if there was an outflow on that day; characteristics: calendar, activity, promo, etc.
Training logistic regression/GBM; forecast p_t - probability of outflow on day t.
13) उत्थान-लक्ष्यीकरण प्रतिधारण
ज़ोन: Persuadables (यदि हम संपर्क करते हैं तो वापस आ जाएंगे), सुनिश्चित चीजें (वापस आएंगी और इसलिए), खोए हुए कारण, डू-नॉट-डिस्टर्ब (संपर्क हार्म)।
मेट्रिक्स: उत्थान @ k, Qini/AUUC; राजनीति - हम बजट के लिए उत्थान द्वारा शीर्ष k से संपर्क करते हैं।
गार्ड: संपर्क आवृत्ति पर टोपी, आरजी/नैतिकता, संपर्क के कारण की व्याख्या।
14) ऑपरेशनल ऑपरेशन
SLO: रिटेंशन बोर्ड अपडेट ≤ 06:00 लॉक।; जोखिम स्कोरिंग की विलंबता ≤ 300 एमएस; Decision→Action ≤ 5 с।
निगरानी: खंडों द्वारा घटता, सुविधा बहाव का पीएसआई, "इवेंट ब्रेक।"
Runibooks: D1 ड्रॉप (ऑनबोर्डिंग/रिलीज़), D7 ड्रॉप (सामग्री/आवृत्ति), स्थानीय संचार चैनल विफलताएं।
15) बार-बार त्रुटियाँ
इकाइयों (sessii↔polzovateli), TZ, गतिविधि विंडो का मिश्रण।
रोलिंग और सटीक संकेतकों की तुलना बराबर है।
बॉट्स/धोखाधड़ीको अनदेखा करना - फुलाया ।
कारण सत्यापन के बिना सहसंबंध पर निष्कर्ष।
कोई हिस्टेरिसिस/कूलडाउन नहीं - थकान से संपर्क करें।
LTV के साथ कोई लिंक नहीं है - हम CR का अनुकूलन करते हैं, लेकिन मूल्य नहीं।
16) प्री-रिलीज़रिटेंशन लूप चेकलिस्ट
- मेट्रिक्स पासपोर्ट (गतिविधि ट्रिगर, विंडो, टीजेड, संस्करण)
- कोहोर्ट रिपोर्ट और सेगमेंट द्वारा अस्तित्व/खतरा
- बहिर्वाह और उत्थान जोखिम मॉडल, कपा और रेलिंग चैनल
- हस्तक्षेप के लिए योजना ए/बी और/या अर्ध-प्रयोग
- ताजगी/कवरेज/शिकायतें/आरजी डैशबोर्ड
- हादसा रनीबुक, हिस्टेरिसिस और नीति में दर-सीमा
- LTV और ROMI के साथ बंडल प्रतिधारण; अपेक्षित मूल्य से प्राथमिकता
कुल
प्रतिधारण विश्लेषण न केवल "कोहोर्ट्स का हीट मैप" है, बल्कि एक प्रबंधित प्रणाली है: सही परिभाषाएं, अस्तित्व/खतरा मॉडल, मूल्य, लक्षित और नैतिक हस्तक्षेप, कठोर प्रभाव मूल्यांकन और परिचालन रेलिंग के साथ। आप एक "वॉच समझते हैं एक्ट सीखते हैं" चक्र का निर्माण करते हैं जो लगातार LTV को बढ़ाता है और बहिर्वाह को कम करता है।