تجزیه و تحلیل تبدیل
تجزیه و تحلیل تبدیل
تبدیل فقط "عدد تقسیم بر عدد نیست. این یک سیستم کنترل شده است: تعاریف روشن و طرح رویداد → مخرج صحیح و پنجره زمان → تقسیم بندی و انتساب → ارتباط با ارزش (LTV/ROMI) → نظارت و آزمایش. در زیر یک چارچوب است که مقیاس از فعال سازی محصول به پرداخت و بازاریابی قیف است.
1) تعاریف و فرمول اصلی
حوادث قیف: مراحل متوالی (مشاهده → کلیک → تایید → سپرده → عمل هدف).
تبدیل گام: (\text {CR} _ {i\to} =\frac {\text {\text {unique entities که} j\text {after} i} {\text {unique entities that have achieved} i})
تبدیل انتها به انتها: (\text {CR} {0\to k} =\prod {s = 0} ^ {k-1 }\text {CR} _ {s\to s + 1})
واحد حسابداری: کاربر/جلسه/دستگاه/سفارش - اصلاح صریح.
پنجره زمان: محدودیت بین مراحل (به عنوان مثال،. چک کردن → سپرده ≤ 7 روز).
قانون طلایی: اولین سندی که نشان می دهد چه کسی در مخرج قرار دارد، «چه زمانی» و «چه چیزی موفقیت آمیز است».
2) برگه های اطلاعات (قالب)
متریک: 'CR _ REG2DEP _ 7D _ v2'
تعریف: نسبت کاربران ثبت نام شده که سپرده ≥1 7 روز ساخته شده است.
واحد: کاربر (user_id، master_id).
پنجره: 7 × 24 ساعت از «ts _ registration».
استثنا: رباتها/حساب تقلب/تست/تکراری.
بخش های پیش فرض: کشور، پلت فرم، کانال جاذبه.
منابع: «event _ register»، «event _ deposit».
گاردریل: fresh≤1ch، coverage≥99٪، antifroda≤Kh FPR.
نسخه/صاحبان/تاریخ فرهنگ لغت.
3) طرح رویداد و کیفیت داده ها
طرح کانونی: «event _ id»، «user _ id»، «device _ id»، «session _ id»، «ts»، «type»، «payload»، «source»، «version».
Idempotence: dedup توسط '(source_id، checksum)' ؛ ورود به سیستم اصلاح.
تمیز کردن: فیلترهای ربات (سرعت، بدون سر، شناخته شده-ASN)، پرچم های تقلب، حساب های تست.
هویت: پل 'user _ id ↔ device/email/phone'، کمک در مورد تقسیم/ادغام کاربران.
4) مخرج صحیح: تله های مکرر
تعصب انتخاب: «فقط دیروز در مخرج مخرج فعال» → برآورد بیش از حد CR.
بقا: کسانی که قبل از مرحله خارج شدند حذف شدند - CR مصنوعی در حال رشد است.
مخلوط کردن واحد: مخرج - جلسات، صورت - کاربران.
Double attribution: یک موفقیت به چندین کانال نسبت داده می شود.
میانگین میانگین ها: میانگین CR در بخش ها به جای جمع کننده های عددی/مخرج.
5) Pseudo-SQL: قیف با ویندوز و منحصر به فرد
sql
WITH regs AS (
SELECT user_id, MIN(ts) AS ts_reg
FROM event_register
WHERE ts BETWEEN:from AND:to
GROUP BY user_id
),
deps AS (
SELECT user_id, MIN(ts) AS ts_dep
FROM event_deposit
GROUP BY user_id
),
eligible AS (
SELECT r.user_id, r.ts_reg, d.ts_dep
FROM regs r
LEFT JOIN deps d
ON d.user_id = r.user_id
AND d.ts_dep BETWEEN r.ts_reg AND r.ts_reg + INTERVAL '7 day'
)
SELECT
COUNT() AS users_reg,
COUNT(ts_dep) AS users_dep_7d,
COUNT(ts_dep)::decimal / COUNT() AS cr_reg2dep_7d
FROM eligible;
رها کردن در مراحل
sql
-- Пример: просмотр → регистрация → депозит (7d)
WITH base AS (...), -- ваш источник views AS (...), regs AS (...), deps AS (...)
SELECT
COUNT(DISTINCT views.user_id) AS step0_view,
COUNT(DISTINCT regs.user_id) AS step1_reg,
COUNT(DISTINCT CASE WHEN regs.ts BETWEEN views.ts AND views.ts + INTERVAL '24 h'
THEN regs.user_id END) AS view2reg_24h,
COUNT(DISTINCT CASE WHEN deps.ts BETWEEN regs.ts AND regs.ts + INTERVAL '7 day'
THEN deps.user_id END) AS reg2dep_7d;
6) گروه ها و تقسیم بندی
گروه ها: فرم بر اساس تاریخ اولین رویداد (ثبت نام/اولین بازدید) → مقایسه منحنی تبدیل.
بخش ها: کشور/کانال/پلت فرم/OS/دستگاه/محتوا/قیمت/شریک.
قیف بر اساس بخش: CR و رها کردن قبل/بعد از سهام، انتشار، تغییرات UX.
عدالت: بررسی تفاوت های خطا/CR در بخش های حساس (اخلاق/انطباق).
7) انتساب: که «سزاوار» تبدیل
تک لمسی: آخرین/اولین کلیک - ساده، اما تحریف چرخه طولانی است.
مبتنی بر موقعیت: فروپاشی U شکل/خطی/زمان.
داده محور (Shapley/Markov): سهم کانال را به ترتیب ارزیابی می کند.
کنترل تکراری: یک موفقیت = یک اعتبار (یا به اشتراک گذاشته شده)، نسخه الگوریتم ثابت شده است.
8) تبدیل میکرو و کیفیت کلیک کنید
مراحل میکرو: مشاهده قیمت گذاری، اضافه کردن به سبد، بررسی KYC، پر کردن فرم 50٪.
کیفیت ترافیک: نرخ گزاف گویی، جلسات درگیر، سهم دیدگاه های «معتبر»، الگوهای ربات.
ارتباط با ارزش: میکرو تبدیل تنها مفید هستند اگر همبستگی/علیت مربوط به اثر کسب و کار (LTV، GGR، خالص).
9) تبدیل به لینک پول: CAC، LTV، ROMI
CAC: هزینه جذب در هر واحد تبدیل (ثبت نام/سپرده/خرید).
ROMI: (\frac {\text {Incremental Revenue}} {\text {Marketing Cost}} - 1).
تبدیل وزن LTV: اولویت بندی بخش ها/کانال ها نه توسط CR، بلکه با ارزش مورد انتظار.
علیت: نمره ROMI - از طریق A/B، DiD، کنترل مصنوعی ؛ همبستگی کافی نیست.
10) آزمایش و بالا بردن
آزمون A/B: تصادفی، MDE/قدرت، فصلی و حسابداری دخالت.
معیارها: هسته CR + guardrails (شکایات، تاخیر، FPR ضد تقلب).
مدل های Uplift: سود تبدیل هدف، نه احتمالات رویداد ؛ نرخ Qini/AUUC، uplift @ k.
11) جنبه های زمان و پنجره ها
نگاه به عقب/نگاه به جلو: پنجره بین قرار گرفتن در معرض (کلیک کنید/مشاهده) و تبدیل/سپرده.
Hysteresis: آستانه ورودی/خروجی مختلف برای روشن/خاموش کردن regressors تبلیغی به طوری که به «چشمک زدن».
تقویم: تعطیلات، حقوق و دستمزد، رویدادهای بزرگ - regressors اجباری/پرچم.
12) چند دستگاه و تقسیم بندی
متقابل دستگاه: نمودار شناسه (کوکی/دستگاه/IDFA/ایمیل/تلفن).
یک به یک: ما یک اقدام هدف را یک بار برای هر کاربر (یا هر سفارش/پرداخت) شمارش می کنیم.
تست/آنلاین: لیست های فیلتر شده از QA/اپراتورها/رباتها - خارج از مخرج و صورت.
13) تجسم و گزارش
گام میله/Sankey: رها کردن در مراحل.
نقشه های گرمای کوهورت: CR در روز 1/3/7/14/30.
نمودارهای پل: سهم عوامل در تغییر CR (UX، تبلیغی، مخلوط کانال).
Dash: تایمر تازه، رویدادهای پوشش، گارد محافظ، هشدارها.
14) نظارت، SLO ها و هشدارها
تازگی SLO: تاخیر به روز رسانی ≤ N دقیقه/ساعت.
نگهبانان کیفیت: پشت سر هم از رباتها/تقلب, اختلاف هویت, قطره در پوشش.
هشدارها: انحراف CR از پیش بینی فصلی، شکستگی رویداد، رشد خطا/تأخیر.
15) Pseudo-SQL: آخرین تخصیص غیر مستقیم
sql
WITH touch AS (
SELECT user_id, channel, ts,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY ts DESC) AS rn
FROM session_touchpoints
WHERE is_direct = false
AND ts <= (SELECT first_conversion_ts FROM conversions WHERE conversions.user_id = session_touchpoints.user_id)
),
credit AS (
SELECT user_id, channel FROM touch WHERE rn = 1
)
SELECT channel, COUNT() AS conv, COUNT()::decimal / SUM(COUNT()) OVER() AS share
FROM credit
GROUP BY channel
ORDER BY conv DESC;
16) ضد الگوهای
میانگین CR توسط کشور/کانال بدون وزن.
مخلوط واحد (جلسات در مقابل کاربران) و مناطق زمانی.
نادیده گرفتن تعاریف فرمول و نسخه (متریک «شناور»).
ویندوز «همانطور که معلوم است» (ثابت نیست) → CR قابل مقایسه نیست.
عدم وجود فیلترهای ربات/تقلب → معیارهای بالا.
انتساب آخرین کلیک به عنوان تنها حقیقت برای همه تصمیمات.
17) چک لیست قبل از انتشار گزارش تبدیل
- گذرنامه متریک: تعریف، واحد، پنجره، استثنا، منابع، نسخه
- الگوی رویداد canonized، dedup/idempotence گنجانده شده است
- رباتها/تقلب/حساب QA حذف شدند ؛ هویت های مخلوط
- ویندوز و مخرج مستند ؛ مناطق موقت توافق کردند
- بخش ها/گروه های آزمایش شده ؛ invariants (DAU ≤ MAU، مقدار روزانه = ماه) ملاقات کرد
- تخصیص انتخاب شده و شرح داده شده ؛ اعتبار دو برابر حذف شده است
- رابطه ارزش: CAC/LTV/ROMI اضافه شده، ارزیابی علی برنامه ریزی شده
- داشبورد: طراوت، پوشش، گاردریل ؛ هشدارها تنظیم می شوند
18) واژه نامه کوتاه
CR (Conversion Rate): نسبتی که فعالیت هدف را تکمیل کرده است.
Drop-off: سهم «کاهش یافته» بین مراحل.
Attribution: روش اختصاص شایستگی برای تبدیل با لمس.
کوهورت: گروه بر اساس تاریخ اولین رویداد.
ROMI: بازده سرمایه گذاری بازاریابی (افزایشی).
بالا بردن: سود تبدیل از مداخله.
Guardrails: محدود کننده های خطر (شکایات، FPR، تاخیر).
نتیجه گیری
تجزیه و تحلیل تبدیل قابل اعتماد به سه نهنگ متکی است: تعاریف صحیح (مخرج/پنجره/واحد)، نظم و انضباط داده ها (idempotency، dedup، antiboot)، ارتباط با ارزش (LTV/CAC/ROMI و علیت). با ساختن قیف ها، گروه ها، اسناد و نظارت بر چارچوب توصیف شده، معیارهایی را دریافت می کنید که می توانید محصول و بازاریابی را مدیریت کنید و نه فقط نمودارها را مشاهده کنید.