转换分析
转换分析
转换不仅仅是"除以数字的数量"。这是一个可管理的系统:明确的定义和事件方案→正确的分母和时间窗口→细分和归属→价值关系(LTV/ROMI)→监控和实验。下方是一个框架,可从产品激活扩展到支付和营销漏斗。
1)定义和基本公式
漏斗事件:连续步骤(查看→点击→注册→验证→存款→目标动作)。
步骤转换: (\text {CR} {i\to j} =\frac {\text{完成}j\text {af}{}i} {\text{唯一实体到达}i}
转换端到端: (\text {CR} {0\to k} =\prod {s=0}^{k-1}\text {CR} {s\to s+1}
会计单位:用户/会议/设备/订单-明确提交。
时间窗口:步骤之间的限制(例如,注册→存款≤ 7天)。
2)护照指标(模板)
METRIC: `CR_REG2DEP_7D_v2`
定义:已登记的用户在7天内≥1存款的百分比。
单位:用户(user_id,master_id)。
窗口:从"ts_registration" 7 × 24小时。
例外:机器人/兄弟/测试帐户/副本。
默认细分市场:国家/地区、平台、吸引渠道。
资料来源:"event_register","event_deposit"。
Guardrails:fresh≤1ch,coverage≥99%,FPR antifroda≤Kh。
版本/所有者/日记本。
3)事件图和数据质量
规范方案是:"event_id","user_id","device_id","session_id","ts","type","payload","source","version"。
相似性:"(source_id,checksum)";校正日志。
清除:机器人过滤器(速度,头部,已知ASN),指纹标志,测试帐户。
身份:"user_id ↔ device/email/phone"桥,用户的拆分/merge帮助。
4)正确分母: 频繁陷阱
Selection bias:"在分母中只有昨天活跃"→ CR过高。
Survivorship:排除前一步的人-CR人为增长。
单位混合:分母是会话,分子是用户。
双重归因:一个成功归功于多个渠道。
平均平均值:CR按段平均而不是分子/分母聚合。
5)Pseudo-SQL: 带有窗口和唯一的漏斗
sql
WITH regs AS (
SELECT user_id, MIN(ts) AS ts_reg
FROM event_register
WHERE ts BETWEEN:from AND:to
GROUP BY user_id
),
deps AS (
SELECT user_id, MIN(ts) AS ts_dep
FROM event_deposit
GROUP BY user_id
),
eligible AS (
SELECT r.user_id, r.ts_reg, d.ts_dep
FROM regs r
LEFT JOIN deps d
ON d.user_id = r.user_id
AND d.ts_dep BETWEEN r.ts_reg AND r.ts_reg + INTERVAL '7 day'
)
SELECT
COUNT() AS users_reg,
COUNT(ts_dep) AS users_dep_7d,
COUNT(ts_dep)::decimal / COUNT() AS cr_reg2dep_7d
FROM eligible;
下降步骤
sql
-- Пример: просмотр → регистрация → депозит (7d)
WITH base AS (...), -- ваш источник views AS (...), regs AS (...), deps AS (...)
SELECT
COUNT(DISTINCT views.user_id) AS step0_view,
COUNT(DISTINCT regs.user_id) AS step1_reg,
COUNT(DISTINCT CASE WHEN regs.ts BETWEEN views.ts AND views.ts + INTERVAL '24 h'
THEN regs.user_id END) AS view2reg_24h,
COUNT(DISTINCT CASE WHEN deps.ts BETWEEN regs.ts AND regs.ts + INTERVAL '7 day'
THEN deps.user_id END) AS reg2dep_7d;
6)队列和细分
队列:根据第一次活动的日期(注册/首次访问)形成→比较转换曲线。
细分市场:国家/频道/平台/OS/设备/内容/价格/合作伙伴。
按细分市场划分的漏斗:CR和在促销、发行、UX更改之前或之后下车。
公平:按敏感部分(道德/合规)检查错误/CR的区别。
7)归属: 谁"应得"转换
单击:最后/第一次点击-简单但扭曲长周期。
基于位置的:U形/线性/时间衰变。
数据驱动程序(Shapley/Markov):通过序列评估通道的贡献。
重复控制:一个成功=一个学分(或股权),算法的版本是固定的。
8)微转换和点击质量
微型步骤:查看启动、添加到购物车、KYC检查、填写表格50%。
流量质量:弹出率,插入会议,"有效"视图的比例以及颠簸模式。
价值关系:只有当与业务效应(LTV,GGR,Net)相关/因果关系时,微转换才有用。
9)转换与金钱的关系: CAC,LTV,ROMI
CAC:每单位转换的吸引成本(注册/存款/购买)。
ROMI: (\frac {\text{增量收入}{\text{营销成本}}-1)。
LTV加权转换:不按CR优先排序片段/频道,而是按预期价值排序。
因果关系:ROMI得分-通过A/B,DiD,合成控制;相关性还不够。
10)实验和uplift
A/B测试:随机化,MDE/电力,季节性和干扰会计。
度量:主要的CR+guardrails(投诉,后退,FPR对抗)。
Uplift模型:针对转换的增加而不是事件的概率;评估Qini/AUUC,uplift@k。
11)时间方面和窗口
回看/回看:曝光(点击查看)和转换/存款之间的窗口。
磁滞:不同的输入/输出阈值,用于打开/关闭促销回归器,以免出现"闪烁"。
日历:假期,薪水,大型活动是强制性的回归者/旗帜。
12)多设备和重复数据消除
跨字节:ID图形(cookie/device/IDFA/电子邮件/电话)。
一对一:用户一次计入一个目标活动(或按订单/付款)。
测试/寄宿:过滤的QA/算子/机器人列表-分母和分子之外。
13)可视化和报告
Step-bars/Sankey:步伐下降。
队列热卡:CR为1/3/7/14/30天。
桥梁图形:因子对CR变化的贡献(UX,促销,通道混合)。
Dash: fresh计时器,coverage事件,guardrails, alerts.
14)监视,SLO和Alertes
SLO新鲜度:更新时间≤ N分钟/小时。
质量守护者:机器人/品格激增,身份差异,封面下降。
Alerts: CR偏离季节预测、事件悬崖、错误上升/后退。
15)Pseudo-SQL: "最后不直接"归因"
sql
WITH touch AS (
SELECT user_id, channel, ts,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY ts DESC) AS rn
FROM session_touchpoints
WHERE is_direct = false
AND ts <= (SELECT first_conversion_ts FROM conversions WHERE conversions.user_id = session_touchpoints.user_id)
),
credit AS (
SELECT user_id, channel FROM touch WHERE rn = 1
)
SELECT channel, COUNT() AS conv, COUNT()::decimal / SUM(COUNT()) OVER() AS share
FROM credit
GROUP BY channel
ORDER BY conv DESC;
16)反模式
不带权重的国家/渠道平均CR。
单位(会话与用户)和临时区域的混合。
忽略公式和版本的定义(度量"漂浮")。
"如何工作"窗口(不固定)→不可比的CR。
缺少bot/frod过滤器→过高的度量。
"最后的点击"归因是所有决策的唯一真理。
17)转换报告发布前的支票清单
- 指标护照:定义、单位、窗口、例外、来源、版本
- 事件方案被规范化,包括去势性/相等性
- Bots/Frod/QA帐户不包括在内;身份溷合
- 窗口和分母已记录;临时区已商定
- 部分/队列已验证;不变量(DAU ≤ MAU,日数=月份)满足
- 选择和描述归属;不包括双重学分
- 价值关系:添加了CAC/LTV/ROMI,计划了因果评估
- Dashbord:新鲜,覆盖,护栏;Alerta定制
18)迷你词汇表
CR(转换率):完成目标操作的份额。
下降:在步骤之间"掉落"的份额。
Attribution:按触摸分配功绩的方法。
Cohort:按第一次活动的日期分组。
ROMI:市场投资回报(增量)。
Uplift:来自干预的转化增加。
Guardrails:风险限制因素(投诉、FPR, latency)。
结果
可靠的转化分析依赖于三个鲸鱼:正确的定义(分母/窗口/单位),数据学科(等效性,滞后性,对位性),价值关系(LTV/CAC/ROMI和因果关系)。通过在所述框架上构建漏斗、队列、归属和监控,您可以获得可以真正管理产品和营销的指标,而不仅仅是观察图形。