行为信号

行为提示

行为信号是用户与产品交互的"遥测"：事件，上下文和时间序列，我们从中推断出意图，兴趣，交通质量，风险和价值。信号操作的可靠轮廓：指示→收集→清洁→规范化→特征形成→决策中的使用→监控和道德。

1）如何考虑行为信号

会议：开始/停止，持续时间，屏幕数量，深度，每天重播，"安静"会议。
Clicks/Tach/Scroll：点击密度、滚动速度、深度、停止（滚动）。
Dwell-time：屏幕/元素上的时间，活动时间（idle filter）。
导航/屏幕关系：序列，循环，rage导航。

输入/表单： 填充速度,修复,tab导航,paste rate.

微型交互：hovers,披露,开关,排序/过滤器。
内容/搜索：查询，CTR，CTCVR，保存，"推迟到以后"。
技术人员：device/browser, FPS/电池状态,错误,延迟,网络（IP/ASN）,离线/在线。
时间/上下文：小时/天/本地日历,地理模式（不精确地理位置,除非需要）。
负面反馈：隐藏、投诉、退货、拒绝Cookie/个性化。

2）指导和事件布局

规范方案（最低）：


event_id, user_id, session_id, ts_utc, type, screen/page, element, value, duration_ms,
device_id, platform, app_version, locale, referrer, ip_hash, asn, experiment_id, schema_version

原理：相等性（通过"（source_id，checksum）"删除），UTC时间，方案版本，稳定身份密钥，PII最小化（哈希/令牌）。

3）清洁和防毒剂

无头/自动化标志：WebDriver/puppeteer签名,缺少自定义手势。
异常速度：超人点击/滚动，"完美"间隔。
网络：数据托管中心,已知代理/VPN ASN。
模式的可重复性：相同的轨迹和序列。
QA/内部：测试帐户/设备列表。
Phrod：设备/IP图形（单个Devys →许多帐户，geo-velocity）。

4）正常化和按时间（PIT）

时间窗户：5分钟/1小时/24小时/7天；expon。平滑。
季节性：每周一天，每周一小时，节日旗帜。
PIT切片：所有特征都在评估时间之前建立；没有来自未来的信息。
在线/线下平价：功能商店中的相同食谱。

5）信号的质量和有效性

覆盖：具有完整事件的会议/屏幕的比例。
新生：入学时间。
一致性："走廊"中每个用户/会话事件的比例（排放控制）。
注意：活动时间/idl过滤器，scroll depth，停止。
意图：过渡到深层行动（filtr→detal→tselevoye）。
可信度：反机器人，可信度/IP。

6）特质形成（功能工程）

R/F：最后一次互动的恢复，每个窗口的频率为7/30/90。
Dwell/scroll：中位数/分位数，具有dwell ≥ X的屏幕比例，深度≥ p％。
序列：n克，马尔可夫过渡，"悔恨"（后退）模式，奔跑。
设备稳定性：更改设备/浏览器、用户代理。
点击质量：点击率对点击元素，愤怒点击。
搜索/意图：查询长度/澄清,搜索后,dwell,成功率。
按身份分组：user_id，device_id，ip_hash，asn。
杂种：会话栓塞（Doc2Vec/Transformer）→聚类/排名。

7）信号→行动： 决策表

信号	上下文	行动	Guardrails
`rage_clicks≥3` или `latency_p95↑`	onbording	显示援助/便利表格	zhaloby≤Kh
`scroll_depth<25%` & `dwell<3с`	内容	重建块/压缩列表	SLA UI
`search_refine≥2` & `no_success`	搜索	提示/面,fallback目录	CTR不是↓
`bot_score≥τ`	任何人	降级体验/kapcha/ban	FPR antibot ≤ 0。5%
"session_runlength↑"夜晚	RG	软提醒/暂停	FPR≤1%

磁滞和culdowns是强制性的，以免被提示"闪烁"。

8）Pseudo-SQL/食谱

A.滚动时间和深度

sql
WITH ev AS (
SELECT user_id, session_id, page, ts,
SUM(CASE WHEN event='user_active' THEN duration_ms ELSE 0 END) AS active_ms,
MAX(CASE WHEN event='scroll' THEN depth_pct ELSE 0 END)     AS max_depth
FROM raw_events
WHERE ts BETWEEN:from AND:to
GROUP BY 1,2,3,4
)
SELECT user_id, session_id,
AVG(active_ms) AS avg_dwell_ms,
PERCENTILE_CONT(0. 5) WITHIN GROUP (ORDER BY max_depth) AS scroll_median
FROM ev
GROUP BY 1,2;

B. Rage-clicks / back-forth

sql
WITH clicks AS (
SELECT user_id, session_id, ts,
LAG(ts) OVER (PARTITION BY user_id, session_id ORDER BY ts) AS prev_ts,
element
FROM ui_events WHERE event='click'
),
rage AS (
SELECT user_id, session_id,
COUNT() FILTER (WHERE EXTRACT(EPOCH FROM (ts - prev_ts)) <= 0. 3) AS rage_clicks
FROM clicks GROUP BY 1,2
),
backforth AS (
SELECT user_id, session_id,
SUM(CASE WHEN action IN ('back','forward') THEN 1 ELSE 0 END) AS nav_bf
FROM nav_events GROUP BY 1,2
)
SELECT r. user_id, r. session_id, r. rage_clicks, b. nav_bf
FROM rage r JOIN backforth b USING (user_id, session_id);

C. Antibot scor（草图）

sql
SELECT user_id, session_id,
(CASE WHEN headless OR webdriver THEN 1 ELSE 0 END)0. 4 +
(CASE WHEN asn_cat='hosting' THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN click_interval_std < 50 THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN scroll_speed_avg > 5000 THEN 1 ELSE 0 END)0. 2 AS bot_score
FROM telemetry_features;

D. n-gram序列

sql
-- Collect screen sequences and transition frequencies
SELECT screen_seq, COUNT() AS freq
FROM (
SELECT user_id, session_id,
STRING_AGG(screen, '→' ORDER BY ts) AS screen_seq
FROM nav_events
GROUP BY 1,2
) t
GROUP BY screen_seq
ORDER BY freq DESC
LIMIT 1000;

9） ML/分析中的行为提示

倾向/个性化：CTR/CTCVR模型，会议安排，下一个最佳动作。
流出/保留：危险模型，响应/频率/序列特征。
Antifrod：形状速度，geo-velo，设备/IP图形，"农场"模式。
流量质量："有效视图"、插话、负面反馈。
A/B和随机性：作为中介的注意指标，但结论是增量的（ROMI/LTV，保留）。

10）可视化

Sankey/step-bars：路径和下降。
Heatmaps：滚动深度，点击卡（非人格）。
Cohort × age：信号如何根据队列年龄变化。
桥图：因子（速度、滚动、错误）对转换变化的贡献。

11）隐私，道德，RG/合规性

PII最小化：标识符哈希，RLS/CLS，导出时掩盖。
同意/透明度：设置跟踪，拒绝-尊重；逻辑是可以解释的。
RG：不使用信号来鼓励有害行为；软提醒/限制。
公平：检查各组的错误/干预差异；排除无效的特征。
存储："原始"事件的TTL时限，聚合更可取。

12）可观察性和漂移

数据质量：覆盖、重复、滞后、空白字段百分比。
信号漂移：dwell/scroll/频率的 PSI/KL；"新"模式。
手术：后期收集，p95特征计算，后卫比例。
Guardrails：爆发bot-scor，投诉，退货；攻击性干预的"停止起重机"。

13）反模式

没有上下文/idl过滤器的原始点击→错误的"注意力"。
单位（sessii↔polzovateli），TZ，窗口→不可比性的混合。
来自未来的Likes（没有PIT）→重新评估模型。
噪音耐受性：强硬的阈值没有滞后→"闪烁"。
忽略反机器人/QA过滤器→过高的度量。
无缘无故记录多余的PII →风险和罚款。

14）行为信号环路启动支票清单

事件方案（版本，UTC，等效性），PII最小化
Antibot/QA过滤器,黑色/白色ASN/设备列表
PIT配方，窗口5m/1h/24h/7d，在线/离线平价
质量度量：coverage, freshness,参与验证器
R/F/dwell/scroll/序列/搜索，会议embeddings
决策表：行动，滞留，拳击，护栏
Dashbords和Alertes漂移（PSI/KL）,投诉/退房,RG指标
文档：日记本、信号护照/指标、业主和runibuki

底线

行为信号仅在有纪律的轮廓中具有价值：正确的教学和PIT，清理和反机器人，持续的特征和明确的行动政策，隐私和RG，观察力和漂移反应。这种方法将"点击和滚动"转换为增强转换，保留和LTV的解决方案-安全，透明和可复制。

行为信号

行为提示

B. Rage-clicks / back-forth

C. Antibot scor（草图）

D. n-gram序列

底线

联系我们

快速联系

视频即将更新

我们目前正忙于各项项目