GH GambleHub

行为信号

行为提示

行为信号是用户与产品交互的"遥测":事件,上下文和时间序列,我们从中推断出意图,兴趣,交通质量,风险和价值。信号操作的可靠轮廓:指示→收集→清洁→规范化→特征形成→决策中的使用→监控和道德。

1)如何考虑行为信号

会议:开始/停止,持续时间,屏幕数量,深度,每天重播,"安静"会议。
Clicks/Tach/Scroll:点击密度、滚动速度、深度、停止(滚动)。
Dwell-time:屏幕/元素上的时间,活动时间(idle filter)。
导航/屏幕关系:序列,循环,rage导航。

输入/表单: 填充速度,修复,tab导航,paste rate.

微型交互:hovers,披露,开关,排序/过滤器。
内容/搜索:查询,CTR,CTCVR,保存,"推迟到以后"。
技术人员:device/browser, FPS/电池状态,错误,延迟,网络(IP/ASN),离线/在线。
时间/上下文:小时/天/本地日历,地理模式(不精确地理位置,除非需要)。
负面反馈:隐藏、投诉、退货、拒绝Cookie/个性化。

2)指导和事件布局

规范方案(最低):

event_id, user_id, session_id, ts_utc, type, screen/page, element, value, duration_ms,
device_id, platform, app_version, locale, referrer, ip_hash, asn, experiment_id, schema_version

原理:相等性(通过"(source_id,checksum)"删除),UTC时间,方案版本,稳定身份密钥,PII最小化(哈希/令牌)。

3)清洁和防毒剂

无头/自动化标志:WebDriver/puppeteer签名,缺少自定义手势。
异常速度:超人点击/滚动,"完美"间隔。
网络:数据托管中心,已知代理/VPN ASN。
模式的可重复性:相同的轨迹和序列。
QA/内部:测试帐户/设备列表。
Phrod:设备/IP图形(单个Devys →许多帐户,geo-velocity)。

4)正常化和按时间(PIT)

时间窗户:5分钟/1小时/24小时/7天;expon。平滑。
季节性:每周一天,每周一小时,节日旗帜。
PIT切片:所有特征都在评估时间之前建立;没有来自未来的信息。
在线/线下平价:功能商店中的相同食谱。

5)信号的质量和有效性

覆盖:具有完整事件的会议/屏幕的比例。
新生:入学时间。
一致性:"走廊"中每个用户/会话事件的比例(排放控制)。
注意:活动时间/idl过滤器,scroll depth,停止。
意图:过渡到深层行动(filtr→detal→tselevoye)。
可信度:反机器人,可信度/IP。

6)特质形成(功能工程)

R/F:最后一次互动的恢复,每个窗口的频率为7/30/90。
Dwell/scroll:中位数/分位数,具有dwell ≥ X的屏幕比例,深度≥ p%。
序列:n克,马尔可夫过渡,"悔恨"(后退)模式,奔跑。
设备稳定性:更改设备/浏览器、用户代理。
点击质量:点击率对点击元素,愤怒点击。
搜索/意图:查询长度/澄清,搜索后,dwell,成功率。
按身份分组:user_id,device_id,ip_hash,asn。
杂种:会话栓塞(Doc2Vec/Transformer)→聚类/排名。

7)信号→行动: 决策表

信号上下文行动Guardrails
`rage_clicks≥3` или `latency_p95↑`onbording显示援助/便利表格zhaloby≤Kh
`scroll_depth<25%` & `dwell<3с`内容重建块/压缩列表SLA UI
`search_refine≥2` & `no_success`搜索提示/面,fallback目录CTR不是↓
`bot_score≥τ`任何人降级体验/kapcha/banFPR antibot ≤ 0。5%
"session_runlength↑"夜晚RG软提醒/暂停FPR≤1%

磁滞和culdowns是强制性的,以免被提示"闪烁"。

8)Pseudo-SQL/食谱

A.滚动时间和深度

sql
WITH ev AS (
SELECT user_id, session_id, page, ts,
SUM(CASE WHEN event='user_active' THEN duration_ms ELSE 0 END) AS active_ms,
MAX(CASE WHEN event='scroll' THEN depth_pct ELSE 0 END)     AS max_depth
FROM raw_events
WHERE ts BETWEEN:from AND:to
GROUP BY 1,2,3,4
)
SELECT user_id, session_id,
AVG(active_ms) AS avg_dwell_ms,
PERCENTILE_CONT(0. 5) WITHIN GROUP (ORDER BY max_depth) AS scroll_median
FROM ev
GROUP BY 1,2;

B. Rage-clicks / back-forth

sql
WITH clicks AS (
SELECT user_id, session_id, ts,
LAG(ts) OVER (PARTITION BY user_id, session_id ORDER BY ts) AS prev_ts,
element
FROM ui_events WHERE event='click'
),
rage AS (
SELECT user_id, session_id,
COUNT() FILTER (WHERE EXTRACT(EPOCH FROM (ts - prev_ts)) <= 0. 3) AS rage_clicks
FROM clicks GROUP BY 1,2
),
backforth AS (
SELECT user_id, session_id,
SUM(CASE WHEN action IN ('back','forward') THEN 1 ELSE 0 END) AS nav_bf
FROM nav_events GROUP BY 1,2
)
SELECT r. user_id, r. session_id, r. rage_clicks, b. nav_bf
FROM rage r JOIN backforth b USING (user_id, session_id);

C. Antibot scor(草图)

sql
SELECT user_id, session_id,
(CASE WHEN headless OR webdriver THEN 1 ELSE 0 END)0. 4 +
(CASE WHEN asn_cat='hosting' THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN click_interval_std < 50 THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN scroll_speed_avg > 5000 THEN 1 ELSE 0 END)0. 2 AS bot_score
FROM telemetry_features;

D. n-gram序列

sql
-- Collect screen sequences and transition frequencies
SELECT screen_seq, COUNT() AS freq
FROM (
SELECT user_id, session_id,
STRING_AGG(screen, '→' ORDER BY ts) AS screen_seq
FROM nav_events
GROUP BY 1,2
) t
GROUP BY screen_seq
ORDER BY freq DESC
LIMIT 1000;

9) ML/分析中的行为提示

倾向/个性化:CTR/CTCVR模型,会议安排,下一个最佳动作。
流出/保留:危险模型,响应/频率/序列特征。
Antifrod:形状速度,geo-velo,设备/IP图形,"农场"模式。
流量质量:"有效视图"、插话、负面反馈。
A/B和随机性:作为中介的注意指标,但结论是增量的(ROMI/LTV,保留)。

10)可视化

Sankey/step-bars:路径和下降。
Heatmaps:滚动深度,点击卡(非人格)。
Cohort × age:信号如何根据队列年龄变化。
桥图:因子(速度、滚动、错误)对转换变化的贡献。

11)隐私,道德,RG/合规性

PII最小化:标识符哈希,RLS/CLS,导出时掩盖。
同意/透明度:设置跟踪,拒绝-尊重;逻辑是可以解释的。
RG:不使用信号来鼓励有害行为;软提醒/限制。
公平:检查各组的错误/干预差异;排除无效的特征。
存储:"原始"事件的TTL时限,聚合更可取。

12)可观察性和漂移

数据质量:覆盖、重复、滞后、空白字段百分比。
信号漂移:dwell/scroll/频率的 PSI/KL;"新"模式。
手术:后期收集,p95特征计算,后卫比例。
Guardrails:爆发bot-scor,投诉,退货;攻击性干预的"停止起重机"。

13)反模式

没有上下文/idl过滤器的原始点击→错误的"注意力"。
单位(sessii↔polzovateli),TZ,窗口→不可比性的混合。
来自未来的Likes(没有PIT)→重新评估模型。
噪音耐受性:强硬的阈值没有滞后→"闪烁"。
忽略反机器人/QA过滤器→过高的度量。
无缘无故记录多余的PII →风险和罚款。

14)行为信号环路启动支票清单

  • 事件方案(版本,UTC,等效性),PII最小化
  • Antibot/QA过滤器,黑色/白色ASN/设备列表
  • PIT配方,窗口5m/1h/24h/7d,在线/离线平价
  • 质量度量:coverage, freshness,参与验证器
  • R/F/dwell/scroll/序列/搜索,会议embeddings
  • 决策表:行动,滞留,拳击,护栏
  • Dashbords和Alertes漂移(PSI/KL),投诉/退房,RG指标
  • 文档:日记本、信号护照/指标、业主和runibuki

底线

行为信号仅在有纪律的轮廓中具有价值:正确的教学和PIT,清理和反机器人,持续的特征和明确的行动政策,隐私和RG,观察力和漂移反应。这种方法将"点击和滚动"转换为增强转换,保留和LTV的解决方案-安全,透明和可复制。

Contact

联系我们

如需任何咨询或支持,请随时联系我们。我们随时准备提供帮助!

开始集成

Email — 必填。Telegram 或 WhatsApp — 可选

您的姓名 可选
Email 可选
主题 可选
消息内容 可选
Telegram 可选
@
如果填写 Telegram,我们也会在 Telegram 回复您。
WhatsApp 可选
格式:+国家代码 + 号码(例如:+86XXXXXXXXX)。

点击按钮即表示您同意数据处理。