行動の手掛かり
行動の手がかり
行動の手掛かりは、ユーザーと製品とのやり取りの「テレメトリー」です。意図、関心、トラフィックの質、リスク、価値を推測するイベント、コンテキスト、時系列です。信号を使用した作業の信頼性の高い回路:計装→コレクション→クリーニング→正規化→記号形成→ソリューション→モニタリングと倫理での使用。
1)行動シグナルを考えるべきこと
セッション:開始/停止、期間、スクリーンの数、深さ、1日あたりの繰り返し、「静かな」セッション。
クリック/タッチ/スクロール:クリックの密度、スクロール速度、深さ、停止(スクロールストップ)。
Dwell-time:画面上の時間/要素、アクティブ時間(アイドルフィルター)。
スクリーンのナビゲーション/相互関係:シーケンス、ループ、レイジナビゲーション。
入力/フォーム:充填速度、修正、タブのナビゲーション、ペーストレート。
マイクロインタラクション:ホバー、明らかに、スイッチ、ソート/フィルタ。
コンテンツ/検索:クエリ、CTR、 CTCVR、保存「、後で延期」。
技術:デバイス/ブラウザ、FPS/バッテリーの状態、エラー、レイテンシ、ネットワーク(IP/ASN)、オフライン/オンライン。
時間/コンテキスト:時間/日/ローカルカレンダー、ジオパターン(必要な場合を除き、正確な位置情報はありません)。
否定的なフィードバック:非表示、苦情、購読解除、クッキー/パーソナライゼーションの拒否。
2)計装とイベント図
正規スキーム(最小):
event_id, user_id, session_id, ts_utc, type, screen/page, element, value, duration_ms,
device_id, platform, app_version, locale, referrer, ip_hash, asn, experiment_id, schema_version
原則:idempotency (dedup by '(source_id、 checksum)')、 UTC time、スキーマバージョン、安定したIDキー、PII最小化(ハッシュ/トークン)。
3)クリーニングおよび反ボット
ヘッドレス/オートメーションフラグ:WebDriver/puppeteer署名、カスタムジェスチャーがありません。
異常な速度:超人的なかちりと言う音/スクロール、「完全な」間隔。
ネットワーク:データホスティングセンター、既知のプロキシ/VPN ASN。
パターンの再現性:同じ軌道とシーケンス。
QA/内部:テストアカウント/デバイスのリスト。
詐欺:デバイス/IPグラフ(1つのデバイス→多くのアカウント、ジオベロシティ)。
4)正規化とポイントインタイム(PIT)
時間の窓:5分/1時間/24時間/7日;エクスポンだ。滑らかになること。
季節:曜日、曜日、休日の旗。
PITスライス:すべての機能は評価時間まで構築されます。未来からの情報はありません。
オンライン/オフラインのパリティ:フィーチャーストアで同じレシピ。
5)信号の質および有効性
カバレッジ:フルイベントでのセッション/スクリーンの共有。
新鮮さ:入場ラグ。
整合性:「回廊」(放射制御)でのユーザー/セッションごとのイベントの割合。
注意:アクティブ時間/idlフィルター、スクロールの深さ、停止。
意図:ディープアクションへの遷移(filtr→detal→tselevoye)。
信頼性:反ボット速度、装置/IPの信頼。
6)特徴工学
R/F:最後の相互作用のrecency、窓7/30/90上の頻度。
Dwell/scroll: medians/quantiles、 dwell ≥ Xのスクリーンの割合、深さ≥ p%。
配列:n-グラム、マルコフ遷移、「反省」のパターン(後ろ)、実行長さ。
デバイスの安定性:デバイス/ブラウザの変更、エントロピーユーザーエージェント。
クリック品質:クリック可能な要素へのクリックの比率、レイジークリック。
検索/意図:クエリの長さ/洗練、検索後のドウェル、成功率。
アイデンティティによる集計:user_id、 device_id、 ip_hash、 asn。
ハイブリッド:セッション埋め込み(Doc2Vec/Transformer)→クラスタリング/ランキング。
7)信号→アクション: 意思決定テーブル
ヒステリシスとクールダウンは、手がかりを「まばたき」しないように必須です。
8)疑似SQL/レシピ
A。アクティブなスクロール時間と深さ
sql
WITH ev AS (
SELECT user_id, session_id, page, ts,
SUM(CASE WHEN event='user_active' THEN duration_ms ELSE 0 END) AS active_ms,
MAX(CASE WHEN event='scroll' THEN depth_pct ELSE 0 END) AS max_depth
FROM raw_events
WHERE ts BETWEEN:from AND:to
GROUP BY 1,2,3,4
)
SELECT user_id, session_id,
AVG(active_ms) AS avg_dwell_ms,
PERCENTILE_CONT(0. 5) WITHIN GROUP (ORDER BY max_depth) AS scroll_median
FROM ev
GROUP BY 1,2;
B。 Rage-clicks/back-forth
sql
WITH clicks AS (
SELECT user_id, session_id, ts,
LAG(ts) OVER (PARTITION BY user_id, session_id ORDER BY ts) AS prev_ts,
element
FROM ui_events WHERE event='click'
),
rage AS (
SELECT user_id, session_id,
COUNT() FILTER (WHERE EXTRACT(EPOCH FROM (ts - prev_ts)) <= 0. 3) AS rage_clicks
FROM clicks GROUP BY 1,2
),
backforth AS (
SELECT user_id, session_id,
SUM(CASE WHEN action IN ('back','forward') THEN 1 ELSE 0 END) AS nav_bf
FROM nav_events GROUP BY 1,2
)
SELECT r. user_id, r. session_id, r. rage_clicks, b. nav_bf
FROM rage r JOIN backforth b USING (user_id, session_id);
C。アンチボットスピード(スケッチ)
sql
SELECT user_id, session_id,
(CASE WHEN headless OR webdriver THEN 1 ELSE 0 END)0. 4 +
(CASE WHEN asn_cat='hosting' THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN click_interval_std < 50 THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN scroll_speed_avg > 5000 THEN 1 ELSE 0 END)0. 2 AS bot_score
FROM telemetry_features;
D。 n-グラム配列
sql
-- Collect screen sequences and transition frequencies
SELECT screen_seq, COUNT() AS freq
FROM (
SELECT user_id, session_id,
STRING_AGG(screen, '→' ORDER BY ts) AS screen_seq
FROM nav_events
GROUP BY 1,2
) t
GROUP BY screen_seq
ORDER BY freq DESC
LIMIT 1000;
9) ML/Analyticsの行動の手掛かり
傾向/パーソナライゼーション:CTR/CTCVRモデル、セッション埋め込み、次のベストアクション。
アウトフロー/保持:ハザードモデル、recency/frequency/sequencesの兆候。
Antifraud:フォームの速度、地理ベロ、デバイス/IPグラフ、「農場」のテンプレート。
トラフィック品質:「有効なビュー」、エンゲージドセッション、負のフィードバック。
A/Bと因果性:メディエーターとしての注意メトリック、しかしインクリメントによる結論(ROMI/LTV、保持)。
10)ビジュアリゼーション
サンキー/ステップバー:パスとドロップオフ。
ヒートマップ:深さをスクロールし、カードをクリックします(非人格的)。
コホート×年齢:シグナルがコホートの年齢によってどのように変化するか。
ブリッジグラフ:変換の変化に要因(速度、スクロール、エラー)の寄与。
11)プライバシー、倫理、RG/コンプライアンス
PII最小化:識別子ハッシュ、RLS/CLS、エクスポート時のマスキング。
同意/透明性:トラッキング設定、拒否-尊重;ロジックは説明可能です。
RG:有害な行動を促すために信号を使用しないでください。ソフトリマインダー/制限。
公平性:グループによるエラー/介入の違いをチェックします。無効な特性を除外します。
貯蔵:「未加工」でき事のためのTTLのタイミング、好まれる集計。
12)観察可能性および漂流
データ品質:カバレッジ、重複、ラグ、空のフィールドの割合。
信号のドリフト:dwell/scroll/frequenciesによるPSI/KL;「新しい」パターン。
動作:レイテンシー収集、標識のP95計算、フォールバックの共有。
ガードレール:ボットスコアサージ、苦情、退会。攻撃的な介入の「停止クレーン」。
13)アンチパターン
コンテキスト/idlフィルタのない生クリック→false「注意」。
単位の混合(sessii↔polzovateli)、 TZ、窓→格差。
Faces from the future (no PIT)→モデルの再評価。
ノイズに対する非耐性:ヒステリシス→「点滅」なしのハードスレッショルド。
アンチボット/QAフィルタ→過大評価メトリクスを無視します。
理由なく余分なPIIを記録する→リスクと罰金。
14)行動信号ループトリガーチェックリスト
- イベントスキーマ(バージョン、UTC、 idempotency)、 PII最小化
- アンチボット/QAフィルタ、ASN/デバイスブラック/ホワイトリスト
- PITの調理法、5m/1h/24h/7d窓、オンライン/オフラインのパリティ
- 品質指標:カバレッジ、鮮度、エンゲージメントバリデータ
- R/F/dwell/scroll/sequence/search、セッション埋め込み
- 意思決定テーブル:アクション、ヒステリシス、クールダウン、ガードレール
- ドリフトダッシュボードとアラート(PSI/KL)、苦情/登録解除、RGインジケータ
- ドキュメント:データ辞書、シグナル/メトリックパスポート、所有者およびrunibooks
合計
行動信号は規律ある回路でのみ価値を提供します:正しい計装とPIT、クリーニングとアンチボット、安定した兆候と明確な行動方針、プライバシーとRG、観測性とドリフト応答。このアプローチは、クリックとスクロールを変換、保持、およびLTVを増加させるソリューションに変換します。