نشانه های رفتاری
نشانه های رفتاری
نشانه های رفتاری «تله متری» تعامل کاربر با یک محصول است: رویدادها، زمینه ها و سری های زمانی که از آن قصد، علاقه، کیفیت ترافیک، ریسک و ارزش را استنباط می کنیم. مدار قابل اعتماد از کار با سیگنال: ابزار دقیق → جمع آوری → تمیز کردن → عادی → نشانه تشکیل → استفاده در راه حل → نظارت و اخلاق.
1) سیگنال های رفتاری را در نظر بگیرید
جلسات: شروع/توقف، مدت زمان، تعداد صفحه نمایش، عمق، تکرار در روز، جلسات «آرام».
کلیک/لمس/اسکرول: تراکم کلیک، سرعت پیمایش، عمق، توقف (اسکرول توقف).
زمان خاموش: زمان روی صفحه/عنصر، زمان فعال (فیلتر بیکار).
ناوبری/ارتباط صفحه نمایش: توالی، حلقه ها، ناوبری خشم.
ورودی/فرم ها: سرعت پر کردن، اصلاحات، ناوبری برگه، سرعت چسباندن.
میکرو تعامل: شناور، نشان می دهد، سوئیچ ها، انواع/فیلتر.
محتوا/جستجو: نمایش داده شد، CTR، CTCVR، موجب صرفه جویی، «به تعویق انداختن برای بعد».
تکنیک: دستگاه/مرورگر، وضعیت FPS/باتری، خطاها، تأخیر، شبکه ها (IP/ASN)، آفلاین/آنلاین.
زمان/زمینه: ساعت/روز/تقویم محلی، الگوهای جغرافیایی (بدون موقعیت جغرافیایی دقیق مگر اینکه مورد نیاز).
بازخورد منفی: پنهان کردن، شکایت، لغو اشتراک، امتناع از کوکی ها/شخصی سازی.
2) ابزار دقیق و نمودار رویداد
طرح متعارف (حداقل):
event_id, user_id, session_id, ts_utc, type, screen/page, element, value, duration_ms,
device_id, platform, app_version, locale, referrer, ip_hash, asn, experiment_id, schema_version
اصول: idempotency (dedup توسط '(source_id، checksum)')، زمان UTC، نسخه طرح، کلید هویت پایدار، حداقل سازی PII (هش/نشانه).
3) تمیز کردن و ضد رباتها
پرچم های بی سر/اتوماسیون: امضاهای WebDriver/puppeteer، حرکات سفارشی از دست رفته.
سرعت غیر طبیعی: کلیک/پیمایش فوق العاده انسان، فواصل «کامل».
شبکه: مراکز میزبانی داده، پروکسی شناخته شده/VPN ASN.
تکرارپذیری الگو: همان مسیرها و توالی ها.
QA/internal: لیست حساب ها/دستگاه های تست.
تقلب: دستگاه/IP-graph (یک دستگاه → بسیاری از حساب ها، سرعت جغرافیایی).
4) عادی سازی و نقطه در زمان (PIT)
پنجره های زمان: 5 دقیقه/1 ساعت/24 ساعت/7 روز ؛ خارج از کشور صاف کردن.
فصلی: روز هفته، ساعت روز، پرچم های تعطیلات.
برش های PIT: تمام ویژگی ها تا زمان ارزیابی ساخته می شوند ؛ هیچ اطلاعاتی از آینده
برابری آنلاین/آفلاین: دستور العمل های مشابه در فروشگاه ویژگی.
5) کیفیت و اعتبار سیگنال
پوشش: سهم جلسات/صفحه نمایش با رویدادهای کامل.
تازگی: تاخیر در پذیرش
سازگاری: نسبت رویدادها در هر کاربر/جلسه در «راهروها» (کنترل انتشار).
توجه: فیلتر زمان فعال/idl، عمق پیمایش، متوقف می شود.
قصد: انتقال به عمل عمیق (filtr → detal → tselevoye).
قابلیت اطمینان: ضد ربات سرعت، اعتماد به دستگاه/IP.
6) مهندسی ویژگی
R/F: فرکانس آخرین تعامل، فرکانس بیش از ویندوز 7/30/90.
ساکن/پیمایش: میانه ها/چندک ها، نسبت صفحه نمایش با ساکن ≥ X، عمق ≥ p٪.
توالی: n-grams، انتقال مارکوف، الگوهای «پشیمانی» (عقب)، طول اجرا.
ثبات دستگاه: تغییرات دستگاه/مرورگر، عوامل کاربر آنتروپی.
کیفیت کلیک: نسبت کلیک به عناصر قابل کلیک، کلیک خشم.
جستجو/قصد: طول/پالایش نمایش داده شد، ساکن پس از جستجو، میزان موفقیت.
تجمع هویت: user_id، device_id، ip_hash، ASN.
هیبریدها: Session embedding (Doc2Vec/Transformer) → خوشه بندی/رتبه بندی.
7) سیگنال → عمل: جدول تصمیم گیری
Hysteresis و cooldowns اجباری هستند به طوری که به «چشمک زدن» سرنخ.
8) شبه SQL/دستور العمل
A. زمان و عمق پیمایش فعال
sql
WITH ev AS (
SELECT user_id, session_id, page, ts,
SUM(CASE WHEN event='user_active' THEN duration_ms ELSE 0 END) AS active_ms,
MAX(CASE WHEN event='scroll' THEN depth_pct ELSE 0 END) AS max_depth
FROM raw_events
WHERE ts BETWEEN:from AND:to
GROUP BY 1,2,3,4
)
SELECT user_id, session_id,
AVG(active_ms) AS avg_dwell_ms,
PERCENTILE_CONT(0. 5) WITHIN GROUP (ORDER BY max_depth) AS scroll_median
FROM ev
GROUP BY 1,2;
B. خشم کلیک می کند/به جلو
sql
WITH clicks AS (
SELECT user_id, session_id, ts,
LAG(ts) OVER (PARTITION BY user_id, session_id ORDER BY ts) AS prev_ts,
element
FROM ui_events WHERE event='click'
),
rage AS (
SELECT user_id, session_id,
COUNT() FILTER (WHERE EXTRACT(EPOCH FROM (ts - prev_ts)) <= 0. 3) AS rage_clicks
FROM clicks GROUP BY 1,2
),
backforth AS (
SELECT user_id, session_id,
SUM(CASE WHEN action IN ('back','forward') THEN 1 ELSE 0 END) AS nav_bf
FROM nav_events GROUP BY 1,2
)
SELECT r. user_id, r. session_id, r. rage_clicks, b. nav_bf
FROM rage r JOIN backforth b USING (user_id, session_id);
C. سرعت آنتی بوت (طرح)
sql
SELECT user_id, session_id,
(CASE WHEN headless OR webdriver THEN 1 ELSE 0 END)0. 4 +
(CASE WHEN asn_cat='hosting' THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN click_interval_std < 50 THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN scroll_speed_avg > 5000 THEN 1 ELSE 0 END)0. 2 AS bot_score
FROM telemetry_features;
توالی D-n-gram
sql
-- Collect screen sequences and transition frequencies
SELECT screen_seq, COUNT() AS freq
FROM (
SELECT user_id, session_id,
STRING_AGG(screen, '→' ORDER BY ts) AS screen_seq
FROM nav_events
GROUP BY 1,2
) t
GROUP BY screen_seq
ORDER BY freq DESC
LIMIT 1000;
9) نشانه های رفتاری در ML/تجزیه و تحلیل
تمایلات/شخصی سازی: مدل CTR/CTCVR، تعبیه جلسه، بهترین اقدام بعدی.
خروج/نگهداری: مدل های خطر، نشانه های فرکانس/فرکانس/توالی.
Antifraud: سرعت فرم ها، geo-velo، دستگاه/IP-graph، قالب «مزارع».
کیفیت ترافیک: «دیدگاه های معتبر»، جلسات درگیر، بازخورد منفی.
A/B و علیت: معیارهای توجه به عنوان واسطه ها، اما نتیجه گیری با افزایش (ROMI/LTV، حفظ).
10) تجسم
Sankey/step-bars: مسیرها و رها کردن.
Heatmaps: عمق پیمایش، کارت های کلیک (غیر شخصی).
کوهورت × سن: چگونه سیگنال های سن کوهورت تغییر
نمودارهای پل: سهم عوامل (سرعت، پیمایش، خطاها) در تغییر تبدیل.
11) حریم خصوصی، اخلاق، RG/انطباق
به حداقل رساندن PII: شناسه هش، RLS/CLS، ماسک در هنگام صادرات.
رضایت/شفافیت: تنظیم ردیابی، امتناع - احترام ؛ منطق قابل توضیح است.
RG: از سیگنال ها برای تشویق رفتار مضر استفاده نکنید ؛ یادآورهای نرم/محدودیت ها
عدالت: بررسی تفاوت های خطا/مداخله توسط گروه ؛ خصوصیات نامعتبر را حذف کنید.
ذخیره سازی: زمان بندی TTL برای رویدادهای «خام»، تجمع ترجیح داده شده است.
12) قابلیت مشاهده و رانش
کیفیت داده: پوشش، تکراری، عقب ماندگی، درصد فیلدهای خالی.
رانش سیگنال: PSI/KL توسط ساکن/پیمایش/فرکانس ؛ الگوهای «جدید»
عامل: جمع آوری تاخیر، محاسبه p95 از علائم، سهم folbacks.
Guardrails: افزایش ربات scor، شکایات، لغو اشتراک ؛ «توقف جرثقیل» در مداخلات تهاجمی.
13) ضد الگوهای
کلیکهای خام بدون context/idl filter → false «توجه».
مخلوط کردن واحد (sessii↔polzovateli)، TZ، پنجره → اختلاف.
چهره هایی از آینده (بدون PIT) → ارزیابی مجدد مدل ها.
عدم تحمل به سر و صدا: آستانه های سخت بدون هیسترزیس → «چشمک زدن».
فیلترهای ضد رباتها/QA را نادیده بگیرید → معیارهای بیش از حد تخمین زده شده.
ضبط PII اضافی بدون هیچ دلیلی → خطرات و جریمه.
14) چک لیست ماشه حلقه سیگنال رفتاری
- طرح رویداد (نسخه ها، UTC، idempotency)، به حداقل رساندن PII
- ضد رباتها/QA فیلتر، ASN/دستگاه لیست سیاه/سفید
- دستور العمل های PIT، پنجره های 5m/1h/24h/7d، برابری آنلاین/آفلاین
- معیارهای کیفیت: پوشش، طراوت، اعتبار سنج تعامل
- R/F/ساکن/اسکرول/دنباله/جستجو، جلسه تعبیه
- جداول تصمیم گیری: اقدامات، هیسترزیس، خنک کننده، گارد محافظ
- داشبورد رانش و هشدار (PSI/KL)، شکایات/لغو اشتراک، شاخص RG
- مستندات: فرهنگ لغت داده، گذرنامه سیگنال/متریک، صاحبان و runibooks
مجموع
سیگنال های رفتاری تنها در یک مدار منظم ارزش دارند: ابزار دقیق و PIT، تمیز کردن و ضد رباتها، نشانه های پایدار و سیاست های عمل روشن، حفظ حریم خصوصی و RG، مشاهده پذیری و پاسخ رانش. این رویکرد کلیک ها و پیمایش ها را به راه حل هایی تبدیل می کند که تبدیل، نگهداری و LTV را افزایش می دهد - با خیال راحت، شفاف و تولید مثل.