الإشارات السلوكية
الإشارات السلوكية
الإشارات السلوكية هي «القياس عن بعد» لتفاعل المستخدم مع المنتج: الأحداث والسياق والسلسلة الزمنية التي نستنتج منها النية والاهتمام وجودة حركة المرور والمخاطر والقيمة. دائرة العمل الموثوق بها مع الإشارات: الأجهزة → جمع → والتنظيف → والتطبيع → وتشكيل الإشارات → واستخدامها في الحلول → والرصد والأخلاق.
1) ما الذي يجب مراعاته في الإشارات السلوكية
الجلسات: البدء/التوقف، المدة، عدد الشاشات، العمق، التكرار يوميًا، الجلسات «الهادئة».
النقرات/اللمس/التمرير: كثافة النقرات، سرعة التمرير، العمق، التوقفات (توقف التمرير).
وقت الإقامة: الوقت على الشاشة/العنصر، الوقت النشط (مرشح الخمول).
الملاحة/الترابط بين الشاشات: التسلسلات، الحلقات، الملاحة الغاضبة.
المدخلات/النماذج: سرعة الملء، والتصحيحات، وملاحة علامة التبويب، ومعدل العجينة.
التفاعلات الدقيقة: تحوم، تكشف، مفاتيح، أنواع/مرشحات.
المحتوى/البحث: الاستفسارات، CTR، CTCVR، يحفظ، «يؤجل لوقت لاحق».
التقنية: جهاز/متصفح، FPS/حالة البطارية، الأخطاء، زمن الوصول، الشبكات (IP/ASN)، غير متصل بالإنترنت/عبر الإنترنت.
الوقت/السياق: الساعة/اليوم/التقويم المحلي، والأنماط الجغرافية (لا يوجد تحديد دقيق للموقع الجغرافي إلا إذا لزم الأمر).
ردود الفعل السلبية: الاختباء، الشكوى، إلغاء الاشتراك، رفض ملفات تعريف الارتباط/التخصيص.
2) مخطط الأجهزة والأحداث
المخطط القانوني (الحد الأدنى):
event_id, user_id, session_id, ts_utc, type, screen/page, element, value, duration_ms,
device_id, platform, app_version, locale, referrer, ip_hash, asn, experiment_id, schema_version
المبادئ: الخصوصية (dedup by '(source_id، checksum)')، وقت التوقيت العالمي المنسق، نسخة المخطط، مفاتيح الهوية المستقرة، تقليل مؤشر الاستثمار الدولي (التجزئة/الرموز).
3) التنظيف ومضادات الروبوتات
أعلام مقطوعة الرأس/الأتمتة: توقيعات WebDriver/محرك الدمى، إيماءات مخصصة مفقودة.
السرعة غير الطبيعية: نقرات خارقة/تمرير، فترات «مثالية».
الشبكة: مراكز استضافة البيانات، معروفة بالوكالة/VPN ASN.
تكرار النمط: نفس المسارات والتسلسلات.
QA/internal: lists of test accounts/devices.
الاحتيال: جهاز/IP-graph (جهاز واحد → العديد من الحسابات، السرعة الجغرافية).
4) التطبيع والنقطة في الوقت المناسب (PIT)
النوافذ الزمنية: 5 دقيقة/ساعة واحدة/24 ساعة/7 أيام ؛ إكسبون. تنعيم.
الموسمية: أعلام يوم الأسبوع وساعة اليوم والعطلات.
شرائح PIT: تم بناء جميع الميزات حتى وقت التقييم ؛ لا معلومات من المستقبل.
التكافؤ عبر الإنترنت/غير متصل: وصفات متطابقة في متجر الميزات.
5) جودة الإشارة وصلاحيتها
التغطية: تقاسم الجلسات/الشاشات مع الأحداث الكاملة.
النضارة: تأخر القبول.
الاتساق: نسب الأحداث لكل مستخدم/جلسة في «الممرات» (مراقبة الانبعاثات).
الانتباه: الوقت النشط/المرشح العاطل، عمق التمرير، يتوقف.
القصد: الانتقال إلى العمل العميق (filtr→detal→tselevoye).
الموثوقية: مضاد لسرعة الروبوت، الثقة في الجهاز/بروتوكول الإنترنت.
6) هندسة الميزات
R/F: حداثة التفاعل الأخير، الترددات فوق النوافذ 7/30/90.
Dwell/scroll: متوسطات/كميات، نسبة الشاشات ذات السكن ≥ X، العمق ≥ p٪.
التسلسلات: n-grams، انتقالات ماركوف، أنماط «الندم» (ذهابًا وإيابًا)، طول الجري.
استقرار الجهاز: تغييرات الجهاز/المتصفح، إنتروبي المستخدم - الوكلاء.
انقر فوق الجودة: نسبة النقرات إلى العناصر القابلة للنقر، نقرات الغضب.
البحث/القصد: طول/صقل الاستفسارات، والسكن بعد البحث، ومعدل النجاح.
التجميعات حسب الهوية: user_id، device_id، ip_hash، asn.
الهجينة: تضمين الجلسة (Doc2Vec/Transformer) → التجميع/الترتيب.
7) إشارة → الإجراء: جدول القرار
الهستيريا والتهدئة إلزامية حتى لا «ترمش» القرائن.
8) وصفات زائفة SQL/
ألف - وقت التمرير النشط وعمقه
sql
WITH ev AS (
SELECT user_id, session_id, page, ts,
SUM(CASE WHEN event='user_active' THEN duration_ms ELSE 0 END) AS active_ms,
MAX(CASE WHEN event='scroll' THEN depth_pct ELSE 0 END) AS max_depth
FROM raw_events
WHERE ts BETWEEN:from AND:to
GROUP BY 1,2,3,4
)
SELECT user_id, session_id,
AVG(active_ms) AS avg_dwell_ms,
PERCENTILE_CONT(0. 5) WITHIN GROUP (ORDER BY max_depth) AS scroll_median
FROM ev
GROUP BY 1,2;
B. نقرات الغضب/ذهابًا وإيابًا
sql
WITH clicks AS (
SELECT user_id, session_id, ts,
LAG(ts) OVER (PARTITION BY user_id, session_id ORDER BY ts) AS prev_ts,
element
FROM ui_events WHERE event='click'
),
rage AS (
SELECT user_id, session_id,
COUNT() FILTER (WHERE EXTRACT(EPOCH FROM (ts - prev_ts)) <= 0. 3) AS rage_clicks
FROM clicks GROUP BY 1,2
),
backforth AS (
SELECT user_id, session_id,
SUM(CASE WHEN action IN ('back','forward') THEN 1 ELSE 0 END) AS nav_bf
FROM nav_events GROUP BY 1,2
)
SELECT r. user_id, r. session_id, r. rage_clicks, b. nav_bf
FROM rage r JOIN backforth b USING (user_id, session_id);
C. Antibot speed (sketch)
sql
SELECT user_id, session_id,
(CASE WHEN headless OR webdriver THEN 1 ELSE 0 END)0. 4 +
(CASE WHEN asn_cat='hosting' THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN click_interval_std < 50 THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN scroll_speed_avg > 5000 THEN 1 ELSE 0 END)0. 2 AS bot_score
FROM telemetry_features;
D. تسلسل n-gram
sql
-- Collect screen sequences and transition frequencies
SELECT screen_seq, COUNT() AS freq
FROM (
SELECT user_id, session_id,
STRING_AGG(screen, '→' ORDER BY ts) AS screen_seq
FROM nav_events
GROUP BY 1,2
) t
GROUP BY screen_seq
ORDER BY freq DESC
LIMIT 1000;
9) الإشارات السلوكية في ML/Analytics
الميول/التخصيص: نماذج CTR/CTCVR، تضمين الجلسة، التالي أفضل إجراء.
التدفق/الاحتفاظ: نماذج المخاطر، علامات الحداثة/التردد/التسلسل.
Antifraud: سرعة الأشكال، geo-velo، الجهاز/IP-graph، قوالب «المزارع».
جودة حركة المرور: «آراء صحيحة»، جلسات مشاركة، ردود فعل سلبية.
ألف/باء والسببية: مقاييس الانتباه كوسطاء، ولكن الاستنتاجات بالزيادة (ROMI/LTV، الاحتفاظ).
10) التصور
Sankey/step-bars: المسارات والانزال.
خرائط الحرارة: تمرير العمق، النقر فوق بطاقات (غير شخصية).
المجموعة × العمر: كيف تتغير الإشارات حسب عمر المجموعة.
الرسوم البيانية للجسر: مساهمة العوامل (السرعة، التمرير، الأخطاء) في التغيير في التحويل.
11) الخصوصية والأخلاق و RG/الامتثال
تقليل PII: تجزئة محدد الهوية، RLS/CLS، إخفاء أثناء التصدير.
الموافقة/الشفافية: التتبع، الرفض - الاحترام ؛ المنطق قابل للتفسير.
RG: لا تستخدم الإشارات لتشجيع السلوك الضار ؛ التذكيرات/الحدود الناعمة.
الإنصاف: التحقق من فروق الخطأ/التدخل حسب المجموعة ؛ يستبعد الخصائص غير الصحيحة.
التخزين: توقيت TTL للأحداث «الخام»، التجميع المفضل.
12) قابلية الملاحظة والانجراف
جودة البيانات: التغطية، التكرار، التأخر، النسبة المئوية للحقول الفارغة.
انحراف الإشارة: PSI/KL عن طريق السكن/التمرير/الترددات ؛ أنماط «جديدة».
التشغيل: جمع الكمون، p95 حساب العلامات، حصة من folbacks.
حواجز الحماية: زيادة الروبوتات، الشكاوى، إلغاء الاشتراكات ؛ «وقف الرافعة» على التدخلات العدوانية.
13) الأنماط المضادة
نقرات خام بدون سياق/مرشح عاطل → «انتباه» خاطئ.
خلط الوحدات (sessii↔polzovateli)، TZ، النوافذ → التفاوت.
وجوه من المستقبل (لا PIT) → إعادة تقييم النماذج.
عدم التسامح مع الضوضاء: عتبات صلبة بدون هستيريا → «وميض».
تجاهل مرشحات مضادات الروبوتات/QA → مقاييس مبالغ فيها.
تسجيل PII إضافي بدون سبب → المخاطر والغرامات.
14) قائمة التحقق من حلقة الإشارة السلوكية
- مخطط الحدث (الإصدارات، UTC، الخصوصية)، تقليل PII إلى الحد الأدنى
- مرشحات مضادة للروبوتات/QA، قوائم ASN/الجهاز بالأبيض/الأسود
- وصفات PIT، نوافذ 5 م/1 ساعة/24 ساعة/7 د، تكافؤ عبر الإنترنت/غير متصل بالإنترنت
- مقاييس الجودة: التغطية والنضارة والمصدقين على المشاركة
- R/F/dwell/scroll/sequence/search، تضمين الجلسة
- جداول القرارات: الإجراءات، الهستيريا، التبريد، حواجز الحماية
- لوحات القيادة والتنبيهات (PSI/KL)، والشكاوى/إلغاء الاشتراكات، ومؤشرات النمو الحقيقي
- الوثائق: قاموس البيانات، والإشارة/الجوازات المترية، والمالكون والكتب الجاهزة
المجموع
توفر الإشارات السلوكية قيمة فقط في دائرة منضبطة: الأجهزة الصحيحة و PIT، والتنظيف والروبوتات المضادة، والعلامات المستقرة وسياسات العمل الواضحة، والخصوصية و RG، وقابلية الملاحظة والاستجابة للانجراف. يترجم هذا النهج النقرات واللفائف إلى حلول تزيد من التحويل والاحتفاظ و LTV - بأمان وشفافية وتكرار.