רמזים התנהגותיים
רמזים התנהגותיים
רמזים התנהגותיים הם ה ”טלמטריה” של האינטראקציה של המשתמש עם מוצר: האירועים, ההקשר, וסדרת הזמן שמהם אנו מסיקים כוונה, עניין, איכות תנועה, סיכון, וערך. מעגל אמין של עבודה עם אותות: איסוף מכשור = ניקוי = normalization = normalization ach sign formation = שימוש בפתרונות = ניטור ואתיקה.
1) מה לשקול סימנים התנהגותיים
הפעלות: התחלה/עצירה, משך, מספר מסכים, עומק, חזרות ביום, הפעלות ”שקטות”.
קליקים/מגע/מגילה: צפיפות לחיצות, מהירות גלילה, עומק, עצירות (גלילה-עצירות).
זמן: זמן על המסך/אלמנט, זמן פעיל (מסנן סרק).
ניווט/אינטרלציה של מסכים: רצפים, לולאות, זעם-ניווט.
קלט/טפסים: מהירות מילוי, תיקונים, ניווט לשונית, קצב הדבקה.
מיקרו אינטראקציות: מרחף, חושף, מתגים, מיני/מסננים.
תוכן/חיפוש: שאילתות, CTR, CTCVR, חוסך, ”לדחות למועד מאוחר יותר”.
טכניקה: התקן/דפדפן, מצב FPS/סוללה, שגיאות, latency, רשתות (IP/ASN), offline/online.
זמן/הקשר: שעה/יום/לוח שנה מקומי, תבניות גיאו (לא מדויק גאולוקציה אלא אם כן נדרש).
משוב שלילי: להתחבא, להתלונן, לבטל, לסרב לעוגיות/אישיות.
2) תרשים מכשירים ואירועים
תוכנה קנונית (מינימום):
event_id, user_id, session_id, ts_utc, type, screen/page, element, value, duration_ms,
device_id, platform, app_version, locale, referrer, ip_hash, asn, experiment_id, schema_version
עקרונות: idempotency (dedup by '(source_id, checksum)), UTC time, סכימה, מפתחות זהות יציבים, מזעור PII (חשיש/אסימונים).
3) ניקוי ואנטי רובוטים
דגלים ללא ראש/אוטומציה: WebDriver/בובנאי חתימות, מחוות מותאמות אישית חסרות.
מהירות חריגה: קליקים על-אנושיים/גלילה, מרווחים ”מושלמים”.
רשת: מרכזי אירוח נתונים, פרוקסי/VPN ASN ידועים.
חזרות תבניות: אותם מסלולים ורצפים.
QA/פנימי: רשימות של חשבונות/התקנים נבחנים.
הונאה: התקן/IP-גרף (התקן אחד = חשבונות רבים, גיאו-מהירות).
4) נורמליזציה ונקודה בזמן (בור)
חלונות זמן: 5 דקות/1 שעה/24 שעות/7 ימים; אקספון. החלקה.
עונתיות: יום בשבוע, שעה ביום, דגלי חג.
פרוסות בור: כל המאפיינים בנויים עד זמן ההערכה; אין מידע מהעתיד.
זוגיות מקוונת/לא מקוונת: מתכונים זהים בחנות.
5) איכות אות ותוקף
סיקור: שיתוף של מפגשים/מסכים עם אירועים מלאים.
רעננות: הודאה לאג.
עקביות: פרופורציות של אירועים לכל משתמש/סשן ב ”מסדרונות” (בקרת פליטה).
שימו לב: מסנן זמן/אידל פעיל, עומק גלילה, עצירות.
כוונה: מעבר לפעולה עמוקה (filtr # detal = tselevoye).
אמינות: אנטי-בוט-מהירות, אמון במכשיר/IP.
6) הנדסת מאפיינים
R/F: חזרה על האינטראקציה האחרונה, תדרים מעל חלונות 7/30/90.
dwell/groll: medians/quancles, פרופורציה של מסכים עם dwell with X, עומק p%.
רצפים: n-גרם, מעברי מרקוב, תבניות של ”חרטה” (הלוך ושוב), אורך ריצה.
יציבות התקן: שינוי התקן/דפדפן, אנטרופיה משתמש-סוכנים.
איכות לחיצה: יחס של קליקים לאלמנטים קליקים, זעם-קליקים.
חיפוש/כוונה: אורך/עידון של שאילתות, שיכון אחרי חיפוש, אחוזי הצלחה.
צבירה בזהות: user_id, device_id, ip_hash, אסן.
Hybrids: Session metbedings (Doc2Vec/Transformer) = קיבוצים/דירוג.
7) אות # פעולה: טבלת החלטות
היסטריה וקירור הם חובה כדי לא ”למצמץ” רמזים.
8) פסאודו ־ SQL/מתכונים
א. גלילה פעילה בזמן ובעומק
sql
WITH ev AS (
SELECT user_id, session_id, page, ts,
SUM(CASE WHEN event='user_active' THEN duration_ms ELSE 0 END) AS active_ms,
MAX(CASE WHEN event='scroll' THEN depth_pct ELSE 0 END) AS max_depth
FROM raw_events
WHERE ts BETWEEN:from AND:to
GROUP BY 1,2,3,4
)
SELECT user_id, session_id,
AVG(active_ms) AS avg_dwell_ms,
PERCENTILE_CONT(0. 5) WITHIN GROUP (ORDER BY max_depth) AS scroll_median
FROM ev
GROUP BY 1,2;
B. זעם-קליקים/הלוך ושוב
sql
WITH clicks AS (
SELECT user_id, session_id, ts,
LAG(ts) OVER (PARTITION BY user_id, session_id ORDER BY ts) AS prev_ts,
element
FROM ui_events WHERE event='click'
),
rage AS (
SELECT user_id, session_id,
COUNT() FILTER (WHERE EXTRACT(EPOCH FROM (ts - prev_ts)) <= 0. 3) AS rage_clicks
FROM clicks GROUP BY 1,2
),
backforth AS (
SELECT user_id, session_id,
SUM(CASE WHEN action IN ('back','forward') THEN 1 ELSE 0 END) AS nav_bf
FROM nav_events GROUP BY 1,2
)
SELECT r. user_id, r. session_id, r. rage_clicks, b. nav_bf
FROM rage r JOIN backforth b USING (user_id, session_id);
C. Antibot speed (סקיצה)
sql
SELECT user_id, session_id,
(CASE WHEN headless OR webdriver THEN 1 ELSE 0 END)0. 4 +
(CASE WHEN asn_cat='hosting' THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN click_interval_std < 50 THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN scroll_speed_avg > 5000 THEN 1 ELSE 0 END)0. 2 AS bot_score
FROM telemetry_features;
D. n-gram רצפים
sql
-- Collect screen sequences and transition frequencies
SELECT screen_seq, COUNT() AS freq
FROM (
SELECT user_id, session_id,
STRING_AGG(screen, '→' ORDER BY ts) AS screen_seq
FROM nav_events
GROUP BY 1,2
) t
GROUP BY screen_seq
ORDER BY freq DESC
LIMIT 1000;
9) רמזים התנהגותיים ב- ML/Analytics
נטיות/אנושיות: מודלים CTR/CTCVR, הטלות הפעלה, הפעולה הבאה-הטובה-ביותר.
זרימה/שימור: מודלים מסוכנים, סימנים של חזרה/תדירות/רצפים.
אנטי-פראוד: מהירות הצורות, Geo-velo, התקן/IP-גרף, תבניות של ”חוות”.
איכות התנועה: ”השקפות תקפות”, פגישות מעורבות, משוב שלילי.
A/B וסיבתיות: מדדי קשב כמתווכים, אך מסקנות על ידי הצטברות (ROMI/LTV, שימור).
10) הדמיה
מסלולים ומסירה.
מפות חום: עומק גלילה, קלפי לחיצה (לא אישי).
קוהורט × גיל: כיצד אותות משתנים על ידי גיל קוהורט.
גרפי גשר: תרומתם של גורמים (מהירות, גלילה, שגיאות) לשינוי בהמרה.
11) פרטיות, אתיקה, אר ג 'י/ציות
מזעור PII: זיהוי חשיש, RLS/CLS, מיסוך במהלך ייצוא.
הסכמה/שקיפות: הגדרת מעקב, סירוב - מכובד; ההיגיון ניתן להסבר.
ר "ג: אל תשתמש באותות כדי לעודד התנהגות מזיקה; תזכורות רכות/גבולות.
הגינות: בדיקת הבדלי שגיאה/התערבות על ידי קבוצה; לא כולל מאפיינים לא תקפים.
אחסון: תזמון TTL לאירועים ”גולמיים”, צבירה מועדפת.
12) יכולת תצפית וסחיפה
איכות נתונים: כיסוי, שכפולים, לפגום, אחוז של שדות ריקים.
סחיפת אותות: PSI/KL על ידי שיכון/גלילה/תדרים; תבניות ”חדשות”.
הפעלה: אוסף איחוי, חישוב p95 של סימנים, שיתוף עממים.
מעקות בטיחות: נחשול רובוט-סקור, תלונות, ללא כותרות; ”עצור-מנוף” בהתערבויות אגרסיביות.
13) אנטי דפוסים
קליקים גולמיים ללא הקשר/מסנן idl = ”תשומת לב” כוזבת.
ערבוב של יחידות (sessii↔polzovateli), TZ, חלונות = פער.
פרצופים מהעתיד (לא בור) * הצבה מחדש של מודלים.
אי-סובלנות לרעש: סף קשה ללא היסטרציה = ”מהבהב”.
התעלם מסנני אנטי-רובוטים/QA כפול מדדים מוערכים יתר על המידה.
הקלטת מח "ש נוספת ללא סיבה. סיכונים וקנסות.
14) בדיקת אותות התנהגותיים
[ סכמת אירוע ] (גרסאות, UTC, idempotency), מזעור PII
[ ] מסנני אנטי-בוטים/QA, ASN/התקן רשימות שחור/לבן
[ ] מתכוני PIT, חלונות 5m/1h/24h/7d, זוגיות מקוונת/לא מקוונת
[ מדדי איכות ]: כיסוי, רעננות, תותחי אירוסין
[ ] R/F/dwell/גלילה/רצף/חיפוש, הטמעות הפעלה
[ טבלאות החלטה ]: פעולות, היסטרזיס, קרירות, מעקות בטיחות
[ ] לוחות מחוונים והתראות (PSI/KL), תלונות/אי כתובות, אינדיקטורים של RG
[ תיעוד ]: מילון נתונים, דרכונים מטריים/אותות, בעלים ורצנים
סך הכל
אותות התנהגותיים מספקים ערך רק במעגל ממושמע: מכשירים נכונים ו-PIT, ניקוי ואנטי-בוטים, סימנים יציבים ומדיניות פעולה ברורה, פרטיות ו-RG, תצפית ותגובת סחיפה. גישה זו מתרגמת לחיצות ומגילות לפתרונות המגבירים את ההמרה, השמירה והטלוויזיה - בבטחה, בשקיפות וברבייה.