Davranış siqnalları
Davranış siqnalları
Davranış siqnalları istifadəçinin məhsulla qarşılıqlı əlaqəsinin "telemetriyası 'dır: niyyət, maraq, trafik keyfiyyəti, risk və dəyər əldə etdiyimiz hadisələr, kontekst və zaman sıraları. Siqnallarla etibarlı kontur: instrumentasiya → toplama → təmizləmə → normallaşdırma → işarələmə → həllərdə istifadə → monitorinq və etika.
1) Davranış siqnalları nədir
Sessiyalar: start/stop, müddət, ekranların sayı, dərinlik, gündə təkrar, «sakit» sessiyalar.
Klik/tach/scroll: klik sıxlığı, sürüşmə sürəti, dərinlik, dayanma (scroll-stops).
Dwell-time: ekran/element vaxtı, aktiv vaxt (idle filter).
Naviqasiya/ekran əlaqəsi: ardıcıllıq, döngələr, rage-naviqasiya.
Giriş/formalar: doldurma sürəti, düzəlişlər, tab-naviqasiya, paste rate.
Mikro interaktsiyalar: xoverlər, açarlar, açarlar, çeşidləmə/filtrlər.
Məzmun/axtarış: sorğular, CTR, CTCVR, saxlama, «sonra təxirə salın».
Texnika: device/browser, FPS/batareya statusu, səhvlər, latency, şəbəkə (IP/ASN), oflayn/online.
Vaxt/kontekst: saat/gün/yerli təqvim, geo-nümunələr (lazım deyilsə, dəqiq geolokasiya olmadan).
Mənfi rəy: gizlətmək, şikayət, abunə, cookie/personalizasiyadan imtina.
2) Alət və hadisə sxemi
Kanonik sxem (minimum):
event_id, user_id, session_id, ts_utc, type, screen/page, element, value, duration_ms,
device_id, platform, app_version, locale, referrer, ip_hash, asn, experiment_id, schema_version
Prinsiplər: idempotentlik (dedup '(source_id, checksum)'), UTC-vaxt, sxemlərin versiyası, sabit identifikasiya açarları, PII-nin minimuma endirilməsi (heş/tokenlər).
3) Təmizləmə və antibot
Headless/automation bayraqlar: WebDriver/puppeteer signature, itkin xüsusi jestlər.
Anormal sürət: Superinsan klik/scroll, «ideal» intervallar.
Şəbəkə: məlumat hostinq mərkəzləri, məşhur proxy/VPN ASN.
Nümunə təkrarlanabilirliyi: eyni trayektoriyalar və ardıcıllıqlar.
QA/daxili: test hesabları/cihazlar siyahıları.
Frod: device/IP qrafik (bir cihaz → bir çox hesab, geo-velocity).
4) Normallaşma və Point-in-Time (PIT)
Müvəqqəti pəncərələr: 5 dəqiqə/1 saat/24 saat/7 gün; ekspon. hamarlama.
Mövsümlük: day-of-week, hour-of-day, bayram bayraqları.
PIT dilimləri: bütün əlamətlər qiymətləndirmə vaxtına qədər qurulur; gələcəkdən məlumat yoxdur.
Online/offline paritet: feature store eyni reseptlər.
5) Siqnalların keyfiyyəti və etibarlılığı
Coverage: tam hadisələr ilə seanslar/ekranlar payı.
Freshness: qəbul gecikməsi.
Consistency: «dəhlizlərdə» istifadəçi/sessiya başına hadisələr payı (emissiya nəzarəti).
Diqqət: aktiv vaxt/filter, scroll depth, dayanma.
Niyyət: dərin hərəkətlərə keçid (filter → detal → hədəf).
Etibarlılıq: anti-skor, cihaza/IP-yə inam.
6) Əlamət (feature engineering)
R/F: son interakt recency, 7/30/90 pəncərələri üçün tezlik.
Dwell/scroll: medianlar/kvantillər, dwell ≥ X ilə ekranların payı, dərinlik ≥ p%.
Ardıcıllıqlar: n-qram, Markov keçidləri, «peşman» nümunələri (back-forth), run-length.
Cihaz sabitliyi: cihaz/brauzer dəyişikliyi, entropy user-agents.
Klik keyfiyyəti: klik elementlərinə ratio klik, rage-clicks.
Axtarış/niyyət: uzunluq/sorğuların dəqiqləşdirilməsi, axtarışdan sonra dwell, success rate.
user_id, device_id, ip_hash, asn.
Hibridlər: sessiyaların embeddingi (Doc2Vec/Transformer) → klasterləşdirmə/sıralama.
7) Siqnal → Fəaliyyət: Həll cədvəli
Histerezis və kuldaunlar ipuçları ilə «yanıb-sönməmək» üçün məcburidir.
8) Psevdo-SQL/reseptlər
A. Aktiv vaxt və skroll dərinliyi
sql
WITH ev AS (
SELECT user_id, session_id, page, ts,
SUM(CASE WHEN event='user_active' THEN duration_ms ELSE 0 END) AS active_ms,
MAX(CASE WHEN event='scroll' THEN depth_pct ELSE 0 END) AS max_depth
FROM raw_events
WHERE ts BETWEEN:from AND:to
GROUP BY 1,2,3,4
)
SELECT user_id, session_id,
AVG(active_ms) AS avg_dwell_ms,
PERCENTILE_CONT(0. 5) WITHIN GROUP (ORDER BY max_depth) AS scroll_median
FROM ev
GROUP BY 1,2;
B. Rage-clicks / back-forth
sql
WITH clicks AS (
SELECT user_id, session_id, ts,
LAG(ts) OVER (PARTITION BY user_id, session_id ORDER BY ts) AS prev_ts,
element
FROM ui_events WHERE event='click'
),
rage AS (
SELECT user_id, session_id,
COUNT() FILTER (WHERE EXTRACT(EPOCH FROM (ts - prev_ts)) <= 0. 3) AS rage_clicks
FROM clicks GROUP BY 1,2
),
backforth AS (
SELECT user_id, session_id,
SUM(CASE WHEN action IN ('back','forward') THEN 1 ELSE 0 END) AS nav_bf
FROM nav_events GROUP BY 1,2
)
SELECT r. user_id, r. session_id, r. rage_clicks, b. nav_bf
FROM rage r JOIN backforth b USING (user_id, session_id);
C. antibot skor (eskiz)
sql
SELECT user_id, session_id,
(CASE WHEN headless OR webdriver THEN 1 ELSE 0 END)0. 4 +
(CASE WHEN asn_cat='hosting' THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN click_interval_std < 50 THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN scroll_speed_avg > 5000 THEN 1 ELSE 0 END)0. 2 AS bot_score
FROM telemetry_features;
D. N-qram ardıcıllığı
sql
-- Collect screen sequences and transition frequencies
SELECT screen_seq, COUNT() AS freq
FROM (
SELECT user_id, session_id,
STRING_AGG(screen, '→' ORDER BY ts) AS screen_seq
FROM nav_events
GROUP BY 1,2
) t
GROUP BY screen_seq
ORDER BY freq DESC
LIMIT 1000;
9) ML/analitikada davranış siqnalları
Meyllər/personalizasiya: CTR/CTCVR modelləri, session embeddings, next-best-action.
Çıxış/saxlama: hazard modelləri, recency/tezlik/ardıcıllıq əlamətləri.
Antifrod: forma sürəti, geo-velo, device/IP-qrafik, «ferma» şablonları.
Trafik keyfiyyəti: «valid baxışlar», engaged sessions, mənfi rəy.
A/B və kauzallıq: vasitəçi kimi diqqət metrikləri, lakin nəticələr - inkrement (ROMI/LTV, saxlama).
10) Vizuallaşdırma
Sankey/step-bars: yollar və drop-off.
Heatmaps: skroll dərinliyi, klik kartları (anonim).
Cohort × age: kohortların yaşına görə siqnallar necə dəyişir.
Bridge qrafikləri: çevirmə dəyişikliyinə amillərin (sürət, skroll, səhvlər) töhfəsi.
11) Gizlilik, etika, RG/komplayens
PII-Minimallaşdırma: Hash identifikatorları, RLS/CLS, ixrac zamanı maskalama.
Razılıq/şəffaflıq: trekinq qurmaq, imtina - hörmət; məntiq başa düşüləndir.
RG: zərərli davranışı təşviq etmək üçün siqnallardan istifadə etməyin; yumşaq xatırlatmalar/limitlər.
Fairness: qruplar üzrə səhv/müdaxilə fərqlərini yoxlamaq; yolverilməz əlamətləri istisna etmək.
Saxlama: «xam» hadisələr üçün TTL şərtləri, aqreqasiya üstünlük.
12) Müşahidə və sürüklənmə
Məlumat keyfiyyəti: coverage, dublikatlar, lağlar, boş sahələrin faizi.
Siqnal sürüklənməsi: dwell/scroll/tezliklər üzrə PSI/KL; «yeni» nümunələr.
Əməliyyat: latency yığımı, p95 hesablanması əlamətləri, folback payı.
Guardrails: bot-skor, şikayətlər, cavablar; aqressiv müdaxilələr üçün «stop-kran».
13) Anti-nümunələr
Kontekst/idl-filter → saxta «diqqət» olmadan xam klik.
Vahidlərin qarışması (seans istifadəçiləri), TZ, pəncərələr → uyğunsuzluq.
Gələcəyin üzləri (PIT yoxdur) → modellərin yenidən qiymətləndirilməsi.
Səs-küy üçün sıfır tolerantlıq: histerezis → «yanıb-sönən» olmadan sərt astanalar.
Ignor antibot/QA-filters → həddindən artıq metrik.
Səbəbsiz əlavə PII qeyd → risklər və cərimələr.
14) Davranış siqnalları kontur başlamaq check-list
- Hadisə sxemi (versiyalar, UTC, idempotentlik), PII minimallaşdırılması
- Antibot/QA filtrləri, qara/ağ ASN/cihazlar siyahıları
- PIT reseptləri, pəncərələr 5m/1h/24h/7d, online/offline paritet
- Keyfiyyət göstəriciləri: coverage, freshness, engagement validatorları
- R/F/dwell/scroll/ardıcıllığı/axtarış əlamətləri, session embeddings
- Decision tables: fəaliyyət, histerezis, kuldaunlar, guardrails
- Daşbordlar və drift (PSI/KL), şikayətlər/cavablar, RG göstəriciləri
- Sənədləşmə: dataslovar, siqnal pasportları/metrik, sahibləri və Runibook
Yekun
Davranış siqnalları yalnız nizam-intizamlı konturda dəyər verir: düzgün instrumentasiya və PIT, təmizləmə və antibotlar, davamlı əlamətlər və aydın fəaliyyət siyasətləri, gizlilik və RG, müşahidə və sürüşmə reaksiyaları. Bu yanaşma «klik və skroll» dönüşümü artıran həllərə çevirir, saxlama və LTV - təhlükəsiz, şəffaf və təkrarlanabilir.