Davranışsal ipuçları
Davranışsal ipuçları
Davranışsal ipuçları, bir kullanıcının bir ürünle etkileşiminin "telemetrisi'dir: niyet, ilgi, trafik kalitesi, risk ve değer çıkardığımız olaylar, bağlam ve zaman serileri. Sinyallerle güvenilir çalışma devresi: enstrümantasyon - toplama - temizleme - normalleştirme - işaret oluşumu - çözümlerde kullanım - izleme ve etik.
1) Davranışsal sinyallerin dikkate alınması gerekenler
Oturumlar: Başlama/durma, süre, ekran sayısı, derinlik, günde tekrarlama, "sessiz" oturumlar.
Tıklamalar/dokunma/kaydırma: tıklama yoğunluğu, kaydırma hızı, derinlik, duraklar (kaydırma durakları).
Bekleme süresi: ekranda/öğede zaman, aktif zaman (boşta filtre).
Gezinme/ekranların karşılıklı ilişkisi: diziler, döngüler, öfke-navigasyon.
Giriş/formlar: doldurma hızı, düzeltmeler, sekme gezinme, yapıştırma hızı.
Mikro etkileşimler: gezinir, açığa çıkarır, anahtarlar, sıralar/filtreler.
İçerik/arama: sorgular, TO, CTCVR, kaydeder,'daha sonrası için ertele ".
Teknik: cihaz/tarayıcı, FPS/pil durumu, hatalar, gecikme, ağlar (IP/ASN), çevrimdışı/çevrimiçi.
Zaman/bağlam: saat/gün/yerel takvim, coğrafi desenler (gerekmedikçe kesin coğrafi konum yok).
Olumsuz geri bildirim: gizleme, şikayet etme, abonelikten çıkma, çerezleri/kişiselleştirmeyi reddetme.
2) Enstrümantasyon ve olay diyagramı
Kanonik şema (minimum):
event_id, user_id, session_id, ts_utc, type, screen/page, element, value, duration_ms,
device_id, platform, app_version, locale, referrer, ip_hash, asn, experiment_id, schema_version
İlkeler: idempotency (dedup by '(source_id, checksum)'), UTC zamanı, şema sürümü, kararlı kimlik anahtarları, PII minimizasyonu (hash/token).
3) Temizlik ve anti-botlar
Başsız/otomasyon bayrakları: WebDriver/kuklacı imzaları, eksik özel hareketler.
Anormal hız: insanüstü tıklamalar/kaydırma, "mükemmel" aralıklar.
Ağ: veri barındırma merkezleri, bilinen proxy/VPN ASN.
Desen tekrarlanabilirliği: aynı yörüngeler ve diziler.
QA/internal: test hesaplarının/cihazlarının listesi.
Dolandırıcılık: cihaz/IP-graph (bir cihaz - birçok hesap, coğrafi hız).
4) Normalleştirme ve Zaman İçinde Nokta (PIT)
Zaman pencereleri: 5 dakika/1 saat/24 saat/7 gün; Expon. yumuşatma.
Mevsimsellik: Haftanın günü, günün saati, tatil bayrakları.
PIT dilimleri: tüm özellikler değerlendirme süresine kadar oluşturulmuştur; Gelecekten bilgi yok.
Çevrimiçi/çevrimdışı eşlik: özellik mağazasında aynı tarifler.
5) Sinyal kalitesi ve geçerliliği
Kapsam: tam etkinliklerle oturumların/ekranların paylaşımı.
Tazelik: giriş gecikmesi.
Tutarlılık: "Koridorlarda" kullanıcı/oturum başına olayların oranları (emisyon kontrolü).
Dikkat: Aktif zaman/idl filtresi, kaydırma derinliği, durur.
Niyet: derin eyleme geçişler (filtr - detal - tselevoye).
Güvenilirlik: anti-bot hızı, cihaza/IP'ye güven.
6) Özellik mühendisliği
R/F: Son etkileşimin sonluğu, windows 7/30/90 üzerindeki frekanslar.
Dwell/scroll: medians/quantiles, dwell ≥ X olan ekranların oranı, derinlik ≥ % p.
Diziler: N-gram, Markov geçişleri, "pişmanlık" kalıpları (ileri geri), çalışma uzunluğu.
Cihaz kararlılığı: cihaz/tarayıcı değişiklikleri, entropi kullanıcı ajanları.
Tıklama kalitesi: tıklamaların tıklanabilir öğelere oranı, öfke tıklamaları.
Arama/niyet: sorguların uzunluğu/arıtılması, aramadan sonra durma, başarı oranı.
Kimliğe göre toplamalar: user_id, device_id, ip_hash, asn.
Melezler: Oturum gömme (Doc2Vec/Transformer) - kümeleme/sıralama.
7) Sinyal - Eylem: Karar Tablosu
Histerezis ve bekleme süreleri, ipuçlarını "kırpmamak" için zorunludur.
8) Pseudo-SQL/Tarifler
A. aktif kaydırma süresi ve derinliği
sql
WITH ev AS (
SELECT user_id, session_id, page, ts,
SUM(CASE WHEN event='user_active' THEN duration_ms ELSE 0 END) AS active_ms,
MAX(CASE WHEN event='scroll' THEN depth_pct ELSE 0 END) AS max_depth
FROM raw_events
WHERE ts BETWEEN:from AND:to
GROUP BY 1,2,3,4
)
SELECT user_id, session_id,
AVG(active_ms) AS avg_dwell_ms,
PERCENTILE_CONT(0. 5) WITHIN GROUP (ORDER BY max_depth) AS scroll_median
FROM ev
GROUP BY 1,2;
B. Öfke-tıklar/ileri-geri
sql
WITH clicks AS (
SELECT user_id, session_id, ts,
LAG(ts) OVER (PARTITION BY user_id, session_id ORDER BY ts) AS prev_ts,
element
FROM ui_events WHERE event='click'
),
rage AS (
SELECT user_id, session_id,
COUNT() FILTER (WHERE EXTRACT(EPOCH FROM (ts - prev_ts)) <= 0. 3) AS rage_clicks
FROM clicks GROUP BY 1,2
),
backforth AS (
SELECT user_id, session_id,
SUM(CASE WHEN action IN ('back','forward') THEN 1 ELSE 0 END) AS nav_bf
FROM nav_events GROUP BY 1,2
)
SELECT r. user_id, r. session_id, r. rage_clicks, b. nav_bf
FROM rage r JOIN backforth b USING (user_id, session_id);
C. Antibot hızı (eskiz)
sql
SELECT user_id, session_id,
(CASE WHEN headless OR webdriver THEN 1 ELSE 0 END)0. 4 +
(CASE WHEN asn_cat='hosting' THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN click_interval_std < 50 THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN scroll_speed_avg > 5000 THEN 1 ELSE 0 END)0. 2 AS bot_score
FROM telemetry_features;
D. n-gram dizileri
sql
-- Collect screen sequences and transition frequencies
SELECT screen_seq, COUNT() AS freq
FROM (
SELECT user_id, session_id,
STRING_AGG(screen, '→' ORDER BY ts) AS screen_seq
FROM nav_events
GROUP BY 1,2
) t
GROUP BY screen_seq
ORDER BY freq DESC
LIMIT 1000;
9) ML/Analytics'te davranışsal ipuçları
Eğilimler/kişiselleştirme: CTR/CTCVR modelleri, oturum gömme, sonraki en iyi eylem.
Çıkış/tutma: tehlike modelleri, sonluk belirtileri/frekans/diziler.
Antifraud: formların hızı, geo-velo, cihaz/IP-grafik, "çiftliklerin" şablonları.
Trafik kalitesi: "Geçerli görünümler", meşgul oturumlar, olumsuz geri bildirim.
A/B ve nedensellik: arabulucular olarak dikkat ölçütleri, ancak artışla sonuçlar (ROMI/LTV, tutma).
10) Görselleştirme
Sankey/step-bars: yollar ve bırakma.
Isı haritaları: kaydırma derinliği, tıklama kartları (kişisel olmayan).
Kohort × yaşı: Sinyallerin kohort yaşına göre nasıl değiştiği.
Köprü grafikleri: faktörlerin (hız, kaydırma, hatalar) dönüşümdeki değişime katkısı.
11) Gizlilik, Etik, RG/Uyumluluk
PII minimizasyonu: tanımlayıcı karmaları, RLS/CLS, dışa aktarma sırasında maskeleme.
Rıza/şeffaflık: izleme ayarı, reddetme - saygı; Mantık açıklanabilir.
RG: Zararlı davranışları teşvik etmek için sinyal kullanmayın; yumuşak hatırlatıcılar/sınırlar.
Adalet: Hata/müdahale farklılıklarını gruba göre kontrol etmek; Geçersiz özellikleri hariç tutun.
Depolama: "Ham" olaylar için TTL zamanlaması, toplama tercih edilir.
12) Gözlemlenebilirlik ve sürüklenme
Veri kalitesi: kapsama alanı, kopyalar, gecikmeler, boş alanların yüzdesi.
Sinyal sürüklenme: PSI/KL tarafından dwell/scroll/frekansları; "Yeni" kalıplar.
Çalışma: gecikme toplama, p95 işaretlerinin hesaplanması, folbacks payı.
Korkuluklar: bot-scor dalgalanması, şikayetler, abonelikten çıkma; Agresif müdahalelerde "stop-crane".
13) Anti-desenler
Bağlam/idl filtresi olmadan ham tıklamalar - yanlış "dikkat".
Birimlerin karıştırılması (sessii↔polzovateli), TZ, pencereler - eşitsizlik.
Gelecekten yüzler (PIT yok) - modellerin yeniden değerlendirilmesi.
Gürültüye toleranssızlık: Histerezis olmadan sert eşikler - "yanıp sönüyor".
Anti-botları/QA filtrelerini görmezden gelin - fazla tahmin edilen metrikler.
Sebepsiz ekstra PII kaydetme - riskler ve para cezaları.
14) Davranışsal Sinyal Döngüsü Tetikleyici Kontrol Listesi
- Olay şeması (sürümler, UTC, idempotency), PII minimizasyonu
- Anti-botlar/QA filtreleri, ASN/cihaz siyah/beyaz listeleri
- PIT tarifleri, 5m/1h/24h/7d pencereler, çevrimiçi/çevrimdışı eşlik
- Kalite metrikleri: kapsama, tazelik, katılım doğrulayıcıları
- R/F/dwell/scroll/sequence/search, oturum gömme
- Karar tabloları: eylemler, histerezis, bekleme süreleri, korkuluklar
- Kayma panoları ve uyarıları (PSI/KL), şikayetler/abonelikten çıkma, RG göstergeleri
- Belgeler: veri sözlüğü, sinyal/metrik pasaportlar, sahipler ve çalışma kitapları
Toplam
Davranışsal sinyaller sadece disiplinli bir devrede değer sağlar: doğru enstrümantasyon ve PIT, temizlik ve anti-botlar, kararlı işaretler ve açık eylem politikaları, gizlilik ve RG, gözlemlenebilirlik ve sürüklenme tepkisi. Bu yaklaşım, tıklamaları ve kaydırmaları, güvenli, şeffaf ve tekrarlanabilir şekilde dönüştürme, saklama ve LTV'yi artıran çözümlere dönüştürür.