Жүрүм-турум сигналдары
Жүрүм-турум сигналдары
Жүрүм-турум сигналдары - бул продукт менен колдонуучунун өз ара аракеттенүүсүнүн "телеметриясы": биз ниетин, кызыкчылыгын, трафиктин сапатын, тобокелчилигин жана баалуулугун алып келген окуялар, контексттер жана убакыт катар. Сигналдар менен иштөө үчүн ишенимдүү контур: инструменттөө → чогултуу → тазалоо → нормалдаштыруу → белгилөө → чечимдерде колдонуу → мониторинг жана этика.
1) Жүрүм-турум сигналдары катары эсептелиши керек
Сессиялар: баштоо/токтотуу, узактыгы, экрандардын саны, тереңдиги, күнүнө кайталоо, "тынч" сессиялар.
Click/tach/scroll: click тыгыздыгы, жылдыруу ылдамдыгы, тереңдик, токтотуу (scroll-stops).
Dwell-time: экран/элемент боюнча убакыт, активдүү убакыт (idle чыпкасы).
Навигация/экран байланышы: ырааттуулук, илмектер, rage-навигация.
Кирүү/формалар: толтуруу ылдамдыгы, оңдоолор, таб-навигация, paste rate.
Микро-interaction: ховерлер, ачылыштар, ачкычтар, сорттоо/чыпкалар.
Мазмун/издөө: суроолор, CTR, CTCVR, сактоо, "кийинкиге калтыруу".
Техника: device/browser, FPS/батарея абалы, каталар, latency, тармак (IP/ASN), оффлайн/онлайн.
Убакыт/контекст: саат/күн/жергиликтүү календар, гео-үлгүлөр (талап кылынбаса, так геолокациясы жок).
Терс пикир: жашыруу, даттануу, жооп, cookie/жекелештирүү баш тартуу.
2) аспаптар жана окуялар схемасы
Канондук схема (минимум):
event_id, user_id, session_id, ts_utc, type, screen/page, element, value, duration_ms,
device_id, platform, app_version, locale, referrer, ip_hash, asn, experiment_id, schema_version
Принциптер: демпотенттүүлүк (dedup '(source_id, checksum)'), UTC-убакыт, схемалардын версиясы, туруктуу идентификация ачкычтары, PII минималдаштыруу (хеш/токендер).
3) тазалоо жана каршы
Headless/automation желектери: WebDriver/puppeteer signatures, жок колдонуучу кыймыл.
Аномалдуу ылдамдыгы: Superman чыкылдатуу/scroll, "идеалдуу" аралыктары.
Тармак: маалымат хостинг борборлору, белгилүү прокси/VPN ASN.
Үлгүнүн кайталанышы: бирдей траекториялар жана ырааттуулуктар.
QA/ички: тесттик эсеп/түзмөктөрдүн тизмеси.
Frod: device/IP-граф (бир түзмөк → көп эсеп, гео-velocity).
4) нормалдаштыруу жана Point-in-Time (PIT)
Убактылуу терезелер: 5 мүнөт/1 саат/24 саат/7 күн; экспон. тегиздөө.
Сезондук: day-of-week, hour-of-day, майрамдык желектер.
PIT тилкелери: бардык белгилер баалоо убактысына чейин курулат; эч кандай маалымат жок.
Онлайн/оффлайн паритет: feature store боюнча бирдей рецепттер.
5) Сигналдардын сапаты жана ырааттуулугу
Coverage: толук окуялар менен сессиялар/экрандар үлүшү.
Freshness: кабыл алуу артта.
Consistency: "коридорлордо" колдонуучу/сессияга окуялардын үлүшү (эмиссияларды көзөмөлдөө).
Эскертүү: активдүү убакыт/IDL чыпкасы, scroll depth, токтотуу.
Ниет: терең иш-аракеттерге өтүү (фильтр → детал → максаттуу).
Ишенимдүүлүк: анти-тез, аппарат/IP ишеним.
6) белгилөө (feature engineering)
R/F: акыркы interact recency, 7/30/90 терезелер үчүн жыштык.
Dwell/scroll: медианалар/квантилдер, dwell ≥ X менен экрандардын үлүшү, тереңдиги ≥ p%.
Ырааттуулугу: n-граммдар, Марк өткөөлдөрү, "өкүнүү" үлгүлөрү (back-forth), run-length.
Аппараттын туруктуулугу: түзмөк/браузерди өзгөртүү, entropy user-agents.
Click сапаты: кликабель элементтерине ratio click, rage-clicks.
Издөө/ниет: узундугу/тактоо суроо, dwell кийин издөө, success rate.
Идентификациялар боюнча агрегациялар: user_id, device_id, ip_hash, asn.
Гибриддер: сессиялардын эмбеддинги (Doc2Vec/Transformer) → кластерлештирүү/ранжирлөө.
7) Сигнал → Иш-аракет: чечимдер жадыбалы
Гистерезис жана кулдаундар "жыпар жыттуу" эмес, милдеттүү болуп саналат.
8) Pseudo-SQL/Recipes
A. Активдүү убакыт жана тереңдик
sql
WITH ev AS (
SELECT user_id, session_id, page, ts,
SUM(CASE WHEN event='user_active' THEN duration_ms ELSE 0 END) AS active_ms,
MAX(CASE WHEN event='scroll' THEN depth_pct ELSE 0 END) AS max_depth
FROM raw_events
WHERE ts BETWEEN:from AND:to
GROUP BY 1,2,3,4
)
SELECT user_id, session_id,
AVG(active_ms) AS avg_dwell_ms,
PERCENTILE_CONT(0. 5) WITHIN GROUP (ORDER BY max_depth) AS scroll_median
FROM ev
GROUP BY 1,2;
B. Rage-clicks / back-forth
sql
WITH clicks AS (
SELECT user_id, session_id, ts,
LAG(ts) OVER (PARTITION BY user_id, session_id ORDER BY ts) AS prev_ts,
element
FROM ui_events WHERE event='click'
),
rage AS (
SELECT user_id, session_id,
COUNT() FILTER (WHERE EXTRACT(EPOCH FROM (ts - prev_ts)) <= 0. 3) AS rage_clicks
FROM clicks GROUP BY 1,2
),
backforth AS (
SELECT user_id, session_id,
SUM(CASE WHEN action IN ('back','forward') THEN 1 ELSE 0 END) AS nav_bf
FROM nav_events GROUP BY 1,2
)
SELECT r. user_id, r. session_id, r. rage_clicks, b. nav_bf
FROM rage r JOIN backforth b USING (user_id, session_id);
C. анти-тез (эскиз)
sql
SELECT user_id, session_id,
(CASE WHEN headless OR webdriver THEN 1 ELSE 0 END)0. 4 +
(CASE WHEN asn_cat='hosting' THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN click_interval_std < 50 THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN scroll_speed_avg > 5000 THEN 1 ELSE 0 END)0. 2 AS bot_score
FROM telemetry_features;
D. N-грамм ырааттуулугу
sql
-- Collect screen sequences and transition frequencies
SELECT screen_seq, COUNT() AS freq
FROM (
SELECT user_id, session_id,
STRING_AGG(screen, '→' ORDER BY ts) AS screen_seq
FROM nav_events
GROUP BY 1,2
) t
GROUP BY screen_seq
ORDER BY freq DESC
LIMIT 1000;
9) ML/аналитика жүрүм-турум сигналдары
Тенденциялар/жекелештирүү: CTR/CTCVR моделдер, session embeddings, next-best-action.
Агып/кармап: hazard-моделдер, recency/жыштык/ырааттуулук белгилери.
Антифрод: формалардын ылдамдыгы, гео-вело, device/IP-графа, "фермалардын" үлгүлөрү.
Трафиктин сапаты: "valid views", engaged sessions, терс пикир.
A/B жана каузалуулук: ортомчу катары көңүл метрика, бирок корутундулары - инкремент (ROMI/LTV, сактоо).
10) Көрүү
Sankey/step-bars: жолдор жана drop-off.
Heatmaps: scroll тереңдиги, click card (anonymous).
Cohort × age: Когорттун жашы боюнча сигналдар кандай өзгөрөт.
Bridge Graphics: өзгөрүү өзгөрүшүнө факторлордун салымы (ылдамдык, скролл, каталар).
11) Купуялык, этика, RG/комплаенс
PII-минималдаштыруу: хеш идентификаторлору, RLS/CLS, экспорттук маскировка.
Макулдук/ачык-айкындуулук: трекингди орнотуу, баш тартуу - урматталат; логикасы түшүнүктүү.
RG: зыяндуу жүрүм-жылдыруу үчүн сигналдарды колдонбогула; жумшак эскертүүлөр/лимиттер.
Fairness: каталарды/интервенцияларды топтор боюнча текшерүү; жол берилгис белгилерди алып салуу.
Сактоо: "чийки" окуялар үчүн TTL мөөнөтү, топтоо артыкчылык берет.
12) Байкоо жана дрейф
Маалыматтардын сапаты: coverage, дубликаттар, лагдар, бош талаалардын пайызы.
Сигналдык дрейф: dwell/scroll/жыштыктар боюнча PSI/KL; "жаңы" үлгүлөрү.
Операциялык: латенси жыйымдар, p95 эсептөө белгилери, фолбэктердин үлүшү.
Guardrails: бот-скор, даттануулар, жооптор; "стоп-кран" агрессивдүү кийлигишүү.
13) Анти-үлгүлөрү
Контекстсиз чийки басуулар/идл чыпкасы → жалган "көңүл буруу".
Бирдиктерди аралаштыруу (сессия колдонуучулары), TZ, терезелер → салыштырбоо.
Келечектен келген жүздөр (PIT жок) → моделдерди кайра баалоо.
Nultolerance ызы-чуу: histeresis жок катуу босоголор → "жаркырап".
Ignor antibot/QA-чыпкалар → ашыкча өлчөө.
себепсиз кошумча PII жазуу → тобокелдиктер жана айыптар.
14) Жүрүм-турум сигналдарынын контурун ишке киргизүү чек тизмеси
- Окуялардын схемасы (версиялар, UTC, ыктымалдуулук), PII минималдаштыруу
- Antibot/QA чыпкалар, кара/ак ASN тизмеси/түзмөктөр
- PIT Recipes, терезелер 5m/1h/24h/7d, онлайн/оффлайн паритет
- Сапат көрсөткүчтөрү: coverage, freshness, engagement validators
- R/F/dwell/scroll/ырааттуулугу/издөө белгилери, session embeddings
- Decision tables: иш-аракеттер, histeresis, кулдаун, guardrails
- Дашборддор жана дрейф (PSI/KL), даттануулар/жооптор, RG көрсөткүчтөр
- Документтер: dataslovar, белги паспорту/метрика, ээлери жана Рунибуки
Жыйынтык
Жүрүм-турум сигналдары тартиптүү схемада гана баалуулукту берет: туура инструменттөө жана PIT, тазалоо жана каршы, туруктуу белгилер жана ачык-айкын иш-аракеттер саясаты, купуялык жана RG, байкоо жана дрейфке реакция. Бул ыкма конверсияны, кармап турууну жана LTV - коопсуз, ачык-айкын жана ойнотулуучу чечимдерди "чыкылдатууларды" которот.