GH GambleHub

Վարքագծային ազդանշաններ

Վարքագծային ազդանշաններ

Վարքագծային ազդանշանները օգտագործողի և արտադրանքի փոխազդեցության «հեռաչափն» են 'իրադարձություններ, համատեքստեր և ժամանակային շարքեր, որոնցից մենք ցույց ենք տալիս մտադրությունը, հետաքրքրությունը, հաճախորդի որակը, ռիսկը և արժեքը։ Ազդանշանների հետ աշխատելու հուսալի ուղղությունը հետևյալն է. Մաքրման պարամետրերի հավաքումը կարգավորվում է նորմալացումով։

1) Ի՞ նչ կարելի է համարել վարքագծային ազդանշաններ

Նստաշրջաններ 'մեկնարկը/կանգառը, տևողությունը, էկրանների քանակը, խորությունը, օրվա կրկնությունները, «հանգիստ» նստաշրջանները։

Clicki/tach/scroll: Կլիկների խտությունը, արտանետման արագությունը, խորությունը, կանգառը (scrome-stops)։

Dell Time: ժամանակը էկրանին/տարրի վրա, ակտիվ ժամանակը (idle ֆիլտրը)։

Ինդուկցիան/էկրանների փոխկապակցվածությունը 'հաջորդականություն, petli, rage-navigiation։

Մուտքագրումը/ձևերը 'արագությունը, ուղղումը, կարգավորումը, paste rate-ը։

Միկրո ինտերացիաներ 'հովերներ, բացահայտումներ, անջատիչներ, տեսակավորում/ֆիլտրեր։

Բովանդակություն/որոնում: Հարցումներ, CTR, CTCVR, պահպանում, «հետաձգել հետո»։

Տեխնոլոգիա ՝ device/browser, FPS/մարտկոցի կարգավիճակը, սխալները, latency, ցանցերը (IP/ASN), օֆլինը/առցանց։

Ժամանակը/համատեքստը 'ժամ/օր/տեղական օրացույց, գեո-պաթերտներ (առանց ճշգրիտ երկրաչափության, եթե անհրաժեշտ չէ)։

Բացասական արձագանքը 'թաքցնել, բողոքել, հափշտակել, հրաժարվել տիկնիկից/կերպարներից։

2) Փոփոխությունը և իրադարձությունների սխեման

Կանոնական սխեմա (նվազագույն)


event_id, user_id, session_id, ts_utc, type, screen/page, element, value, duration_ms,
device_id, platform, app_version, locale, referrer, ip_hash, asn, experiment_id, schema_version

Սկզբունքները ՝ idempotenty (dedup '(source _ id, noksum), UTC-ժամանակը, սխեմաների տարբերակը, կայուն ինքնության բանալիները, PII (heshi/tocens) նվազեցումը։

3) Մաքրումը և հակատանկը

Headless/automation դրոշները ՝ WinDriver/puppeteer ազդանշաններ, որոնք բացակայում են օգտագործողի ժեստերը։

Աննորմալ արագություն 'գերմարդկային կլիկներ/սկրոլ, «կատարյալ» ընդմիջումներ։

Ցանցը 'ամսաթվերի կենտրոններ, որոնք հայտնի են MSN ASN-ը։

Պատկերի կրկնությունը 'նույն հետքերը և հաջորդականությունը։

QA/ներքին 'թեստային հաշիվների ցուցակները/սարքերը։

Ֆրոդը 'device/IP գրաֆիկ (մեկ dewis, շատ հաշիվներ, geo-velocity)։

4) Նորմալացում և Point-in-Time (PIT)

Ժամանակավոր պատուհանները '5 րոպե/1 ժամ/24 ժամ/7 օր; էքսպոն։ հարթեցում։

Սեզոն 'day-of-week, hour-of-day, տոնական դրոշներ։

PIT կտրվածքներ. Բոլոր նշանները կառուցվում են մինչև գնահատման ժամանակը։ ապագայի ոչ մի տեղեկություն չկա։

Առցանց/օֆլայնը հավասարաչափ է 'նույն բաղադրատոմսերը feature store-ում։

5) Ազդանշանների որակը և մեծությունը

Coverage 'նստաշրջանների/էկրանների մասը ամբողջական իրադարձություններով։

Freshness: Lag։

Consistency: Օգտագործողի/2019 վրա իրադարձությունների մասնաբաժինը «միջանցքներում» (արտանետումների վերահսկումը)։

Ուշադրություն 'ակտիվ ժամանակը/idl ֆիլտրը, scrope depth, կանգառը։

Մտադրությունը խորը գործողությունների անցումն է (ֆիլտրը մանրաթելային է)։

Հուսալիություն 'հակաբոտիկ սկոր, վստահություն dewiss/IP։

6) Նշումը (feature ineering)

R/F: Վերջին ինտերեկտի ռեկորդային, 7/30/90 պատուհանի հաճախականությունը։

Medell/scro.ru: Medians/quanali, Express-ի մասնաբաժինը Express X-ից, խորությունը 42p%։

Հաջորդականությունները ՝ n-գրամ, մարկովական անցումներ, «զղջման» (back-forth), run-length։

Հիմնական սարքերը 'dewis/զննարկչի փոփոխություն, entropy user-agents։

Կլիկի որակը 'ratio clicks-ը կլիկաբելային տարրերի, rage-clicks-ի համար։

Որոնումը/մտադրությունը 'հարցումների երկարությունը/հստակեցումը, որոնումից հետո ell-ը, success rate-ը։

Նույնականության ագրեգացիաները ՝ user _ id, device _ id, ip _ hash, asn։

Հիբրիդները 'նստաշրջանների սաղմեդիները (Doc2Vec/Transformer) բացատրում են կլաստերիզացիա/ռենջացիա։

7) Ազդանշան ՝ համապատասխան որոշումներ

ԱզդանշաններՀամատեքստըԳործողությունGuardrails
`rage_clicks≥3` или `latency_p95↑`onbordingցույց տալ օգնությունը/թեթև ձևբողոքներ, որոնք վերաբերում են H- ի բողոքներին
`scroll_depth<25%` & `dwell<3с`բովանդակությունվերակառուցել բլոկները/սեղմված ցուցակըSLA UI
`search_refine≥2` & `no_success`որոնում/ ֆասետներ, fallback-կատալոգCTR չի նշվում
`bot_score≥τ`սահմանափակում/գլխարկ/բանFPR հակատանկային թիվ 0։ 5%
«session _ runlength media»RGփափուկ հիշեցումներ/դադարFPR≤1%

Հիստերեևսկու և կուլդաունները պարտադիր են, որ չփորձեն «գաղթել» հուշերով։

8) Կեղծ-SQL/բաղադրատոմսեր

A. ակտիվ ժամանակը և խորությունը

sql
WITH ev AS (
SELECT user_id, session_id, page, ts,
SUM(CASE WHEN event='user_active' THEN duration_ms ELSE 0 END) AS active_ms,
MAX(CASE WHEN event='scroll' THEN depth_pct ELSE 0 END)     AS max_depth
FROM raw_events
WHERE ts BETWEEN:from AND:to
GROUP BY 1,2,3,4
)
SELECT user_id, session_id,
AVG(active_ms) AS avg_dwell_ms,
PERCENTILE_CONT(0. 5) WITHIN GROUP (ORDER BY max_depth) AS scroll_median
FROM ev
GROUP BY 1,2;

B. Rage-clicks / back-forth

sql
WITH clicks AS (
SELECT user_id, session_id, ts,
LAG(ts) OVER (PARTITION BY user_id, session_id ORDER BY ts) AS prev_ts,
element
FROM ui_events WHERE event='click'
),
rage AS (
SELECT user_id, session_id,
COUNT() FILTER (WHERE EXTRACT(EPOCH FROM (ts - prev_ts)) <= 0. 3) AS rage_clicks
FROM clicks GROUP BY 1,2
),
backforth AS (
SELECT user_id, session_id,
SUM(CASE WHEN action IN ('back','forward') THEN 1 ELSE 0 END) AS nav_bf
FROM nav_events GROUP BY 1,2
)
SELECT r. user_id, r. session_id, r. rage_clicks, b. nav_bf
FROM rage r JOIN backforth b USING (user_id, session_id);

Անտիբոտ սկոր (ուրվագիծ)

sql
SELECT user_id, session_id,
(CASE WHEN headless OR webdriver THEN 1 ELSE 0 END)0. 4 +
(CASE WHEN asn_cat='hosting' THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN click_interval_std < 50 THEN 1 ELSE 0 END)0. 2 +
(CASE WHEN scroll_speed_avg > 5000 THEN 1 ELSE 0 END)0. 2 AS bot_score
FROM telemetry_features;

D հաջորդականությունը n-գրամ

sql
-- Collect screen sequences and transition frequencies
SELECT screen_seq, COUNT() AS freq
FROM (
SELECT user_id, session_id,
STRING_AGG(screen, '→' ORDER BY ts) AS screen_seq
FROM nav_events
GROUP BY 1,2
) t
GROUP BY screen_seq
ORDER BY freq DESC
LIMIT 1000;

9) Վարքագծային ազդանշանները ML/վերլուծության մեջ

Հակումներ/կերպարներ ՝ CTR/CTCVR մոդելներ, session embeddings, next-best-գործողություն։

Հոսք/պահել: hazard մոդելներ, recency/հաճախականության/հաջորդականության նշաններ։

Անտիֆրոդը 'ձևերի արագությունը, գեո-վելոն, device/IP գրաֆիկը, «ֆերմերի» օրինակները։

Մրցույթի որակը '«վալիդային դիտարկումներ», draged sessions, բացասական արձագանք։

A/B և քաուզալությունը 'ուշադրության չափումները որպես միջնորդներ, բայց եզրակացությունները' համապատասխան (ROMI/LTV, պահպանումը)։

10) Տեսողականություն

Sankey/step-bars 'ճանապարհներ և drop-off։

Heatmaps: խորությունը, տեսահոլովակների քարտեզները (անանուն)։

Cohronsage: Ինչպե՞ ս են փոխվում կոորդինատային տարիքի ազդանշանները։

Bridge-գրաֆիկները 'գործոնների ներդրումը (արագություն, սկրոլ, սխալներ) փոխակերպման փոփոխության մեջ։

11) Գաղտնիությունը, էթիկան, RG/complaens

PII-նվազեցումը 'հակաբիոտիկներ, RSA/CLS, դիմակավորում էքսպորտում։

Համաձայնություն/թափանցիկություն 'tracking, հրաժարումը հարգում է. տրամաբանությունը բացատրելի է։

RG 'չօգտագործել ազդանշաններ վնասակար վարքագծի խրախուսման համար։ փափուկ հիշեցումներ/լիմիտներ։

Fairness: սխալների/միջամտությունների տարբերությունների ստուգում խմբերի վրա։ բացառել անթույլատրելի նշանները։

Պահեստավորում 'TTL պայմանները «հում» իրադարձությունների համար, ագրեգացիան ավելի նախընտրելի է։

12) Դիտողությունն ու դրեյֆը

Տվյալների որակը 'coverage, կրկնօրինակներ, բայեր, դատարկ դաշտերի տոկոսը։

Ազդանշանային dreaft: PSI/KL-ն ալյումինե/scrope/հաճախականությամբ; «նոր» փամփուշտներ։

Վիրահատական 'latency հավաքում, p95 հաշվարկում նշանները, ֆոլբեկների մասը։

Guardrails: Բոտի սկորի աճը, բողոքները, հուղարկավորությունները։ «Stop-kran» -ը ագրեսիվ միջամտությունների համար։

13) Anti-patterna

Պանրի կտորները առանց կոնտեքստի/idl-international-ը կեղծ «ուշադրություն» են։

Միավորների խառնուրդը (խորհրդատվական օգտագործողներ), TZ, պատուհանները կանխատեսվում են անօգուտ։

Ապագայի աղվեսները (ոչ PIT) բացատրում են մոդելների վերագնահատումը։

Լռությունը աղմուկի հանդեպ. Կոշտ շեմեր առանց հիստերեզիսի «միգրացիա»։

Հակաբոտիկների/QA ֆիլտրերի անտեսումը հաստատվում է գերագնահատված մետրերով։

Լրացուցիչ PII-ի ձայնագրումը առանց ռիսկի և տուգանքների։

14) Վարքային ազդանշանների գործարկման թուղթ

  • Իրադարձությունների սխեմա (տարբերակ, UTC, idempotention), PII նվազագույնի
  • Անտիբոտ/QA ֆիլտրեր, սև/սպիտակ ASN/սարքերի ցուցակներ։
  • PIT բաղադրատոմսեր, պատուհաններ 5m/1h/24h/7d, on.ru/24.ru-paritet
  • Որակի մետրերը 'coverage, freshness, dragragram vaidators
  • R/F/wwww.ell/scrome/հաջորդականություն/որոնում, session embeddings
  • Decision tables: գործողություններ, histereae, kuldowns, guardrails, guardrails։
  • Dashbords և alerta dreefa (PSI/KL), բողոքներ/ազդանշաններ, RG ցուցիչներ, RG-ազդանշաններ։
  • Peter: Datableker, ազդանշանային անձնագրեր/մետրիկ, սեփականատերեր և ռունիբուկներ։

Արդյունքը

Վարքագծային ազդանշանները արժեքավոր են միայն կարգապահության մեջ 'ճիշտ փոփոխումը և PIT-ը, մաքրումը և հակատանկը, գործողությունների կայուն նշանները, գաղտնիությունը և RG-ն, դիտողությունն ու արձագանքը։ Այս մոտեցումը թարգմանում է «կտորներ և սկրոլներ», որոնք բարձրացնում են ծրարը, պահպանումը և LTV-ը 'անվտանգ, թափանցիկ և վերարտադրված։

Contact

Կապ հաստատեք մեզ հետ

Կապ հաստատեք մեզ հետ ցանկացած հարցի կամ աջակցության համար։Մենք միշտ պատրաստ ենք օգնել։

Սկսել ինտեգրացիան

Email-ը՝ պարտադիր է։ Telegram կամ WhatsApp — ըստ ցանկության։

Ձեր անունը ըստ ցանկության
Email ըստ ցանկության
Թեմա ըստ ցանկության
Նամակի բովանդակություն ըստ ցանկության
Telegram ըստ ցանկության
@
Եթե նշեք Telegram — մենք կպատասխանենք նաև այնտեղ՝ Email-ի дополнение-ով։
WhatsApp ըստ ցանկության
Ձևաչափ՝ երկրի կոդ և համար (օրինակ՝ +374XXXXXXXXX)։

Սեղմելով կոճակը՝ դուք համաձայնում եք տվյալների մշակման հետ։