მოთამაშეთა პროფილირება
მოთამაშეთა პროფილირება
პროფილირება არის მოთამაშის სისტემური აღწერა მონაცემების, ქცევის, ღირებულებისა და რისკების საშუალებით, მართვადი გადაწყვეტილებების მისაღებად: შინაარსისა და ოფისის პერსონალიზაცია, რეაქტიული გააქტიურება, შეზღუდვები და RG, საპორტო და მარკეტინგის პრიორიტეტიზაცია. გასაღები - ეთიკა და შესაბამისობა: მინიმალური PII, გამჭვირვალე პოლიტიკოსები, ახსნა.
1) მიზნები და გამოყენების არეალი
პროდუქტი/UX: პერსონალური ფანჯრები, საწყისი სცენარები, ტრენინგი, სირთულის შეზღუდვები.
მარკეტინგი/CRM: welcome/შემდეგი საუკეთესო ოფშორული, ჯვარედინი სელი, სიხშირის ქუდები, „მშვიდი საათი“.
რისკი/შესაბამისობა: RG ინდიკატორები, ანომალიები, სანქციები/KUS ნაბიჯი (დისკრიმინაციის გარეშე).
მონეტიზაცია: პრიორიტეტი მოსალოდნელი ღირებულებისთვის (LTV) და არა „ნედლეული“ კონვერტაციით.
ოპერაციები: SLA ეტაპი, VIP მომსახურება, არხების სიმძლავრე.
2) მონაცემები და იდენტურობა
მოვლენები: ვიზიტები/სესიები, კლიშეები, თამაშები/ფსონები, ანაბრები/დასკვნები, კამპანიის პასუხები.
კონტექსტი: პლატფორმა/OS/მოწყობილობა, გეო/TZ, მოზიდვის არხი, კალენდარი/ტირიფი.
ანტიბოტი/ფროიდი: headless/ASN/proxy სიგნალები, მოწყობილობები/IP გრაფიკი.
იდენტურობები: user _ id, ელ.ფოსტა/ტელეფონი device _ id - გადახდის ნიშნები; golden record, ისტორია merge/split.
ხარისხი: შენახვა UTC- ში, მოვლენების იდემპოტენტურობა, სქემების ვერსიები; Point in Time fich- ისთვის.
3) ნიშნები და ქცევითი ნიმუშები
RFM: ჩანაწერები/სიხშირე/ფულადი სახსრები ფანჯრებში 7/30/90.
სესიები: ხანგრძლივობა, სიღრმე, კვირის დღე/დღე, „სერია“ (run-length).
შინაარსი: საყვარელი კატეგორიები/პროვაიდერები, მრავალფეროვნება/სიახლე, „ჩამოსხმა“.
ფინანსები: ანაბრები/საშუალო შემოწმება, ARPPU/ARPU, ხარჯების ცვალებადობა.
RG სიგნალები: არანორმალური ხანგრძლივობა/ინტერვალები, ხშირი ანაბრები, ღამის აქტივობა (როგორც guardrails, არა როგორც მიზნობრივი მიზანი).
რეაქციები: იარაღის/წერილების გახსნა/დაწკაპუნება, პასუხები, საჩივრები.
ტექნიკური: მოწყობილობის/IP სტაბილურობა, გარემოს შეცვლა.
4) პროფილის მეთოდები
წესები: სწრაფად და გასაგებად (მაგალითად, „ახალბედა 48ch მეორე ვიზიტის გარეშე“).
RFM მაკიაჟი: მატრიცები „ახალი × სიხშირე ფულადი“ (R-backets, F-backets, M-backets).
კლასტერიზაცია: k-means/Gauss mix/DBSCAN ნორმალიზებული ქცევითი მეტრიკის მიხედვით.
Ambedings: user/item საერთო სივრცეში (MF/ორსართულიანი ქსელები) + „ინტერესების“ კლასტერიზაცია.
ტენდენცია (ტენდენცია): მოვლენის ალბათობა (ანაბარი, გამეორება, გამეორება) შეცდომების ღირებულების შესახებ გადაწყვეტილებები.
Uplift მიდგომა: ინტერვენციის ზრდის ალბათობა; зоны Persuadables/Sure/Lost/DnD.
5) პროფილის პასპორტები და პრიორიტეტები
პროფილის პასპორტი
Код: `P_R0-7_F3-9_M50-199_Casino-Mobile`
განმარტება: RFM ბაკეტები + დომინანტური შინაარსი + პლატფორმა
ზომა, განახლების სიხშირე, საშუალო LTV კვანტური
რისკები და გამონაკლისები (RG/შესაბამისობა), მფლობელი, ვერსია
რეკომენდებული მოქმედებები: პოლიტიკა (არხები, შემოქმედება, ქუდი, „მშვიდი საათი“)
მეტრიკა: uplift/ROMI, საჩივრები/პასუხები, fairness დიაგნოზი
6) Decision tables (ესკიზი)
ჰისტერეზი: შესასვლელი ბარიერი უფრო მაღალია, ვიდრე შაბათ-კვირას, რათა გამორიცხოს „მოციმციმე“.
კონფლიქტები: პრიორიტეტები - უსაფრთხოება (RG/შესაბამისობა) - ეკონომიკა - UX.
7) ფსევდო-SQL და რეცეპტები
A. RFM ბაქტერიები
sql
WITH acts AS (
SELECT user_id,
MAX(ts) AS last_act,
COUNT() FILTER (WHERE ts > NOW()-INTERVAL '30 day') AS f_30d
FROM event_activity GROUP BY 1
),
spend AS (
SELECT user_id,
SUM(amount) FILTER (WHERE ts > NOW()-INTERVAL '90 day') AS m_90d
FROM fact_payments GROUP BY 1
)
SELECT a. user_id,
DATE_PART('day', NOW()-a. last_act) AS recency_days,
a. f_30d, s. m_90d,
CASE WHEN DATE_PART('day', NOW()-a. last_act)<=7 THEN 'R0-7'
WHEN DATE_PART('day', NOW()-a. last_act)<=30 THEN 'R8-30' ELSE 'R31+' END AS R_bucket,
CASE WHEN a. f_30d>=10 THEN 'F10+' WHEN a. f_30d>=3 THEN 'F3-9' ELSE 'F0-2' END AS F_bucket,
CASE WHEN s. m_90d>=200 THEN 'M200+' WHEN s. m_90d>=50 THEN 'M50-199' ELSE 'M0-49' END AS M_bucket
FROM acts a LEFT JOIN spend s USING(user_id);
დომინანტური შინაარსის კატეგორია
sql
SELECT user_id,
category AS top_category
FROM (
SELECT user_id, category,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY COUNT() DESC) AS rn
FROM event_content
WHERE ts > NOW() - INTERVAL '30 day'
GROUP BY 1,2
) t
WHERE rn=1;
პროფილის შეკრება
sql
SELECT u. user_id,
r. R_bucket, r. F_bucket, r. M_bucket, c. top_category, d. platform
FROM users u
LEFT JOIN rfm r USING(user_id)
LEFT JOIN top_content c USING(user_id)
LEFT JOIN devices d USING(user_id);
8) პერსონალიზაცია და ღირებულებასთან კავშირი
LTV წონა: პროფილები დაანგარიშდება მოსალოდნელი ღირებულებით (LTV კვარტალი).
შემდეგი - საუკეთესო მოქმედება: პროფილის კავშირი სამოქმედო ბიბლიოთეკასთან (შინაარსი, ოფერები, კომუნიკაციები).
Reason codes: აჩვენეთ „რატომ გთავაზობთ ამას“ (განმარტება საფოსტო პორტისთვის).
9) კონფიდენციალურობა, ეთიკა და RG
მინიმალური PII: ტოქსიკაცია, RLS/CLS, შენიღბვა ექსპორტში.
Fairness: ეფექტების/შეცდომების განსხვავებების შემოწმება ქვეყნის/პლატფორმების მიხედვით; მიუღებელი ნიშნების გამორიცხვა (მაგ., მგრძნობიარე ატრიბუტები).
RG პრინციპები: პროფილებმა არ უნდა შეუწყონ ხელი მავნე ქცევას; სიხშირის ქუდები და „მშვიდი საათი“ სავალდებულოა; მომხმარებლის გასაჩივრების გზა.
გამჭვირვალობა: ჟურნალი „სიგნალი - პროფილი, გამოსავალი - შედეგი“, პოლიტიკოსის ვერსია.
10) მონიტორინგი და დრიფტი
პროფილების ხარისხი: განაწილების სტაბილურობა (PSI/KL) საკვანძო ფილიალებში; „არაპროფილირებული“ წილი.
ეფექტი: uplift/ROMI პროფილების შიგნით მოქმედებების შესახებ; NNT, re- გააქტიურების კონვერტაცია, LTV დელტა.
რისკები: საჩივრები/პასუხები, RG ინდიკატორები, FPR ანტიბოტი/ფილტრების ფრაგმენტი.
SLO: პროფილების განახლება 06:00 საათამდე ლოკი., ონლაინ კლასიფიკაცია - 300 ms p95.
რუნიბუკი: საჩივრების ზრდა, მონაცემთა დეგრადაცია (მოვლენების კლდე), RG რისკების ზრდა.
11) არქიტექტურა და MLOps
Feature Store: PIT რეცეპტები, TTL სესიის ხაზები, ონლაინ/ოფლაინ პარიტეტი.
Pipline: batch პროფილების განახლება + online scoring (propensity/uplift).
ორკესტრი: idempotence, DLQ, rate-limit per user/channel, „მშვიდი საათი“.
დოკუმენტაცია: პროფილის/კამპანიის პასპორტები, changelog ვერსიები, წვდომის აუდიტი.
ფოლბეკი: safe-default პროფილი (popular-safe), ინციდენტების დროს რისკის შინაარსის გათიშვა.
12) ანტი შაბლონები
პროფილები „სილამაზის გულისთვის“ გაზომილი სიხშირის გარეშე.
ერთეულების და TZ- ის შერევა, PIT- ის არარსებობა სახეები და ყალბი დასკვნები.
RG/ეთიკის უგულებელყოფა, სიხშირის ქუდები - საჩივრები/რისკები.
„საშუალო“ მრიცხველების/მნიშვნელთა აგრეგაციის ნაცვლად.
ჰისტერეზის არარსებობა არის მოქმედების „მოციმციმე“.
აუხსნელი პროფილები (არა reason codes) - ოპერაციული ქაოსი.
13) პროფილის გაშვების ჩეკის სია
- აღწერილია მიზნები (UX/მარკეტინგი/რისკი), KPI და guardrails
- მოვლენების სქემები, PIT ფიჩები, ანტიბოტი/ფროიდის ფილტრები აქტიურია
- შეგროვებული RFM/ქცევითი/შინაარსის ნიშნები, ემბედინგი
- იქმნება პროფილები (წესები/მტევანი/propensity/uplift) პასპორტებით
- Decision tables: hysteresis, culdown, პრიორიტეტები, მატრიქსის კონფლიქტი
- მონიტორინგი: ეფექტი (uplift/ROMI), რისკები (საჩივრები/RG), დრიფტი (PSI/KL)
- ორკესტრი და არხები: rate-limit, „მშვიდი საათი“, DLQ, აუდიტი
- დოკუმენტაცია: ვერსიები/მფლობელები/რუნიბუკები; ფოლკლორული პოლიტიკა მზად არის
შედეგი
მოთამაშეთა პროფილირება არ არის ეტიკეტები, არამედ კონტროლირებადი სისტემა: მაღალი ხარისხის მონაცემები და PIT ფიჩები - მნიშვნელოვანი პროფილები (ქცევა/ღირებულება/მგრძნობელობა) - მოქმედების პოლიტიკა ჰისტერეზისთან და guardrails - ეფექტისა და დრიფტის მონიტორინგი - მკაცრი კონფიდენციალურობა და RG. ასეთი წრე ურთიერთქმედებას ხდის შესაბამისი, უსაფრთხო და ზომიერად მომგებიანი.