Профілювання гравців
Профілювання гравців
Профілювання - це системний опис гравця через дані, поведінку, цінність і ризики, щоб приймати керовані рішення: персоналізація контенту і офферів, ре-активація, ліміти і RG, пріоритизація саппорту і маркетингу. Ключ - етика і комплаєнс: мінімум PII, прозорі політики, зрозумілість.
1) Цілі та зона застосування
Продукт/UX: персональні вітрини, стартові сценарії, навчання, обмеження складності.
Маркетинг/CRM: welcome/next-best-offer, крос-селл, частотні капи, «тихий годинник».
Ризик/комплаєнс: RG-індикатори, аномалії, санкції/КУС-степ-ап (без дискримінації).
Монетизація: пріоритизація за очікуваною цінністю (LTV), а не за «сирою» конверсією.
Операції: SLA-черги, VIP-обслуговування, місткість каналів.
2) Дані та ідентичності
Події: візити/сесії, кліки, ігри/ставки, депозити/висновки, відгуки на кампанії.
Контекст: платформа/OS/пристрій, гео/TZ, канал залучення, календар/івенти.
Антибот/фрод: сигнали headless/ASN/proxy, device/IP граф.
Ідентичності: user_id ↔ e-mail/телефон ↔ device_id ↔ платіжні токени; golden record, історії merge/split.
Якість: зберігання в UTC, ідемпотентність подій, версії схем; Point-in-Time для фіч.
3) Ознаки і поведінкові патерни
RFM: recency/частота/грошовість у вікнах 7/30/90.
Сесії: тривалість, глибина, час доби/дня тижня, «серії» (run-length).
Контент: улюблені категорії/провайдери, різноманітність/новизна, «залипання».
Фінанси: депозити/середній чек, ARPPU/ARPU, волатильність витрат.
Сигнали RG: аномальна тривалість/інтервали, часті депозити, нічна активність (як guardrails, не як мета таргетингу).
Реакції: відкриття/клік гармат/листів, відписки, скарги.
Технічні: стабільність девайсу/IP, зміни середовища.
4) Методи профілювання
Правила (rule-based): швидко і зрозуміло (наприклад, «новачок без другого візиту 48ч»).
RFM-гриди: матриці «свіжість × частота × грошовість» (R-бакети, F-бакети, M-бакети).
Кластеризація: k-means/мікси Гауса/DBSCAN за нормалізованими поведінковими метриками.
Ембеддинги: user/item в загальному просторі (MF/двобаштові мережі) + кластеризація «інтересів».
Схильності (propensity): ймовірність події (депозит, повтор, churn) → рішення щодо вартості помилок.
Uplift-підхід: імовірність приросту від інтервенції; зоны Persuadables/Sure/Lost/DnD.
5) Паспорти профілів та пріоритизація
Паспорт профілю (template)
Код: `P_R0-7_F3-9_M50-199_Casino-Mobile`
Визначення: RFM-бакети + домінуючий контент + платформа
Розмір, частота оновлення, середній LTV-квантиль
Ризики та виключення (RG/комплаєнс), власник, версія
Рекомендовані дії: policy (канали, креативи, капи, «тихий годинник»)
Метрики: uplift/ROMI, скарги/відписки, fairness-діагностика
6) Decision tables (ескіз)
Гістерезис: вхідний поріг вище вихідного, щоб виключити «миготіння».
Конфлікти: пріоритети - безпека (RG/комплаєнс) → економіка → UX.
7) Псевдо-SQL і рецепти
A. RFM-бакети
sql
WITH acts AS (
SELECT user_id,
MAX(ts) AS last_act,
COUNT() FILTER (WHERE ts > NOW()-INTERVAL '30 day') AS f_30d
FROM event_activity GROUP BY 1
),
spend AS (
SELECT user_id,
SUM(amount) FILTER (WHERE ts > NOW()-INTERVAL '90 day') AS m_90d
FROM fact_payments GROUP BY 1
)
SELECT a. user_id,
DATE_PART('day', NOW()-a. last_act) AS recency_days,
a. f_30d, s. m_90d,
CASE WHEN DATE_PART('day', NOW()-a. last_act)<=7 THEN 'R0-7'
WHEN DATE_PART('day', NOW()-a. last_act)<=30 THEN 'R8-30' ELSE 'R31+' END AS R_bucket,
CASE WHEN a. f_30d>=10 THEN 'F10+' WHEN a. f_30d>=3 THEN 'F3-9' ELSE 'F0-2' END AS F_bucket,
CASE WHEN s. m_90d>=200 THEN 'M200+' WHEN s. m_90d>=50 THEN 'M50-199' ELSE 'M0-49' END AS M_bucket
FROM acts a LEFT JOIN spend s USING(user_id);
B. домінуюча категорія контенту
sql
SELECT user_id,
category AS top_category
FROM (
SELECT user_id, category,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY COUNT() DESC) AS rn
FROM event_content
WHERE ts > NOW() - INTERVAL '30 day'
GROUP BY 1,2
) t
WHERE rn=1;
C. збірка профілю
sql
SELECT u. user_id,
r. R_bucket, r. F_bucket, r. M_bucket, c. top_category, d. platform
FROM users u
LEFT JOIN rfm r USING(user_id)
LEFT JOIN top_content c USING(user_id)
LEFT JOIN devices d USING(user_id);
8) Персоналізація і зв'язок з цінністю
LTV-зважування: профілі ранжуйте за очікуваною цінністю (LTV-квантилі).
Next-best-action: зв'язка профілю з бібліотекою дій (контент, оффери, комунікації).
Reason codes: показуйте «чому ми це пропонуємо» (пояснюваність для саппорту).
9) Приватність, етика і RG
Мінімум PII: токенізація, RLS/CLS, маскування при експортах.
Fairness: перевірка відмінностей ефектів/помилок по країнах/платформах; виключення неприпустимих ознак (наприклад, чутливі атрибути).
RG-принципи: профілі не повинні заохочувати шкідливу поведінку; частотні капи і «тихі години» обов'язкові; шлях апеляції користувачеві.
Прозорість: журнал «signal→profil→resheniye→deystviye→iskhod», версія політик.
10) Моніторинг і дрейф
Якість профілів: стабільність розподілів (PSI/KL) за ключовими фічами; частка «непрофільованих».
Ефект: uplift/ROMI щодо дій всередині профілів; NNT, конверсія ре-активацій, LTV-дельта.
Ризики: скарги/відписки, RG-індикатори, FPR антибот/фрод фільтрів.
SLO: оновлення профілів до 06:00 лок., latency онлайнової класифікації ≤ 300 мс p95.
Рунібуки: сплеск скарг, деградація даних (обрив подій), сплеск RG-ризиків.
11) Архітектура і MLOps
Feature Store: PIT-рецепти, TTL сесійних фіч, онлайн/офлайн паритет.
Пайплайн: batch-оновлення профілів + online scoring (propensity/uplift).
Оркестратор: ідемпотентність, DLQ, rate-limit per user/channel, «тихий годинник».
Документація: паспорти профілів/кампаній, changelog версій, аудит доступу.
Фолбеки: safe-default профіль (popular-safe), відключення ризик-контенту при інцидентах.
12) Анти-патерни
Профілі «заради краси» без вимірного інкременту.
Змішування одиниць і TZ, відсутність PIT → лики і помилкові висновки.
Ігнор RG/етики, частотних капів - скарги/ризики.
«Середнє середніх» замість агрегування числівників/знаменників.
Відсутність гістерезису → «миготіння» дій.
Незрозумілі профілі (немає reason codes) - операційний хаос.
13) Чек-лист запуску профілювання
- Описані цілі (UX/маркетинг/ризик), KPI і guardrails
- Схеми подій, PIT-фічі, антибот/фрод-фільтри активні
- Зібрані RFM/поведінкові/контентні ознаки, ембеддинги
- Сформовані профілі (правила/кластери/propensity/uplift) з паспортами
- Decision tables: гістерезис, кулдауни, пріоритети, конфлікт-матриця
- Моніторинг: ефект (uplift/ROMI), ризики (скарги/RG), дрейф (PSI/KL)
Оркестратор і канали: rate-limit, «тихий годинник», DLQ, аудит
- Документація: версії/власники/рунібуки; фолбек-політика готова
Підсумок
Профілювання гравців - це не ярлики, а керована система: якісні дані і PIT-фічі → осмислені профілі (поведінка/цінність/чутливість) → політики дій з гістерезисом і guardrails → моніторинг ефекту і дрейфу → сувора приватність і RG. Такий контур робить взаємодію релевантною, безпечною і виміряно вигідною.