Профілювання гравців

Профілювання - це системний опис гравця через дані, поведінку, цінність і ризики, щоб приймати керовані рішення: персоналізація контенту і офферів, ре-активація, ліміти і RG, пріоритизація саппорту і маркетингу. Ключ - етика і комплаєнс: мінімум PII, прозорі політики, зрозумілість.

1) Цілі та зона застосування

Продукт/UX: персональні вітрини, стартові сценарії, навчання, обмеження складності.
Маркетинг/CRM: welcome/next-best-offer, крос-селл, частотні капи, «тихий годинник».
Ризик/комплаєнс: RG-індикатори, аномалії, санкції/КУС-степ-ап (без дискримінації).
Монетизація: пріоритизація за очікуваною цінністю (LTV), а не за «сирою» конверсією.
Операції: SLA-черги, VIP-обслуговування, місткість каналів.

2) Дані та ідентичності

Події: візити/сесії, кліки, ігри/ставки, депозити/висновки, відгуки на кампанії.
Контекст: платформа/OS/пристрій, гео/TZ, канал залучення, календар/івенти.
Антибот/фрод: сигнали headless/ASN/proxy, device/IP граф.
Ідентичності: user_id ↔ e-mail/телефон ↔ device_id ↔ платіжні токени; golden record, історії merge/split.
Якість: зберігання в UTC, ідемпотентність подій, версії схем; Point-in-Time для фіч.

3) Ознаки і поведінкові патерни

RFM: recency/частота/грошовість у вікнах 7/30/90.
Сесії: тривалість, глибина, час доби/дня тижня, «серії» (run-length).
Контент: улюблені категорії/провайдери, різноманітність/новизна, «залипання».
Фінанси: депозити/середній чек, ARPPU/ARPU, волатильність витрат.
Сигнали RG: аномальна тривалість/інтервали, часті депозити, нічна активність (як guardrails, не як мета таргетингу).
Реакції: відкриття/клік гармат/листів, відписки, скарги.
Технічні: стабільність девайсу/IP, зміни середовища.

4) Методи профілювання

Правила (rule-based): швидко і зрозуміло (наприклад, «новачок без другого візиту 48ч»).
RFM-гриди: матриці «свіжість × частота × грошовість» (R-бакети, F-бакети, M-бакети).
Кластеризація: k-means/мікси Гауса/DBSCAN за нормалізованими поведінковими метриками.
Ембеддинги: user/item в загальному просторі (MF/двобаштові мережі) + кластеризація «інтересів».
Схильності (propensity): ймовірність події (депозит, повтор, churn) → рішення щодо вартості помилок.
Uplift-підхід: імовірність приросту від інтервенції; зоны Persuadables/Sure/Lost/DnD.

5) Паспорти профілів та пріоритизація

Паспорт профілю (template)

Код: `P_R0-7_F3-9_M50-199_Casino-Mobile`

Визначення: RFM-бакети + домінуючий контент + платформа

Розмір, частота оновлення, середній LTV-квантиль

Ризики та виключення (RG/комплаєнс), власник, версія

Рекомендовані дії: policy (канали, креативи, капи, «тихий годинник»)

Метрики: uplift/ROMI, скарги/відписки, fairness-діагностика

6) Decision tables (ескіз)

Профіль/умова	Контекст	Дія	Кулдаун	Guardrails
`Newcomer & R0-7 & F0-2 & uplift_dep≥0. 05`	онбординг	welcome-оффер S + туторіал	3д	ROMI≥0
`VIP & value_q≥0. 9`	сервіс	персональний менеджер, ліміти L	7д	zhaloby≤Kh
`risk_churn≥0. 8 & no_session≥7д`	утримання	пуш + е-mail ре-активація	5д	NNT≤K
`RG_risk≥τ`	будь-який	пауза/поради RG/ліміти	1д	FPR≤1%

Гістерезис: вхідний поріг вище вихідного, щоб виключити «миготіння».
Конфлікти: пріоритети - безпека (RG/комплаєнс) → економіка → UX.

7) Псевдо-SQL і рецепти

A. RFM-бакети

sql
WITH acts AS (
SELECT user_id,
MAX(ts) AS last_act,
COUNT() FILTER (WHERE ts > NOW()-INTERVAL '30 day') AS f_30d
FROM event_activity GROUP BY 1
),
spend AS (
SELECT user_id,
SUM(amount) FILTER (WHERE ts > NOW()-INTERVAL '90 day') AS m_90d
FROM fact_payments GROUP BY 1
)
SELECT a. user_id,
DATE_PART('day', NOW()-a. last_act) AS recency_days,
a. f_30d, s. m_90d,
CASE WHEN DATE_PART('day', NOW()-a. last_act)<=7 THEN 'R0-7'
WHEN DATE_PART('day', NOW()-a. last_act)<=30 THEN 'R8-30' ELSE 'R31+' END AS R_bucket,
CASE WHEN a. f_30d>=10 THEN 'F10+' WHEN a. f_30d>=3 THEN 'F3-9' ELSE 'F0-2' END AS F_bucket,
CASE WHEN s. m_90d>=200 THEN 'M200+' WHEN s. m_90d>=50 THEN 'M50-199' ELSE 'M0-49' END AS M_bucket
FROM acts a LEFT JOIN spend s USING(user_id);

B. домінуюча категорія контенту

sql
SELECT user_id,
category AS top_category
FROM (
SELECT user_id, category,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY COUNT() DESC) AS rn
FROM event_content
WHERE ts > NOW() - INTERVAL '30 day'
GROUP BY 1,2
) t
WHERE rn=1;

C. збірка профілю

sql
SELECT u. user_id,
r. R_bucket, r. F_bucket, r. M_bucket, c. top_category, d. platform
FROM users u
LEFT JOIN rfm r USING(user_id)
LEFT JOIN top_content c USING(user_id)
LEFT JOIN devices d USING(user_id);

8) Персоналізація і зв'язок з цінністю

LTV-зважування: профілі ранжуйте за очікуваною цінністю (LTV-квантилі).
Next-best-action: зв'язка профілю з бібліотекою дій (контент, оффери, комунікації).
Reason codes: показуйте «чому ми це пропонуємо» (пояснюваність для саппорту).

9) Приватність, етика і RG

Мінімум PII: токенізація, RLS/CLS, маскування при експортах.
Fairness: перевірка відмінностей ефектів/помилок по країнах/платформах; виключення неприпустимих ознак (наприклад, чутливі атрибути).
RG-принципи: профілі не повинні заохочувати шкідливу поведінку; частотні капи і «тихі години» обов'язкові; шлях апеляції користувачеві.
Прозорість: журнал «signal→profil→resheniye→deystviye→iskhod», версія політик.

10) Моніторинг і дрейф

Якість профілів: стабільність розподілів (PSI/KL) за ключовими фічами; частка «непрофільованих».
Ефект: uplift/ROMI щодо дій всередині профілів; NNT, конверсія ре-активацій, LTV-дельта.
Ризики: скарги/відписки, RG-індикатори, FPR антибот/фрод фільтрів.
SLO: оновлення профілів до 06:00 лок., latency онлайнової класифікації ≤ 300 мс p95.
Рунібуки: сплеск скарг, деградація даних (обрив подій), сплеск RG-ризиків.

11) Архітектура і MLOps

Feature Store: PIT-рецепти, TTL сесійних фіч, онлайн/офлайн паритет.
Пайплайн: batch-оновлення профілів + online scoring (propensity/uplift).
Оркестратор: ідемпотентність, DLQ, rate-limit per user/channel, «тихий годинник».
Документація: паспорти профілів/кампаній, changelog версій, аудит доступу.
Фолбеки: safe-default профіль (popular-safe), відключення ризик-контенту при інцидентах.

12) Анти-патерни

Профілі «заради краси» без вимірного інкременту.
Змішування одиниць і TZ, відсутність PIT → лики і помилкові висновки.
Ігнор RG/етики, частотних капів - скарги/ризики.
«Середнє середніх» замість агрегування числівників/знаменників.
Відсутність гістерезису → «миготіння» дій.
Незрозумілі профілі (немає reason codes) - операційний хаос.

13) Чек-лист запуску профілювання

Описані цілі (UX/маркетинг/ризик), KPI і guardrails
Схеми подій, PIT-фічі, антибот/фрод-фільтри активні
Зібрані RFM/поведінкові/контентні ознаки, ембеддинги
Сформовані профілі (правила/кластери/propensity/uplift) з паспортами
Decision tables: гістерезис, кулдауни, пріоритети, конфлікт-матриця
Моніторинг: ефект (uplift/ROMI), ризики (скарги/RG), дрейф (PSI/KL)

Оркестратор і канали: rate-limit, «тихий годинник», DLQ, аудит

Документація: версії/власники/рунібуки; фолбек-політика готова

Підсумок

Профілювання гравців - це не ярлики, а керована система: якісні дані і PIT-фічі → осмислені профілі (поведінка/цінність/чутливість) → політики дій з гістерезисом і guardrails → моніторинг ефекту і дрейфу → сувора приватність і RG. Такий контур робить взаємодію релевантною, безпечною і виміряно вигідною.

Профілювання гравців