GH GambleHub

Аналитика конверсий

Аналитика конверсий

Конверсия — это не просто «число делящихся на число». Это управляемая система: четкие определения и событийная схема → корректный знаменатель и окно времени → сегментация и атрибуция → связь с ценностью (LTV/ROMI) → мониторинг и эксперименты. Ниже — каркас, который масштабируется от продуктовой активации до платежных и маркетинговых воронок.

1) Определения и базовая формула

События воронки: последовательные шаги (просмотр → клик → регистрация → верификация → депозит → целевое действие).

Конверсия шага: (\text{CR}_{i\to j} = \frac{\text{уникальные сущности, завершившие }j\text{ после }i}{\text{уникальные сущности, достигшие }i})

Конверсия сквозная: (\text{CR}{0\to k} = \prod{s=0}^{k-1} \text{CR}_{s\to s+1})

Единица учета: пользователь / сессия / устройство / заказ — фиксируйте явно.
Окно времени: ограничение между шагами (напр., регистрация → депозит ≤ 7 дней).

💡 Золотое правило: сначала задокументируйте кто в знаменателе, «когда» и «что считается успешным».

2) Паспорта метрик (template)

METRIC: `CR_REG2DEP_7D_v2`

Определение: доля зарегистрированных пользователей, совершивших ≥1 депозит в 7 дней.
Единица: пользователь (user_id, master_id).
Окно: 7×24 ч от `ts_registration`.
Исключения: боты/фрод/тестовые аккаунты/дубликаты.
Сегменты по умолчанию: страна, платформа, канал привлечения.
Источники: `event_register`, `event_deposit`.
Guardrails: fresh≤1ч, coverage≥99%, FPR антифрода≤X.
Версия/владельцы/датасловарь.

3) Схема событий и качество данных

Каноническая схема: `event_id`, `user_id`, `device_id`, `session_id`, `ts`, `type`, `payload`, `source`, `version`.
Идемпотентность: дедуп по `(source_id, checksum)`; журнал коррекций.
Очистка: фильтры ботов (скорость, headless, known-ASN), фрод-флаги, тестовые аккаунты.
Идентичности: мост `user_id ↔ device/email/phone`, справка о сплит/merge пользователей.

4) Корректные знаменатели: частые ловушки

Selection bias: «в знаменателе только активные вчера» → завышение CR.
Survivorship: исключили ушедших до шага — CR искусственно растет.
Смешение единиц: знаменатель — сессии, числитель — пользователи.
Двойная атрибуция: один успех приписан нескольким каналам.
Среднее средних: усреднение CR по сегментам вместо агрегирования числителей/знаменателей.

5) Псевдо-SQL: воронка с окнами и уникальностями

sql
WITH regs AS (
SELECT user_id, MIN(ts) AS ts_reg
FROM event_register
WHERE ts BETWEEN:from AND:to
GROUP BY user_id
),
deps AS (
SELECT user_id, MIN(ts) AS ts_dep
FROM event_deposit
GROUP BY user_id
),
eligible AS (
SELECT r.user_id, r.ts_reg, d.ts_dep
FROM regs r
LEFT JOIN deps d
ON d.user_id = r.user_id
AND d.ts_dep BETWEEN r.ts_reg AND r.ts_reg + INTERVAL '7 day'
)
SELECT
COUNT()                AS users_reg,
COUNT(ts_dep)              AS users_dep_7d,
COUNT(ts_dep)::decimal / COUNT()    AS cr_reg2dep_7d
FROM eligible;

Drop-off по шагам

sql
-- Пример: просмотр → регистрация → депозит (7d)
WITH base AS (...), -- ваш источник views AS (...), regs AS (...), deps AS (...)
SELECT
COUNT(DISTINCT views.user_id)                           AS step0_view,
COUNT(DISTINCT regs.user_id)                            AS step1_reg,
COUNT(DISTINCT CASE WHEN regs.ts BETWEEN views.ts AND views.ts + INTERVAL '24 h'
THEN regs.user_id END)                     AS view2reg_24h,
COUNT(DISTINCT CASE WHEN deps.ts BETWEEN regs.ts AND regs.ts + INTERVAL '7 day'
THEN deps.user_id END)                     AS reg2dep_7d;

6) Когорты и сегментация

Когорты: формируйте по дате первого события (регистрация/первый визит) → сравнивайте кривые конверсии.
Сегменты: страна/канал/платформа/OS/устройство/контент/цена/партнер.
Воронка по сегментам: CR и drop-off до/после акций, релизов, изменений UX.
Справедливость: проверяйте различие ошибок/CR по чувствительным сегментам (этика/комплаенс).

7) Атрибуция: кто «заслужил» конверсию

Single-touch: last/first click — просто, но искажает долгие циклы.
Position-based: U-образная/линейная/временной распад.
Data-driven (Shapley/Markov): оценивает вклад каналов по последовательностям.
Контроль дубликатов: один успех = один кредит (или долевой), версия алгоритма зафиксирована.

8) Микро-конверсии и качества кликов

Микро-шаги: просмотр прайсинга, добавление в корзину, проверка KYC, заполнение формы 50%.
Качество трафика: bounce-rate, engaged-sessions, доля «валидных» просмотров, ботовые паттерны.
Связь с ценностью: микро-конверсии полезны, только если коррелируют/причинно связаны с бизнес-эффектом (LTV, GGR, Net).

9) Связь конверсии с деньгами: CAC, LTV, ROMI

CAC: стоимость привлечения за единицу конверсии (регистрации/депозита/покупки).
ROMI: (\frac{\text{Инкрементальная выручка}}{\text{Маркетинговые затраты}} - 1).
LTV-взвешенная конверсия: приоритизируйте сегменты/каналы не по CR, а по ожидаемой ценности.
Причинность: оценка ROMI — через A/B, DiD, синтетический контроль; корреляции недостаточно.

10) Эксперименты и uplift

A/B-тесты: рандомизация, MDE/power, учет сезонности и интерференции.
Метрики: основной CR + guardrails (жалобы, latency, FPR антифрода).
Uplift-модели: таргетируют прирост конверсии, а не вероятность события; оценивайте Qini/AUUC, uplift@k.

11) Временные аспекты и окна

Look-back / Look-forward: окно между экспозицией (клик/просмотр) и конверсией/депозитом.
Гистерезис: разные пороги вход/выход для включения/выключения промо-регрессоров, чтобы не «мигать».
Календарь: праздники, зарплатные, крупные ивенты — обязательные регрессоры/флаги.

12) Мульти-устройства и дедупликация

Кросс-девайс: граф идентификаторов (cookie/device/IDFA/email/телефон).
One-to-one: одно целевое действие засчитываем один раз per пользователь (или per заказ/платеж).
Тест/интернал: фильтрованные списки QA/операторов/ботов — вне знаменателя и числителя.

13) Визуализации и отчеты

Step-bars / Sankey: drop-off по шагам.
Когортные теплокарты: CR на 1/3/7/14/30 день.
Bridge-графики: вклад факторов в изменение CR (UX, промо, канал-микс).
Dash: fresh-таймер, coverage событий, guardrails, алерты.

14) Мониторинг, SLO и алерты

SLO свежести: лаг обновления ≤ N минут/часов.
Стражи качества: всплеск ботов/фрода, разлад идентичностей, падение coverage.
Алерты: отклонение CR от сезонного прогноза, обрыв событий, рост ошибок/latency.

15) Псевдо-SQL: атрибуция «last non-direct»

sql
WITH touch AS (
SELECT user_id, channel, ts,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY ts DESC) AS rn
FROM session_touchpoints
WHERE is_direct = false
AND ts <= (SELECT first_conversion_ts FROM conversions WHERE conversions.user_id = session_touchpoints.user_id)
),
credit AS (
SELECT user_id, channel FROM touch WHERE rn = 1
)
SELECT channel, COUNT() AS conv, COUNT()::decimal / SUM(COUNT()) OVER() AS share
FROM credit
GROUP BY channel
ORDER BY conv DESC;

16) Анти-паттерны

Среднее CR по странам/каналам без весов.
Смешение единиц (сессии vs пользователи) и временных зон.
Игнор дефиниций формул и версий (метрика «плывет»).
Окна «как получится» (не фиксированы) → не сопоставимые CR.
Отсутствие фильтров ботов/фрода → завышенные метрики.
Атрибуция «last click» как единственная истина для всех решений.

17) Чек-лист перед публикацией конверсионного отчета

  • Паспорт метрики: определение, единица, окно, исключения, источники, версия
  • Схема событий канонизирована, дедуп/идемпотентность включены
  • Боты/фрод/QA-аккаунты исключены; идентичности сведены
  • Окна и знаменатели задокументированы; временные зоны согласованы
  • Сегменты/когорты проверены; инварианты (DAU ≤ MAU, суммы по дням = месяцу) соблюдены
  • Атрибуция выбрана и описана; двойной кредит исключен
  • Связь с ценностью: CAC/LTV/ROMI добавлены, причинная оценка спланирована
  • Дашборд: свежесть, coverage, guardrails; алерты настроены

18) Мини-глоссарий

CR (Conversion Rate): доля, завершившая целевое действие.
Drop-off: доля, «выпавшая» между шагами.
Attribution: метод распределения заслуги за конверсию по касаниям.
Cohort: группа по дате первого события.
ROMI: возврат маркетинговых инвестиций (инкрементально).
Uplift: прирост конверсии от интервенции.
Guardrails: ограничители рисков (жалобы, FPR, latency).


Итог

Надежная аналитика конверсий опирается на три кита: корректные определения (знаменатели/окна/единицы), дисциплина данных (идемпотентность, дедуп, антибот), связь с ценностью (LTV/CAC/ROMI и причинность). Построив воронки, когорты, атрибуцию и мониторинг по описанному каркасу, вы получаете метрики, по которым можно реально управлять продуктом и маркетингом, а не только наблюдать графики.

Contact

Свяжитесь с нами

Обращайтесь по любым вопросам или за поддержкой.Мы всегда готовы помочь!

Начать интеграцию

Email — обязателен. Telegram или WhatsApp — по желанию.

Ваше имя необязательно
Email необязательно
Тема необязательно
Сообщение необязательно
Telegram необязательно
@
Если укажете Telegram — мы ответим и там, в дополнение к Email.
WhatsApp необязательно
Формат: +код страны и номер (например, +380XXXXXXXXX).

Нажимая кнопку, вы соглашаетесь на обработку данных.