Analityka konwersji
Analityka konwersji
Konwersja to nie tylko "liczba podzielna przez liczbę. "To jest kontrolowany system: jasne definicje i schemat zdarzeń → prawidłowy mianownik i okno czasu → segmentacja i przypisanie → połączenie z wartością (LTV/ROMI) → monitorowanie i eksperymenty. Poniżej znajduje się ramy, które kształtują się od aktywacji produktu do płatności i marketingowych lejków.
1) Definicje i wzór podstawowy
Zdarzenia lejkowe: kroki sekwencyjne (oglądanie → kliknięcia → rejestracja → weryfikacja → depozyt → działanie docelowe).
Konwersja kroku: (\tekst {CR} _ {i\do j} =\frac {\text {unikalne podmioty, które ukończyły} j\tekst {after} i} {\tekst {unikalne podmioty, które osiągnęły} i})
Koniec-koniec konwersji: (\tekst {CR} {0\do k} =\prod {s = 0} ^ {k-1 }\tekst {CR} _ {s\do s + 1})
Jednostka księgowa: użytkownik/sesja/urządzenie/zamówienie - naprawić wprost.
Okno czasu: limit między krokami (np. check-in → depozyt ≤ 7 dni).
2) Arkusze danych (szablon)
METRIC: „CR _ REG2DEP _ 7D _ v2”
Definicja: odsetek zarejestrowanych użytkowników, którzy dokonali wpłaty ≥ 1 przez 7 dni.
Jednostka: użytkownik (user_id, master_id).
Okno: 7 × 24 godziny od 'ts _ registration'.
Wyjątki: boty/oszustwa/konta testowe/duplikaty.
Domyślne segmenty: kraj, platforma, kanał przyciągania.
Źródła: 'event _ register', 'event _ deposit'.
Szyny ochronne: świeże ≤ 1ch, zasięg ≥ 99%, antyfroda FPR ≤ Kh.
Wersja/właściciele/słownik daty.
3) Schemat zdarzeń i jakość danych
Schemat kanoniczny: 'event _ id',' user _ id', 'device _ id',' session _ id', 'ts',' type ',' payload ',' source ',' version '.
Idempotencja: dedup przez '(source_id, checksum)'; dziennik korekcji.
Czyszczenie: filtry bot (prędkość, bezgłowa, znany ASN), flagi oszustwa, konta testowe.
Tożsamości: most 'user _ id na urządzeniu/email/phone', pomoc w podziale/połączeniu użytkowników.
4) Prawidłowe mianowniki: częste pułapki
Tendencja selekcyjna: „aktywny tylko wczoraj w mianowniku” → przecena CR.
Przetrwanie: ci, którzy odeszli przed krokiem, zostali wykluczeni - CR sztucznie rośnie.
Mieszanie jednostek: mianownik - sesje, licznik - użytkownicy.
Podwójne przypisanie: jeden sukces przypisany wielu kanałom.
Średnia średnich: uśrednianie CR w poszczególnych segmentach zamiast agregowania liczników/mianowników.
5) Pseudo-SQL: lejek z oknami i wyjątkowością
sql
WITH regs AS (
SELECT user_id, MIN(ts) AS ts_reg
FROM event_register
WHERE ts BETWEEN:from AND:to
GROUP BY user_id
),
deps AS (
SELECT user_id, MIN(ts) AS ts_dep
FROM event_deposit
GROUP BY user_id
),
eligible AS (
SELECT r.user_id, r.ts_reg, d.ts_dep
FROM regs r
LEFT JOIN deps d
ON d.user_id = r.user_id
AND d.ts_dep BETWEEN r.ts_reg AND r.ts_reg + INTERVAL '7 day'
)
SELECT
COUNT() AS users_reg,
COUNT(ts_dep) AS users_dep_7d,
COUNT(ts_dep)::decimal / COUNT() AS cr_reg2dep_7d
FROM eligible;
Kropla w krokach
sql
-- Пример: просмотр → регистрация → депозит (7d)
WITH base AS (...), -- ваш источник views AS (...), regs AS (...), deps AS (...)
SELECT
COUNT(DISTINCT views.user_id) AS step0_view,
COUNT(DISTINCT regs.user_id) AS step1_reg,
COUNT(DISTINCT CASE WHEN regs.ts BETWEEN views.ts AND views.ts + INTERVAL '24 h'
THEN regs.user_id END) AS view2reg_24h,
COUNT(DISTINCT CASE WHEN deps.ts BETWEEN regs.ts AND regs.ts + INTERVAL '7 day'
THEN deps.user_id END) AS reg2dep_7d;
6) Kohorty i segmentacja
Kohorty: formularz według daty pierwszego wydarzenia (rejestracja/pierwsza wizyta) → porównaj krzywe konwersji.
Segmenty: Kraj/Kanał/Platforma/OS/Urządzenie/Zawartość/Cena/Partner.
Lejek według segmentu: CR i drop-off przed/po zapasach, wydania, zmiany UX.
Uczciwość: Sprawdź różnice w zakresie błędów/CR w segmentach wrażliwych (etyka/zgodność).
7) Przypisanie: kto „zasłużył” na nawrócenie
Pojedynczy dotyk: ostatnie/pierwsze kliknięcie - proste, ale zniekształca długie cykle.
Położenie: U-kształt/liniowy/czas próchnicy.
Napędzane danymi (Shapley/Markov): ocenia wkład kanału według sekwencji.
Duplikat control: jeden sukces = jeden kredyt (lub wspólny), wersja algorytmu naprawiona.
8) Mikro konwersje i kliknij jakość
Mikro kroki: przeglądanie cen, dodawanie do koszyka, sprawdzanie KYC, wypełnianie formularza 50%.
Jakość ruchu: bounce-rate, engaged-sessions, share of „valid” views, bot patterns.
Powiązanie z wartością: mikro-konwersje są przydatne tylko wtedy, gdy są skorelowane/związane ze skutkiem biznesowym (LTV, GGR, Net).
9) Konwersja na Money Link: CAC, LTV, ROMI
CAC: koszt przyciągania na jednostkę konwersji (rejestracja/depozyt/zakup).
ROMI: (\frac {\text {Przychody przyrostowe}} {\tekst {Koszty marketingowe}} - 1).
Konwersja ważona LTV: nadać priorytet segmentom/kanałom nie według CR, ale według wartości oczekiwanej.
Przyczynowość: wynik ROMI - za pośrednictwem A/B, DiD, kontrola syntetyczna; korelacja jest niewystarczająca.
10) Eksperymenty i podnoszenie
Testy A/B: randomizacja, MDE/moc, sezonowość i rachunkowość zakłóceń.
Metryki: podstawowe CR + barierki (skargi, opóźnienia, zapobieganie oszustwom FPR).
Modele podwyższenia: docelowe zyski konwersji, a nie prawdopodobieństwa zdarzeń; ocenić Qini/AUUC, uplift @ k.
11) Aspekty czasu i okna
Look-back/Look-forward: okno między ekspozycją (kliknij/zobacz) a konwersją/depozytem.
Histereza: różne progi wejścia/wyjścia, aby włączyć/wyłączyć regresory promo, aby nie „mrugać”.
Kalendarz: wakacje, wynagrodzenie, duże imprezy - obowiązkowe regresory/flagi.
12) Wielorakie urządzenia i deduplikowanie
Urządzenie krzyżowe: wykres identyfikatora (cookie/urządzenie/IDFA/e-mail/telefon).
Jeden do jednego: liczymy jedną akcję docelową raz na użytkownika (lub na zamówienie/płatność).
Test/online: filtrowane listy QA/operatorów/botów - poza mianownikiem i licznikiem.
13) Wizualizacje i raporty
Kroki/Sankey: podrzucić w krokach.
Mapy ciepła kohorty: CR w dniu 1/3/7/14/30.
Wykresy mostowe: wkład czynników w zmianę CR (UX, promo, mix kanału).
Deska rozdzielcza: świeży zegar, wydarzenia z zasięgiem, szyny ochronne, wpisy.
14) Monitorowanie, SLO i wpisy
Świeżość SLO: aktualizacja lag ≤ N minut/godziny.
Strażnicy jakości: wybuch botów/oszustw, niezgodność tożsamości, spadek zasięgu.
Wpisy: odchylenie CR od prognozy sezonowej, pęknięcie zdarzenia, wzrost błędu/opóźnienie.
15) Pseudo-SQL: ostatnie przypisanie niepochodzące bezpośrednio
sql
WITH touch AS (
SELECT user_id, channel, ts,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY ts DESC) AS rn
FROM session_touchpoints
WHERE is_direct = false
AND ts <= (SELECT first_conversion_ts FROM conversions WHERE conversions.user_id = session_touchpoints.user_id)
),
credit AS (
SELECT user_id, channel FROM touch WHERE rn = 1
)
SELECT channel, COUNT() AS conv, COUNT()::decimal / SUM(COUNT()) OVER() AS share
FROM credit
GROUP BY channel
ORDER BY conv DESC;
16) Anty-wzory
Średnia wartość CR według kraju/kanału bez ciężarów.
Wymieszać jednostki (sesje kontra użytkownicy) i strefy czasowe.
Ignorowanie formuły i definicji wersji (metryczne „floaty”).
Windows „jak się okazuje” (nie naprawiono) → nie porównywalny CR.
Brak filtrów bot/oszustwa → wysokie metryki.
Ostatnie kliknięcie przypisanie jako jedyna prawda dla wszystkich decyzji.
17) Lista kontrolna przed opublikowaniem raportu o konwersji
- Paszport metryczny: definicja, jednostka, okno, wyjątki, źródła, wersja
- Kanonizowany wzór zdarzeń, dedup/idempotence included
- Wykluczone rachunki botów/oszustw/QA; tożsamości mieszane
- Okna i mianowniki udokumentowane; uzgodnione strefy czasowe
- Badane segmenty/kohorty; niezmienne (DAU ≤ MAU, dzienne kwoty = miesiąc) spełnione
- Przypisanie wybrane i opisane; podwójny kredyt wykluczony
- Stosunek wartości: dodano CAC/LTV/ROMI, zaplanowano ocenę przyczynową
- Deska rozdzielcza: świeżość, pokrycie, szyny ochronne; ustawione są wpisy
18) Mini glosariusz
CR (kurs przeliczeniowy): Odsetek, który zakończył działanie docelowe.
Drop-off: udział „spadł” między etapami.
Przypisanie: metoda przypisywania zasług do konwersji przez dotyk.
Kohorta: grupa według daty pierwszego wydarzenia.
ROMI: zwrot z inwestycji marketingowych (przyrostowych).
Podwyższenie: konwersja zysku z interwencji.
Bariery ochronne: ograniczniki ryzyka (skargi, FPR, opóźnienia).
Wynik
Wiarygodna analiza konwersji opiera się na trzech wielorybach: poprawnych definicjach (mianowniki/okna/jednostki), dyscyplinie danych (idempotencja, dedup, antiboot), skojarzeniu z wartością (LTV/CAC/ROMI i przyczynowość). Budując lejki, kohorty, przypisywanie i monitorowanie na opisanych ramach, otrzymujesz metryki, dzięki którym naprawdę możesz zarządzać produktem i marketingiem, a nie tylko obserwować wykresy.