Conversion-Analysen
Conversion-Analysen
Eine Conversion ist nicht nur „die Anzahl der Dividierenden durch eine Zahl“. Es ist ein kontrolliertes System: klare Definitionen und ein ereignisorientiertes Schema → ein korrekter Nenner und Zeitfenster → Segmentierung und Attribution → eine Wertbeziehung (LTV/ROMI) → Überwachung und Experimente. Unten ist ein Rahmen, der von der Produktaktivierung bis zu Zahlungs- und Marketingtrichtern skaliert.
1) Definitionen und Grundformel
Trichterereignisse: aufeinanderfolgende Schritte (Anzeigen → Klicken → Registrieren → Verifizieren → Einzahlen → Zielaktion).
Schrittkonvertierung: (\text {CR} _ {i\to j} =\frac {\text {eindeutige Entitäten, die} j\text {nach} i} {\text {eindeutige Entitäten, die} i} erreicht haben)
Konvertierung durch: (\text {CR} {0\to k} =\prod {s = 0} ^ {k-1 }\text {CR} _ {s\to s + 1})
Rechnungseinheit: Benutzer/Sitzung/Gerät/Bestellung - explizit erfassen.
Zeitfenster: Begrenzung zwischen den Schritten (z. B. Registrierung → Anzahlung ≤ 7 Tage).
2) Kennzahlenpässe (Vorlage)
METRIC: `CR_REG2DEP_7D_v2`
Definition: Anteil der registrierten Nutzer, die innerhalb von 7 Tagen eine ≥1 Einzahlung getätigt haben.
Einheit: Benutzer (user_id, master_id).
Fenster: 7 × 24 h von 'ts _ registration'.
Ausnahmen: Bots/Betrug/Testkonten/Duplikate.
Standardsegmente: Land, Plattform, Anziehungskanal.
Quellen: 'event _ register', 'event _ deposit'.
Guardrails: fresh≤1ch, coverage≥99%, FPR antifroda≤Kh.
Version/Besitzer/Datenwörterbuch.
3) Ereignisschema und Datenqualität
Kanonisches Schema: 'event _ id', 'user _ id', 'device _ id', 'session _ id', 'ts', 'type', 'payload', 'source', 'version'.
Idempotenz: Dedup durch'(source_id, checksum)'; Korrekturprotokoll.
Bereinigung: Bot-Filter (Speed, Headless, Known-ASN), Betrugsflags, Testkonten.
Identitäten: 'user _ id ↔ device/email/phone' Brücke, Hilfe über split/merge Benutzer.
4) Korrekte Nenner: häufige Fallen
Selection bias: „im Nenner nur gestern aktiv“ → Überschätzung von CR.
Survivorship: Eliminierte, die vor dem Schritt gegangen waren - CR wächst künstlich.
Einheitenmischung: Nenner - Sitzungen, Zähler - Benutzer.
Doppelte Zuschreibung: Ein Erfolg wird mehreren Kanälen zugeschrieben.
Durchschnitt der Mittelwerte: Mittelung der CR über Segmente statt Aggregation der Zähler/Nenner.
5) Pseudo-SQL: Trichter mit Fenstern und Einzigartigkeiten
sql
WITH regs AS (
SELECT user_id, MIN(ts) AS ts_reg
FROM event_register
WHERE ts BETWEEN:from AND:to
GROUP BY user_id
),
deps AS (
SELECT user_id, MIN(ts) AS ts_dep
FROM event_deposit
GROUP BY user_id
),
eligible AS (
SELECT r.user_id, r.ts_reg, d.ts_dep
FROM regs r
LEFT JOIN deps d
ON d.user_id = r.user_id
AND d.ts_dep BETWEEN r.ts_reg AND r.ts_reg + INTERVAL '7 day'
)
SELECT
COUNT() AS users_reg,
COUNT(ts_dep) AS users_dep_7d,
COUNT(ts_dep)::decimal / COUNT() AS cr_reg2dep_7d
FROM eligible;
Drop-off in Schritten
sql
-- Пример: просмотр → регистрация → депозит (7d)
WITH base AS (...), -- ваш источник views AS (...), regs AS (...), deps AS (...)
SELECT
COUNT(DISTINCT views.user_id) AS step0_view,
COUNT(DISTINCT regs.user_id) AS step1_reg,
COUNT(DISTINCT CASE WHEN regs.ts BETWEEN views.ts AND views.ts + INTERVAL '24 h'
THEN regs.user_id END) AS view2reg_24h,
COUNT(DISTINCT CASE WHEN deps.ts BETWEEN regs.ts AND regs.ts + INTERVAL '7 day'
THEN deps.user_id END) AS reg2dep_7d;
6) Kohorten und Segmentierung
Kohorten: Bilden Sie nach dem Datum des ersten Ereignisses (Registrierung/erster Besuch) → vergleichen Sie die Konversionskurven.
Segmente: Land/Kanal/Plattform/OS/Gerät/Inhalt/Preis/Partner.
Trichter nach Segmenten: CR und Drop-off vor/nach Aktien, Veröffentlichungen, UX-Änderungen.
Fairness: Überprüfen Sie die Fehler-/CR-Unterscheidung nach sensiblen Segmenten (Ethik/Compliance).
7) Zuschreibung: Wer die Conversion „verdient“ hat
Single-Touch: last/first click - einfach, aber verzerrt lange Zyklen.
Positionsbasiert: U-förmiger/linearer/zeitlicher Zerfall.
Data-driven (Shapley/Markov): wertet den Beitrag der Kanäle nach Sequenzen aus.
Dublettenkontrolle: ein Erfolg = ein Kredit (oder Anteil), die Version des Algorithmus ist festgelegt.
8) Mikro-Conversions und Klickqualität
Mikroschritte: Pricing ansehen, in den Warenkorb legen, KYC-Check, Formular 50% ausfüllen.
Traffic-Qualität: Bounce-Rate, Engaged-Sessions, Anteil „gültiger“ Views, Botmuster.
Value Relation: Micro Conversions sind nur dann sinnvoll, wenn sie mit dem Geschäftseffekt korrelieren/kausal zusammenhängen (LTV, GGR, Net).
9) Konversionsbeziehung mit Geld: CAC, LTV, ROMI
CAC: Kosten pro Konversionseinheit (Registrierung/Einzahlung/Kauf).
ROMI: (\frac {\text {Inkrementelle Einnahmen}} {\text {Marketingkosten}} - 1).
LTV-gewichtete Conversion: Priorisieren Sie Segmente/Kanäle nicht nach CR, sondern nach Erwartungswert.
Kausalität: ROMI-Bewertung - durch A/B, DiD, synthetische Kontrolle; Korrelation ist nicht ausreichend.
10) Experimente und Uplift
A/B-Tests: Randomisierung, MDE/Leistung, Berücksichtigung von Saisonalität und Interferenz.
Metriken: Haupt CR + guardrails (Beschwerden, Latenz, FPR Anti-Fraud).
Uplift-Modelle: Ziel ist der Conversion-Gewinn, nicht die Wahrscheinlichkeit eines Ereignisses; bewerten Qini/AUUC, uplift @ k.
11) Zeitliche Aspekte und Fenster
Look-back/Look-forward: Fenster zwischen Belichtung (Click/View) und Conversion/Deposit.
Hysterese: Verschiedene Ein-/Ausgangsschwellen zum Ein-/Ausschalten der Promo-Regressoren, um nicht zu „blinken“.
Kalender: Feiertage, Gehälter, Großveranstaltungen - obligatorische Regressoren/Flaggen.
12) Multi-Devices und Deduplizierung
Geräteübergreifend: Kennungsgraph (Cookie/Gerät/IDFA/E-Mail/Telefon).
One-to-one: Eine Zielaktion zählt einmal pro Benutzer (oder pro Bestellung/Zahlung).
Test/Internal: gefilterte Listen von QS/Operatoren/Bots - außerhalb von Nenner und Zähler.
13) Visualisierungen und Berichte
Step-Bars/Sankey: Drop-off in Schritten.
Kohortenhitzekarten: CR an Tag 1/3/7/14/30.
Bridge-Charts: Beitrag von Faktoren zur CR-Veränderung (UX, Promo, Channel-Mix).
Dash: Fresh-Timer, Ereignisabdeckung, Guardrails, Alerts.
14) Überwachung, SLO und Warnungen
Frische SLO: Update Lag ≤ N Minuten/Stunden.
Hüter der Qualität: Bots/Betrug platzen, Identitäten zerbrechen, Abdeckung fällt.
Alerts: Abweichung der CR von der Saisonprognose, Abbruch der Ereignisse, Anstieg der Fehler/Latenz.
15) Pseudo-SQL: „last non-direct“ -Attribution
sql
WITH touch AS (
SELECT user_id, channel, ts,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY ts DESC) AS rn
FROM session_touchpoints
WHERE is_direct = false
AND ts <= (SELECT first_conversion_ts FROM conversions WHERE conversions.user_id = session_touchpoints.user_id)
),
credit AS (
SELECT user_id, channel FROM touch WHERE rn = 1
)
SELECT channel, COUNT() AS conv, COUNT()::decimal / SUM(COUNT()) OVER() AS share
FROM credit
GROUP BY channel
ORDER BY conv DESC;
16) Anti-Muster
Durchschnittlicher CR nach Ländern/Kanälen ohne Gewichtung.
Mischen von Einheiten (Sitzungen vs Benutzer) und Zeitzonen.
Ignorieren der Definitionen von Formeln und Versionen (die Metrik „schwimmt“).
Fenster „wie es geht“ (nicht fixiert) → nicht vergleichbare CRs.
Das Fehlen von Bot/Betrug-Filtern → übertriebene Metriken.
Die Zuschreibung „last click“ als alleinige Wahrheit für alle Entscheidungen.
17) Checkliste vor Veröffentlichung des Konversionsberichts
- Passport Metrics: Definition, Einheit, Fenster, Ausnahmen, Quellen, Version
- Veranstaltungsschema kanonisiert, Dedup/Idempotenz enthalten
- Bots/Fraud/QA-Konten sind ausgeschlossen; Identitäten werden zusammengeführt
- Fenster und Nenner sind dokumentiert; Zeitzonen vereinbart
- Segmente/Kohorten überprüft; Invarianten (DAU ≤ MAU, Beträge nach Tagen = Monat) eingehalten
- Attribution ausgewählt und beschrieben; Doppelkredit ausgeschlossen
- Value Relation: CAC/LTV/ROMI hinzugefügt, kausale Bewertung geplant
- Dashboard: Frische, Abdeckung, guardrails; Alerts konfiguriert
18) Mini-Glossar
CR (Conversion Rate) - Der Anteil, der die Zielaktion abgeschlossen hat.
Drop-off: Der Anteil, der zwischen den Schritten „fiel“.
Attribution: Methode zur Verteilung der Verdienste für die Konvertierung durch Berührung.
Cohort: Gruppe nach Datum der ersten Veranstaltung.
ROMI: Return on Marketing Investment (inkrementell).
Uplift: Konversionssteigerung durch Intervention.
Guardrails: Risikobegrenzer (Beschwerden, FPR, Latenz).
Ergebnis
Zuverlässige Conversion Analytics stützt sich auf drei Säulen: korrekte Definitionen (Nenner/Fenster/Einheiten), Datendisziplin (Idempotenz, Dedup, Anti-Bot), Value-Relation (LTV/CAC/ROMI und Kausalität). Indem Sie Trichter, Kohorten, Attribution und Überwachung nach dem beschriebenen Rahmen erstellen, erhalten Sie Metriken, anhand derer Sie das Produkt und das Marketing tatsächlich verwalten können, anstatt nur Diagramme zu beobachten.