Conversion-Analysen

Eine Conversion ist nicht nur „die Anzahl der Dividierenden durch eine Zahl“. Es ist ein kontrolliertes System: klare Definitionen und ein ereignisorientiertes Schema → ein korrekter Nenner und Zeitfenster → Segmentierung und Attribution → eine Wertbeziehung (LTV/ROMI) → Überwachung und Experimente. Unten ist ein Rahmen, der von der Produktaktivierung bis zu Zahlungs- und Marketingtrichtern skaliert.

1) Definitionen und Grundformel

Trichterereignisse: aufeinanderfolgende Schritte (Anzeigen → Klicken → Registrieren → Verifizieren → Einzahlen → Zielaktion).

Schrittkonvertierung: (\text {CR} _ {i\to j} =\frac {\text {eindeutige Entitäten, die} j\text {nach} i} {\text {eindeutige Entitäten, die} i} erreicht haben)

Konvertierung durch: (\text {CR} {0\to k} =\prod {s = 0} ^ {k-1 }\text {CR} _ {s\to s + 1})

Rechnungseinheit: Benutzer/Sitzung/Gerät/Bestellung - explizit erfassen.
Zeitfenster: Begrenzung zwischen den Schritten (z. B. Registrierung → Anzahlung ≤ 7 Tage).

💡 Goldene Regel: Dokumentieren Sie zuerst wer im Nenner, „wann“ und „was als erfolgreich gilt“.

2) Kennzahlenpässe (Vorlage)

METRIC: `CR_REG2DEP_7D_v2`

Definition: Anteil der registrierten Nutzer, die innerhalb von 7 Tagen eine ≥1 Einzahlung getätigt haben.
Einheit: Benutzer (user_id, master_id).
Fenster: 7 × 24 h von 'ts _ registration'.
Ausnahmen: Bots/Betrug/Testkonten/Duplikate.
Standardsegmente: Land, Plattform, Anziehungskanal.
Quellen: 'event _ register', 'event _ deposit'.
Guardrails: fresh≤1ch, coverage≥99%, FPR antifroda≤Kh.
Version/Besitzer/Datenwörterbuch.

3) Ereignisschema und Datenqualität

Kanonisches Schema: 'event _ id', 'user _ id', 'device _ id', 'session _ id', 'ts', 'type', 'payload', 'source', 'version'.
Idempotenz: Dedup durch'(source_id, checksum)'; Korrekturprotokoll.
Bereinigung: Bot-Filter (Speed, Headless, Known-ASN), Betrugsflags, Testkonten.
Identitäten: 'user _ id ↔ device/email/phone' Brücke, Hilfe über split/merge Benutzer.

4) Korrekte Nenner: häufige Fallen

Selection bias: „im Nenner nur gestern aktiv“ → Überschätzung von CR.
Survivorship: Eliminierte, die vor dem Schritt gegangen waren - CR wächst künstlich.
Einheitenmischung: Nenner - Sitzungen, Zähler - Benutzer.
Doppelte Zuschreibung: Ein Erfolg wird mehreren Kanälen zugeschrieben.
Durchschnitt der Mittelwerte: Mittelung der CR über Segmente statt Aggregation der Zähler/Nenner.

5) Pseudo-SQL: Trichter mit Fenstern und Einzigartigkeiten

sql
WITH regs AS (
SELECT user_id, MIN(ts) AS ts_reg
FROM event_register
WHERE ts BETWEEN:from AND:to
GROUP BY user_id
),
deps AS (
SELECT user_id, MIN(ts) AS ts_dep
FROM event_deposit
GROUP BY user_id
),
eligible AS (
SELECT r. user_id, r. ts_reg, d. ts_dep
FROM regs r
LEFT JOIN deps d
ON d. user_id = r. user_id
AND d. ts_dep BETWEEN r. ts_reg AND r. ts_reg + INTERVAL '7 day'
)
SELECT
COUNT()                AS users_reg,
COUNT(ts_dep)              AS users_dep_7d,
COUNT(ts_dep)::decimal / COUNT()    AS cr_reg2dep_7d
FROM eligible;

Drop-off in Schritten

sql
-- Example: view → register → deposit (7d)
WITH base AS (...), -- your source views AS (...), regs AS (...), deps AS (...)
SELECT
COUNT(DISTINCT views. user_id)                           AS step0_view,
COUNT(DISTINCT regs. user_id)                            AS step1_reg,
COUNT(DISTINCT CASE WHEN regs. ts BETWEEN views. ts AND views. ts + INTERVAL '24 h'
THEN regs. user_id END)                     AS view2reg_24h,
COUNT(DISTINCT CASE WHEN deps. ts BETWEEN regs. ts AND regs. ts + INTERVAL '7 day'
THEN deps. user_id END)                     AS reg2dep_7d;

6) Kohorten und Segmentierung

Kohorten: Bilden Sie nach dem Datum des ersten Ereignisses (Registrierung/erster Besuch) → vergleichen Sie die Konversionskurven.
Segmente: Land/Kanal/Plattform/OS/Gerät/Inhalt/Preis/Partner.
Trichter nach Segmenten: CR und Drop-off vor/nach Aktien, Veröffentlichungen, UX-Änderungen.
Fairness: Überprüfen Sie die Fehler-/CR-Unterscheidung nach sensiblen Segmenten (Ethik/Compliance).

7) Zuschreibung: Wer die Conversion „verdient“ hat

Single-Touch: last/first click - einfach, aber verzerrt lange Zyklen.
Positionsbasiert: U-förmiger/linearer/zeitlicher Zerfall.
Data-driven (Shapley/Markov): wertet den Beitrag der Kanäle nach Sequenzen aus.
Dublettenkontrolle: ein Erfolg = ein Kredit (oder Anteil), die Version des Algorithmus ist festgelegt.

8) Mikro-Conversions und Klickqualität

Mikroschritte: Pricing ansehen, in den Warenkorb legen, KYC-Check, Formular 50% ausfüllen.
Traffic-Qualität: Bounce-Rate, Engaged-Sessions, Anteil „gültiger“ Views, Botmuster.
Value Relation: Micro Conversions sind nur dann sinnvoll, wenn sie mit dem Geschäftseffekt korrelieren/kausal zusammenhängen (LTV, GGR, Net).

9) Konversionsbeziehung mit Geld: CAC, LTV, ROMI

CAC: Kosten pro Konversionseinheit (Registrierung/Einzahlung/Kauf).
ROMI: (\frac {\text {Inkrementelle Einnahmen}} {\text {Marketingkosten}} - 1).
LTV-gewichtete Conversion: Priorisieren Sie Segmente/Kanäle nicht nach CR, sondern nach Erwartungswert.
Kausalität: ROMI-Bewertung - durch A/B, DiD, synthetische Kontrolle; Korrelation ist nicht ausreichend.

10) Experimente und Uplift

A/B-Tests: Randomisierung, MDE/Leistung, Berücksichtigung von Saisonalität und Interferenz.
Metriken: Haupt CR + guardrails (Beschwerden, Latenz, FPR Anti-Fraud).
Uplift-Modelle: Ziel ist der Conversion-Gewinn, nicht die Wahrscheinlichkeit eines Ereignisses; bewerten Qini/AUUC, uplift @ k.

11) Zeitliche Aspekte und Fenster

Look-back/Look-forward: Fenster zwischen Belichtung (Click/View) und Conversion/Deposit.
Hysterese: Verschiedene Ein-/Ausgangsschwellen zum Ein-/Ausschalten der Promo-Regressoren, um nicht zu „blinken“.
Kalender: Feiertage, Gehälter, Großveranstaltungen - obligatorische Regressoren/Flaggen.

12) Multi-Devices und Deduplizierung

Geräteübergreifend: Kennungsgraph (Cookie/Gerät/IDFA/E-Mail/Telefon).
One-to-one: Eine Zielaktion zählt einmal pro Benutzer (oder pro Bestellung/Zahlung).
Test/Internal: gefilterte Listen von QS/Operatoren/Bots - außerhalb von Nenner und Zähler.

13) Visualisierungen und Berichte

Step-Bars/Sankey: Drop-off in Schritten.
Kohortenhitzekarten: CR an Tag 1/3/7/14/30.
Bridge-Charts: Beitrag von Faktoren zur CR-Veränderung (UX, Promo, Channel-Mix).
Dash: Fresh-Timer, Ereignisabdeckung, Guardrails, Alerts.

14) Überwachung, SLO und Warnungen

Frische SLO: Update Lag ≤ N Minuten/Stunden.
Hüter der Qualität: Bots/Betrug platzen, Identitäten zerbrechen, Abdeckung fällt.
Alerts: Abweichung der CR von der Saisonprognose, Abbruch der Ereignisse, Anstieg der Fehler/Latenz.

15) Pseudo-SQL: „last non-direct“ -Attribution

sql
WITH touch AS (
SELECT user_id, channel, ts,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY ts DESC) AS rn
FROM session_touchpoints
WHERE is_direct = false
AND ts <= (SELECT first_conversion_ts FROM conversions WHERE conversions. user_id = session_touchpoints. user_id)
),
credit AS (
SELECT user_id, channel FROM touch WHERE rn = 1
)
SELECT channel, COUNT() AS conv, COUNT()::decimal / SUM(COUNT()) OVER() AS share
FROM credit
GROUP BY channel
ORDER BY conv DESC;

16) Anti-Muster

Durchschnittlicher CR nach Ländern/Kanälen ohne Gewichtung.
Mischen von Einheiten (Sitzungen vs Benutzer) und Zeitzonen.
Ignorieren der Definitionen von Formeln und Versionen (die Metrik „schwimmt“).
Fenster „wie es geht“ (nicht fixiert) → nicht vergleichbare CRs.
Das Fehlen von Bot/Betrug-Filtern → übertriebene Metriken.
Die Zuschreibung „last click“ als alleinige Wahrheit für alle Entscheidungen.

17) Checkliste vor Veröffentlichung des Konversionsberichts

Passport Metrics: Definition, Einheit, Fenster, Ausnahmen, Quellen, Version
Veranstaltungsschema kanonisiert, Dedup/Idempotenz enthalten
Bots/Fraud/QA-Konten sind ausgeschlossen; Identitäten werden zusammengeführt
Fenster und Nenner sind dokumentiert; Zeitzonen vereinbart
Segmente/Kohorten überprüft; Invarianten (DAU ≤ MAU, Beträge nach Tagen = Monat) eingehalten
Attribution ausgewählt und beschrieben; Doppelkredit ausgeschlossen
Value Relation: CAC/LTV/ROMI hinzugefügt, kausale Bewertung geplant
Dashboard: Frische, Abdeckung, guardrails; Alerts konfiguriert

18) Mini-Glossar

CR (Conversion Rate) - Der Anteil, der die Zielaktion abgeschlossen hat.
Drop-off: Der Anteil, der zwischen den Schritten „fiel“.
Attribution: Methode zur Verteilung der Verdienste für die Konvertierung durch Berührung.
Cohort: Gruppe nach Datum der ersten Veranstaltung.
ROMI: Return on Marketing Investment (inkrementell).
Uplift: Konversionssteigerung durch Intervention.
Guardrails: Risikobegrenzer (Beschwerden, FPR, Latenz).

Summe

Zuverlässige Conversion Analytics stützt sich auf drei Säulen: korrekte Definitionen (Nenner/Fenster/Einheiten), Datendisziplin (Idempotenz, Dedup, Anti-Bot), Value-Relation (LTV/CAC/ROMI und Kausalität). Indem Sie Trichter, Kohorten, Attribution und Überwachung nach dem beschriebenen Rahmen erstellen, erhalten Sie Metriken, anhand derer Sie das Produkt und das Marketing tatsächlich verwalten können, anstatt nur Diagramme zu beobachten.

Conversion-Analysen