Analyse des conversions
Analyse des conversions
La conversion n'est pas simplement un « nombre divisé par un nombre ». Il s'agit d'un système contrôlé : définitions claires et schéma d'événement → dénominateur correct et fenêtre temporelle → segmentation et attribution → rapport à la valeur (LTV/ROMI) → surveillance et expérimentation. Ci-dessous, un cadre qui s'étend de l'activation des produits aux corbeaux de paiement et de marketing.
1) Définitions et formule de base
Événements d'entonnoir : étapes successives (affichage → click → inscription → vérification → dépôt → action ciblée).
Conversion de l'étape : (\text {CR} _ {i\to j} =\frac {\text {entités uniques ayant terminé} j\text {après} i} {\text {entités uniques ayant atteint} i})
Conversion de bout en bout : (\text {CR} {0\to k} =\prod {s = 0} ^ {k-1 }\text {CR} _ {s\to s + 1})
Unité de compte : utilisateur/session/appareil/commande - enregistrer explicitement.
Fenêtre temporelle : limite entre les étapes (par exemple, inscription → dépôt ≤ 7 jours).
2) Passeports métriques (template)
METRIC: `CR_REG2DEP_7D_v2`
Définition : proportion d'utilisateurs enregistrés ayant effectué un dépôt ≥1 de 7 jours.
Unité : utilisateur (user_id, master_id).
Fenêtre : 7 × 24 h de « ts _ registration ».
Exceptions : bots/frod/comptes de test/doublons.
Segments par défaut : pays, plate-forme, canal d'attraction.
Sources : 'event _ register', 'event _ deposit'.
Guardrails : fresh≤1ch, coverage≥99 %, FPR antifroda≤Kh.
Version/propriétaires/date du dictionnaire.
3) Schéma des événements et qualité des données
Schéma canonique : 'event _ id', 'user _ id', 'device _ id', 'session _ id', 'ts', 'type', 'payload', 'source', 'version'.
Idempotence : dedup par '(source_id, checksum)' ; Journal des corrections.
Nettoyage : filtres de bots (vitesse, headless, known-ASN), drapeaux frod, comptes de test.
Identités : pont 'user _ id ↔ device/email/phone', aide de split/merge des utilisateurs.
4) Dénominateurs corrects : pièges fréquents
Sélection bias : « dans le dénominateur seulement actif hier » → surestimation CR.
Survivorship : exclu ceux qui sont partis avant l'étape - CR grandit artificiellement.
Mélange d'unités : dénominateur - sessions, numérateur - utilisateurs.
Double attribution : un succès attribué à plusieurs chaînes.
Moyenne moyenne : moyenne des CR par segment au lieu d'agréger les numérateurs/dénominateurs.
5) Pseudo-SQL : entonnoir avec fenêtres et uniques
sql
WITH regs AS (
SELECT user_id, MIN(ts) AS ts_reg
FROM event_register
WHERE ts BETWEEN:from AND:to
GROUP BY user_id
),
deps AS (
SELECT user_id, MIN(ts) AS ts_dep
FROM event_deposit
GROUP BY user_id
),
eligible AS (
SELECT r.user_id, r.ts_reg, d.ts_dep
FROM regs r
LEFT JOIN deps d
ON d.user_id = r.user_id
AND d.ts_dep BETWEEN r.ts_reg AND r.ts_reg + INTERVAL '7 day'
)
SELECT
COUNT() AS users_reg,
COUNT(ts_dep) AS users_dep_7d,
COUNT(ts_dep)::decimal / COUNT() AS cr_reg2dep_7d
FROM eligible;
Drop-off par étapes
sql
-- Пример: просмотр → регистрация → депозит (7d)
WITH base AS (...), -- ваш источник views AS (...), regs AS (...), deps AS (...)
SELECT
COUNT(DISTINCT views.user_id) AS step0_view,
COUNT(DISTINCT regs.user_id) AS step1_reg,
COUNT(DISTINCT CASE WHEN regs.ts BETWEEN views.ts AND views.ts + INTERVAL '24 h'
THEN regs.user_id END) AS view2reg_24h,
COUNT(DISTINCT CASE WHEN deps.ts BETWEEN regs.ts AND regs.ts + INTERVAL '7 day'
THEN deps.user_id END) AS reg2dep_7d;
6) Cohortes et segmentation
Les cohortes : formez selon la date du premier événement (l'enregistrement / la première visite) → comparez les conversions courbes.
Segments : pays/canal/plateforme/OS/périphérique/contenu/prix/partenaire.
Entonnoir par segment : CR et drop-off avant/après promotions, sorties, changements UX.
Équité : vérifier la distinction des erreurs/CR par segment sensible (éthique/conformité).
7) Attribution : Qui a « mérité » la conversion
Single-touch : last/first click - simple, mais déforme les cycles longs.
Position-basée : Désintégration en U/linéaire/temporelle.
Data-driven (Shapley/Markov) : évalue la contribution des canaux par séquence.
Contrôle des doublons : un succès = un crédit (ou une action), la version de l'algorithme est fixée.
8) Micro-conversions et qualité des clics
Micro-étapes : affichage des prix, ajout au panier, vérification KYC, remplissage du formulaire 50 %.
Qualité du trafic : taux de bounce, engaged-sessions, proportion de vues « valides », modèles de bottes.
Lien avec la valeur : les micro-conversions ne sont utiles que si elles sont corrélées/causales à l'effet d'entreprise (LTV, GGR, Net).
9) Lien de conversion avec l'argent : CAC, LTV, ROMI
CAC : coût de l'attraction par unité de conversion (inscription/dépôt/achat).
ROMI : (\frac {\text {Recettes incrémentielles} {\text {Frais de marketing}} - 1).
Conversion LTV pondérée : hiérarchiser les segments/canaux non pas par CR, mais par valeur attendue.
Causalité : évaluation ROMI - par A/B, DiD, contrôle synthétique ; la corrélation n'est pas suffisante.
10) Expériences et uplift
Tests A/B : randomisation, EMI/puissance, prise en compte de la saisonnalité et de l'interférence.
Métriques : principal CR + guardrails (plaintes, latency, FPR antifroda).
Modèles uplift : ciblent l'augmentation de la conversion plutôt que la probabilité d'un événement ; évaluez Qini/AUUC, uplift @ k.
11) Aspects temporaires et fenêtres
Look-back/Look-forward : fenêtre entre l'exposition (click/view) et la conversion/dépôt.
Hystérésis : différents seuils d'entrée/sortie pour allumer/éteindre les régresseurs promotionnels afin de ne pas « clignoter ».
Calendrier : jours fériés, salaires, grands événements - régresseurs/drapeaux obligatoires.
12) Multi-appareils et déduplication
Cross device : graphique des identifiants (cookie/device/IDFA/email/téléphone).
One-to-one : une action cible est comptée une fois par l'utilisateur (ou par commande/paiement).
Test/Internal : listes filtrées QA/opérateurs/bots - hors dénominateur et numérateur.
13) Visualisations et rapports
Step-bars/Sankey : drop-off par étapes.
Cartes thermiques de cohorte : CR le 1/3/7/14/30 jour.
Graphiques de pont : contribution des facteurs au changement de CR (UX, promo, canal-mix).
Dash : fresh-timer, coverage des événements, guardrails, alertes.
14) Monitoring, SLO et alertes
SLO de fraîcheur : rafraîchissement ≤ N minutes/heures.
Les gardiens de la qualité : sursaut de bots/frod, dissensions identitaires, chute du coverage.
Alerties : écart de CR par rapport aux prévisions saisonnières, chute des événements, augmentation des erreurs/latitude.
15) Pseudo-SQL : attribution « last non-direct »
sql
WITH touch AS (
SELECT user_id, channel, ts,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY ts DESC) AS rn
FROM session_touchpoints
WHERE is_direct = false
AND ts <= (SELECT first_conversion_ts FROM conversions WHERE conversions.user_id = session_touchpoints.user_id)
),
credit AS (
SELECT user_id, channel FROM touch WHERE rn = 1
)
SELECT channel, COUNT() AS conv, COUNT()::decimal / SUM(COUNT()) OVER() AS share
FROM credit
GROUP BY channel
ORDER BY conv DESC;
16) Anti-modèles
Moyenne des CR par pays/canal sans poids.
Mélange d'unités (sessions vs utilisateurs) et de zones temporelles.
Ignorer les définitions des formules et des versions (métrique « flottant »).
Les fenêtres « comment ça marche » (non fixes) ne → pas comparables CR.
L'absence de filtres bots/frods → des métriques surévaluées.
L'attribution du "dernier clic'est la seule vérité pour toutes les décisions.
17) Chèque avant la publication du rapport de conversion
- Passeport métrique : définition, unité, fenêtre, exceptions, sources, version
- Le schéma des événements est canonisé, dedup/idempotence inclus
- Les comptes bots/frod/QA sont exclus ; identités réduites
- Les fenêtres et dénominateurs sont documentés ; les zones temporaires sont harmonisées
- Segments/cohortes testés ; invariants (DAU ≤ MAU, montants par jour = mois) respectés
- L'attribution est choisie et décrite ; double crédit exclu
- Lien avec la valeur : CAC/LTV/ROMI ajouté, évaluation causale planifiée
- Dashboard : fraîcheur, coverage, guardrails ; alerties mis en place
18) Mini-glossaire
CR (taux de conversion) : part qui a terminé l'action cible.
Drop-off : la part qui est « tombée » entre les étapes.
Attribution : méthode de répartition des mérites de conversion par touches.
Cohort : groupe par date du premier événement.
ROMI : retour sur investissement marketing (incrémental).
Uplift : augmentation de la conversion par intervention.
Guardrails : limiteurs de risques (plaintes, FPR, latitude).
Total
L'analyse robuste des conversions repose sur trois baleines : des définitions correctes (dénominateurs/fenêtres/unités), la discipline des données (idempotence, dedup, antibot), le rapport à la valeur (LTV/CAC/ROMI et causalité). En construisant des entonnoirs, des cohortes, l'attribution et la surveillance selon le cadre décrit, vous obtenez des métriques qui vous permettent de gérer réellement le produit et le marketing, pas seulement d'observer des graphiques.