Análisis de conversiones
Análisis de conversiones
La conversión no es simplemente «el número que se divide por el número». Es un sistema controlado: definiciones claras y esquema de eventos → denominador correcto y ventana de tiempo → segmentación y atribución → relación de valor (LTV/ROMI) → monitoreo y experimentación. A continuación, un marco que escala desde la activación de productos hasta los cuervos de pago y marketing.
1) Definiciones y fórmula básica
Eventos de embudo: pasos consecutivos (ver → clic → registro → verificación → depósito → acción objetivo).
Conversión de paso: (\text {CR} _ {i\to j} =\frac {\text {entidades únicas que completaron} j\text {después} i} {\text {entidades únicas que alcanzaron} i})
La conversión es de extremo a extremo: (\text {CR} {0\to k} =\prod {s = 0} ^ {k-1 }\text {CR} _ {s\to s + 1})
Unidad de contabilidad: usuario/sesión/dispositivo/pedido - fijar explícitamente.
Ventana de tiempo: límite entre pasos (por ejemplo, registro → depósito ≤ 7 días).
2) Métricas de pasaportes (template)
METRIC: `CR_REG2DEP_7D_v2`
Definición: porcentaje de usuarios registrados que han realizado un depósito ≥1 de 7 días.
Unidad: usuario (user_id, master_id).
Ventana: 7 × 24 horas desde 'ts _ registration'.
Excepciones: bots/frod/cuentas de prueba/duplicados.
Segmentos predeterminados: país, plataforma, canal de atracción.
Fuentes: 'event _ register', 'event _ deposite'.
Guardrails: fresh≤1ch, coverage≥99%, FPR antifroda≤Kh.
Versión/propietarios/diccionario de datos.
3) Esquema de eventos y calidad de datos
Esquema canónico: 'event _ id', 'user _ id', 'device _ id', 'session _ id', 'ts',' type ',' payload ',' source ',' version '.
Idempotencia: dedoup por '(source_id, checksum)'; Registro de correcciones.
Limpieza: filtros de bots (velocidad, headless, known-ASN), banderas de frod, cuentas de prueba.
Identidades: puente 'user _ id ↔ device/email/phone', ayuda sobre usuarios divididos/merge.
4) Denominadores correctos: trampas frecuentes
Selección bias: «en el denominador sólo activo ayer» → sobrestimación CR.
Survivorship: Excluyeron a los que se fueron antes del paso - CR crece artificialmente.
Mezcla de unidades: denominador - sesiones, numerador - usuarios.
Doble atribución: un éxito atribuido a múltiples canales.
Promedio: promedio de CR por segmento en lugar de agregación de numeradores/denominadores.
5) Pseudo-SQL: embudo con ventanas y singularidades
sql
WITH regs AS (
SELECT user_id, MIN(ts) AS ts_reg
FROM event_register
WHERE ts BETWEEN:from AND:to
GROUP BY user_id
),
deps AS (
SELECT user_id, MIN(ts) AS ts_dep
FROM event_deposit
GROUP BY user_id
),
eligible AS (
SELECT r.user_id, r.ts_reg, d.ts_dep
FROM regs r
LEFT JOIN deps d
ON d.user_id = r.user_id
AND d.ts_dep BETWEEN r.ts_reg AND r.ts_reg + INTERVAL '7 day'
)
SELECT
COUNT() AS users_reg,
COUNT(ts_dep) AS users_dep_7d,
COUNT(ts_dep)::decimal / COUNT() AS cr_reg2dep_7d
FROM eligible;
Drop-off por pasos
sql
-- Пример: просмотр → регистрация → депозит (7d)
WITH base AS (...), -- ваш источник views AS (...), regs AS (...), deps AS (...)
SELECT
COUNT(DISTINCT views.user_id) AS step0_view,
COUNT(DISTINCT regs.user_id) AS step1_reg,
COUNT(DISTINCT CASE WHEN regs.ts BETWEEN views.ts AND views.ts + INTERVAL '24 h'
THEN regs.user_id END) AS view2reg_24h,
COUNT(DISTINCT CASE WHEN deps.ts BETWEEN regs.ts AND regs.ts + INTERVAL '7 day'
THEN deps.user_id END) AS reg2dep_7d;
6) Cohortes y segmentación
Cohortes: forme por fecha del primer evento (registro/primera visita) → compare las curvas de conversión.
Segmentos: país/canal/plataforma/OS/dispositivo/contenido/precio/socio.
Embudo por segmentos: CR y drop-off antes/después de acciones, lanzamientos, cambios de UX.
Equidad: compruebe la diferencia de errores/CR por segmentos sensibles (ética/cumplimiento).
7) Atribución: quién «mereció» la conversión
Single-touch: last/first click es simple, pero distorsiona ciclos largos.
Position-based: desintegración en U/lineal/temporal.
Data-driven (Shapley/Markov): evalúa la contribución de los canales por secuencias.
Control de duplicados: un éxito = un crédito (o participación), la versión del algoritmo está fija.
8) Micro-conversiones y clics de calidad
Micro-pasos: ver el prising, añadir al carrito, comprobar KYC, rellenar el formulario 50%.
Calidad del tráfico: bounce-rate, engaged-sessions, fracción de vistas «válidas», patrones de bote.
Relación con el valor: las micro conversiones sólo son útiles si están correlacionadas/causalmente relacionadas con el efecto de negocio (LTV, GGR, Net).
9) Relación de conversión con el dinero: CAC, LTV, ROMI
CAC: costo de atracción por unidad de conversión (registro/depósito/compra).
ROMI: (\frac {\text {Ingresos incrementales}} {\text {Costos de marketing}} - 1).
Conversión ponderada por LTV: priorice los segmentos/canales, no por CR, sino por el valor esperado.
Causalidad: evaluación ROMI - a través de A/B, DiD, control sintético; la correlación no es suficiente.
10) Experimentos y uplift
Pruebas A/B: aleatorización, MDE/power, contabilidad de estacionalidad e interferencia.
Métricas: CR + guardrails básicos (quejas, latencia, FPR antifraude).
Modelos de Uplift: dirigen la ganancia de conversión en lugar de la probabilidad de un evento; evaluar Qini/AUUC, uplift @ k.
11) Aspectos temporales y ventanas
Look-back/Look-forward: una ventana entre la exposición (clic/vista) y la conversión/depósito.
Histéresis: diferentes umbrales de entrada/salida para encender/apagar los regresores promocionales para no «parpadear».
Calendario: vacaciones, salarios, grandes eventos - regresiones/banderas obligatorias.
12) Multi-dispositivos y deduplicación
Dispositivo cruzado: gráfico de ID (cookie/device/IDFA/email/teléfono).
One-to-one: una acción objetivo cuenta una vez por usuario (o por pedido/pago).
Prueba/internal: listas filtradas de QA/operadores/bots - fuera del denominador y el numerador.
13) Visualizaciones e informes
Step-bars/Sankey: drop-off en los pasos.
Tarjetas de calor de cohorte: CR a 1/3/7/14/30 día.
Gráficos de puente: contribución de factores al cambio CR (UX, promo, canal-mezcla).
Dash: temporizador fresco, coverage de eventos, guardrails, alertas.
14) Monitoreo, SLO y alertas
Frescura de SLO: Actualización de valor ≤ N minutos/horas.
Guardianes de calidad: estallido de bots/frod, desorden de identidades, caída de coverage.
Alertas: desviación de CR del pronóstico estacional, acantilado de eventos, aumento de errores/latencia.
15) Pseudo-SQL: atribución «last non-direct»
sql
WITH touch AS (
SELECT user_id, channel, ts,
ROW_NUMBER() OVER (PARTITION BY user_id ORDER BY ts DESC) AS rn
FROM session_touchpoints
WHERE is_direct = false
AND ts <= (SELECT first_conversion_ts FROM conversions WHERE conversions.user_id = session_touchpoints.user_id)
),
credit AS (
SELECT user_id, channel FROM touch WHERE rn = 1
)
SELECT channel, COUNT() AS conv, COUNT()::decimal / SUM(COUNT()) OVER() AS share
FROM credit
GROUP BY channel
ORDER BY conv DESC;
16) Anti-patrones
RC promedio por países/canales sin escalas.
Mezcla de unidades (sesiones vs usuarios) y zonas temporales.
Ignora las definiciones de fórmulas y versiones (la métrica «flota»).
Las ventanas «cómo va a funcionar» (no fijas) → las CR no comparables.
No hay filtros de bots/frod → métricas infladas.
Atribución de «último clic» como la única verdad para todas las soluciones.
17) Lista de verificación antes de publicar el informe de conversión
- Métricas de pasaporte: definición, unidad, ventana, excepciones, fuentes, versión
- Se canoniza el esquema de eventos, se incluye dedoup/idempotencia
- Se excluyen las cuentas de bots/frod/QA; identidades reducidas
- Las ventanas y los denominadores están documentados; zonas temporales acordadas
- Segmentos/cohortes verificados; invariantes (DAU ≤ MAU, sumas por día = mes) respetadas
- Atribución seleccionada y descrita; doble crédito excluido
- Relación con el valor: CAC/LTV/ROMI añadido, evaluación causal planificada
- Dashboard: frescura, coverage, guardrails; alertas personalizadas
18) Mini glosario
CR (Tasa de conversión): la proporción que completó la acción objetivo.
Drop-off: la proporción que «cayó» entre los pasos.
Attribution: método de distribución del mérito por conversión por toques.
Cohort: grupo por fecha del primer evento.
ROMI: retorno de la inversión de marketing (incremental).
Uplift: aumento de la conversión de la intervención.
Guardrails: limitadores de riesgos (quejas, FPR, latency).
Resultado
Un sólido análisis de conversiones se basa en tres ballenas: definiciones correctas (denominadores/ventanas/unidades), disciplina de datos (idempotencia, dedoup, antibot), relación con el valor (LTV/CAC/ROMI y causalidad). Al construir embudos, cohortes, atribución y monitoreo en el marco descrito, se obtienen métricas a través de las cuales se puede administrar realmente el producto y el marketing, no solo observar los gráficos.