Arquitectura de la plataforma Gamble Hub
1) Objetivos y principios
Objetivo: una plataforma iGaming resistente a los picos, complaciente y rentable con un rápido Time-to-Market.
Principios:- Domain-Driven Design: contextos bounded claros y contratos.
- Núcleo de eventos (EDA): los eventos son la fuente de la verdad sobre los cambios.
- Idempotencia y observabilidad: todos los flujos críticos con claves de idempotencia y rastreo.
- Seguridad predeterminada: Confianza cero, los privilegios más pequeños, cifrado.
- Escalabilidad y tolerancia a fallas: multi-AZ/región, modos de degradación.
- FinOps: $/1000 RPS, $/ms p95, orientación CDN/caché.
2) Circuito de alto nivel (lógico)
[Users/Affiliates/Partners]
│
┌────────────┐
│ Edge (CDN, │ Anycast, WAF, bot filters, SSL/TLS, rate-limit
│ WAF, PoP) │
└─────┬──────┘
│
┌───────────────┐ mTLS/JWT, throttling, canary
│ API Gateway / │──────────────────────────────┐
│ Reverse Proxy│ │Backoffice/Operator UI
└───┬─────┬─────┘ │(RBAC, audit)
│ │ │
│ └────────→ Admin/API (RBAC, IAM) ─────┘
│
Payment ├──Orkestr (PSP Router, KYC/AML, RG)
├──Igrovoy domain (Aggregator, Sessions, RNG proxy)
├──Finansovyy domain (Wallet, Ledger, Limits)
├──Produktovyye domains (Bonus/Promo, Tournament, Loyalty)
├──Polzovatelsky domain (Account, Auth, Profile)
├──Komm. domain (CRM, Push/Email/SMS, Segments)
└──Risk/Antifrod (Rules, Scoring, Device/Intel ASN)
│
┌──────────┴──────────┐
│ Event Bus (Kafka) │ topics: payments, bets, wins, sessions, kyc, promo, audit
└───────┬─────────────┘
│
┌───────────┴───────────┐
│ Data Platform (RT + │ Stream proc, OLAP DWH, Lake, feature store, BI
│ Batch: DWH/Lake/RT) │
└────────────────────────┘
3) Contornos de dominio y servicios clave
3. 1 Usuario y acceso
Cuenta/Auth: registro, entrada, MFA, sesiones, bloqueos.
Perfil/Preferencias: local, límites de juego responsable (RG).
IAM/RBAC: operadores, sapport, roles y auditorías.
3. 2 Finanzas
Wallet/Ledger: monederos multi-moneda, transacciones, bloqueos de fondos, registro en un Seat inmutable.
Orchestrator de pago: enrutamiento PSP, idempotencia, prioridades, failover, métricas Time-to-Wallet.
Limits & Compliance: límites de depósitos/apuestas/pérdidas, sanciones y cumplimiento de país.
3. 3 Contenido y juego
Aggregator de juegos: directorio de proveedores, inicio de sesiones, difusión de estados, hooks web.
RNG/Proxy: conexión segura a proveedores RNG, control de integridad.
Session & Bet Engine: apuestas, resultados, cálculo de ganancias, anti-dubly.
3. 4 Promoción y retención
Bonus Engine: depósito/no depósito, fripines, wagering, expiry.
Tournament/Leaderboard: actualizaciones de tiempo real, anti-Abuse.
Loyalty/Progression: niveles, XP, misiones, escaparate offer.
3. 5 Riesgo y antifraude
Motor de regla: reglas deterministas, puntuación, cheques de velocidad.
Inteligencia de dispositivo/red: fingerprint, señales ASN/geo-conductual.
Gestión de casos: investigación, RAE/strikes, escaladas.
3. 6 KYC/AML & RG
KYC: verificación de documentos, fuentes de terceros.
AML: listas, monitoreo de transacciones, umbrales de informes.
Responsible Gaming: límites/auto-exclusión/tiempos de espera con alertas de eventos.
3. 7 Comunicaciones y CRM
Segments/Elegibilidad: audiencias, frecuencia, riesgo-score.
Journey/Orchestrator: каналы email/SMS/push/in-app.
Contenido: pancartas, páginas promocionales, fichas A/B.
4) Capas de integración
API Gateway / Reverse Proxy
TLS 1. 3, mTLS para socios, JWT/OIDC, firmas HMAC (colbecs externos).
Routing: host/path/header, canary/weighted, geo-routing para PoP.
Protección: WAF, filtros bot, rate-limit, request-collapsing, caché semi-altavoces.
Event Bus (Kafka)
Топики: `payments.`, `wallet.`, `betting.`, `rg.`, `kyc.`, `promo.`, `audit.`.
Garantías: «al menos una vez», claves de idempotencia, deduplicación, DLQ.
Esquemas: Avro/Protobuf + registro, evolución de los circuitos.
Proveedores de pago (PSP)
Smart-routing por métodos/países/ASNs, límites de proveedores.
Hooks web con verificación de firma, repetición de entrega, anti-duplicado.
Reconciliación: conciliación de diarios, discrepancias y alertas.
Proveedores de contenido
Hoja de seguridad IP, tokens/firmas, temporizadores/retiros con presupuesto, proveedor de SLA.
Meta-catálogo y health-checks, rutas «grises» para fuentes sospechosas.
5) Datos y análisis
Circuito RT
Agregaciones en streaming (ganar/perder, depósitos GGR/Net, actividad), señales antifraude.
Fides para escaparates, tablas de liderazgo, disparadores CRM en segundos.
Batch/DWH/Lake
Modelo de capa (Bronce/Plata/Oro), SCD, eliminación de GDPR, contratos de datos.
BI/estados financieros: Depósitos Net, Time-to-Wallet, ARPPU/LTV, cohortes.
Feature Store para ML (puntuación riesgo/salida/personalización).
6) Observabilidad y ERE
Метрики: p50/95/99, error-rate, throughput, saturation, queue-lag, Time-to-Wallet, hit-ratio CDN.
Registros: estructural, filtración PII, muestreo.
Tracks: end-to-end (traceparent), sampling tail-based en las colas.
- API p95 ≤ 250 ms; error ≤ 0. 3 %/30 días.
- Pago «depósito» p95 ≤ 6 s; éxito ≥ 97%.
- Emisión de un bono ≤ 500 ms p95.
- Alertas: fallas en el presupuesto, crecimiento de 429/retraídas, tributo de los consumidores de eventos, reducción de la respuesta TLS.
7) Seguridad y cumplimiento
Zero Trust: mTLS east-west, la política de menos privilegios, los límites explícitos de las redes.
IAM: verificación centralizada de tokens, préstamos de vida corta, administrador secreto.
WAF/DDoS: firmas + comportamiento, greypass/capcha, tiered-cache/negative-cache.
Cifrado: en tránsito (TLS) y en reposo (KMS, altavoces DB).
GDPR/PII: minimización, seudonimización, derecho al olvido, auditoría de accesos.
KYC/AML/RG: verificación y presentación de informes obligatorios; Gestión de casos.
Audit trail: un registro inmutable para operadores, eventos críticos y configuraciones.
8) Fiabilidad, DR y topologías
Multi-AZ/Región: activo-activo frente, activo-pasivo de storage crítico por RPO/RTO.
PoP/Edge: más cerca del jugador, Anycast, origin-shield, calentando cachés.
Failover playbooks: pérdida de región, degradación del proveedor, caché parcial down.
Modos de degradación: escaparate/catálogo simplificado, respuestas en caché, fichas CRM diferidas, antifraude «light».
9) Productividad y rentabilidad
CDN/TTL: SWR/if-error, clave de caché sin «ruido», tiered/shield.
HTTP/3, TLS resumen: reducción de apretones de manos, ChaCha20 en los móviles.
gRPC/protobaf: llamadas entre servicios.
Caché: Redis para hot-set (directorios, perfiles, límites).
FinOps: mix reserved/on-demand/spot, auto-parking staging, sampling logs/tracks.
10) CI/CD y plataforma del desarrollador
IaC: Terraform/Helm, políticas de OPA (etiquetas, TTL, clases).
Pipelines: linternas/pruebas/seccanas/smoke perf; release train, canary/blue-green.
Secrets: vault/secret-manager, rotation, sin «secretos en la gita».
Banderas Ficha: rollout progresivo, A/B, apagar el fich «caliente» al instante.
Golden Paths: plantillas de servicio (envolturas de métricas/logs/tracks, retraídas, idempotencia).
11) Contratos de datos y eventos (ejemplo)
Evento 'wallet. transaction. v1` (protobuf):- `tx_id` (uuid), `idempotency_key`, `subject_id` (user), `amount` (minor units), `currency`,
12) Mini playbucks
Antes del evento máximo (T-30 min)
1. Aumentar minReplicas y minNodes servicios de destino, warm pools.
2. Calentar CDN/DNS/TLS/connects, calentar catálogos/torneos populares.
3. Apriete las reglas de bot e incluya rutas «grises».
4. Compruebe los límites de PSP, proveedores de contenido de salud.
Incidente de pago (aumento de los rechazos de PSP-1)
1. Convertir peso en PSP-2/3 (smart-routing), aumentar retry-budget c backoff.
2. Habilitar banner y alertas de estado.
3. Post-incidente: RCA, redistribución de la cartera de proveedores.
Degradación de la base de datos (aumento de las solicitudes p95)
1. Habilitar la capa de almacenamiento en caché, reducir la frecuencia de los escaparates pesados.
2. Límites de tiempo para tokens/bonos, colas para el cálculo.
3. Plan de optimización: índices, lotes, read-replicas.
13) SLO-set (ejemplo)
API: p95 ≤ 250 ms, error ≤ 0. 3% (30 días).
Pagos: T2W (depósito) p95 ≤ 6 s; 'success _ rate' ≥ 97%.
Sesiones de juego: creación de ≤ 300 ms p95, estabilidad de conexiones ≥ 99. 9%.
Antifraude: tiempo de solución ≤ 200 ms p95 para reglas en línea.
DWH: SLA preparación de escaparates diarios - 06:00 TZ local.
14) Hoja de ruta para la evolución
1. v1: monolito de núcleo + gateway, Kafka «adentro» (ópticos mínimos), analítica básica.
2. v2: asignación de dominios (wallet, payments, bonus, aggregator), eventos completos, Redis, política CDN.
3. v3: multi-región activo-activo frente, activo-pasivo storaggi, smart-routing PSP, RT-leadboard.
4. v4: ML-scoring (feature store), personalización de offer, optimizador automático FinOps (commit/spot mix), Zero Trust end-to-end.
15) Lista de verificación de preparación para la producción
- Los límites de dominio y los contratos (API + eventos) están documentados.
- Se ha implementado la idempotencia de pagos/apuestas y la dedupe general.
- SLO/alertas de flujo clave (API, Payment, Wallet, Bonus, Tournament).
- Filtros WAF/DDoS/bot y rate-limits habilitados, auditoría habilitada.
- Plan y simulacros de DR (pérdida de AZ/región, proveedor de contenido/PSP).
- Observabilidad: métricas/logs/tracks, dashboards de eventos pico.
- CI/CD con canario/azul-verde y rollback rápido.
- FinOps: etiquetas, showback/chargeback, $/1k RPS, lifecycle/sampling.
- Procesos GDPR/KYC/AML/RG con auditoría y SLA.
- Reseñas de seguridad: secretos, IAM, políticas de acceso, cifrado.
Resultado
La arquitectura Gamble Hub es un conjunto de dominios independientes relacionados con eventos, con una fuerte seguridad, observabilidad y rentabilidad. Este diseño proporciona un rendimiento predecible para torneos y transmisiones, integraciones rápidas con proveedores, flujos de pago controlados y indicadores de fondos transparentes, a la vez que se mantiene satisfecho y listo para escalar por regiones.