GH GambleHub

Data Mesh: modelo de dados federado

(Secção Tecnologia e Infraestrutura)

Resumo curto

O Data Mesh é um modelo organizacional e técnico, onde os dados são considerados produtos de comandos de domínios, e o papel central da plataforma é fornecer autoatendimento, padrões e complicações. Para iGaming, isso significa que a equipe de Payments possui o Deposit Events e o Net Depositits Mart, a equipe de Risk é a Fraud Signals, a Games é a Bet Events e a plataforma central fornece o catálogo, os contratos de circuito, a disponibilidade, o monitoramento de qualidade, os finops e a plataforma central ferramentas de streaming/ELT.

1) Princípios do Data Mesh

1. Domínio: Cada domínio (Payments, Risk, Games, KYC/Compliance, CRM, Affiliate) possui seus conjuntos de dados e seu ciclo de vida.
2. Dados como produto: cada conjunto tem dono, descrição, SLO, acesso SLA, documentação, versão, feedback e cartão de trânsito.
3. Plataforma Self-serve: pipline padrão ingest/trans/serve, modelos, segurança padrão, diretório e observabilidade.
4. Gerenciamento federal: padrões gerais de esquema, métricas, PII/localização e qualidade - no centro; implementação e evolução - em domínios.

2) Modelo operacional e papéis

Domain Data Product Owner (DPO): priorização, SLO, backlogs de melhorias no produto de dados.
Domain Data Engineer/Analytics Engineer: circuitos, piplines, testes de DQ, versioning.
Domain Steward: semântica de campos, conformidade com dicionário de métricas e classificação PII.
Plataforma Team: catálogo, IAM/RBAC, Policy-as-Code, formatos de tabela (Delta/Iceberg/Hudi), orquestração, observabilidade, finopes.
Federated Governance Board: aprova padrões (esquemas, métricas, segurança) e resolve disputas de domínios cruzados.

3) «Data Product» - passaporte e artefatos

Composição mínima do produto de dados:
  • Contract (padrão, tipos, evolução, compatibilidade).
  • API de acesso (SQL/tabela, topic/stream, arquivo/share).
  • SLA/SLO (frescura, disponibilidade, qualidade).
  • Testes DQ (exclusividade, faixas, integridade de referência).
  • Documentação (descrição de campos, exemplos de solicitação, owner, contato).
  • Versioning (semantic versioning circuitos, política de depredação).
  • Políticas (PII, localização, retenção/TTL, direitos).

Modelo de passaporte (YAML, exemplo)

yaml name: bets. events. v1 domain: games owner: games-data@company interface:
sql: lakehouse. silver. bets_events stream: kafka://bets. events. v1 share: read-only (EU only)
schema_version: 1. 3. 0 slo:
freshness: "<= 5 min (p95)"
availability: ">= 99. 9%"
dq:
- unique: bet_id
- valid_values: currency in [EUR, USD, TRY, BRL]
- non_negative: [stake, payout]
security:
pii: false region: EU retention: 365d lineage:
sources: [game_engine. outbox, payments. psp. webhooks]
consumers: [crm. triggers, risk. realtime, dwh. fact_bets]
versioning:
compat: backward deprecation_policy: "60 days"

4) Interoperabilidade e padrões

Esquemas/contratos: Avro/Protobuf/JSON-Schema + Schema Registry; política de back-compat que impede alterações de quebra sem uma nova versão maior.
Camada semântica: Definições de GGR, NGR, Net Depositits, LTV, cômodos - como código (dbt metrics/semantic layer).
Identificadores: globais 'player _ id', 'tenant _ id', 'bet _ id', guias unificados de países/moedas/provedores.
Metadados: colunas obrigatórias 'ingest _ ts', 'schema _ versão', 'trace _ id', 'fonte', 'region'.
Acesso: SQL (lakehouse/OLAP), estirpe (Kafka/Pulsar), tabelas de sharing/snapshots; Formato de troca - Parquet/Delta/Iceberg.

5) Referência tecnológica (agnóstico para vendedores)

Ingest: Outbox/CDC из OLTP → Kafka → Lakehouse (Bronze).
Transform: ELT/dbt в Silver/Gold; «MERGE», SCD, vitrines materiais.
Serve: OLAP (ClickHouse/BigQuery/Snowflake), RT-движки (Pinot/Druid) для near-real-time.
Catálogo/Lineage: diretório único, documentação automática, gráfico de dependências.
Observabilidade: métricas de frescura/SLO, DQ-assert, lajes de strim, custo.
Políticas: IAM/RBAC/ABAC, criptografia, localização (rotação de dados de área).

6) SLO/SLA para produtos de dados

Exemplos de SLO alvo:
  • Freshness: Bets Events (p95) ≤ 5 мин; Fraud Signals ≤ 30 segundos; Net Deposits Mart ≤ 15 min
  • Availability: ≥ 99. 9% para interfaces de leitura.
  • Quality: Duplicado ≤ 0. 01%, percentual de campos obrigatórios vazios ≤ 0. 1%, 100% de consistência cambial.
  • Costa SLO: Valor das raias de vitrine ≤ N $/dia, small files ratio <10%.

7) Segurança, PII e localização

Classificação PII/sensíveis de final/operação.
Técnicas: criptografia at-rest/in-transit; toquenização PII; camuflar colunas; filtros row-level por 'tenant _ id'.
Localização: Produtos de domínio são publicados em regiões permitidas (EU/TR/LATAM); Sharing de fronteira - apenas unidades sem PII.
Auditoria: quem publicou/leu; versão do esquema; solicitação de habilitação por meio de concordata.

8) FinOps e gerenciamento de custo

Orçamentos de domínios: limites de compute, alertas de sobrepreço.
Armazenamento: Classes de armazenamento + TTL (Bronze curto, Silver médio, Gold longo/unidade).
Otimização de solicitações: partitações/clusterização, visualizações materializadas, BI.
Small files: competition/OPTIMIZE políticas; tamanho alvo do arquivo 128-1024 MB.

9) Ciclo de vida e evolução

Versioning: 'domain. product. v{major}`; campos menores - back-compat.
Deprekate: notificação dos consumidores, período de dois caminhos, alertas automáticas para versões antigas.
Mudanças de esquema: Pull Request para o repositório de contratos; Testes de compatibilidade CI; a publicação automática para o catálogo.
Feedback: canal do produto (issue tracker), NPS dos consumidores, hora para responder aos incidentes.

10) Especificação para iGaming - mapa de domínios e produtos

Payments

`payments. psp. webhooks. v1` (stream)

`mart_net_deposits_daily. v1 '(SQL) - SLO frescura ≤ 15 min; PII-free

Games

`bets. events. v1 '(stream/SQL) - p95 ≤ 5 min

`mart_ggr_daily. v1 '(SQL/MV) - unidades por país/jogo

Risk/Anti-fraud

`risk. signals. v1 '(stream) - p95 ≤ 30 segundos

`risk. case_mgmt. v1 '(SQL) - SCD2 histórico de investigação

CRM/Personalization

`crm. triggers. v1 '(stream) - desencadeadores segmentais

`profile. features. online. v1 '(KV/SQL) - fici online (TTL)

KYC/Compliance

`kyc. status. v1 '(SQL) - PII protegido, row-level policies

`responsible_gaming. events. v1 '(stream) - limites/sinais

11) Processos e artefatos da plataforma

Catálogo: pesquisa de domínio/campo/rótulos PII, pré-visualização de esquemas e exemplos.
Geradores de modelos: cookiecutter para o novo produto (passaporte, CI, testes DQ, dashboard SLO).
Policy-as-Código: regras de exportação, PII, sharing entre regiões.
Observabilidade: dashboards prontos: Freshness, DQ Erros, Cost, Lineage, Stream lag.
Runbooks: incidentes de frescura/DQ/circuitos, deprekate de emergência, reversão de versões.

12) Migração para o Data Mesh (mapa de trânsito)

1. Inventário de datasets atuais → agrupamento por domínio.
2. Piloto de 2-3 domínio (Payments, Games, Risk) - confeccionar como produtos com passaportes.
3. Diretório e padrões: esquemas, métricas, PII/localização, DQ.
4. Self-serve: modelos de pipline, CI/CD, monitoramento SLO.
5. Corte de vitrines monolíticas para domínios; suporte de dois caminhos para interfaces antigas.
6. Conselho Federal - sessões regulares, revezamento do contrato de mudanças.
7. Escala em CRM/Afiliados/Marketing, depois em parceiras.

13) Folha de cheque de implementação

Domínios definidos; proprietários e canais de comunicação são designados.
Catálogo executado; passaporte de cada produto publicado.
Esquemas - no repositório de contratos; A CI está testando compatibilidade/DQ.
Os SLO/SLA foram declarados; Os dashboards Freshness/DQ/Costa estão disponíveis.
Políticas PII/localização - código; a auditoria está ativada.
FinOps, orçamentos, alertas, «valor de domínio».
Processo de versionização/depósito - documentado e automatizado.
Incidentes de runbooks - disponíveis e treinados (game-day).

14) Antipattern

"Renomeado para Data Mesh, mas tudo através do comando central de dados - a garganta estreita não é eliminada.
A ausência de um único dicionário de métricas GGR/NGR varia entre os domínios.
Esquemas sem contratos ou testes de compatibilidade → lançamentos «quebrantes».
Sem Self-serve → cada tabela é criada manualmente, com time-to-data alto.
Ignorar PII/localização em sharing cruzado-regional.
Os micro-produtos sem proprietários/SLO são dados «abandonados».

15) KPI de sucesso Data Mesh

Time-to-Data: desde a ideia até o produto de dados disponível (mediana ↓).
Reutilização: número de domínios de consumo por produto.
Qualidade: Taxa de verificação DQ bem sucedida, defeitos em milhões de eventos.
Confiabilidade: conformidade SLO recente/disponibilidade.
Custo: $/consulta/usuário, participação small files, reciclagem compute.
Velocidade de alterações: lançamentos de circuito/vitrines por semana.

Resumo

O Data Mesh não é apenas uma tecnologia, mas também uma federação de domínios administrada, onde os dados são produtos com seus proprietários, SLO, contratos e métricas de qualidade. Em iGaming, essa abordagem alivia gargalos estreitos, acelera a integração (antifrode, pagamentos, CRM), melhora a transparência das métricas (GGR/NGR/LTV) e controla o custo. Construa uma forte plataforma self-serve, introduza padrões federativos e uma cultura de «dados como produto», e seu ecossistema analítico é escalado com o negócio - sem perda de qualidade, velocidade e complacência.

Contact

Entrar em contacto

Contacte-nos para qualquer questão ou necessidade de apoio.Estamos sempre prontos para ajudar!

Telegram
@Gamble_GC
Iniciar integração

O Email é obrigatório. Telegram ou WhatsApp — opcionais.

O seu nome opcional
Email opcional
Assunto opcional
Mensagem opcional
Telegram opcional
@
Se indicar Telegram — responderemos também por lá.
WhatsApp opcional
Formato: +indicativo e número (ex.: +351XXXXXXXXX).

Ao clicar, concorda com o tratamento dos seus dados.