Analista de ecossistema
1) O papel dos analistas no ecossistema de rede
O analista do ecossistema é uma capacidade transversal de coletar, normalizar e interpretar sinais de todos os participantes (operadores, estúdios/RGS, PSP/APM, KYC/AML, afiliados/mídia, stripteers, SRE, segurança), transformando-os em soluções: rotação de pagamentos, recomendações de conteúdo, guardas RG, Limites, Fija bandeiras, campanhas cruzadas, planejamento de capacidade e DR..
O objetivo é uma única verdade sobre dados (single fonte of truth), SLO/KPI previsível e rápido ciclo de melhorias.
2) Fontes, eventos e ontologia
2. 1 Modelo de evento (domínio mínimo)
`click`, `session_start/stop`, `bet/spin`, `round_start/result`, `deposit/withdrawal`, `psp_auth`, `kyc_status`, `fraud_signal`, `reward_granted`, `leaderboard_update`, `stream_interaction`.
2. 2 Identificadores e conectividade
`playerId` (псевдоним), `operatorId`, `providerId`, `contentId`, `campaignId`, `paymentRouteId`, `tableId`, `traceId`.
Todos os ID são tocados, o PII é armazenado em áreas de cofre.
2. 3 Ontologia e contratos de dados
Schema Registry e dicionários de domínios.
Data Contracts: proprietário, destino, SLA frescura/completura, fórmulas de métricas, valores válidos.
Versioning: semver para circuitos e fórmulas.
3) Arquitetura de analistas
3. 1 Fluxo e armazenamento
Streaming (≤1-5 s): pneu de evento → visualizações materializadas (dashboards operacionais, SRE, real-time soluções).
Batch (5-15 min/diárias): CDC/ETL → DWH/Lakehouse (finanças, relatórios, complicações).
Camadas Hot/Warm/Cold, arquivamento S3 compatível, vácuo/retenção.
3. 2 Camadas de dados
Raw (inalterável, cifra, lineage).
Estaging (limpeza/normalização).
Semantic (estrelas/noodles, vaquinhas, métricas).
Função Store (sinais online/off-line).
Knowledge Graph (gráficos de entidades/ligações para recomendações e antifrode).
3. 3 Acesso e segurança
RBAC+ABAC+ReBAC, mTLS/JWS, torneamento, filtros jurisdicionais, SoD (divisão de responsabilidades), auditoria WORM.
4) Catálogo de métricas (canônico)
4. 1 Produto e crescimento
Vórtices CR: login → KYC → depósito → jogo ativo.
Retenção D1/D7/D30, ARPU/ARPU, LTV (cumulativo/modelo).
Engagement: sessões/DAU/WAU/MAU, duração média, missões/torneios.
4. 2 Pagamentos/PSP/APM
Conversion Rate (ARM x região x dispositivo), p95 autorizações, risco de charjback, resistência à rota, tempo de cut-over.
4. 3 KYC/AML
Pass-rate e SLA etapas, FP/FN, influência sobre depósito CR, fila de review manual.
4. 4 Conteúdo/estúdio
Sessões/envolvimento/retenção por jogo, RTP/volatilidade, live-SLI (e2e-atraso, packet loss).
4. 5 Infra/SRE
p95/p99 API, corretor, integração uptime, headroom, Dr. Flips, orçamento de erros.
4. 6 Finanças
GGR/Net Revenue, rake/fee, Costa-to-Serve (per rps/txn/stream/eventos), créditos/penalties (SLO-associados).
5) Atribuição e experimentação
5. 1 Atribuição
Regra: «last eligível touch» com janelas de jurisdição, anti-duplicação de pós-bek, cross-device stitching sobre os tocantes acordados.
Testes sanity, alinhamento financeiro/legal.
5. 2 Experiências
A/B/C, substituição (jurisdição, segmentos de risco, dispositivo), guardrais (SLO, RG, complacência).
Plataforma de contagem unificada: efeitos, intervalos de confiança, CUPED/CPP para reduzir a dispersão.
Função-flags/Progressive delivery com roll automático sobre o orçamento de erro.
6) Feature Store и Knowledge Graph
6. 1 Feature Store
Sinais online (reação ≤ 20-50 ms): propensity, risk, rotinas de pagamento, sabores de conteúdo.
Sinais offline (batch/treinamento).
SLA frescura/consistency, controle à deriva, testes de vazamento de PDN.
6. 2 Knowledge Graph
Nós: jogador, segmento, jogo, provedor, APM/PSP, região, campanha, evento de risco.
Costelas: «jogou», «depósito APM», «verificado», «participante da campanha», «funcionou antifrod pattern».
Use-cases: recomendações, look-alike, colunas, dependências implícitas em pagamentos e rotas.
7) Analista federal, privacidade e complacência
Federated Learning (FL): treinamento de modelos em dados de parceiros sem transferência de PDN; segure aggregation e privacidade diferencial (DP).
DPA/DPIA: metas, prazos de armazenamento, fluxos de fronteiras.
Minimização PII: Tocinização, camuflagem, áreas de cofre separadas.
Auditoria: consultas e cálculos com logs e traceId WORM.
8) MLOps e BIops (analista como produto)
8. 1 MLOps
Cartões de modelo (alvo, dados, métricas, riscos), treinamento automático/deplom, monitoramento de drivt/latency, Canary/Shadow.
Métricas: AUC/PR, lift, KS, fairness, latency inference, taxa de reaproveitamento.
8. 2 BIOPs (painéis/vitrines)
Versionização de fórmulas/widgets, chainjlogs, barras de areia e dados demo, testes de painéis conformance.
Painéis SLO: frescura de dados, p95 renders, disponibilidade, taxa de sucesso em dinheiro.
9) Economia de analistas:
- Costa per rps/txn/stream/event, custo de inferência/1000 solicitações, armazenamento de fichas e agregações de stream.
- Valor Map: aporte de modelos/regras em depósitos CR, ARPU/LTV, redução de charjbacks e incidentes.
- RI experimentos: uplift, tempo de retorno, impacto sobre SLO/multas/crédito.
- Otimização: cabeçalho, particionização, proxy de colunas, janelas adaptativas.
10) Observabilidade de dados e qualidade
Data-SLO: completeness, freshness, uniqueness, consistency.
Schema-violações/Lineage: Alertas de separação de circuitos, caminho visual de origem.
Reconciação: processamento de unidades (finanças, atribuições), controle de duplicações/perdas.
Correlação Trace: 'traceId' desde o evento até painéis e ações.
11) Gerenciamento de alterações e versões
Versões semânticas de circuitos e fórmulas, migrações «add-only», adaptadores entre versões.
Mudança-windows, auto-rollback, «cases de seleção» compatibilidade, plano de deprecação com janelas paralelas.
12) Anti-pattern
Muitas verdades, fórmulas diferentes de uma métrica em diferentes equipes.
PDN crus em BI: falta de tocenização/camuflagem.
Eventos sem Schema Registry - separações de vitrines e modelos.
Experimentos sem guard, aumento de incidentes/multas.
Retraias sem idempotação em pipas: duplos/deslocamento.
SLO «em papel»: sem alertas/botões parados.
Falta de lineagem: número controverso não pode ser comprovado.
Entrada de dados SPOF, sem N + 1.
13) Folhas de cheque de implementação
13. 1 Dados e esquemas
- Ontologia e dicionários aprovados.
- Schema Registry + Data Contracts (proprietário, SLA, versão).
- Toquenização/camuflagem de PDN, DPIA é formalizada.
13. 2 Pipas e qualidade
- Stream + Batch linhas de montagem, SLAs frescos/completos.
- Dados-testes (incluindo atribuição/finanças), reconciação jobs.
- Alertas em draft/violações/pneus de liga.
13. 3 Métricas e painéis
- Catálogo de métricas com fórmulas e proprietários.
- Versões de widgets, banco de areia, conjunto de conformance.
- painéis SLO (frescura, render, disponibilidade).
13. 4 Modelos e soluções
- Cartões de modelo, monitoramento, canary/shadow.
- Função Store (online/offline), controle à deriva.
- Guardrails RG/complacência, botões parados.
13. 5 Economia
- Cost-to-Serve карта (per rps/txn/event/stream).
- Value Map e o processo de avaliação ROY.
- Co-funding/créditos/pênaltis estão ligados a métricas.
14) Mapa de trânsito da maturidade
v1 (Foundation): eventos/ontologia, Schema Registry, painéis básicos e relatórios de dados-testes.
v2 (Integration): vitrines stream, catálogo de métricas, plataforma A/B, Função Store, associados scorecards.
v3 (Automation): modelos preditivos SRE/pagamentos/conteúdo, dosagem automática por SLI, BIops, auto-alerts e auto-rollback.
v4 (Networked Intelligence): modelos federativos (FL/DP), knowledge graph como um núcleo de recomendações e antifrode, vitrines interpartidárias e soluções conjuntas.
15) Resumo breve
Analista de ecossistema é semântica + fluxos + soluções. Normalize eventos e fórmulas, forneça stream/batch-pypline de qualidade, conduza um catálogo de métricas, use a Função Store e o gráfico de conhecimento, proteja a privacidade (DP/FL), gere versões e SLO. Vincule-se a tudo com a economia (Costa-to-Serve e ROY) - e sua rede de participantes vai aprender todos os dias e tomar decisões mais rápido que o mercado.