Treino de máquina em iGaming

1) Malas de negócios e valor

Produto/rendimento: previsão LTV, churn (saída), propensidade de depósito/compra, missões dinâmicas/buscas, next-best-action/offer.
Marketing/CRM: look-alike, segmentação, real-time desencadeadores, otimização de bônus (ABO - Abuse-resistant Bónus Optimization).
Risco/Complaens: antifrod/AML (velocity, estruturação, indícios gráficos), Sorriso Gaming (RG) - risco-scor, desencadeadores de intervenção.
Operações/SRE: previsão de incidentes, capacity/traffic forecasting, anomalias dos provedores.
Finanças: previsão GGR/NGR, sensibilidade fx, detecção de manipulação de contêineres.

Indicações de efeito: + 3-7% para Net Revenue através da personalização, - 20-40% para fraud-loss, - 10-25% para churn, SLA resposta RG <5 s para online.

2) Dados e sinais (Função Engenharia)

Fontes: gamplay, pagamentos/PSP, autenticação, dispositivos/ASN/geo, RG/KYC/KYB, UTM de marketing, logs de provedor, safort/texto.

Fichas básicas:

Janelas comportamentais: N taxas/depósitos e valores de 10 min/hora/dia, recency/frequency/monetary.
Sequências: cadeias de jogos, tempo com última atividade, sinais de sessão.
Geo/dispositivo: país/mercado, ASN, tipo device/navegador.
Gráficos: ligações jogador-cartão-dispositivo-IP, componentes/central (fraud rings).
Contextuais: hora do dia/dia da semana/feriado do mercado, provedor/gênero/jogo volátil.
RG/AML: limites, auto-exclusões, bandeiras de screening, RR/sanções (por meio de dinheiro/asinhrão).

Recomendações:

Normalize as moedas e o tempo (UTC + mercado local).
Historize as medidas (SCD II).
Alinhar transformações on-line/offline (código único na Função Store).

3) Arquitetura: offline ↔ online

3. 1 Traçado offline

Lakehouse: Bronze→Silver (normalização/enriquecimento) →Gold (datasets).
Função Store (offline): maiúsculas de fórmulas fic, point-in-time join, materialização de amostras de treinamento.
Treinamento: contêineres com dependências fixas; experimentos de rastreamento (métricas/artefatos/dados).
Validação: k-fold/temporal split, backtest, avaliação off-policy.

3. 2 Circuito online

Ingest → Stream Processing: Flink/Spark/Beam com janelas/watermarks, idempotidade.
Função Store (online): dinheiro de baixo nível (Redis/Scylla) + moldes offline.
Serving: REST/gRPC de endpoint, grafo de escrutínio, routing AB, canários.
Vitrine real-time: ClickHouse/Pinot para painéis/regras.

4) Modelos e abordagens típicas

Classificação/registro: churn/depósito/frod/RG (LogReg, XGBoost/LightGBM, TabNet, CatBoost).
Classificação/recomendação: faturamento/folha-ranging (LambdaMART), seq2rec (RNN/Transformers), bandidos contextuais.
Anomalias: Isolation Forest, One-Class SVM, AutoEncoder, Prophet/TSfresh para filas de tempo.
Gráficos, Node2Vec/GraphSAGE/GNN para anéis de fraude.
Causalidade (causal): modelos uplift, T-learner/X-learner, DoWhy/CausalML.
NLP/ASR: tíquetes/bate-papos, classificação de queixas, sentment, temas.

5) Métricas de qualidade

Classificação: ROC-AUC/PR-AUC, Fórmula nas liminares operacionais, expected cost (FP/FN ponderado), KS para o escrutínio de risco.
Recomendações: NDCG @ K, MAP @ K, coverage/diversity, CTR/CVR online.
TS/Forecast: MAPE/SMAPE, WAPE, P50/P90 erro, cobertura PI.
RG/AML: precisão/recall com SLA, médio time-to-intervene.
Economia: uplift em Net Revenue, fraud saved, campanhas ROY,% bónus.

6) Avaliação e experiências

Offline: temporal split, backtest por semanas/mercados/tenentes.
Online: A/B/n, CUPED/diff-in-diff, tests sequential.
Off-policy: IPS/DR. para políticas de personalização.
Stat. potência: cálculo do tamanho da amostra com dispersão e MDE.

Exemplo de limite de custo (pseudocode):

python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)

7) Privacidade, ética, complacência

Minimização PII: pseudônimos, isolamento de muppings, CLS/RLS.
Residência: caminhos separados EEA/UK/BR; sem join's cruzado regional sem base.
DSAR/PTBF: remoção/redação em fichas e logs; Legal Hold para maletas/relatórios.
Fairness/preconceito: auditoria de fichas, disparate impact, controle de variáveis proxy.
Expainability: SHAP/função importance, cartões de modelo (owner, data, dados, métricas, riscos).
Segurança: KMS/CMK, segredos fora dos logs, arquivos de lançamento WORM.

8) MLOps: ciclo de vida

1. Data & Featuras: esquemas/contratos, regras DQ (completeness/uniqueness/range/temporal), lineage.
2. Treinamento, contêineres, autopeças, trekking de experiências.
3. Validação: testes de compatibilidade de circuito, bias/fairness, testes de performance.
4. Lançamento (CI/CD/CT): lançamentos de canais/escalonados, bandeiras de fique, «lançamento escuro».
5. Serving: skeiling automático, cachê, gRPC/REST, timeouts/retrai.
6. Monitoramento: à deriva de dados/previsões (PSI/KL), latency p95, error-rate, coverage, "silent metrics'.
7. Re-train: planificação/desencadeamento à deriva/degradação das métricas.
8. Incidentes: runbook, retrocesso de modelo, fallback (regra/modelo simples).

9) Função Store (núcleo de coerência)

Off-line: point-in-time computação, anti-leakage, versão da fórmula Fiech.
Online: baixa latência (≤ 10-30 ms), TTL, coerência com offline.
Contratos: nome/descrição, proprietário, SLA, fórmula, testes de conformidade online/offline.

Exemplo de especificação de fichas (YAML):

yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5

10) Mapeamento em linha e regras

Híbrido ML + Rulas: modelo → screen + explicações; regras - hard-guard/ética/lei.
Firmware: CEP-pattern (estruturing/velocity/device switch) + mapeamento ML.
SLA: p95-t-end de 50-150 ms para personalização, ≤ 2-5 s para alertas RG/AML.

Pseudo-código de routagem:

python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))

11) Dados para treinamento: amostras e editoras

Janelas de evento: t0 - Árbitro, t0 + editora (depósito/preto/frod).
Controle Leakage: point-in-time join, excluindo eventos futuros.
Balanço: rateio/peso das classes, focal loss para classes raras.
Ética: excluir atributos sensíveis/proxy, controlar a influência.

12) Economia e produtividade

Custo do fic: Leia a costa/função e a costa/request, e evite pesados online-join's.
Fios quentes em RAM, frios em lazy.
Materialização: agregação offline; online apenas crítica.
Quotas: limites para réplicas, battestes nas janelas do tempo; chargeback por comandos.

13) Exemplos de SQL/pseudo-código

Point-in-time amostra para churn (30 dias de silêncio):

sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;

Janela de depósito online (Flink SQL, 10 min):

sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);

14) Mapa de trânsito de implementação

MVP (4-6 semanas):

1. Catálogo de sinais e Função Store v1 (5-10 fies para Payments/Gamplay).

2. Modelo de base churn/depósito (XGBoost) + A/B para 10 a 20% do tráfego.

3. Serving online com dinheiro (p95 <150 ms) e lançamentos canários.

4. Monitoramento à deriva/qualidade, cartão modelo, revezamento runbook.

Fase 2 (6-12 semanas):

Screens RG/AML, sinais gráficos, real-time desencadeadores.
Modelos Uplift para bônus, bandidos contextuais, avaliação off-policy.
Auto-re-trein à deriva/calendário, automação da documentação.

Fase 3 (12-20 semanas):

Personalização do catálogo de jogos (seq2rec), otimização multi-objetiva (renda/responsabilidade).
Cervingo multi-regional, SLAs/quotas, chargeback por fichas/inferência.
Auditoria Fairness e testes de estresse, doutor-exercício e repositórios de lançamentos WORM.

15) RACI

R (Resolvível): MLOps (plataforma/serving), Data Science (modelos/experimentos), Data Eng (fichas/piplines).
A (Accountable): Head of Data / CDO.
C (Consulted): Compliance/DPO (PII/RG/AML/DSAR), Security (KMS/segredos), SRE (SLO/custo), Finance (efeito/ROY), Legal.
I (Informed): Produto/Marketing/Operações/Suporte.

16) Folha de cheque antes de vender

Os fichas estão alinhados online/offline e os testes de reaproveitabilidade foram concluídos.
O cartão do modelo (owner, dados, métricas, riscos, fairness) está completo.
Lançamento de canário/fichflag; SLA e alertas latency/erros/deriva.
As políticas PII/DSAR/PTBF/Legal Hold foram cumpridas; Os logs são impessoais.
Runbook incidentes/reversão; estratégia fallback.
As experiências foram formalizadas (hipóteses, métricas, duração, MDE).
O custo da inferência e do fic estão incluídos no orçamento; quotas e limites estão incluídos.

17) Anti-pattern

Discrepância online/offline fic → inoperabilidade.
APIs externas sincronizadas em «caminho quente» sem cachês ou temporizadores.
Fórmulas de métricas opacas/falta de cartões de modelo.
Reaproveitamento/deriva sem monitoramento e treinamento.
PII em análise e treinamento sem CLS/RLS/Minimização.
«Um grande modelo para tudo» sem descomposição de domínio.

18) Total

O ML no iGaming não é um conjunto de modelos «mágicos», mas uma disciplina: dados e fici alinhados, treinamento offline reproduzível, servining online confiável, MLOps rigoroso, métricas transparentes e ética/complacência. Seguindo este manual, você vai construir um sistema que aumenta a renda e a retenção de forma estável, reduz os riscos e cumpre as exigências regulatórias - em escala, rápida e previsível.

Treino de máquina em iGaming

Entrar em contacto

Contacto rápido

O vídeo será atualizado em breve

Estamos atualmente muito ocupados com projetos