Analista entre cadeias
(Secção: Ecossistema e Rede)
1) O que é um analista entre cadeias e o que é necessário
A análise entre cadeias (cross-chain analytics) é uma metodologia e um stack que combinam telemetria e eventos de muitas correntes, pontes, provedores e aplicativos em um único modelo de dados. Objetivos:- Uma única contabilidade de valor e atividade: volume, liquidez, comissões, retenções.
- Observabilidade de pontes e conexões P2P: finalização, laje, reorg/desafio eventos.
- Atribuição de tráfego e conversões: cheyn→cheyn, kanal→produkt.
- Risco e complicação: AML, sanções, frod comportamental, identificação de entidades.
- Decisão: OKR/orçamentos, limites, regulamentos de atualização e liquidez.
2) Fontes de dados e eventos (lista canônica)
1. Cadeias/registros: blocos, transações, logs de eventos, estados de contratos inteligentes.
2. Pontes: inscrições, recibos, provas (light/optimístico/ZK), estatais de finalização.
3. Provedores de pagamento/CUS: verificações, limites, estatais de pagamento.
4. Eventos alimentares: onboarding, depósitos/apostas/conclusões, métricas de jogo e comportamento.
5. Transporte P2P: Pub/Sub recibos, sucesso RPC, latency.
6. Guias: redes, ativos, decimals, chainId, endereços de contrato, versões SDK.
3) Arquitetura de dados (fluxos e armazenamento)
Ingest (streaming): conectores de nodes/indexadores, webhooks pontes, CDC de banco de operações.
Camadas cruas (Bronze/Raw): Partições imutáveis com o rótulo «observed _ at» e metadados de origem.
Limpeza/Normalização (Silver): dedução, enriquecimento semântico, alinhamento de temporizão, mapping de ativos.
Modelos de núcleo (Gold/Core): factos unificados 'transfers', 'bridges', 'onchain _ events', 'kyc _ status', 'payouts'.
Vitrines (Marts): Finanças (GTV/TVL/Take Rate), Produto (Retensas/Vórtices), Risco, Operação (SLO).
Kesh/Serve: OLAP/HTAP para dashboards e API, e pesquisa separada em/tx.
Transporte: Kafka/Pulsar (exactly-once semantics acima da idempotação), armazenamento de objetos para matérias-primas, parquete/colinvertebrados para analistas.
4) Finalização, reorgues e idempotação
Estados de evento: 'observed' n' confirmed (k) 'n' finalized' n' invalidated (reorg) '.
Regra de confirmação (K-confirmações): configura a rede/tipo de ativo.
Optimistic/Challenge janelas: suporte ao status «contestável» para pontes.
Idempotidade: 'idempotency _ key = chainId'block'tx'logIndex'topic' (ou hash de carga útil).
Reprodução de pere (replay): backfill programado e restauração por mudança de indexador.
5) Modelo de identidade e entidade (entity resolution)
O endereço de Ator é endereços, chaves, carteiras, conta/organização/provedor.
Grafo de circuito cruzado: ligações de endereços por um único proprietário (evristas, assinaturas, dados onboards).
Níveis de confiança: hard-link (KYC, on-chain), soft-link (correlações comportamentais).
Pseudônimo: guarde os ID (PID) estáveis em vez de PII no analista.
6) Esquema de evento unificado (simplificado)
yaml event:
id: string # global UUID observed_at: timestamp # when they saw chain_id: string # 'eth-mainnet', 'solana-mainnet',...
block_height: long tx_hash: string log_index: int event_type: string # transfer bridge. lock bridge. mint kyc. pass payout. done...
status: string # observed confirmed finalized invalid actor_src: string # address/peer-id/source organization actor_dst: string # address/peer-id/destination organization asset: string # canonical symbol (e. g., USDC), + decimals amount: decimal usd_value: decimal # rate normalization at the observed_at bridge_ref: string # link with the application/receipt of the metadata bridge: object # network/contract/version/gac/fee, etc.
idempotency_key: string
7) Normalização de ativos e preços
Guia de ativos canônicos: símbolo, decimals, chain maping, endereços de contrato.
FX normalização: cursos históricos e preços de ativos por tempo 'observed _ at'.
Gangles multi-ativos: Agrupe os bens «embrulhados» e nativos.
8) Métricas-chave e vitrines
8. 1 Finanças e liquidez
GTV (Gross Transmissão Volume) em redes/ativos/pontes.
TVL e Net Flow por pontes e pool.
Take Rate/comissão por volume; Costa-to-Serve para transferência.
Payout SLA Hit Rate, Finality p50/p95, Pending Backlog.
8. 2 Produto e usuário
Cross-chain MAU/DAU (dedup по PID),
Retenção D1/D7/D30, tendo em conta a actividade multifacetada,
Funtel: rede de entrada → ponte → produto de destino → ação.
QoT (Qualidade do Tráfego): vale de tráfego após o anti-Frod.
8. 3 Risco e Complacência
Fraud/Dispute Rate, High-Risk Score%, Sanctions Hit%.
Anataly rate por pattern traduções, cheque velocity, clustering.
KYB/KYC Pass% e timing.
8. 4 Operacionalização e SLO
Bridge Success-Rate, p95 Finality, Relay Availability,
Reorg/Challenge events, Error budget burn.
9) Exemplos de SQL/pseudo-pedidos
GTV por pares de cadeia
sql
SELECT src. chain_id AS src_chain,
dst. chain_id AS dst_chain,
date_trunc('day', e. observed_at) AS d,
SUM(e. usd_value) AS gtv_usd
FROM events e
JOIN bridges b ON e. bridge_ref = b. id
JOIN networks src ON b. src_chain_id = src. id
JOIN networks dst ON b. dst_chain_id = dst. id
WHERE e. status = 'finalized' AND e. event_type IN ('bridge. lock','bridge. mint','transfer')
GROUP BY 1,2,3;
Cross-chain retention D7
sql
WITH first_touch AS (
SELECT pid, MIN(observed_at) AS t0
FROM product_events
WHERE event IN ('signup','first_deposit')
GROUP BY pid
),
week_activity AS (
SELECT DISTINCT pid
FROM product_events pe
JOIN first_touch ft USING(pid)
WHERE pe. observed_at BETWEEN ft.t0 + INTERVAL '1 day'
AND ft.t0 + INTERVAL '7 day'
)
SELECT 100. 0 COUNT() / (SELECT COUNT() FROM first_touch) AS d7_retention_pct
FROM week_activity;
Vitrine para ponte SLO
sql
SELECT date_trunc('hour', observed_at) AS h,
100. 0 SUM(CASE WHEN status='finalized' THEN 1 END)/COUNT() AS success_rate,
percentile_cont(0. 95) WITHIN GROUP (ORDER BY (finalized_at - observed_at)) AS p95_finality_min,
SUM(CASE WHEN challenge_event THEN 1 END) AS challenges
FROM bridge_events
WHERE observed_at >= now() - INTERVAL '7 days'
GROUP BY 1;
10) Atribuição e caminho multi-canal
Modelo last-touch/posição-based com balanças para a fonte de rede, ponte e produto.
UTM→On -chain: Vincule cliques/refilmagens a um endereço onchain em uma linha (com consentimento).
Modelos associativos: Shapley/Markov para caminhos complexos «set→most→produkt».
11) Anti-frod e sinais comportamentais
Sinais gráficos: contrapartidas compartilhadas, traduções circulares, rotação rápida.
Limites Velocity e anomalias: picos, «fragmentação» de quantias, clusters noturnos.
Esquemas de fraude em pontes, reaproveitamento, tentativas de contornar KYC, sanduíches com liquidez.
Modelos: busting gradiente/graph-embeddings; ensinem na marcação de incidentes.
12) Privacidade e complacência (privacidade-by-design)
PII Minimização: PID em vez de identificadores diretos, toquenização.
Data residency: partilhamento por região, criptografia em paz/viagem.
Direito de eliminação: tombstone/redação evento comprovável.
Acesso e auditoria: LCA de papel, registros de leitura, relatórios de verificação assinados.
13) SLI/SLO para piplins analíticos
SLI (exemplo):- Freshness (mediana da laje de 'observed _ at' antes de aparecer no Gold),
- Completeness (% dos eventos sem buracos nas expectativas de K-confirmações),
- Cortestness (% dos eventos validados por esquemas/regras),
- Reorg handling sucess (% de inválidos/revezamentos corretos),
- Serve latency (p95 pedidos de vitrines/dashboards).
- Freshness p95 ≤ 3 min (streaming), ≤ 15 min (batch).
- Completeness ≥ 99. 7%, Correctness ≥ 99. 9%.
- Reorg handling success ≥ 99. 9%.
- Serve p95 ≤ 500 ms (vitrines principais).
14) Observabilidade de dados e lineage
Data Lineage: de dashbord a um evento cru (column-level).
Sinais de qualidade: completeness, uniqueness, referencial integrity, schema draft.
Alerts: «falhas silenciosas» (sem dados novos), corridas de distribuição, «unknown» estender campos.
15) Dashboards (modelos)
A. Cross-Chain Ops (real tempo/hora):- Success-Rate, p95 Finality, Relay Availability, Challenge/Reorg, backlog, error budget burn.
- TVL, Net Flow per chain, cost-per-transfer, utilization, fundo de seguros.
- MAU/DAU (dedup), cross-chain retence, vórtices de canal, QoT.
- Fraud/Dispute Rate, santions hits, high-risk share, velocidade de julgamento.
16) Regulamentos operacionais e playbook
Incidente: liga de frescura> SLO
Verificar conectores/indexadores, mudar para reserva, incluir modo degradado (as vitrines mostram «último finalizado»), eskalate ao dono da fonte.
Incidente: Surga/challenge
Aumentar K-confirmações/janela de disputa, ativar «delayed finalization» para grandes quantias, notificar ponte/operadores.
Incidente: divergência de divisas/ativos
Congelar os pares afetados, reverter o guia, redefinir a normalização USD e publicar o relatório.
Incidente: salto Fraud/Dispute
Endurecer os limites/mapeamento, incluir o revezamento de mão high-risk, ensinar o modelo no pattern recente.
17) Exemplo de configuração (pseudo-YAML)
Janelas de finalização em redes
yaml finality:
eth-mainnet: 12 # блоков polygon: 256 solana: "optimistic: 32 slots"
optimistic-bridge: { challenge_minutes: 20 }
zk-bridge: { proof_time_sla: 180 }
Regras de Idempotação e Dedução
yaml dedup:
key_template: "${chain_id} ${block_height} ${tx_hash} ${log_index} ${event_type}"
ttl_hours: 48
SLO piplins
yaml pipelines:
ingest_stream:
freshness_p95_min: 3 completeness_min_pct: 99. 7 gold_build:
correctness_min_pct: 99. 9 reorg_success_min_pct: 99. 9
18) Folha de cheque de implementação
1. Capture fontes, esquemas, janelas de finalização e proprietários.
2. Inclua Idempotidade e reorg-handling (states + replay).
3. Construa um núcleo de modelos (transfers/bridges/onchain _ events/kyc/payouts).
4. Configure as guias de ativos e a normalização FX.
5. Defina os piplins SLI/SLO e os dashboards.
6. Implemente entity resolution e private-by-design.
7. Inclua os registos anti-frod e regulamentos de incidentes.
8. Faça backfill e testes em maletas históricas reorg/challenge.
9. Reveja regularmente os circuitos, o peso das métricas e as fontes.
19) Glossário
Finality - irreversibilidade de estado/evento.
Reorg é um cruzamento de cadeia que leva à anulação de parte dos blocos.
Challenge period é uma janela de contestação em modelos optimísticos.
Entity resolution - Mapeamento de endereços/contas de uma única entidade.
GTV/TVL - volume de transações/valor bloqueado.
Completeness/Freshness/Corttness - métricas básicas de qualidade de dados.
O resultado é que o analista entre cadeias não é apenas um resumo de métricas, mas uma disciplina controlada, como um único padrão de eventos, finalização correta, pipas sustentáveis, privacidade, anti-frod e vitrines compreensíveis. Seguindo este quadro, o ecossistema tem uma visão verdadeiramente «transversal» sobre o valor, os riscos e o crescimento, desde o bloco cru até a solução de negócios.