Analityka międzysieciowa
(Sekcja: Ekosystem i sieć)
1) Czym jest analityka międzysieciowa i dlaczego jest potrzebna
Analiza międzysieciowa to metodologia i stos łączący telemetrię i zdarzenia z wielu łańcuchów, mostów, dostawców i aplikacji w jeden model danych. Cele:- Ujednolicona księgowość wartości i działalności: wolumeny, płynność, prowizje, zatrzymanie.
- Obserwowalność mostów i połączeń P2P: finalizacja, opóźnienia, reorg/challenge events.
- Przypisanie ruchu i konwersji: cheyn → cheyn, kanal → produkt.
- Ryzyko i zgodność: AML, sankcje, oszustwa behawioralne, identyfikacja podmiotu.
- Podejmowanie decyzji: OKR/budżety, limity, przepisy dotyczące aktualizacji i płynności.
2) Źródła i wydarzenia danych (wykaz kanoniczny)
1. Łańcuchy/rejestry: bloki, transakcje, dzienniki zdarzeń, stany inteligentnych umów.
2. Mosty: aplikacje, paragony, dowody (światło/optymistyczne/ZK), statusy finalizacji.
3. Dostawcy płatności/CCS: przechodzące kontrole, limity, statusy płatności.
4. Wydarzenia produktowe: pokład, depozyty/zakłady/wnioski, gry i metryki behawioralne.
5. Transport P2P: paragony Pub/Sub, sukces RPC, opóźnienie.
6. Książki referencyjne: sieci, aktywa, liczby dziesiętne, Id, adresy kontraktowe, wersje SDK.
3) Architektura danych (strumienie i magazynowanie)
Ingest (streaming): złącza do węzłów/indeksów, mostów webhooks, CDC z baz danych operacyjnych.
Surowy (brąz/surowiec): niezmienne partie oznaczone „observed _ at” metadanymi źródłowymi.
Oczyszczanie/normalizacja (srebro): dedup, wzbogacanie semantyczne, wyrównanie timezonu, odwzorowanie aktywów.
Modele jądra (Gold/Core): ujednolicone fakty 'transfery', 'mosty', 'onchain _ events', 'kyc _ status', 'wypłaty'.
Marts: finanse (GTV/TVL/Take Rate), produkt (retencja/lejki), ryzyko (punktacja), system operacyjny (SLO).
Cache/Serve: OLAP/HTAP dla desek rozdzielczych i interfejsów API oraz osobne wyszukiwanie adresów/tx.
Transport: Kafka/Pulsar (dokładnie raz semantyka nad idempotencją), przechowywanie obiektów do surowców, formaty parkietów/kolumn do analityki.
4) Finalizacja, reorgia i idempotencja
Stany zdarzeń są „obserwowane” → „potwierdzone (k)” → „sfinalizowane” → „unieważnione (reorg)”.
Reguła K-confirmations - Skonfigurowana według typu sieci/aktywów.
Optymistyczne/Wyzwanie okna: Wsparcie dla „zakwestionowanego” statusu dla mostów.
Idempotencja: 'idempotence _ key = Id' block 'tx' logIndex 'topic' (lub payload hash).
Powtórka: zaplanowane odzyskiwanie zasypki i zmiany indeksu.
5) Model restrukturyzacji i uporządkowanej likwidacji jednostki
Adres → Aktor: adresy, klucze, portfele, konto/organizacja/dostawca.
Wykres poprzeczny: relacje adresowe jednego właściciela (heurystyka, podpisy, dane pokładowe).
Poziomy ufności: hard-link (KYC, podpis łańcuchowy), soft-link (korelacje behawioralne).
Aliasing: Przechowywać stabilne identyfikatory (PID) zamiast PII w analityce.
6) Ujednolicony schemat zdarzeń (uproszczony)
yaml event:
id: string # global UUID observed_at: timestamp # when they saw chain_id: string # 'eth-mainnet', 'solana-mainnet',...
block_height: long tx_hash: string log_index: int event_type: string # transfer bridge. lock bridge. mint kyc. pass payout. done...
status: string # observed confirmed finalized invalid actor_src: string # address/peer-id/source organization actor_dst: string # address/peer-id/destination organization asset: string # canonical symbol (e. g., USDC), + decimals amount: decimal usd_value: decimal # rate normalization at the observed_at bridge_ref: string # link with the application/receipt of the metadata bridge: object # network/contract/version/gac/fee, etc.
idempotency_key: string
7) Normalizacja aktywów i cen
Kanoniczny katalog aktywów: symbol, przecinki, mapowanie łańcucha, adresy umów.
Normalizacja FX: stopy historyczne i ceny aktywów według „observed _ at” znacznika czasowego.
Pakiety wieloaktywne: Grupa „owinięta” i aktywa rodzime.
8) Kluczowe wskaźniki i prezentacje
8. 1 Finansowanie i płynność
GTV (wolumen transakcji brutto) przez sieci/aktywa/mosty.
TVL i Net Flow nad mostami i basenami.
Weź opłatę za stawkę/objętość; Cost-to-Serve do przeniesienia.
Wypłata SLA Hit Rate, Finalność p50/p95, Oczekujące zaległości.
8. 2 Produkt i użytkownik
Łańcuch krzyżowy MAU/DAU (dedup ма PID),
D1/D7/D30 zatrzymywania z uwzględnieniem działalności wielokołowej,
Lejek: sieć wejściowa → most → produkt docelowy → działanie.
QoT (jakość ruchu): walidacja ruchu po zwalczaniu oszustw.
8. 3 Ryzyko i zgodność
Oszustwo/Wskaźnik sporów, Wysoki wynik ryzyka%, Sankcje Hit%.
Wskaźnik anomalii według wzorców tłumaczeń, kontroli prędkości, klastrowania.
KYB/KYC Przechodzi% i terminy.
8. 4 System operacyjny i SLO
Wskaźnik sukcesu mostu, Finalność p95, Dostępność przekaźnika,
Wydarzenia Reorg/Challenge, Spłonął budżet błędu.
9) Przykłady zapytań SQL/Pseudo
GTV według par obwodów
sql
SELECT src. chain_id AS src_chain,
dst. chain_id AS dst_chain,
date_trunc('day', e. observed_at) AS d,
SUM(e. usd_value) AS gtv_usd
FROM events e
JOIN bridges b ON e. bridge_ref = b. id
JOIN networks src ON b. src_chain_id = src. id
JOIN networks dst ON b. dst_chain_id = dst. id
WHERE e. status = 'finalized' AND e. event_type IN ('bridge. lock','bridge. mint','transfer')
GROUP BY 1,2,3;
Retencja poprzeczna D7
sql
WITH first_touch AS (
SELECT pid, MIN(observed_at) AS t0
FROM product_events
WHERE event IN ('signup','first_deposit')
GROUP BY pid
),
week_activity AS (
SELECT DISTINCT pid
FROM product_events pe
JOIN first_touch ft USING(pid)
WHERE pe. observed_at BETWEEN ft.t0 + INTERVAL '1 day'
AND ft.t0 + INTERVAL '7 day'
)
SELECT 100. 0 COUNT() / (SELECT COUNT() FROM first_touch) AS d7_retention_pct
FROM week_activity;
Prezentacja mostu SLO
sql
SELECT date_trunc('hour', observed_at) AS h,
100. 0 SUM(CASE WHEN status='finalized' THEN 1 END)/COUNT() AS success_rate,
percentile_cont(0. 95) WITHIN GROUP (ORDER BY (finalized_at - observed_at)) AS p95_finality_min,
SUM(CASE WHEN challenge_event THEN 1 END) AS challenges
FROM bridge_events
WHERE observed_at >= now() - INTERVAL '7 days'
GROUP BY 1;
10) Przypisanie i ścieżka wielokanałowa
model last-touch/position-based z obciążnikami dla źródła sieci, mostu i produktu.
UTM → On-chain: powiązać kliknięcia/polecenia z adresem onchain podczas wsiadania (za zgodą).
Modele asocjacyjne: Shapley/Markov dla złożonego zestawu → większość → ścieżki produktów.
11) Antykonkurencyjne i behawioralne sygnały
Cechy wykresu: wspólni kontrahenci, transfery okrągłe, szybki obrót.
Ograniczenia prędkości i anomalie: wybuchy, „podział” ilości, skupiska nocne.
Systemy oszustw mostowych: resubmisja, próby obejścia KYC, schematy kanapek z płynnością.
Modele: zwiększenie gradientu/osadzanie wykresu; uczyć znakowania incydentów.
12) Prywatność i zgodność (prywatność z projektem)
Minimalizacja PII: PID zamiast identyfikatorów bezpośrednich, tokenizacja.
Rezydencja danych: podział według regionu, szyfrowanie „na spoczynku/na drodze”.
Prawo do usunięcia: nagrobek/zdarzenia z redakcją.
Dostęp i audyt: rola ACL, dzienniki odczytu, podpisane sprawozdania z kontroli.
13) SLI/SLO dla rurociągów analitycznych
SLI (przykład):- świeżość (mediana opóźnienia od 'observed _ at' do pojawienia się w Gold),
- Kompletność (% zdarzeń bez otworów zgodnie z oczekiwaniami K-confirmations),
- poprawność (% zdarzeń zatwierdzonych przez schematy/zasady),
- Sukces obsługi Reorg
- Obsługiwać opóźnienia (p95 żądania do sklepów/desek rozdzielczych).
- Świeżość p95 ≤ 3 min (strumieniowanie), ≤ 15 min (partia).
- Kompletność ≥ 99. 7%, prawidłowość ≥ 99. 9%.
- Skuteczność leczenia Reorg ≥ 99. 9%.
- Podawać p95 ≤ 500 ms (główne prezentacje).
14) Obserwowalność i rodowód
Rodowód danych: od deski rozdzielczej do zdarzenia surowego (poziom kolumny).
Sygnały jakości: kompletność, wyjątkowość, integralność odniesienia, dryfowanie schematu.
Wpisy: „ciche awarie” (brak nowych danych), skoki dystrybucyjne, wzrost 'nieznanych' pól.
15) Deski rozdzielcze (szablony)
A. Operacje krzyżowe (w czasie rzeczywistym/godzina):- Wskaźnik sukcesu, Finalność p95, Dostępność przekaźnika, Wyzwanie/Reorg, Zaległości, Spalić budżet błędu.
- TVL, przepływ netto na łańcuch, koszt na transfer, wykorzystanie, fundusz ubezpieczeniowy.
- MAU/DAU (dedup), retencja krzyżowa, lejki kanałowe, QoT.
- Oszustwo/Wskaźnik sporów, sankcje, udział wysokiego ryzyka, szybkość postępowania.
16) Przepisy operacyjne i playbook
Incydent: świeżość Opóźnienie> SLO
Sprawdź złącza/indeksery, przełączyć na kopię zapasową, włączyć tryb degradacji (prezentacje pokazują „ostatni finalizowany”), esskalować do właściciela źródła.
Incydent: reorg/challenge surge
Powiększyć K-potwierdzenia/okno sporu, włączyć „opóźnione finalizacji” dla dużych kwot, powiadomić mostek/operatorów.
Incydent Waluta/Rozbieżność aktywów
Zamrożenie dotkniętych par, wycofanie katalogu, ponowne obliczenie normalizacji USD, opublikowanie raportu.
Incydent: oszustwo/skok sporny
Dokręć limity/punktację, włącz ręczną ocenę wysokiego ryzyka, zakończ szkolenie modelu na świeżym wzorze.
17) Przykład konfiguracji (Pseudo-YAML)
Finalizacja okien według sieci
yaml finality:
eth-mainnet: 12 # блоков polygon: 256 solana: "optimistic: 32 slots"
optimistic-bridge: { challenge_minutes: 20 }
zk-bridge: { proof_time_sla: 180 }
Zasady idempotencji i deduplikacji
yaml dedup:
key_template: "${chain_id} ${block_height} ${tx_hash} ${log_index} ${event_type}"
ttl_hours: 48
Rurociąg SLO
yaml pipelines:
ingest_stream:
freshness_p95_min: 3 completeness_min_pct: 99. 7 gold_build:
correctness_min_pct: 99. 9 reorg_success_min_pct: 99. 9
18) Lista kontrolna wdrażania
1. Przechwytywanie źródeł, schematów, okien finalizacyjnych i właścicieli.
2. Włącz obsługę idempotencji i reorg (stan + powtórka).
3. Zbuduj jądro modeli (transfers/bridges/onchain_events/kyc/payouts).
4. Skonfiguruj katalogi aktywów i normalizację FX.
5. Zdefiniować rurociąg SLI/SLO i deski rozdzielcze.
6. Wdrożenie restrukturyzacji i uporządkowanej likwidacji podmiotów i indywidualnego projektowania prywatności.
7. Uwzględnij przepisy dotyczące oceny oszustw i incydentów.
8. Uruchom zasypkę i testy historycznych spraw reorg/challenge.
9. Regularnie przeglądaj schematy, masy metryczne i źródła.
19) Słownik
Finalność - nieodwracalność stanu/zdarzenia.
Reorg - ponowna instalacja łańcucha, prowadząca do anulowania części bloków.
Okres wyzwań - okno wyzwań w modelach optymistycznych.
Restrukturyzacja i uporządkowana likwidacja jednostek - odwzorowanie adresów/rachunków jednego podmiotu.
GTV/TVL - wolumen transakcji/wartość zablokowana.
Kompletność/świeżość/poprawność - podstawowe wskaźniki jakości danych.
Najważniejsze: analityka międzysieciowa to nie tylko podsumowanie metryki, ale dyscyplina możliwa do opanowania: jeden schemat wydarzeń, prawidłowa finalizacja, stabilne rurociągi, prywatność, przeciwdziałanie oszustwom i zrozumiałe prezentacje. Stosując się do tych ram, ekosystem zyskuje prawdziwie „end-to-end” pogląd na wartość, ryzyko i wzrost - od surowego bloku po rozwiązanie biznesowe.