GH GambleHub

Siatka danych: sfederowany model danych

(Sekcja: Technologia i infrastruktura)

Krótkie podsumowanie

Data Mesh jest modelem organizacyjnym i technicznym, w którym dane traktowane są jako produkty zespołów domen, a centralną rolą platformy jest zapewnienie samoobsługi, standardów i zgodności. W przypadku iGaming oznacza to: zespół Płatności jest właścicielem "Deposit Events" i "Net Deposits Mart', zespół Risk jest właścicielem" Fraud Signals ", Games posiada" Bet Events "i" Leaderboards ", a centralna platforma podaje katalog, programy umów, dostęp, monitorowanie jakości, finopy i narzędzia streaming/ELT.

1) Zasady siatki danych

1. Odpowiedzialność domeny: każda domena (Płatności, Ryzyko, Gry, KYC/Zgodność, CRM, Affiliate) jest właścicielem swoich zbiorów danych i ich cyklu życia.
2. Dane jako produkt: każdy zestaw posiada właściciela, opis, SLO, dostęp SLA, dokumentację, wersję, opinie i mapę drogową.
3. Platforma samoobsługowa: standardowe rurociągi ingest/transform/serve, szablony, domyślne zabezpieczenia, katalog i obserwowalność.
4. Sfederowane zarządzanie: wspólne standardy systemów, mierników, PII/lokalizacji i jakości - w centrum; wdrażanie i ewolucja - w domenach.

2) Model operacyjny i role

Właściciel produktu danych domeny (DPO): priorytetyzacja, SLO, zaległości w ulepszaniu produktu danych.
Domena Data Engineer/Analytics Engineer: schematy, rurociągi, testy DQ, wersioning.
Domain Steward: semantyka polowa, korespondencja do słownika metrycznego i klasyfikacji PII.
Zespół Platform: katalog, IAM/RBAC, Policy-as-Code, formaty tabeli (Delta/Iceberg/Hudi), orkiestra, obserwowalność, finops.
Federowana Rada Zarządzająca: zatwierdza standardy (systemy, mierniki, bezpieczeństwo), rozstrzyga spory międzysystemowe.

3) „Produkt danych” - paszport i artefakty

Minimalny skład produktu danych:
  • Umowa (schemat, rodzaje, ewolucja, zgodność).
  • Dostęp API (SQL/table, topic/stream, file/share).
  • SLA/SLO (świeżość, dostępność, jakość).
  • Testy DQ (wyjątkowość, zakresy, integralność odniesienia).
  • Dokumentacja (opis pól, przykłady wniosków, właściciel, kontakt).
  • Wersioning (semantyczne programy wersioning, polityka deprecate).
  • Zasady (PII, lokalizacja, retencja/TTL, prawa).

Szablon paszportu (YAML, przykład)

yaml name: bets. events. v1 domain: games owner: games-data@company interface:
sql: lakehouse. silver. bets_events stream: kafka://bets. events. v1 share: read-only (EU only)
schema_version: 1. 3. 0 slo:
freshness: "<= 5 min (p95)"
availability: ">= 99. 9%"
dq:
- unique: bet_id
- valid_values: currency in [EUR, USD, TRY, BRL]
- non_negative: [stake, payout]
security:
pii: false region: EU retention: 365d lineage:
sources: [game_engine. outbox, payments. psp. webhooks]
consumers: [crm. triggers, risk. realtime, dwh. fact_bets]
versioning:
compat: backward deprecation_policy: "60 days"

4) Interoperacyjność i normy

Programy/umowy: Avro/Protobuf/JSON-Schema + Schema Registry; polityka back-compat, bez zmiany bez nowej głównej wersji.
Warstwa semantyczna: ujednolicone definicje GGR, NGR, depozytów netto, LTV, kohort - jako kod (dbt metrics/semantic layer).
Identyfikatory: globalny 'player _ id',' lokator _ id', 'bet _ id', jednolity kraj/waluta/dostawca katalogów.
Metadane: wymagane kolumny 'ingest _ ts',' schema _ version ',' trace _ id', 'source', 'region'.
Dostęp: SQL (lakehouse/OLAP), stream (Kafka/Pulsar), table/snapshot sharing; format wymiany to Parkiet/Delta/Góra Lodowa.

5) Wzorzec referencyjny procesu (agnostyczny dla sprzedawców)

Połknięcie: Outbox/CDC II OLTP → Kafka → Lakehouse (Brąz).
Przekształcenie: ELT/dbt Б. Silver/Gold; przyrostowe „MERGE”, SCD, wyświetlacze materiałowe.
Podawać: OLAP (ClickHouse/Query/Snowflake), RT-двивка (Pinot/Druid) дла w czasie rzeczywistym.
Katalog/Lineage: jeden katalog, automatyczna dokumentacja, wykres zależności.
Obserwowalność: świeżość/metryka SLO, DQ-assert, opóźnienia strumieniowe, koszt.
Zasady: IAM/RBAC/ABAC, szyfrowanie, lokalizacja (routing danych strefy).

6) SLO/SLA dla produktów danych

Przykłady docelowych SLO:
  • Świeżość: Zakłady Zdarzenia (p95) ≤ 5 мий; Sygnały oszustwa ≤ 30 sekund; Depozyty netto Mart ≤ 15 min.
  • Dostępność: ≥ 99. 9% dla interfejsów odczytu.
  • Jakość: duplikaty ≤ 0. 01%, udział pustych wymaganych pól ≤ 0. 1%, spójność waluty 100%.
  • Koszt SLO: koszt skanów okiennych ≤ N $/dzień, mały stosunek plików <10%.

7) Bezpieczeństwo, PII i lokalizacja

Klasyfikacja: PII/wrażliwe finansowe/operacyjne.
Środki techniczne: szyfrowanie podczas odpoczynku/tranzytu; tokenizacja PII; kolumny maskujące; filtry poziomu wiersza przez 'lokator _ id'.
Lokalizacja: produkty domeny są publikowane w zatwierdzonych regionach (EU/TR/LATAM); podział transgraniczny - tylko jednostki bez PII.
Audyt: kto opublikował/czytał; Żądania eskalacji praw w wersji schematu - poprzez zatwierdzenie.

8) FinOps i zarządzanie wartością

Budżety według domeny: limity obliczeniowe, alerty overspend.
Przechowywanie: klasy przechowywania + TTL (Brąz krótki, Medium srebrne, Złoto długie/kruszywa).
Optymalizacja zapytań: partycje/klastrowanie, zmaterializowane widoki, buforowanie wyników BI.
Małe pliki: zagęszczenie/OPTYMALIZACJA polityk; Docelowy rozmiar pliku to 128-1024 MB.

9) Cykl życia i ewolucja

Wersioning: 'domena. produkt. v {major} '; niewielkie pola - back-compat.
Deprecate: powiadomienie konsumentów, okres „dwóch kolei”, automatyczne wpisy do starszych wersji.
Zmiany schematu: Pull Request do repozytorium kontraktowego; testy kompatybilności CI; AutoPublish do katalogu.
Informacje zwrotne: kanał produktu (tracker emisji), konsumencki NPS, czas reakcji incydentu.

10) Betonowanie dla iGaming - mapa domeny i produktu

Płatności

'płatności. psp. webhooks. v1 '(strumień)

"mart _ net _ deposits _ daily. v1 '(SQL) - świeżość SLO ≤ 15 minut; Wolny od PII

Gry

'zakłady. wydarzenia. v1 '(strumień/SQL) - p95 ≤ 5 min

'mart _ ggr _ dziennie. v1 '(SQL/MV) - agregaty według kraju/gry

Ryzyko/Zwalczanie nadużyć finansowych

"ryzyko. sygnały. v1 '(strumień) - p95 ≤ 30 sek

'risk. case_mgmt. v1 '(SQL) - Historia badania SCD2

CRM/Personalizacja

'crm. wyzwalacze. v1 '(strumień) - wyzwalacze segmentu

"profile. cechy. online. v1 '(KV/SQL) - funkcje online (TTL)

KYC/Zgodność

'kyc. status. v1 '(SQL) - Polityka PII chroniona, poziom wiersza

"Responsible _ gaming. wydarzenia. v1 '(strumień) - granice/sygnały

11) Procesy platformowe i artefakty

Katalog: wyszukiwanie według etykiet domeny/pól/PII, podgląd diagramów i przykładów.
Generatory szablonów: kuchenka do nowego produktu (paszport, CI, testy DQ, deska rozdzielcza SLO).
Kod polityki: zasady eksportu, PII, wymiana między regionami.
Obserwowalność: gotowe deski rozdzielcze: świeżość, błędy DQ, koszt, Lineage, Stream lag.
Książki startowe: incydenty świeżości/DQ/schematy, deprecate awaryjne, odwrócenie wersji.

12) Migracja do siatki danych (mapa drogowa)

1. Spis bieżących zbiorów danych → grupowanie według domeny.
2. Pilot 2-3 domeny (Płatności, Gry, Ryzyko) - wydanie jako produkty z paszportami.
3. Katalog i standardy: schematy, mierniki, PII/lokalizacja, DQ.
4. Samoobsługa: szablony rurociągów, CI/CD, monitorowanie SLO.
5. Cięcie monolitycznych prezentacji do wielkiego pieca; „dwusilnikowe” wsparcie dla starych interfejsów.
6. Sfederowana Rada - regularne sesje, przegląd zmian kontraktowych.
7. Skala do CRM/Affiliates/Marketing, a następnie Partner Share.

13) Lista kontrolna wdrażania

Zdefiniowane domeny; właściciele i kanały komunikacyjne są przypisane.
Katalog uruchomiony; paszport każdego produktu jest publikowany.
Schematy - w repozytorium kontraktowym; CI testów kompatybilności/DQ.
deklaracja SLO/SLA; Świeżość/DQ/Dostępne są deski rozdzielcze.
Polityka PII/lokalizacja - kod; włączony audyt.
FinOps: budżety, wpisy, koszt według raportu domeny.
Proces versioning/deposit - udokumentowany i zautomatyzowany.
Książki startowe incydentów - dostępne i przeszkolone (gra-day).

14) Antypattery

„Zmieniono nazwę siatki danych, ale wszystko przez centralne polecenie danych” - wąska szyja nie jest eliminowana.
Brak jednego słownika mierników → GGR/NGR różni się między domenami.
Programy bez umów i testów zgodności → „łamanie” zwolnień.
Brak Samoobsługi → każda tabela jest tworzona ręcznie, wysoki czas do danych.
Ignorowanie PII/lokalizacji w ramach podziału międzyregionalnego.
Mikro produkty bez właścicieli/SLO - „porzucone” dane.

15) Sukces siatki danych KPI

Czas-to-Data: od pomysłu do dostępnego produktu danych (mediana

Ponowne wykorzystanie: liczba domen konsumenckich na produkt.
Jakość: udział udanych kontroli DQ, wady na milion zdarzeń.
Niezawodność: zgodność SLO ze świeżością/dostępnością.
Koszt: $/request/user, udział małych plików, usuwanie obliczeń.
Szybkość zmian: obwód/sklepowe wydania tygodniowo.

Podsumowanie

Data Mesh jest nie tylko technologią, ale także zarządzaną federacją domen, gdzie dane są produktami z właścicielami, SLO, kontraktami i metrykami jakości. W iGaming podejście to usuwa wąskie szyje, przyspiesza integrację (przeciwdziałanie oszustwom, płatności, CRM), poprawia przejrzystość mierników (GGR/NGR/LTV) i kosztów kontroli. Zbuduj silną platformę samoobsługową, wprowadź standardy federacyjne i kulturę danych jako produktu, a Twój ekosystem analityczny skala z biznesem - bez utraty jakości, prędkości lub zgodności.

Contact

Skontaktuj się z nami

Napisz do nas w każdej sprawie — pytania, wsparcie, konsultacje.Zawsze jesteśmy gotowi pomóc!

Telegram
@Gamble_GC
Rozpocznij integrację

Email jest wymagany. Telegram lub WhatsApp są opcjonalne.

Twoje imię opcjonalne
Email opcjonalne
Temat opcjonalne
Wiadomość opcjonalne
Telegram opcjonalne
@
Jeśli podasz Telegram — odpowiemy także tam, oprócz emaila.
WhatsApp opcjonalne
Format: kod kraju i numer (np. +48XXXXXXXXX).

Klikając przycisk, wyrażasz zgodę na przetwarzanie swoich danych.