GH GambleHub

同步分析數據

1)為什麼生態系統需要同步分析

該網絡匯集了運營商,工作室/RGS,附屬機構,PSP/APM,KYC/AML提供商和媒體。要看到一個單一的畫面(漏鬥CR→FTD→ARPU/LTV,RG/合規性,SLO運輸,財務/RevShare),生態系統需要電路和櫥窗之間的規範,及時和可證明的數據同步-沒有「兩個真理」,具有明顯的變化歷史和成本控制。


2)本體和數據合同

Сущности: `eventId`, `traceId`, `participantId`, `role` (operator/studio/affiliate/psp/kyc/stream), `jurisdiction`, `brandId`, `campaignId`, `apmRouteId`, `gameId`, `tableId`, `currency`, `schemaVersion`, `formulaVersion`.

規範事件(最低):
  • `click`, `session_start`, `registration`, `kyc_status`, `deposit`, `ftd`, `bet/spin`, `reward_granted`, `withdrawal`, `postback_sent/received`, `rg_guardrail_hit`, `stream_sli`.

Data Contracts:

Schema Registry中的方案(semver,字段兼容性);

業主,聚合窗口,SLA的新鮮度和完整性;

錯誤策略(nullable/存根)、參考書(貨幣、本地、RTP配置文件)。

Metric Store:公式版本(GGR/NetRev/CR/ARPU/LTV, K因素)、其所有者和加入日期-公式始終在報告中踢。


3)時間語義和窗口

Event Time vs Processing Time:聚合必須基於事件的時間而不是處理時間。
Watermarks:控制「後期」事件;多普利姆策略(例如T+24 h)。
窗口:滑動/日歷,重新計票時裝載。
延遲作為度量:每個店面發布「ingest_lag」和「publish_lag」。


4)傳輸和同步模式

1.CDC/流媒體(real time):

事件總線(EDA),通過「traceId/participantId」分組;

通過消費者和身體哈希的相等性,「正好是意義上的一次」;

受監督的拓撲:原始事件,歸一化,聚合/甲骨文。

2.Batch/microbatch:

帶有遊標分頁的增量上載(時間/日誌遊標);

格式:帶電路的Parquet/Avro;政黨宣言。

3.API/webhooks:

帶有光標和「Idempotency-Key」的「/vN/事件」;

webhooks簽名(JWS/HMAC),重播註冊表,backoff+jitter。

4.Asset-sink:

參考書/locales/遊戲目錄作為驗證的樂隊(哈希,TTL)。


5)異位,去世和後期事件

Idempotency-Key和身體散布在關鍵路徑(付款/後備箱)上。
重復數據消除:窗口± 5分鐘/水上公園;存儲「可見」哈希。
後期事件:upsert/倒計時政策;changelog店面。
從商業意義上講,Exactly-once:我們不需要「經紀人的魔力」,我們要求消費者的偶然性和電路的確定性。


6)歸屬和公式的一致性

歸因:最後可觸及的規則,通過渠道/司法管轄區的窗口,跨字節-僅通過令牌(沒有粗糙的PDn)。
度量公式:每個條目都指的是「formulaVersion」;MAJOR更改發布為「data_formula_change」事件。
根據規則Backfill:如果公式發生變化,則允許在過渡期(冷凍時期)雙重發布(舊/新)。


7)數據質量: SLI/SLO和構象測試

SLI數據質量:
  • 新鮮(publish_lag p95),
  • 完整性(事件比例vs基準),
  • 唯一性(重復比例),
  • 一致性(貨幣/地方/ID),
  • 精度(校驗和/甲骨文),
  • 時間線性(走廊中的晚期事件)。
SLO(地標):
  • publish_lag p95 ≤ 1-5 s(操作面板),≤ 15分鐘(吹風機)。聚合物);
  • 完整性≥ 99。T+15分鐘5%,99 ≥。T+24 h中的9%;
  • 副本≤ 0。1‰;與甲骨文的差異≤ 0。1–0.3%.

配對測試:電路,必填字段,參考書,webhook簽名,遊標上載而無需通過。


8)線性,審計和甲骨文

線性:從店面/行車記錄儀到主集(電路/版本/所有者)。
WORM審核:不變模式/公式/鍵/異常日誌。
甲骨文(簽名摘要):GGR/NetRev/SLO/RG帶有「formulaVersion」,「hash(inputs)」,「kid」,「traceId」是發票和上訴的真相來源。
試用「跟蹤包」:SLA 60-90,用於P1/P2事件。


9)隱私,本地化和安全

PII最小化:「playerId」標記化,禁用Logs/店面中的 PDn,僅在保險箱區域進行分解。
本地化:司法管轄區地圖(我們存儲/處理數據類別)。
零信托:mTLS,短壽命令牌,egress-allow-list,鍵輪換/JWKS。

ABAC/ReBAC/SoD: 訪問「看到它自己和一致」;「我衡量≠影響≠改變。」


10)財務重組和結算

Net Revenue佳能(簡化):
[
NetRev = GGR - BonusCost - Jackpot/PoolShare - PaymentFees - Chargebacks - Tax/Levy - FraudLosses
]
對賬:
  • 遊標卸載,「ors」(簽名單元),校驗和;
  • 發票狀態,差異行為和SLA分析;
  • FX規則,NET7/14/30,丘陵和klau後退。

11)管理同步成本

基數策略:禁止標簽中的「userId」/原始 URL;允許使用「routeId/campaignId」。
Downsampling/roll-ups: 1с→1м→5м;RAW數據壽命短,聚合時間長。
自適應跟蹤采樣:錯誤/慢路徑/新版本的基本百分比+優先級。
SLO-first:僅收集支持解決方案的內容(SLO/財務/RG)。


12)同步的達什伯德

Data Sync Overview: publish_lag、完整性、雙重性、後期成本、計劃漂移、構象錯誤。
Attribution Health:後衛的及時性、後衛窗口、有爭議的案例。
財務/Oracle:與甲骨文的聚合差異,發票狀態。
Jurisdiction Map:定位/PDn流,遵守DPA/DPIA。


13)操作,事件,RCA

Alerts: burn-rate按新鮮/完整性計算,電路漂移,重復激增。
戰爭室:現成的總線/webhook/CDC/店面花花公子;用於聚合/公式的停止按鈕。

RCA「沒有找到罪魁禍首」: fakt→gipoteza→eksperiment→vyvod→deystviye;post-mortem SLO.


14)反模式

關於指標/公式和入學日期的「兩個真理」。
負荷下的歷史分區(僅光標)。
博客/店面中的原始PDn;沒有令牌化。
一個沒有簽名的後衛動物園,→雙打/洞。
在聚合中混合事件/處理時間。
沒有後期事件的水上市場和政策。
手動匹配(Excel/手動卸載)而不是甲骨文。
具有無限標簽基數的單個大表。


15)支票單

設計

  • 本體論,Schema Registry,所有者,參考書。
[] Metric Store с `formulaVersion` и frozen-period для MAJOR.
  • 時間語義(event time, watermarks),後期事件策略。
  • 運輸:EDA/CDC,具有簽名的API/webhooks,光標,等效性。
  • 數據質量SLI/SLO,配對測試,Alertes。
[] Privacy/Localization (DPIA/DPA), Zero Trust, ABAC/ReBAC/SoD.
  • 甲骨文和重構規則。

開始運行

  • 沙盒和負載/混沌輪胎/店面運行。
  • 加那利同步1%→5%→25%→50%→100%與guardrails。
  • Dashbords publish_lag/completeness/duplicates/drift。
  • 公式和加入日期的文檔;release-notes `data_formula_change`.

運營活動

  • DQ每周報告;SLO/guardrails修訂。
  • 每月的方案/公式/訪問範圍。
  • 經紀人/經紀人/陳列櫃的常規DR/xaoc。

16)成熟度路線圖

v1(基金會):單個電路,基本CDC/butch,遊標器,DQ-SLI,手動恢復。

v2 (Integration): watermarks和後期事件策略,oracula, dashboards, auto-retrai with jitter.

v3 (Automation):預測性新鮮/完整性監測,智能重新定位,自動重新索引,自適應采樣。
v4(網絡治理):網絡間甲骨文/質量信號交換、DAO公式規則和透明國庫。


17)成功指標

數據質量:publish_lag p95, completeness%, duplicate ‰, late%, schema drift rate。
統一性:記錄為「formulaVersion」的報告比例,無事件的MAJOR數。
財務:與甲骨文的差異,自動回收的份額,爭議性<X%。
操作:MTTD/MTTR同步事件,自動足跡/滾動比例。
合規性:0 PDn泄漏,成功的DPIA/DPA驗證,100% WORM登錄可用性。
可觀察性經濟學:rps/事件上的成本到同步,遵守基數。


簡短的摘要

同步分析數據不是復制表格,而是信任和時間協議:方案和公式的規範,與水廠的事件時間,遊標和偶數,後期和後期事件,DQ-SLO和甲骨文,隱私和本地化。遵循這一框架,生態系統將獲得單一、新鮮和可證明的分析,這是快速解決方案、誠實計算和可擴展網絡增長的基礎。

Contact

與我們聯繫

如有任何問題或支援需求,歡迎隨時聯絡我們。我們隨時樂意提供協助!

開始整合

Email 為 必填。Telegram 或 WhatsApp 為 選填

您的姓名 選填
Email 選填
主旨 選填
訊息內容 選填
Telegram 選填
@
若您填寫 Telegram,我們將在 Email 之外,同步於 Telegram 回覆您。
WhatsApp 選填
格式:國碼 + 電話號碼(例如:+886XXXXXXXXX)。

按下此按鈕即表示您同意我們處理您的資料。