GH GambleHub

同步分析数据

1)为什么生态系统需要同步分析

该网络汇集了运营商,工作室/RGS,附属机构,PSP/APM,KYC/AML提供商和媒体。要看到一个单一的画面(漏斗CR→FTD→ARPU/LTV,RG/合规性,SLO运输,财务/RevShare),生态系统需要电路和橱窗之间的规范,及时和可证明的数据同步-没有"两个真理",具有明显的变化历史和成本控制。


2)本体和数据合同

Сущности: `eventId`, `traceId`, `participantId`, `role` (operator/studio/affiliate/psp/kyc/stream), `jurisdiction`, `brandId`, `campaignId`, `apmRouteId`, `gameId`, `tableId`, `currency`, `schemaVersion`, `formulaVersion`.

规范事件(最低):
  • `click`, `session_start`, `registration`, `kyc_status`, `deposit`, `ftd`, `bet/spin`, `reward_granted`, `withdrawal`, `postback_sent/received`, `rg_guardrail_hit`, `stream_sli`.

Data Contracts:

Schema Registry中的方案(semver,字段兼容性);

业主,聚合窗口,SLA的新鲜度和完整性;

错误策略(nullable/存根)、参考书(货币、本地、RTP配置文件)。

Metric Store:公式版本(GGR/NetRev/CR/ARPU/LTV, K因素)、其所有者和加入日期-公式始终在报告中踢。


3)时间语义和窗口

Event Time vs Processing Time:聚合必须基于事件的时间而不是处理时间。
Watermarks:控制"后期"事件;多普利姆策略(例如T+24 h)。
窗口:滑动/日历,重新计票时装载。
延迟作为度量:每个店面发布"ingest_lag"和"publish_lag"。


4)传输和同步模式

1.CDC/流媒体(real time):

事件总线(EDA),通过"traceId/participantId"分组;

通过消费者和身体哈希的相等性,"正好是意义上的一次";

受监督的拓扑:原始事件,归一化,聚合/甲骨文。

2.Batch/microbatch:

带有游标分页的增量上载(时间/日志游标);

格式:带电路的Parquet/Avro;政党宣言。

3.API/webhooks:

带有光标和"Idempotency-Key"的"/vN/事件";

webhooks签名(JWS/HMAC),重播注册表,backoff+jitter。

4.Asset-sink:

参考书/locales/游戏目录作为验证的乐队(哈希,TTL)。


5)异位,去世和后期事件

Idempotency-Key和身体散布在关键路径(付款/后备箱)上。
重复数据消除:窗口± 5分钟/水上公园;存储"可见"哈希。
后期事件:upsert/倒计时政策;changelog店面。
从商业意义上讲,Exactly-once:我们不需要"经纪人的魔力",我们要求消费者的偶然性和电路的确定性。


6)归属和公式的一致性

归因:最后可触及的规则,通过渠道/司法管辖区的窗口,跨字节-仅通过令牌(没有粗糙的PDn)。
度量公式:每个条目都指的是"formulaVersion";MAJOR更改发布为"data_formula_change"事件。
根据规则Backfill:如果公式发生变化,则允许在过渡期(冷冻时期)双重发布(旧/新)。


7)数据质量: SLI/SLO和构象测试

SLI数据质量:
  • 新鲜(publish_lag p95),
  • 完整性(事件比例vs基准),
  • 唯一性(重复比例),
  • 一致性(货币/地方/ID),
  • 精度(校验和/甲骨文),
  • 时间线性(走廊中的晚期事件)。
SLO(地标):
  • publish_lag p95 ≤ 1-5 s(操作面板),≤ 15分钟(吹风机)。聚合物);
  • 完整性≥ 99。T+15分钟5%,99 ≥。T+24 h中的9%;
  • 副本≤ 0。1‰;与甲骨文的差异≤ 0。1–0.3%.

配对测试:电路,必填字段,参考书,webhook签名,游标上载而无需通过。


8)线性,审计和甲骨文

线性:从店面/行车记录仪到主集(电路/版本/所有者)。
WORM审核:不变模式/公式/键/异常日志。
甲骨文(签名摘要):GGR/NetRev/SLO/RG带有"formulaVersion","hash(inputs)","kid","traceId"是发票和上诉的真相来源。
试用"跟踪包":SLA 60-90,用于P1/P2事件。


9)隐私,本地化和安全

PII最小化:"playerId"标记化,禁用Logs/店面中的 PDn,仅在保险箱区域进行分解。
本地化:司法管辖区地图(我们存储/处理数据类别)。
零信托:mTLS,短寿命令牌,egress-allow-list,键轮换/JWKS。

ABAC/ReBAC/SoD: 访问"看到它自己和一致";"我衡量≠影响≠改变。"


10)财务重组和结算

Net Revenue佳能(简化):
[
NetRev = GGR - BonusCost - Jackpot/PoolShare - PaymentFees - Chargebacks - Tax/Levy - FraudLosses
]
对账:
  • 游标卸载,"ors"(签名单元),校验和;
  • 发票状态,差异行为和SLA分析;
  • FX规则,NET7/14/30,丘陵和klau后退。

11)管理同步成本

基数策略:禁止标签中的"userId"/原始 URL;允许使用"routeId/campaignId"。
Downsampling/roll-ups: 1с→1м→5м;RAW数据寿命短,聚合时间长。
自适应跟踪采样:错误/慢路径/新版本的基本百分比+优先级。
SLO-first:仅收集支持解决方桉的内容(SLO/财务/RG)。


12)同步的达什伯德

Data Sync Overview: publish_lag、完整性、双重性、后期成本、计划漂移、构象错误。
Attribution Health:后卫的及时性、后卫窗口、有争议的桉例。
财务/Oracle:与甲骨文的聚合差异,发票状态。
Jurisdiction Map:定位/PDn流,遵守DPA/DPIA。


13)操作,事件,RCA

Alerts: burn-rate按新鲜/完整性计算,电路漂移,重复激增。
战争室:现成的总线/webhook/CDC/店面花花公子;用于聚合/公式的停止按钮。

RCA"没有找到罪魁祸首": fakt→gipoteza→eksperiment→vyvod→deystviye;post-mortem SLO.


14)反模式

关于指标/公式和入学日期的"两个真理"。
负荷下的历史分区(仅光标)。
博客/店面中的原始PDn;没有令牌化。
一个没有签名的后卫动物园,→双打/洞。
在聚合中混合事件/处理时间。
没有后期事件的水上市场和政策。
手动匹配(Excel/手动卸载)而不是甲骨文。
具有无限标签基数的单个大表。


15)支票单

设计

  • 本体论,Schema Registry,所有者,参考书。
[] Metric Store с `formulaVersion` и frozen-period для MAJOR.
  • 时间语义(event time, watermarks),后期事件策略。
  • 运输:EDA/CDC,具有签名的API/webhooks,光标,等效性。
  • 数据质量SLI/SLO,配对测试,Alertes。
[] Privacy/Localization (DPIA/DPA), Zero Trust, ABAC/ReBAC/SoD.
  • 甲骨文和重构规则。

开始运行

  • 沙盒和负载/混沌轮胎/店面运行。
  • 加那利同步1%→5%→25%→50%→100%与guardrails。
  • Dashbords publish_lag/completeness/duplicates/drift。
  • 公式和加入日期的文档;release-notes `data_formula_change`.

运营活动

  • DQ每周报告;SLO/guardrails修订。
  • 每月的方案/公式/访问范围。
  • 经纪人/经纪人/陈列柜的常规DR/xaoc。

16)成熟度路线图

v1(基金会):单个电路,基本CDC/butch,游标器,DQ-SLI,手动恢复。

v2 (Integration): watermarks和后期事件策略,oracula, dashboards, auto-retrai with jitter.

v3 (Automation):预测性新鲜/完整性监测,智能重新定位,自动重新索引,自适应采样。
v4(网络治理):网络间甲骨文/质量信号交换、DAO公式规则和透明国库。


17)成功指标

数据质量:publish_lag p95, completeness%, duplicate ‰, late%, schema drift rate。
统一性:记录为"formulaVersion"的报告比例,无事件的MAJOR数。
财务:与甲骨文的差异,自动回收的份额,争议性<X%。
操作:MTTD/MTTR同步事件,自动足迹/滚动比例。
合规性:0 PDn泄漏,成功的DPIA/DPA验证,100% WORM登录可用性。
可观察性经济学:rps/事件上的成本到同步,遵守基数。


简短的摘要

同步分析数据不是复制表格,而是信任和时间协议:方案和公式的规范,与水厂的事件时间,游标和偶数,后期和后期事件,DQ-SLO和甲骨文,隐私和本地化。遵循这一框架,生态系统将获得单一、新鲜和可证明的分析,这是快速解决方桉、诚实计算和可扩展网络增长的基础。

Contact

联系我们

如需任何咨询或支持,请随时联系我们。我们随时准备提供帮助!

开始集成

Email — 必填。Telegram 或 WhatsApp — 可选

您的姓名 可选
Email 可选
主题 可选
消息内容 可选
Telegram 可选
@
如果填写 Telegram,我们也会在 Telegram 回复您。
WhatsApp 可选
格式:+国家代码 + 号码(例如:+86XXXXXXXXX)。

点击按钮即表示您同意数据处理。