GH GambleHub

度量體系結構

度量體系結構

度量體系結構是一個規則,工件和服務系統,可在整個組織中提供明確的定義,可復制的計算,透明的訪問和可靠的指標操作。目的是使「MAU」,「Retention D30」或「ARPPU」在所有行車記錄,實驗和報告中都被視為相同。

1)原則

1.公式和手冊的單一真相來源(單一真相來源)。
2.語義與實現分離:業務定義生活在語義層而不是每個SQL/筆記本電腦中。
3.帶有歷史遷移控制的指標,方案和公式(v1→v2)的轉換。
4.可重復性和可測試性:計算是確定性的,由測試覆蓋。
5.可觀察性:新鮮,飽滿,一致性和漂移-具有SLO和Alert。
6.安全性和私有性:最小化PII,RLS/CLS,審核。
7.操作作為代碼:定義、轉換、策略-在CI/CD存儲庫中。

2)體系結構層

原始數據:事件/事務,參考書,模型邏輯/infra。
集成和清理:CDC/增量加載,去除,統一臨時區域。
數據模型(DWH):恒星/雪花,緩慢變化的測量(SCD),代理密鑰。
語義層度量:單一定義、聚合、過濾器、時間表、滾動邏輯。
設計層:batch/microbatch/流;窗戶,水印,按鍵去除。
目錄和詞典:「指標護照」,線性,所有者,權利。
訪問和消耗:BI/dashbords,API指標,卸載,實驗/AV。

3)數據合同和指標

來源合同(事件/表)

方案:字段,類型,零彈性,主鍵。
SLA:新鮮(例如「≤10分鐘放電」),頻率,最大延遲教區。
質量:鍵的唯一性,有效的值域,時區,等效性。
更改:模式演變策略(backward/forward),執行計劃。

指標合同

名稱/代碼: 「RET_D30_v2」

Domein/所有者: 產品分析

定義(人文語言)

公式: SQL/偽代碼+輸入店面/語義對象

粒度/時間邏輯: 每天/每周;時間點規則,時間區

默認分段/過濾器

單位和貨幣(匯率/轉換日期)

SLO: 新鮮≤ X,精度≥ Y,可用性≥ Z

版本/更改歷史記錄/加入日期

Guardrails: 允許的範圍,p1/p99 vinzorization規則

4)語義層度量

圖層任務集中存儲聚合定義和規則:
  • 元素:測量(日期,國家,平臺),事實(事件,revenue),度量(ARPU,Retention D 30),可計算字段,日歷(奴隸/周末,假期)。
  • 時間行為:日歷表,滯後,隊列,「滾動」窗口(7/30/90)。
  • Rollup和一致性:每天的總和=一個月,同時排除雙重核算(distinct users)。
  • Mix-adjustment:正常化為誠實YoY的永久渠道/國家組合。
  • 多種貨幣/時差:在交易日帶到基本貨幣;本地和「規範」UTC切片。

5)計算: butch、microbatch、stream

Butch:每晚/每小時的喬巴舞,完整/增量重新計票,等速控制。
Microbatch:操作行車記錄儀的窗口1-15分鐘。
流:通過輪胎的事件;窗口(tumbling/sliding/session)、水標簽(late data)、單詞語義(按+offset store鍵排序)。

窗戶模式:
  • 用於操作KPI的「HOP 5m,WINDOW 1h」;
  • 日間指標的「TUMBLE 1d」;
  • 會議的「SESSION 30 m」。

6)質量和可驗證性

數據測試:示意圖、域(範圍)、參考關系。
度量測試:不變量(DAU≤MAU),非空段,單調性期望(累積性)。
對賬(重新計算):語義層和參考報告/會計之間。
數據健康:新鮮,完整,復制,空值,異常跳躍。
漂移度量:關鍵峰上的PSI/KL/JS,尤其是ML度量。

7)驗證和遷移

公式版本:「METRIC_NAME_vN」。禁止在不更改版本的情況下悄悄更改定義。

遷移策略:
  • 側面:v1和v2被認為是平行的;對用戶進行核對和培訓。
  • 切斷:在低負載窗口中將消費者切換到v2;存檔v1。
  • 重新計算歷史:根據歷史數據重新計算歷史;差值協議(diff報告)。
  • 通訊:changelog,進入日期,誰會受到影響,說明。

8)度量數據模型

事實:谷物(event_id,transaction_id,user_day),事件時間,總和/數量。
測量:用戶,設備,地理,通道,產品,日歷;SCD類型用於歷史性。

密鑰: 代理ID,穩定的業務密鑰,對應表(映射).

反配對:身份規則(user merge),會話的「滑動」窗口。

9)單位,貨幣,季節性

單位/格式:顯式單位,四舍五入,量表(日誌/線性)。
Multivaluta:在操作日按路線轉換;保存「原始」和標準化金額。
季節性:YoY和季節性指數;單獨的「節日」效果。

10)安全和訪問

Row-Level Security (RLS):訪問國家/品牌/合作夥伴的度量標準。
Column-Level Security (CLS):掩蓋PII/財務領域。
審計:誰要求一個指標,哪些過濾器,哪些數據導出。
API區分:「按角色分組」vs「詳細上載」。

11)可觀察性和SLO

SLO新鮮: 例如,「運行KPI-Lag ≤ 15分鐘,每天-直到當地時間06:00。」

SLO可用性:≥ 99。API/語義層為 9%。
Alerts: SLO延遲,指標跳躍,NULL/重復增長, v1 vs v2> X%差異。
Runbooks:降級時該怎麼做-RCA步驟,fallback(例如,切換到最後一個有效的「快照度量」)。

12)實驗和指標

Guardrail度量:潛在性,容錯性,FPR/FNR得分。
A/B的統一定義:轉換,保留,NSM-通過相同的語義層。
最小可區分效應(MDE),電力分析:將參數存儲在度量卡中。
Causal歸屬:混合調整和對照組的策略。

13) API指標和消費

Запросы: `GET /metrics/{name}?from=2025-09-01&to=2025-10-01&dims=country,platform&filters=channel:paid`.

策略:限制,緩存,分離,等效的「出口」。
版本:標題「X-Metric-Version: v2」,deprecation警告。

14)模板和工件

指標護照(示例)

代碼/版本: 「ARPPU_v3」

定義: 期間每個付費用戶的平均收入

Формула: `sum(revenue_net) / count_distinct(user_id where paying_flag=1)`

粒度: 一天;滾動:周/月=分子總和/分母總和

資料來源: 'fact_payments_v2','dim_users_scd'

單位: 貨幣「base_ccy」;日期的匯率轉換

默認過濾器: 活動市場,排除測試交易

SLO: 新鮮≤ 1小時;API可用性≥ 99。9%

Guardrails: ARPPU ∈ [0;10 000];vinzorization p1/p99

所有者: Monetization Analytics;審計日期:2025-10-01

查看指標發布列表

  • 定義和公式一致,包含在測試中
  • 創建語義對象;lineage已記錄
  • Backfill和裁判員對賬完成
  • SLO/Alertes定制;runbook準備就緒
  • 權利和RLS設置;隱藏的PII
  • 在dashbords/實驗中替換了舊版本
  • Changelog/通信發送

SQL偽代碼點對點(Retention D30示例)

sql
WITH cohort AS (
SELECT user_id, MIN(event_date) AS signup_date
FROM fact_events
WHERE event_type = 'signup'
GROUP BY 1
),
activity AS (
SELECT user_id, event_date
FROM fact_events
WHERE event_type = 'app_open'
),
ret AS (
SELECT c. signup_date,
COUNT(DISTINCT CASE WHEN a. event_date = c. signup_date + INTERVAL '30 day' THEN a. user_id END) AS returned,
COUNT(DISTINCT c. user_id) AS cohort_size
FROM cohort c
LEFT JOIN activity a
ON a. user_id = c. user_id
AND a. event_date BETWEEN c. signup_date AND c. signup_date + INTERVAL '30 day'
GROUP BY 1
)
SELECT signup_date, returned / cohort_size AS retention_d30
FROM ret;

15)頻繁的錯誤以及如何避免錯誤

安靜的公式編輯:始終通過版本和changelog。
「在每個筆記本電腦中以不同的方式」的度量標準:強制執行語義層/API。
不一致的時間段/貨幣:中央日歷和FX表。
雙重用戶核算:滾動規則和唯一密鑰。
不透明的新鮮度:清晰顯示變量/更新時間。
依賴一個工程師:一切都像代碼,有咆哮和腫瘤。

底線

度量體系結構是詞典+語義層+可靠計算+hovernance和SLO。按照所描述的原則(合同,測試,版本,可觀察性,安全性),您將度量標準從「數字爭議」轉變為可持續的產品和業務管理機制。

Contact

與我們聯繫

如有任何問題或支援需求,歡迎隨時聯絡我們。我們隨時樂意提供協助!

開始整合

Email 為 必填。Telegram 或 WhatsApp 為 選填

您的姓名 選填
Email 選填
主旨 選填
訊息內容 選填
Telegram 選填
@
若您填寫 Telegram,我們將在 Email 之外,同步於 Telegram 回覆您。
WhatsApp 選填
格式:國碼 + 電話號碼(例如:+886XXXXXXXXX)。

按下此按鈕即表示您同意我們處理您的資料。