GH GambleHub

數據聚類

1)為什麼聚類iGaming平臺

無標簽個性化:按行為對玩家進行分組,以定位offers, limits, UX。
操作和風險:我們識別出「精細文件」、非典型支付模式、欺詐集群。
產品和內容:按最喜歡的提供商/機械師(crash/slots/live),生命周期劃分的細分市場。
分析和戰略洞察力:按市場/活動/季節劃分的細分市場如何變化。

2)數據和特征空間

2.1個來源

遊戲行為:會話頻率/長度,投註/分鐘,波動,最喜歡的類型/提供商。
付款:存款/收款頻率/金額、方法(Papara/PIX/carta)、存款/差額。
營銷/CRM:吸引渠道,對獎金/任務的反應,推桿反應。
設備/平臺:OS、版本、客戶端穩定性、網絡類型。
RG/合規性:自我排斥標誌,限制,轉向sapport(無PII)。

2.2 Engineering Fich

按窗戶分列:7/28/90天;我們按活動日進行配給。
標準化/robast滑板:z-score/robust-scaler(IQR),「長尾巴」的日誌滑板。
類別→ embedding/one-hot:提供商/頻道/國家/地區。
維度還原:用於噪聲和可視化的PCA/UMAP,但要存儲「原始」向量以進行解釋。
Zero-PII:代幣而不是標識符,禁止個人字段。

3)算法以及何時使用

k-means/Mini-Batch k-means是用於大數據的快速基礎;球形假設。
GMM是軟隸屬關系(probilities),對「邊緣」玩家有用。
DBSCAN/HDBSCAN-找到任意形狀的群集和「噪聲」(異常);對「eps」敏感。
分層(Ward/average)是段的「樹」的樹狀程序,平均值為N。
光譜-用於非球形簇。通往大N的道路。
SOM(Kohonen卡)是行為模式的可解釋的2D卡。
混合類型(混合數據):k-prototypes,k-modes,Gower距離。

提示:從Mini-Batch k-means(速度)+HDBSCAN(噪音/異常)開始,比較穩定性。

4)如何選擇k和質量評估

內部度量標準是:Silhouette(越高,越好),Davies-Bouldin(更低-更好),Calinski-Harabasz。
穩定性:重新聚類在開銷樣本,蘭德索引/NMI分區之間。
外部有效性:集群之間的KPI(GGR/NET,保留,offer轉換,FPR)可辨別性。
業務解釋:群集必須具有清晰的配置文件和操作。如果沒有-重新定義字節/比率/算法。

5)概況和可解釋

群集配置文件:中位數/分位數,頂級遊戲/提供商,設備,支付方法,渠道。
人口差異:在p點/Δ中σ,「雷達」成像。
本地解釋器:SHAP/Permutation importance用於集群之間的邊界(通過訓練有素的分類器"cluster_id")。
稱集群:「High-rollers crash」,「Bonus-hunters slots」,「Casual weekend live」。

6)運營(在線/離線)

每天/每周一次離線聚類→發布「護照」片段。
在線分配:最近的中心(k-means),概率(GMM),「噪聲」(HDBSCAN)→後退規則。
漂移:監視PSI/KC的關鍵故障、群集之間的遷移、「噪聲」頻率。
生命周期:每1-3個月審計;MAJOR在改變飲食/配給時。

7)集成和行動

個性化:offers/頻率限制,供應商選擇和錦標賽機械師。
CRM/通道:槍聲/回聲頻率,時間窗口,語言/音調。
市場營銷:按部門分列的預算,創意,LTV預測;「nudge」 vs 「value」策略。
RG/風險:風險集群的軟幹預,異常的「手動」審查。
Antifrod:非典型支付途徑/配額集群→得分增加。

8)隱私和合規性

報告的k匿名(每個切片至少N對象)。
Fichy/Logs/dashbords中的Zero-PII,令牌化;代幣上的DSAR刪除。
Geo/tenant隔離:在許可證區域中培訓/存儲數據段。
公平支票:檢查敏感度量的差異(國家/支付方法/設備)。
使用:禁止RG集群(政策)的「侵略性」離岸外包。

9)成功指標

運營:在線歸因比例<X毫秒,中心穩定性,遷移/歸屬不足。
業務:uplift offers轉化,ARPPU/LTV按細分市場,FPR反氟化物降低,RG反應速率。
模型質量:silhouette ↑,DB ↓,穩定性↑,群集之間的KPI可辨別性。

10)管道(基準)

Bronze → Silver → Gold → Serve

1.Ingest事件/付款/設備→清潔/喬伊納。
2.功能商店:店面計算(7/28/90d),標準化,口罩/令牌。
3.用於可視化(不用於伺服器)的Dim-reduction(PCA/UMAP)。
4.聚類(離線),度量得分,「護照」的生成。
5.Online Assignment API:最近的中心/概率/」噪音」。
6.監視:漂移,遷移,「噪音」頻率,KPI跨段。
7.Release: semver, shadow/canary, rollback;BI中的段目錄。

11)細分市場示例(iGaming)

Bonus-hunters slots:高比率frispin/Cash Back,短會話,很多輸出故障-軟促銷限制,透明條件。
Crash-risk takers:短暫的密集會話,快速加息-頻率限制/冷卻。
實時社交:長時間的夜間直播會議,高的CTR社交活動-策劃流和喜歡的活動。
Thin-file newcomers:1-2存款,很少回合-歡迎圖托裏亞爾,支持KYC。
Anomaly-payments:經常更換錢包/方法,地質賽馬是一種增強的防凍劑。

12)工件模板

12.1片段目錄(片段)

yaml version: 1. 4. 0 segments:
- id: s_high_roller_crash name: "High-rollers crash"
size_share: 0. 07 centroid:
stake_per_min_z: 2. 1 volatility_z: 1. 8 session_len_min: 6. 4 actions: ["limit_bet_growth","vip_care","rg_cooldown_soft"]
- id: s_bonus_hunter_slots name: "Bonus-hunters slots"
size_share: 0. 19 centroid:
bonus_usage_rate: 0. 63 withdraw_decline_rate: 0. 21 actions: ["clear_terms","frequency_cap","onboarding_quest"]

12.2瀏覽政策

yaml serving:
assigner: "nearest_centroid"  # or gmm_prob p95_latency_ms: 50 min_confidence: 0. 6 unknown_policy: "fallback_rules"
privacy:
pii_in_features: false min_group_size: 50 monitoring:
drift_psi_max: 0. 2 migration_rate_warn: 0. 25

12.3集群護照(BI)

yaml cluster_id: s_live_social share: 0. 23 kpi:
d30_retention: 0. 42 arppu: 27. 4 behavior:
sessions_evening_share: 0. 68 provider_top: ["Evolution","Pragmatic Live"]
crm:
push_ctr: 0. 11 promo_sensitivity: "medium"
rg_flags: ["cooldown_hint"]

13)實施路線圖

0-30天(MVP)

1.收集店面(7/28/90d),標準化,切斷PII。
2.5-9群集上的Mini-Batch k-means+用於「噪音」的基本HDBSCAN。
3.集群護照,在線助手,dashboard遷移/漂移。
4.兩個產品實驗是:分段離頻器和槍支頻率。

30-90天

1.GMM用於軟附件;混合類型(k-prototypes)。
2.在N日,影子→金絲雀中重新裝配一次;PSI/遷移警報。
3.可解釋性(SHAP卡),段的BI目錄和CRM/推薦者的 API。

3-6個月

1.Geo/Tenant特定片段;與設備/付款圖合並。
2.LTV規劃的長期隊列+過渡矩陣(Markov)。
3.段級別的RG/AML策略;對隱私/道德的外部審計。

14)反模式

選擇k「眼睛」和僅評分silhouette而無需業務檢查。
PII和行為幻想的混合;報告中缺少k匿名性。
沒有在線助手→ BI中的「掛起」片段沒有動作。
季節/促銷活動的再培訓;缺乏對遷移的監測。
使用集群進行沒有RG加爾達規則的「激進」營銷。
一組針對所有國家/品牌的細分市場,沒有本地功能。

15) RACI

數據平臺(R):幻燈片店面、管道、監控、版本註冊。
數據科學(R):選擇算法,k/度量,解釋。
產品/CRM (A):分段操作,實驗。
風險/RG (C):限制政策和「重」細分市場的HITL。
安全/DPO(A/R):隱私,令牌化,k匿名。
BI (C): dashbords、目錄、文檔。

16)相關部分

分段定位,推薦系統,玩家分析,減少偏見,性能基準,分析和度量API,MLOps:模型操作,數據倫理和透明度。

底線

聚類不僅是UMAP圖形,而且是制造工具:沒有PII的純仙女,可持續的度量標準和可理解的「護照」細分,在線助手以及CRM/產品/RG中的動作。通過定期審核和監測漂移,它將「行為混亂」轉變為可管理的增長,安全和責任策略。

Contact

與我們聯繫

如有任何問題或支援需求,歡迎隨時聯絡我們。我們隨時樂意提供協助!

開始整合

Email 為 必填。Telegram 或 WhatsApp 為 選填

您的姓名 選填
Email 選填
主旨 選填
訊息內容 選填
Telegram 選填
@
若您填寫 Telegram,我們將在 Email 之外,同步於 Telegram 回覆您。
WhatsApp 選填
格式:國碼 + 電話號碼(例如:+886XXXXXXXXX)。

按下此按鈕即表示您同意我們處理您的資料。