GH GambleHub

Məlumatların klasterləşdirilməsi

1) Niyə iGaming-platforma klasterləşdirilməsi

Etiketsiz personalizasiya: offerləri, limitləri, UX hədəfləmək üçün oyunçuları davranış baxımından qruplaşdırırıq.
Əməliyyatlar və risk: «nazik fayllar», qeyri-tipik ödəmə nümunələri, frod klasterləri aşkar.
Məhsul və məzmun: sevimli provayderlərə/mexaniklərə (crash/slots/live), həyat dövrlərinə görə seqmentlər.
Analitika və strateji daxilolmalar: bazarlarda/kampaniyalarda/mövsümlərdə qarışıq seqmentlər necə dəyişir.

2) Məlumatlar və işarə məkanı

2. 1 Mənbələr

Oyun davranışı: seansların tezliyi/uzunluğu, dərəcələr/dəq, dəyişkənlik, sevimli janrlar/provayderlər.
Ödənişlər: depozitlərin/çıxarışların tezliyi/məbləğləri, metodlar (Papara/PIX/kart), chargeback/sapmalar.
Marketinq/CRM: cəlb kanalları, bonuslar/kvestlərə reaksiya, push-cavablar.
Qurğular/platformalar: OS, versiyası, müştəri sabitliyi, şəbəkə növü.
RG/complayens: özünü istisna bayraqlar, limitlər, sapport (PII olmadan).

2. 2 Mühəndislik Fich

Pəncərələrə görə aqreqatlar: 7/28/90 gün; «aktiv gün üçün» norma.
Standartlaşdırma/robast skeylinq: z-score/robust-scaler (IQR), «uzun quyruqlar» üçün log skeylləri.
Kateqoriyalar → embeddinq/one-hot: provayderlər/kanallar/ölkələr.
Ölçü azaldılması: Səs-küy və vizuallaşdırma üçün PCA/UMAP, lakin şərh üçün «xam» vektoru saxlayın.
Zero-PII: identifikatorlar əvəzinə tokenlər şəxsi sahələri qadağan edir.

3) Alqoritmlər və onları nə vaxt almaq

k-means/Mini-Batch k-means - böyük məlumatlar üçün sürətli bazeline; kürə fərziyyəsi.
GMM - yumşaq mənsubiyyət (probabilities), «sərhəd» oyunçular üçün faydalıdır.
DBSCAN/HDBSCAN - ixtiyari formalı klasterlər və «səs-küy» (anomaliyalar) tapır; həssasdır 'eps'.
İerarxik (Ward/average) - «ağac» seqmentləri üçün dendroqramlar, orta N. yaxşı.
Spektral - qeyri-sferik klasterlər üçün; böyük N. yol.
SOM (Kohonen xəritələri) - davranış nümunələrinin interpretasiya olunan 2D xəritələri.
Qarışıq tiplər (mixed data): k-prototypes, k-modes, Gauer məsafə.

İpucu: Mini-Batch k-means (sürət) + HDBSCAN (səs-küy/anomaliyalar) ilə başlayın və sabitliyi müqayisə edin.

4) k seçmək və keyfiyyəti qiymətləndirmək üçün necə

Daxili metriklər: Silhouette (daha yüksək, daha yaxşı), Davies-Bouldin (aşağı - daha yaxşı), Calinski-Harabasz.
Sabitlik: Butstrep-samples, Rand Index/NMI bölünmələr arasında yenidən klasterləşdirilməsi.
Xarici etibarlılıq: KPI fərqliliyi (GGR/NET, saxlama, offer çevirmə, FPR).
Biznes şərhi: klasterlərin aydın profilləri və hərəkətləri olmalıdır. Əgər yoxdursa, fiçləri/miqyası/alqoritmi yenidən təyin edin.

5) Profillər və açıqlanabilirlik

Klaster profili: medianlar/kvantili fich, top oyunlar/provayderlər, cihazlar, ödəniş metodları, kanallar.
Populyasiyanın fərqi: p-nöqtələrdə/ Δ σ, «radar» ilə vizuallaşdırma.
Local explainers: Klasterlər arasındakı sərhədlər üçün SHAP/Permutation importance («Təlim olunmuş klassifikator» vasitəsilə cluster_id").
Klasterləri «High-rollers crash», «Bonus-hunters slots», «Casual weekend live» adlandırırıq.

6) Əməliyyat (online/offline)

Offline-klasterləşdirmə/həftədə bir dəfə → «pasport» seqmentlərinin nəşri.
Online atama: ən yaxın mərkəz (k-means), ehtimal (GMM), «səs-küy» (HDBSCAN) → fallback qaydaları.
Drift: PSI/KC-ni əsas fiş, klasterlər arasında miqrasiya, səs-küy tezliyi ilə izləyirik.
Həyat dövrü: hər 1-3 ayda bir reviziya; MAJOR formaları/normaları dəyişdirərkən.

7) İnteqrasiya və fəaliyyət

Personalizasiya: offerlər/tezlik limitləri, provayderlərin və turnir mexaniklərinin seçimi.
CRM/kanallar: push/email tezliyi, vaxt pəncərələri, dil/ton.
Marketinq: seqmentlər üzrə büdcə, yaradıcılıq, LTV proqnozu; «nudge» vs «value» strategiyası.
RG/risk: risk klasteri üçün yumşaq müdaxilələr, anomaliyalar üçün «əl» baxış.
Antifrod: atipik ödəniş yolları/cihazlar klasterləri → artırılmış skoring.

8) Gizlilik və uyğunluq

Hesabatların k-anonimliyi (kəsik başına minimum N obyekt).
Zero-PII Fich/Log/Dashboard, tokenizasiya; DSAR-token aradan qaldırılması.
Geo/tenant-izolyasiya: seqmentləri lisenziya bölgəsində öyrətmək/saxlamaq.
Fairness-check: həssas ölçmələr (ölkə/ödəmə metodu/cihaz) üçün fərqləri yoxlayın.
Istifadə: RG-klaster (siyasət) üçün «aqressiv» offerlər qadağandır.

9) Uğur metrikası

Əməliyyat: onlayn atributların payı <X ms, mərkəzlərin sabitliyi, miqrasiya/aşağı atributlar.
Biznes: offer dönüşüm uplift, seqmentlər ARPPU/LTV, antifrod FPR azaldılması, RG reaksiya sürəti.
Modelin keyfiyyəti: silhouette ↑, DB ↓, stability ↑, KPI-nin klasterlər arasında fərqliliyi.

10) Pipline (etalon)

Bronze → Silver → Gold → Serve

1. Ingest hadisələr/ödənişlər/cihazlar → təmizləmə/joyne.
2. Feature Store: vitrinlərin hesablanması (7/28/90d), standartlaşdırma, maskalar/tokenlər.
3. Dim-reduction (PCA/UMAP) vizualizasiya üçün (Serving üçün deyil).
4. Clustering (offline), metrik qiymətləndirmə, «pasport» generasiyası.
5. Online assignment API: ən yaxın mərkəz/ehtimal/» səs-küy».
6. Monitorinq: seqmentlər üzrə sürüklənmə, miqrasiya, «səs-küy» tezliyi, KPI.
7. Release: semver, shadow/canary, rollback; BI seqmentlər kataloqu.

11) Seqment nümunələri (iGaming)

Bonus-hunters slots: yüksək frispins/cashback payı, qısa sessiyalar, bir çox geri çəkilmə - yumşaq promo limitləri, şəffaf şərtlər.
Crash-risk takers: qısa intensiv sessiyalar, sürətli bahis artımı - tezlik limitləri/soyutma.
Live-social: canlı uzun axşam sessiyaları, sosial kampaniyalarda yüksək CTR - streams və live-eventlərin kurasiyası.
Thin-file newcomers: 1-2 depozit, az raundlar - xoş tutorial, KYC dəstəyi.
Anomaly-payments: cüzdan/metodların tez-tez dəyişdirilməsi, geo-sıçrayışlar - gücləndirilmiş antifrod.

12) Artefakt şablonları

12. 1 Seqment kataloqu (fraqment)

yaml version: 1. 4. 0 segments:
- id: s_high_roller_crash name: "High-rollers crash"
size_share: 0. 07 centroid:
stake_per_min_z: 2. 1 volatility_z: 1. 8 session_len_min: 6. 4 actions: ["limit_bet_growth","vip_care","rg_cooldown_soft"]
- id: s_bonus_hunter_slots name: "Bonus-hunters slots"
size_share: 0. 19 centroid:
bonus_usage_rate: 0. 63 withdraw_decline_rate: 0. 21 actions: ["clear_terms","frequency_cap","onboarding_quest"]

12. 2 Servinq siyasəti

yaml serving:
assigner: "nearest_centroid"  # or gmm_prob p95_latency_ms: 50 min_confidence: 0. 6 unknown_policy: "fallback_rules"
privacy:
pii_in_features: false min_group_size: 50 monitoring:
drift_psi_max: 0. 2 migration_rate_warn: 0. 25

12. 3 Klaster pasportu (BI)

yaml cluster_id: s_live_social share: 0. 23 kpi:
d30_retention: 0. 42 arppu: 27. 4 behavior:
sessions_evening_share: 0. 68 provider_top: ["Evolution","Pragmatic Live"]
crm:
push_ctr: 0. 11 promo_sensitivity: "medium"
rg_flags: ["cooldown_hint"]

13) Tətbiqi yol xəritəsi

0-30 gün (MVP)

1. Vitrinləri (7/28/90d) toplayın, standartlaşdırın, PII-ni kəsin.
2. 5-9 klasterdə Mini-Batch k-means + «səs-küy» üçün əsas HDBSCAN.
3. Klaster pasportu, onlayn assigner, miqrasiya/sürüşmə daşbordu.
4. İki product-eksperiment: seqment offerləri və topların tezliyi.

30-90 gün

1. yumşaq aksesuarlar üçün GMM; qarışıq növləri (k-prototypes).
2. N gün, shadow → canary hər dəfə auto-montaj; PSI/miqrasiya alert.
3. CRM/tövsiyəçi üçün Interpretability (SHAP kartları), seqmentlərin BI kataloqu və API.

3-6 ay

1. Geo/tenant-spesifik seqmentlər; cihazlar/ödənişlər qrafiki ilə birləşmə.
2. LTV planlaşdırma üçün uzunmüddətli kohortlar + keçid matrisləri (Markov).
3. Seqment səviyyəsində RG/AML siyasəti; məxfiliyin/etikanın xarici auditi.

14) Anti-nümunələr

Seçimi k «göz» və qiymətləndirilməsi yalnız silhouette heç bir iş yoxlamalar.
PII və davranış xüsusiyyətlərini qarışdırın; hesabatlarda k-anonimliyin olmaması.
No online assigner 'a → seqmentlər BI-də heç bir hərəkət olmadan «asılır».
Mövsüm/aksiya üçün yenidən təlim; miqrasiya monitorinqinin olmaması.
RG-gard qaydaları olmadan «aqressiv» marketinq üçün klasterlərdən istifadə.
Yerli xüsusiyyətləri olmayan bütün ölkələr/markalar üçün bir seqment.

15) RACI

Data Platform (R): vitrinlər fich, paypline, monitorinq, versiya reyestri.
Data Science (R): alqoritm seçimi, k/metrika, şərh.
Product/CRM (A): seqmentlər üzrə fəaliyyət, təcrübələr.
Risk/RG (C): «ağır» seqmentlər üçün məhdudiyyətlər və HITL siyasəti.
Security/DPO (A/R): gizlilik, tokenizasiya, k-anonimlik.
BI (C): Daşbordlar, kataloqlar, sənədləşmə.

16) Əlaqəli bölmələr

Seqmentləşdirilmiş hədəfləmə, Tövsiyə sistemləri, Oyunçuların profilləşdirilməsi, Qərəzin azaldılması, Performans bençmarkinqi, API analitikası və metrikası, MLOps: modellərin istismarı, Məlumatların etikası və şəffaflığı.

Yekun

Klasterləşdirmə sadəcə bir UMAP qrafiki deyil, istehsal alətidir: PII olmayan təmiz fiçlər, davamlı metriklər və aydın seqmentlərin «pasportları», onlayn-assigner və CRM/Product/RG fəaliyyətləri. Müntəzəm audit və dreyf monitorinqi ilə o, «davranış xaosunu» idarə olunan böyümə, təhlükəsizlik və məsuliyyət strategiyalarına çevirir.

Contact

Bizimlə əlaqə

Hər hansı sualınız və ya dəstək ehtiyacınız varsa — bizimlə əlaqə saxlayın.Həmişə köməyə hazırıq!

İnteqrasiyaya başla

Email — məcburidir. Telegram və ya WhatsApp — istəyə bağlıdır.

Adınız istəyə bağlı
Email istəyə bağlı
Mövzu istəyə bağlı
Mesaj istəyə bağlı
Telegram istəyə bağlı
@
Əgər Telegram daxil etsəniz — Email ilə yanaşı orada da cavab verəcəyik.
WhatsApp istəyə bağlı
Format: ölkə kodu + nömrə (məsələn, +994XXXXXXXXX).

Düyməyə basmaqla məlumatların işlənməsinə razılıq vermiş olursunuz.