Məlumatların seqmentləşdirilməsi
Məlumat seqmentasiyası
Seqmentasiya bir çox obyektin (istifadəçilər, əməliyyatlar, məhsullar, hadisələr) hədəfləmə, fərdiləşdirmə, təhlil və risklərin idarə edilməsi üçün homojen qruplara bölünməsidir. Yaxşı seqmentasiya marjinallığı artırır, xərcləri azaldır və qərarları başa düşülən edir.
1) Məqsədlər və tamaşalar
Marketinq və böyümə: kişiselleştirilmiş offerlər, əlaqə tezliyi, anti-spam siyasəti.
Monetizasiya: qiymət ayrıseçkiliyi, bandllar, VIP xidmət.
Risk və uyğunluq: nəzarət səviyyələri, KYC/AML tetikləyiciləri, şübhəli nümunələrin hesablanması.
Məhsul və təcrübə: ssenari, məzmun/oyun tövsiyələri, dinamik limitlər.
Əməliyyatlar: dəstəyin prioritetləşdirilməsi, limitlərin və kvotaların bölüşdürülməsi.
Seqmentasiya vahidini (istifadəçi/sessiya/satıcı), üfüqi (7/30/90 gün), yenidən hesablama tezliyini (onlayn/gündəlik/həftəlik) və hədəf KPI-ləri formalaşdırırıq.
2) Seqmentlərin taksonomiyası
Demoqrafiya/geo: ölkə, dil, platforma.
Davranış: fəaliyyət, tezlik, dərinlik, günün vaxtı, sevimli kateqoriyalar.
Dəyər (value-based): ARPU/ARPPU, LTV-kvantillər, marjinallıq.
Mərhələ: onbording, yetkin, «yuxu», geri.
RFM: Recency, Frequency, Monetary binaları/kvantilləri ilə.
Kohort: qeydiyyat tarixi/ilk ödəniş/mənbə.
Risk seqmentləri: chargeback-risk, bonus-abuse-risk, anormal fəaliyyət.
Həyat dövrü: propensity-to-churn, propensity-to-buy, next-best-action.
Kontekst: cihaz/kanal/regional qaydalar.
3) Məlumat və hazırlıq
Point-in-time düzgünlük: əlamətlər mövcud «keçmiş» hesab olunur.
Pəncərələr üzrə aqreqatlar: 7/30/90 günlük məbləğ/tezlik/kvantil.
Normallaşma: Robast skeylinq (median/MAD), uzun quyruqlar üçün log dönüşümləri.
Kateqoriyalar: one-hot/target/hash; «nadir» dəyərləri nəzarət.
Keyfiyyət: boşluqlar, dublikatlar, sxemlərin sürüklənməsi, zaman zonalarının sinxronizasiyası.
Semantika: ML seqmentasiyasına qədər açıq iş qaydaları (məsələn, 1 depozit ≥).
4) Seqmentasiya üsulları
4. 1. Qaydalar və eşiklər (white-box)
Sadə şərtlər: «LTV ≥ X və tezlik ≥ Y olarsa VIP».
Üstünlüklər: başa düşüləndir, siyasət kimi tez tətbiq olunur.
Mənfi cəhətləri: sürüklənmə zamanı kövrəklik, qaydaların sayının artması ilə dəstək çətinliyi.
4. 2. Klasterləşdirmə (unsupervised)
k-means/k-medoids: ədədi fiçalarda sürətli basline.
GMM: yumşaq aksesuarlar, ehtimal seqmentləri.
HDBSCAN/DBSCAN: anomaliyalar kimi ixtiyari formalı + «səs-küy» klasterləri.
Qarışıq tiplərdə spektral/EM: mürəkkəb həndəsələr üçün.
Feature learning → cluster: əvvəlcə embeddinq (autoencoder/transformer), sonra gizli məkanda klasterləşdirmə.
4. 3. Supervayzer seqmentasiyası (hədəf-driven)
Biz modeli hədəf KPI-də (məsələn, LTV/risk) öyrədirik və seqmentləri proqnozlaşdırma kvantilləri, SHAP profilləri və ağac həlləri ilə qururuq.
Üstünlüklər: seqmentlər biznes məqsədinə «bağlıdır», asanlıqla uplift yoxlamaq.
Mənfi cəhətləri: «uyğunlaşma» riski; ciddi validasiya lazımdır.
4. 4. Tezlik motivləri və qaydaları
RFM matrisləri, assosiativ qaydalar (support/lift), tez-tez ardıcıllıqlar (PrefixSpan) - xüsusilə ərzaq naviqasiyası və bandlları üçün.
4. 5. Qrafik/şəbəkə seqmentləri
Rabitə icmaları (cihazlar, ödəniş metodları, referallar); GNN xüsusiyyətləri zənginləşdirmək üçün.
5) yanaşma seçimi: sürətli matris
6) Seqmentasiya keyfiyyətinin qiymətləndirilməsi
Daxili metriklər (etalonsuz):- Silhouette/Davies-Bouldin/Calinski-Harabasz: kompakt və ayrılıq.
- Sabitlik: Jaccard/ARI/butstrep arasında.
- Məlumatlılıq: əsas fiqurların seqmentlərarası dispersiyası.
- KPI homojenliyi: LTV/dönüşüm/seqmentlər arasında risk fərqləri.
- Actionability: müdaxilələrə cavab verən seqmentlərin payı.
- Uplift/A/B: seqment hədəfləməsində artım vs ümumi hədəfləmə.
- Əhatə: «mövcud» seqmentlərdə istifadəçilərin% -i (yalnız «səs-küy» deyil).
7) Validasiya və sabitlik
Temporal CV: Zaman seqmentlərinin sabitliyini yoxlamaq (pəncərə rolling).
Qrup validasiyası: train/val arasında istifadəçiləri/cihazları qarışdırmayın.
Replikasiya: qonşu bazarlarda/kanallarda başlanğıc.
Drift: PSI/JS-div sahələr və seqmentlərin paylanması üzrə; həddi alert.
Sabit sidlər/başlanğıc: seqmentasiya versiyalarını müqayisə etmək.
8) Şərh edilə bilər
Seqmentlərin pasportları: qaydaların/sentroidlərin təsviri, açar fiçalar (top-SHAP/permutation), auditoriyanın portreti, KPI profili.
Vizuallaşdırma: seqmentlərin rəngləri ilə UMAP/t-SNE, seqmentlərə görə metrik «qəfəs».
Aktivləşdirmə qaydaları: insan leyblları («High-Value Infrequent», «Risky Newcomers»).
9) Əməliyyat tətbiqi
Fichestor: onlayn/oflayn əlamətlərin vahid hesablanması funksiyaları.
Recoring: SLA və tezlik (onlayn giriş, gündə bir dəfə, hadisə zamanı).
API/batch-ixrac: istifadəçi ID → seqment/ehtimal/vaxt işarələri.
Version: 'SEG _ MODEL _ vX', məlumat müqaviləsi, təlim nümunəsinin «dondurulması» tarixi.
Siyasət: hər seqment üçün - fəaliyyət qaydaları (offer/limitlər/dəstək prioriteti).
Fail-safe: Deqradasiya zamanı defolt seqmenti (No fich/time).
10) Təcrübələr və qərarların qəbulu
A/B/n seqmentlər üzrə: eyni seqmentlər şəbəkəsində müxtəlif offerləri/limitləri sınaqdan keçiririk.
Uplift qiymətləndirilməsi: hədəf effekti vs nəzarət (Qini/AUUC, uplift @k).
Budget allocation: büdcəni marjinallıq/risk limitlərinə görə seqmentlərə ayırırıq.
Guardrails: Risk seqmentləri, əlaqə tezliyi və auditoriya yorğunluğu üçün FPR/FNR.
11) Etika, gizlilik, uyğunluq
Məlumatların minimuma endirilməsi: lazımi minimum istifadə, təxəllüs.
Ədalət: həssas seqmentlər üzrə səhvləri və siyasətçilərin «sərtliyini» müqayisə edirik; Qorunan Attributları qaydalardan çıxarırıq və ya fairness düzəlişləri tətbiq edirik.
İzahat hüququ: seqmentin mənimsənilməsinin məntiqini sənədləşdiririk.
Audit: seqmentlər üzrə versiyalar, giriş xüsusiyyətləri, həllər və kampaniyaların nəticələri.
12) Artefakt şablonları
Seqment pasportu
Kod/versiya: 'SEG _ HVIF _ v3'
Təsvir: «Yüksək dəyər, nadir fəaliyyət»
Meyarlar/mərkəz: 'LTV _ quantile ≥ 0. 9`, `Recency_days ∈ [15,45]`, `Frequency_30d ∈ [1,3]`
Ölçüsü/əhatə dairəsi: 4. 8% istifadəçi (son 30 gün)
KPI profili: ARPPU ↑ 2. 4 Mediana ×, Churn-risk orta
Tövsiyələr: yumşaq re-engage offerlər, cross-sell premium mallar, 1/7d tezlik limiti
Risklər: həddindən artıq endirimlər → «asılılıq»
Sahibi: CRM/Monetization
Tarix/etibarlılıq: 2025-10-15; rübdə bir dəfə yenidən baxılması
Seqmentasiya müqaviləsi
Mənbə: 'fs. user_activity_v5`
Cədvəl: gecə batch 02:00 UTC; «purchase» hadisəsi zamanı onlayn yeniləmə
Xidmət: 'segmentor. api/v1/score` (p95 ≤ 120 мс)
Log: 'seg _ scoring _ log' (hash, versiyası, sürətli, seqment)
Alertlər: «UNKNOWN» payı> 2%; PSI açar xüsusiyyətləri> 0. 2; seqmentlərin balanssızlığı> gündə 10 pp
13) Buraxılışdan əvvəl çek siyahısı
- Razılaşdırılmış məqsədlər və KPI seqmentasiya təsiri
- Təyin edilmiş vahid, pəncərə və yenidən hesablama tezliyi
- basline (rule-based) və ML variant var; uplift müqayisə
- Seqmentlərin sənədləşdirilməsi + vizuallaşdırma və insan etiketləri
- Özelleştirilmiş A/B, guardrails və alert drift
- Version, məlumat müqavilələri, insidentlər üçün Runibook
- Hər seqment və default-fallback fəaliyyət siyasəti
Yekun
Seqmentasiya «birdəfəlik klasterləşdirmə» deyil, idarəetmə dövrəsidir: düzgün məlumatlar və pəncərələr, şəffaf seqmentlər, KPI ilə əlaqə, ciddi validasiya, əməliyyat SLO və drift monitorinqi. Çətinlik əlavə edin (embeddinq, qraflar, supervayzer yanaşması) yalnız ölçülə bilən uplift verir və iş və uyğunluq üçün izah edilə bilən olaraq qalır.