Performans benchmarking
1) Niyə iGaming platforma bençmarkları
Tutumun planlaşdırılması: infrastruktur «prime-time», turnir və ya yeni provayder dözə biləcəyini təsdiqləmək.
Texnologiya seçimi: verilənlər, SQL/OLAP mühərrikləri, axın, FS/ML-serving, caches, API şlüzləri.
Reqressiya nəzarəti: buraxılışlardan sonra, sxemlərin/modellərin miqrasiyası, modellərin yenilənməsi.
Büdcə və TCO: «$ üçün performans» və «$ üçün gecikmə» müqayisə.
Nəticə: hisslər deyil, rəqəmlər əsasında «almaq/optimallaşdırmaq/təxirə salmaq» qərarı.
2) Metodologiya: özünüzü necə aldatmamaq olar
1. Hər şeyi qeyd edin: məlumat/kod versiyaları, klaster konfiqləri, sidlər, data-kat.
2. Isınma (warm-up) → sabit plato → deqradasiya: biz yalnız plato ölçmək.
3. Replikasiyalar: 3 ≥; etibarlı interval 95%.
4. Real profillər: zirvələri/« tənəffüs »yük, think-time, isti açar cibləri.
5. Eyni semantika: eyni SQL/Fich Joys/KPI, eyni pəncərələr və filtrlər.
6. Cache gigiyenası: «qızdırılmış cache» və «cold start» testləri - ayrıca.
7. Müstəqillik: bench stendi prod/əlaqəli təcrübələrdən təcrid olunmuşdur.
8. Stop meyarları: SLO pozuldu və ya saturations əldə - test başa çatır.
3) İş yükü portfeli (workload mix)
3. 1 Ingestion/ETL (Bronze → Silver → Gold)
Metriklər: events/s, end-to-end freshness, uğur/retrailer, dəyəri/1000 mesajlar.
Testlər: PSP/provayderlərin burst axını, «çirkli» məlumatlar, schema drift.
3. 2 SQL/OLAP (DWH/kublar)
Metriklər: latency p50/p95/p99, throughput (QPS), skanerlər/bayt/nüvədə-san, cost/query.
Sorğular: GGR/NET day/week, kohorts saxlama, depozit huniləri, ağır joins.
3. 3 Streaming (oyun turları, ödəniş siqnalları)
Metrik: E2E-gizli pəncərə, watermark gecikmələri, exactly-once, konsumer gecikməsi.
Ssenarilər: provayder «sıçrayış» X3, bir partiyanın düşməsi, rebalancing.
3. 4 Feature Store və oflayn hazırlıq
Metriklər: point-in-time join latency, throughput fich/san, fich qrupunun materiallaşma vaxtı, təravət.
Ssenarilər: kütləvi yenidən kalibrləmə, hekayənin yenidən oynanılması (backfill).
3. 5 ML-servinq (online/batch/stream)
Metriklər: p95/p99, error rate, feature freshness, hit-rate cache, cost/1k skoring, soyuq başlanğıc.
Ssenarilər: ödənişlər üçün spike (KUS/antifrod), səhmlər zamanı RG-skorinq.
3. 6 API analitiklər və metriklər
Metriklər: p95 ≤ hədəf, success-rate, cache hit, cost/sorğu, FX/TZ məhdudiyyətləri.
Scripts: partnyor panelləri, kütləvi hesabatlar, uzun-tail filtrlər.
4) Metrika və SLI/SLO
ML üçün əlavə: ASE/yük altında kalibrləmə, PSI/pik girişlərin sürüklənməsi.
5) Təcrübə dizaynı
5. 1 Yükləmə profilləri
Ramp-up 10-15 dəq → Plateau 30-60 dəq → Ramp-down.
Piki: «turnir» profili (10 min X3), «həftə sonu aksiyası» (2 saat X1. 8), «flaş dil» (5 dəq X5).
Think-time и key-skew (80/20) для API/Feature Store.
5. 2 Dəyişənlərə nəzarət
Partiyalar/replikasiyaların ölçülərinin, konnektlərin limitlərinin, pool ölçüsünün müəyyən edilməsi.
«Ağıllı avtotünerlərin» söndürülməsi və ya dürüstlük üçün onların təlimi.
Ayrı-ayrı proqramlar with/without cache.
5. 3 Statistika və hesabat
Media, IQR, etibarlı interval.
Latency-histoqram qrafikləri, time-series, saturations.
Ayrı bir blok «qeyri-müəyyənlik və etibarlılıq təhlükəsi».
6) Artefaktların dəsti
6. 1 Bençmark pasportu (şablon)
Məqsəd: (məsələn, təsdiq p95 API ≤ X3-də 300 ms)
Yüklər: (SQL TPC-like, API-mix, ML-skoring 200 QPS...)
Verilənlər: həcmi, isti açar cibləri, snapshot versiyası
Konfiqurasiya: klasterlər, versiyalar, limitlər, bayraqlar
Metrik/SLO: siyahı, eşik, alert
Stand: izolyasiya, regionlar, şifrələmə açarları
Risklər: soyuq startlar, şəbəkə növbələri, cash siyasəti
6. 2 YAML profil yükü (eskiz)
yaml name: analytics_api_peak_oct ramp_up: PT10M plateau: PT40M ramp_down: PT5M mix:
- endpoint: /v2/metrics/revenue qps: 180 group_by: [date, brand, country]
cache_ratio: 0. 6
- endpoint: /v2/metrics/retention qps: 60 window: ROLLING_28D cache_ratio: 0. 3 limits:
concurrency: 800 per_ip_qps: 50 think_time_ms: {p50: 80, p95: 250}
6. 3 Başlanğıc çek siyahısı
- Data/snapshots sabit, cache təmizlənir (cold-run üçün).
- Konfigi/versiyaları pasport qeyd; seed quraşdırılmışdır.
- SLO Alerts daxildir; izləmə və profillər aktivdir.
- SLO pozuntusu zamanı geri çəkilmə/dayandırma planı.
- Kanal #bench -status, on-call məsul təyin.
7) iGaming domenlərinin xüsusiyyətləri
7. 1 Provayder tədbirləri və turnirləri
Oyunlar/provayderlər, «vitrin effekti» (bir-iki oyun 40-60% trafik verir).
Deqradasiyaya reaksiya olaraq lobbinin yenidən qurulmasını (feature flags) daxil edin.
7. 2 Ödənişlər/PSP
İki fazalı əməliyyatlar, retralar, növbələr, idempotentlik.
Paralel olaraq marşrut variantlarını (primary/backup PSP) test edin.
7. 3 RG/Antifrod/KYC
Test tail-latentlik və fallback-evristics (model mövcud olmadıqda).
VIP/incə fayllar üçün ayrı profillər (thin-file).
8) Alətlər və təcrübələr
Yük Generation: k6/JMeter/locust (API), öz hadisə reigers (stream).
Profil: sorğu izi, flamegraphs, GC/alloc, GPU util.
Observability: metrik və loglarda build/commit etiketləri, sahiblərinin məsuliyyəti.
Cost-metrik: $/1k sorğu, $/saat plato, «SLO dəyəri».
9) Təhlil və şərh
SLO səviyyəsində müqayisə edin: «yerinə yetirildi/yox» və yalnız bundan sonra - «nə qədər sürətli».
Cache qazancını mühərrik/memarlıq qazancından ayırın.
OLAP üçün «mərkəzləşdirilmiş qaynar nöqtə» (shuffle, skew) bayt skanlarına baxın.
ML üçün - kvantizasiya/distillə effekti və skor cache hit reyti.
10) Tutumun planlaşdırılması
Nəticələri scaling düsturlarına çevirin: QPS/core, events/s/instance, $/vahid.
Bir baş otaq (məsələn, 30%) qurun və avtoskeylin sərhədlərini göstərin.
Deqradasiyanın «qırmızı düyməsini» saxlayın: ağır fiçləri/widgetları çıxarın, sadələşdirilmiş KPI-ləri daxil edin.
11) Rollar və RACI
Data Platform (R): stendlər, orkestr, müşahidə, alətlər.
Domain Owners (R): scriptlər və SQL/KPI, düzgünlüyün yoxlanılması.
ML Lead (R): skoring profilləri, cache/kvantlaşdırma.
SRE (R): limitlər, avtoskeyl, insidentlər.
Security/DPO (C): test məlumatlarının məxfiliyi, tokenizasiya.
Product/Finance (A/C): SLO, biznes məqsədləri və şərhi.
12) Tətbiqi yol xəritəsi
0-30 gün (MVP)
1. Üçün bench ssenariləri kataloqu: ingestion, OLAP, API, ML.
2. «Prime-time» API və ödənişlər üçün pasport və YAML profili.
3. Dashboard SLO/Saturation/Cost; SLO uğursuzluqları.
4. Kritik dəyişikliklər üçün «bench before release» qaydaları.
30-90 gün
1. Axın-benç (late data, rebalancing, X3 burst).
2. ML-xidmət: shadow + cold-start, kvantizasiya və cache.
3. Metrik və pasportlardan hesabatların (PDF/Confluence) avtomatik generasiyası.
4. Dar yerlərin inventarizasiyası, ROI ilə optimallaşdırma bazası.
3-6 ay
1. Müntəzəm mövsümi bençi (yay/payız/bayram).
2. il üçün Capacity planı: headroom, büdcə, genişləndirmə nöqtələri.
3. Avto-replay hadisələr (repro benci), champion-challenger konfiqurasiyaları.
4. Xarici partnyor testləri (provayderlər/PSP) imzalanmış vebhuklarla.
13) Anti-nümunələr
Ayrı testlər olmadan cache və motor qarışdırma.
Isınma yoxdur və plato əvəzinə qısa «sprint».
isti açarları və qüsurları olmadan oyuncaq data üzərində Benchi.
Ignor p99 və GC/IO; quyruqları əvəzinə «orta sürət».
«Portağal ilə alma» müqayisə: müxtəlif SQL/filtrələr/pəncərələr.
Təkrarlanma protokolu yoxdur: nəticəni oynatmaq mümkün deyil.
14) Əlaqəli bölmələr
DataOps-praktikalar, API analitikləri və metriklər, MLOps: modellərin istismarı, məlumat axınlarından alertlər, Audit və versiya, Məlumatların saxlanması siyasəti, Təhlükəsizlik və şifrələmə, Giriş nəzarəti.
Yekun
Benchmarking mühəndislik intizamıdır, «birdəfəlik qaçış» deyil. Ciddi metodologiya, real iGaming profilləri, şəffaf SLO və dəyər uçotu rəqəmləri etibarlı həllərə çevirir: harada ölçmək, nəyi optimallaşdırmaq, hansı riskləri qəbul etmək və növbəti zirvəyə hansı təhlükəsizlik marjasını saxlamaq.