GH GambleHub

Multimodal modellər

1) Niyə iGaming multimodallığı

iGaming dərhal mətnlər (biletlər, rəylər, qaydalar), şəkillər/videolar (KYC, kreativlər, axınlar), tablar/hadisələr (ödənişlər, raundlar), bəzən audio (zənglər/axınlar). Multimodellər bu kanalları birləşdirir:
  • (KYC + liveness, «ekran-ekran», şəkillərin dəyişdirilməsi);
  • yurisdiksiyalar üzrə kreativlərin/videoların moderasiyasını və marka-seyfini sürətləndirmək;
  • axınların və provayderlərin/oyunların qeyd kontekstini başa düşmək;
  • UX problemlərinin köklərini tapmaq (video + log hadisələri + şərhlər);
  • sapport agentlərinə «zəngin» cavablar vermək (mətn + ekran/video/link);
  • RG proseslərini yaxşılaşdırın (şikayət mətni + vizual üzülmə nümunəsi + sessiya tarixi).

2) Memarlıq və nümunələr

2. 1 CLIP bənzər (dual encoders, contrastive)

İki enkoder (mətn/vizual) ITC (image-text contrastive) üzrə öyrənilir. Sürətli axtarış/matç: loqotiplər, yaradıcı oyun, axın, provayder.

2. 2 Encoder→Decoder / VLM

Vizual enkoder + şəkil/video «təsvir» üçün LLM-dekoder, UI/ekran haqqında suallara cavab, KYC həllərinin izahı. Grounding (bbox/maskalar) və Toolformer-stil zəng alətləri dəstəkləyir.

2. 3 Perceiver/Perceiver IO/Flamingo-oxşar

Uzun ardıcıllıq və qarışıq modalizm (çərçivələr + mətn + cədvəl fiçləri). Axınlar və ardıcıl KYC çərçivələri üçün faydalıdır.

2. 4 LLM-kimi-orkestrator (Router/Agent)

Kritik yolda yüngül ixtisaslaşmış modellər (kart/üz deteksiyası, OCR, ASR) + nəticələri birləşdirən, qaydalara səbəb olan, insan oxu səbəbləri yazır.

2. 5 Fusion-Late / Fusion-Early / Co-attention

Daha sonra birləşmə - etibarlı və ucuz; erkən - daha güclü, lakin daha bahalı. Prod yolu üçün: daha çox late + co-attention (dəqiqlik/dəyər balansı).


3) Məlumatlar və nişanlar

Sinxronizasiya: çərçivələr/altyazılar/oyun hadisələri/söhbətlər → zaman hizalaması (ASR/audio üçün ishal).
PII/biometrik: şəxsləri/sənədləri (qutuları/maskaları) redaktə edirik, identifikatorları tokenləşdiririk; DSAR uyğunluğu.
Domen lüğətləri: PSP/provayderlər/oyunlar, RG/bonus şərtləri, yerli ödənişlər (Papara/Mefete/PIX).
Sintetika: sənədlər/selfie işıq/bucaq variasiyaları ilə; müxtəlif loqotiplər/STA ilə yaradıcılıq; ekranı «yenidən sökmək».
Aktiv təlim: model qeyri-müəyyən/sərhəd hallarını qeyd edir; HITL konturu.
Balans: nadir siniflər (spuf, qadağan olunmuş simvol, 18 +) - ən azı əsas kütlə.


4) Hizalama və təlim

ITC (InfoNCE): şəkil/kadr mətni (bir çox mənfi, temperatur softmaks).
ITM (Image-Text Matching): Binar «uyğun/uyğun deyil».
Instruction tuning: dialoqlar «sual UI/sənəd → cavab + əsaslandırma».
Grounding: bbox/link maskalarında supervision «səhv budur».
Causal/Tool use: «gördüm → OCR/NER çağırıldı → PSP limitlərini müqayisə etdi» şablonları.
RLHF/RLAIF: «qoruyucu» ssenarilər üçün reviewers üstünlük (reklam/18 +/RG).


5) Gizlilik, təhlükəsizlik, etika

Biometrics-by-design: on-device prevalidation, edge-inference, embeddinq şifrələmə, saxlama müddəti.
Sıfır-PII: nə xam çərçivələr, nə də sənədin tam mətni; tokenlər və case linklər.
DSAR/Legal Hold: kriptovalyutası, dəyişməz log həllər (WORM).
Fairness/Bias: işıqlandırma/dəri tonu/kamera/dil → müntəzəm hesabatlar və paritet toleranslar.
Yurisdiksiyalar: 18 + filtrlər, «məsuliyyətli reklam», bölgədə saxlama və lisenziya açarları.


6) Əsas ssenarilər (iGaming)

1. KYC + Həyat (video + mətn)

OCR sənəd sahələri, ərizə ilə müqayisə (cədvəl).
Selfie/kadrlar → embeddinq/spuf-skor; region qaydalarına istinad edərək «niyə deny» izahı.

2. Yaradıcı moderasiya/video

Qadağan olunmuş mətnlərin/loqotiplərin/simvolların, yaş formalarının, bahislərin/yanıltıcı mesajların deteksiyası.
Marketinq üçün «siyasi» hesabat yaratmaq: nəyi düzəltmək və niyə.

3. Axın analitikası (video + söhbət)

Logo/oyun/hadisələr (böyük uduşlar, endirim), söhbət tonallığı, toksiklik.
Provayderə reklam atributları, taymkodlar üzrə bərabərləşdirmə.

4. Sapport/UX (ekran görüntüləri + mətn)

Q&A ekran: "Harada çıxış düyməsi? ", "Niyə KYC səhv?" - UI sahəsinin işıqlandırılması ilə.

5. RG/Antifrod

«screen re-capture» video patternləri, şikayət mətni və sessiya siqnalları ilə müqayisə; HITL eskalasiyası.


7) Metriklər və bençmarklar

BlokMetrika
CLIP axtarışRecall@k, nDCG@k, mAP; latency p95
OCR/sənədlərCER/WER, F1 sahələri, coverage simvol
Liveness/SpoofAPCER/BPCER, EER, AUC; bias-gap (pp)
ModerasiyaPrecision @deny/Recall @deny, Regionlar üzrə FPR
UI Sual-CavabEM/F1, Faithfulness (sitatlar/grounding), p95
Axınlar/loqomAP @ 50/75, hadisədən əvvəl lag, hit-rate
Təhlükəsizlik/etikaPII sızması = 0, DSAR SLA, Fairness Deltası

Online SLO: success rate ≥ 99. 5%, p95 ≤ 300-500 ms (marşrutdan asılıdır), drift-alert.


8) Əməliyyat və dəyəri (MLOps)

Registry: model/data/augmentation versiyası; policy «harada tətbiq edilə bilər».
Buraxılışlar: shadow/canary/blue-green; avtomatik geri FPR/latency/drift.
Müşahidə: latency p50/95/99, error rate, GPU/CPU util, PSI drift (səhnələr/dillər).
Cost control: distillə/kvantlaşdırma (FP16/INT8), kadr-sampling, embeddinq cache, routing «yüngül/ağır».
HITL: mübahisəli sıra; aktiv təlim və golden-set doldurulması.
Geo/tenant izolyasiyası: müxtəlif açarlar, kvotalar, route siyasəti.


9) Şablonlar (istifadəyə hazır)

9. 1 multimodal moderator API

yaml
POST /v1/moderation/mm request:
image_token: "img_..."
text: "Join now and win..."
market: "TR"
channel: "display"
response:
violations: ["age_rating_missing","misleading_promise"]
grounding:
- type: "bbox"
label: "misleading_promise"
box: [x1,y1,x2,y2]
decision: "deny"
trace_id: "..."
slo: {p95_ms: 350}
privacy: {pii: false}

9. 2 SLO/Gizlilik Siyasəti

yaml service: multimodal.core slo:
success_rate: 0.995 latency_p95_ms: 300 drift_psi_max: 0.2 privacy:
store_raw_media: false biometrics_tokenized: true retention: "P30D"
ethics:
bias_gap_pp_max: 3

9. 3 Model kartı (fraqment)

yaml model: "mm_clip_ui_vlm@2.3.1"
task: ["creative_moderation","ui_qa","kyc_support"]
data: {images: 2.1M, texts: 12M, videos: 90k clips}
metrics:
moderation_precision_deny: 0.92 ui_qa_f1: 0.81 ocr_cer: 0.055 limits:
no_personal_photos_in_training: true region_keys: ["EEA","LATAM","TR"]
review_cycle_days: 90

9. 4 «events_mm_gold» sxemi

yaml ts: TIMESTAMP brand: STRING country: STRING modality: STRING   # image    video    text    mix task: STRING     # moderation    kyc    ui_qa    stream_logo decision: STRING   # allow    manual    deny scores: MAP<STRING,FLOAT>
grounding: JSON    # bboxes/masks/timecodes trace_id: STRING

9. 5 Prompt şablon (UI Q&A, təhlükəsizlik)


Ты ассистент по UI. На входе: описание экрана (OCR/объекты) и вопрос.
1) Отвечай только тем, что видно на экране или в правилах бренда.
2) Если данных не хватает — скажи «недостаточно информации» и предложи шаг.
3) Никогда не проси пользователя присылать документы в чат.
Верни: ответ, краткое обоснование, при наличии — координаты области.

10) Tətbiqi yol xəritəsi

0-30 gün (MVP)

1. CLIP-axtarış loqotipləri/oyunları + yaradıcı sadə moderasiya (mətn/18 +).
2. Ekran görüntülərində (zonas seçimi) Q&A UI, sapport inteqrasiyası.
3. Paypline PII-redaktə və tokenizasiya; latency/success müşahidə.

30-90 gün

1. Video modul axını: logo/heilight + chat bağlama (ASR/ton).
2. KYC köməkçisi: qərar izahları (sənəd/selfie grounding), hitl-növbə.
3. Canary-relizlər, dreyf-alertlər (səhnələr/dillər), bias/fairness hesabatları.

3-6 ay

1. Domen tapşırıqlarında təlimatların tamamlanması (moderasiya/UX/PSP qaydaları).
2. Ödəniş axınlarında məxfi inferens (TEE )/VIP.
3. Distillə/kvantlaşdırma, embeddinq cache; sorğu üçün büdcə dəyəri.
4. Mübahisəli və post-mortemlərdən golden-cases avtomatik istehsal.


11) Anti-nümunələr

Çiy kadrlar/səs log və səbəbsiz uzun müddət saxlama.
Kritik ödəniş yolunda «hər şey üçün bir model» - router və fallback olmadan.
Moderasiyada grounding/izahın olmaması: marketinq və tənzimləyicilərlə mübahisələr.
Ignor bias/işıqlandırma/kamera - KYC lokal uğursuzluqlar.
Heç bir sürüklənmə: deqradasiyalar bölgələrə yayılır.
HITL olmadan modellər: kənar hallarda heç bir təkmilləşdirmə.


12) Əlaqəli bölmələr

Kompüter görmə iGaming, NLP və mətn emalı, Sentiment təhlili, DataOps təcrübələri, MLOps: modellərin istismarı, Anomaliyalar və korrelyasiyaların təhlili, Məlumat axınlarının alertləri, API analitikası və metrikası, Məlumat təhlükəsizliyi və şifrələmə, Giriş nəzarəti, Məlumat etikası və şəffaflıq.


Yekun

Multimodal modellər müxtəlif kanalları - mətn, şəkil, video, səs və hadisələri razılaşdırılmış, izah edilə bilən və təhlükəsiz həll axınına çevirir. iGaming-də bu, KYC-dən daha sürətli və daha dürüst, daha az freud, təhlükəsiz yaradıcılıq, axınlarda provayderlərin şəffaf atributu və məxfiliyə, büdcəyə və tənzimləyiciyə ciddi riayət etməklə ağıllı sapport cavabları deməkdir.

Contact

Bizimlə əlaqə

Hər hansı sualınız və ya dəstək ehtiyacınız varsa — bizimlə əlaqə saxlayın.Həmişə köməyə hazırıq!

İnteqrasiyaya başla

Email — məcburidir. Telegram və ya WhatsApp — istəyə bağlıdır.

Adınız istəyə bağlı
Email istəyə bağlı
Mövzu istəyə bağlı
Mesaj istəyə bağlı
Telegram istəyə bağlı
@
Əgər Telegram daxil etsəniz — Email ilə yanaşı orada da cavab verəcəyik.
WhatsApp istəyə bağlı
Format: ölkə kodu + nömrə (məsələn, +994XXXXXXXXX).

Düyməyə basmaqla məlumatların işlənməsinə razılıq vermiş olursunuz.