MLOps: işletim modelleri
1) iGaming'de sömürünün rolü
İGaming'de modeller gerçek parayı ve düzenlemeyi etkiler: RG müdahaleleri, dolandırıcılıkla mücadele, ödemeler, KYC, limitler, teklifler ve öneriler. Operasyon, garantili SLO, izlenebilirlik ve güvenlik ile tahminlerin güvenilir bir sunumudur.
Hedefler:- Kesinti olmadan öngörülebilir sürümler ve geri dönüşler.
- Veri tutarlılığı ve çevrimdışı/çevrimiçi özellikler.
- Gözlemlenebilirlik: kalite, sürüklenme, dürüstlük, gizlilik.
- TCO azaltma: performans, önbellek, GPU/CPU karışımları.
- Uyumluluk (denetim/DSAR/Yasal Bekletme/etik).
2) Hizmet veren mimariler
Toplu (çevrimdışı): gece/saatlik puanlama (limitler, bölümler). Artılar: daha ucuz, daha istikrarlı. Eksiler: Anında tepki yok.
Akış (neredeyse gerçek zamanlı): 1-5 dakika pencereli olay işleme (bahisler, anomaliler).
Çevrimiçi (senkronizasyon API'si): UX/risk çözümleri, önbellekleme ve bozulma için <100-300 ms p95.
Hybrid: "baseline from batch + online refinement" (örnek: 7 günlük RG riski + online seans tetikleyicileri).
- Ensemble/Kritik bir yolda hafif bir "kapı modeli'ile istifleme.
- Model hatası/özelliği durumunda Fallback sezgisel analizi.
- Devre Kesici ve tepe noktalarında veya sağlayıcılar düştüğünde hız sınırlaması.
3) Model Kayıt Defteri ve Sürüm Yönetimi
Model Kaydı: sürümler, sahipler, çıkış tarihi, metrikler (AUC/PR, kalibrasyon), dataset_version, feature_set_version, kullanım kısıtlamaları.
Model Kart: görev, veri/özellikler, adalet/gizlilik bölümü, risk bölgeleri, inceleme sıklığı.
Yayın politikası: 'MAJOR. MINÖR. PATCH '+ zorunlu geri alma planı.
Champion-Challenger: Paralel yarışmacı raporlarla koşar; Kriterler karşılandığında otomatik promosyon.
4) Çevrimiçi özellikler ve tutarlılık
Özellik Mağazası: çevrimdışı (eğitim) ve çevrimiçi (çıkarım) katı sözleşmelerle vitrinler.
Zaman yolculuğu ve point-in-time eğitime katılmak.
Idempotent, hedef sızıntısına karşı özelliği ve korumayı günceller.
Tutarlılık: Yazdıklarınızı okuyun veya SLA teslimat garantileri (örneğin, ≤ 60 saniye).
Özellik politikası: listelere izin ver/reddet, maskeleme, tokenizasyon, proxy PII yasağı.
5) Serbest bırakma stratejileri
Shadow: tüm yük - şampiyon; Challenger taleplerin bir kopyasını alır, cevaplar işi etkilemez.
Kanarya: 1-10 % trafik - yeni sürüm; KPI/metriklerin karşılaştırılması, eşiklere göre otomatik geri alma.
Mavi-Yeşil: iki sunucu/uç nokta havuzu; DNS/rota değiştirme.
Bayraklar: piyasalar/kiracılar/kanallar tarafından ince ayar.
6) Gözlemlenebilirlik ve uyarı
Sinyaller (online):- Güvenilirlik: hata oranı, zaman aşımları, p50/p95/p99 gecikme süresi, QPS, doygunluk.
- Veri/özellikler: tazelik, bütünlük, dağılımlar, anomaliler, ihmaller, şema sürüklenmesi.
- Kalite: kalibrasyon, gerçek sonrası metrikler (AUC/PR, yükseltme), müdahale yanıtı.
- Sürüklenme: girişlerde (PSI/KS) ve çıkışlarda (skor sürüklenmesi).
- Etik/adalet: EO/EOp-deltaları, farklı etki.
- Gizlilik: Saldırı-AUC (üyelik/inversiyon) ≈ 0. 5, ε - kullanım (DP ise).
- İş: ters ibraz, RG müdahaleleri, tekliflerin dönüştürülmesi - bölümlere ayrılmış.
- P95 gecikme süresi ≤ 200 ms (çevrimiçi puanlama RG/sahtekarlık önleme).
- Hata oranı ≤ 0. %1 5-dk. kaba.
- Drift PSI ≤ 0. 2 temel özelliklerde; EOp-delta ≤ 3 p.p.
- Tazelik özelliği ≤ 60 sn; Boşluklar ≤ 0. 5%.
- ACE ≤ 0 kalibrasyonu. 02.
7) Olaylar ve oyun kitapları
Sev seviyeleri: P1 (ödeme engelleme/RG hatası), P2 (hata büyümesi> eşik), P3 (kalite bozulması).
Otomatik azaltma: şampiyona geçiş, istek sıklığını azaltma, geri dönüş kurallarını etkinleştirme, "toksik" özellikleri izole etme.
Runbook'lar: "özellik modası geçmiş", "sürüklenme büyüdü", "besleme yazımı değişti", "GPU tükendi" için kontrol listeleri.
Post mortem: RCA, düzeltme planı, güncelleme testleri/eşikler/sözleşmeler.
8) Deney ve değişim kontrolü
A/B ve çok kollu haydut - sadece anahtar gruplar (ülke/kanal/cihaz) tarafından katmanlaştırılmış.
Etik durdurma kuralları: RG riski/şikayetlerinde keskin bir artış ile.
Değiştirmeden önce çift çalıştırma vitrin özellikleri ve modelleri.
Sonuçların istikrarlı bir şekilde yorumlanması için KPI'ların ve tanımların (BI sözleşmesi) sürümlenmesi.
9) Satışlarda güvenlik ve gizlilik
mTLS/TLS 1. 3, istek imzası, anti-replay (nonce/idempotency).
Secrets from Secrets Manager, JIT yayınlama, denetim.
Girdilerin/günlüklerin tokenizasyonu; İzlerde PII inhibisyonu.
TEE/Gizli VIP Ödeme Çıkarımı/AML (gerekirse).
Özelliklere ve uç noktalara erişim ilkeleri (RBAC/ABAC/JIT).
DSAR/Legal Hold: Belirteçle açıklanabilirlik ve silinebilirlik için bir çözüm izi.
10) Performans ve maliyet
Özellikle kararlı sinyaller için TTL ile önbellek (özellik/puan).
Hızlanma için niceleme/damıtma (INT8/FP16).
Otomatik ölçekleme: QPS/gecikmeye göre yatay, toplu iş boyutuna göre dikey.
CPU/GPU hibrid: GPU'da gecikme kritik, CPU'da "kütle".
Soğuk başlangıç izleme, model ısıtma.
Model havuzu ve önbellek lokalitesi için pazar/kiracı tarafından "yapışkan yönlendirme".
11) iGaming vakaları (referanslar)
RG puanlama: girişte ve oturumlarda çevrimiçi puanlama; Katı geçersiz kılmalar (kendini dışlama), hedef metrik EOp + kalibrasyonudur.
Dolandırıcılıkla mücadele/ödemeler: ön yetkilendirme çözümleri <150 ms; FPR EO kontrolü, güçlü sinyal toplayıcıları.
KYC/AML: ince dosya desteği; İş ortağı ile PSI/MPC; DSAR uyumluluğu.
Kişiselleştirme: yükseltme modelleri ve frekans sınırları; Yüksek riskin agresif tekliflerden dışlanması.
12) Operasyonun metrikleri ve SLO'su (örnek)
13) Eser desenleri
13. 1 Sürüm Notları
Model: 'rg _ risk @ 2. 1. 0 '(KÜÇÜK)
Değişiklikler: eklenen özellik 'loss _ streak _ 7d'; Kalibrasyon güncellendi
Doğrulama: gölge 14 gün; Delta KPI ≤ 0. 3%; EOp delta normal
Rollout: kanarya %10 AB - %50 - %100
Geri alma: flag'rg. use_v1=true'
Sahibi/Tarihi/Bilet
13. 2 Model kart (parça)
Görev: dolandırıcılıkla mücadele ödemeleri
Veri: 'payments _ gold v3. 2 ', özellik kümesi' payout _ signals v1. 7`
Metrikler: AUC = 0. 89, ACE = 0. 015, FPR @ operalar. eşik = 1. 2%
Adalet: EO TPR/FPR Δ ≤ 2 п. п. по "ülke/yöntem"
Kısıtlamalar: VIP müşteriler - yalnızca insan incelemesiyle
Gizlilik: TEE-çıkarımı; PII olmadan günlüğe kaydetme
İnceleme: Her 90 günde bir
13. 3 Uç Nokta SLO ilkesi (snippet)
yaml endpoint: /v1/score/rg slo:
latency_p95_ms: 200 success_rate: 0. 995 max_error_burst_per_5m: 50 data:
feature_freshness_s: 60 allowed_missing_pct: 0. 5 ethics:
eop_delta_pp: 3 privacy:
attack_auc_max: 0. 55
13. 4 Runbook "Güncel Olmayan Özellikler"
1. Feature Store'daki gecikmeyi ve feed'in kaynağını kontrol edin.
2. Yedek kanala/önbelleğe geçin.
3. Trafiği azaltın/geri dönüş kurallarını etkinleştirin.
4. # ml-statüsünde iletişim; Olay SLA tarafından P2/P1.
5. RCA ve sözleşme/yeniden ödeme düzenlemeleri.
14) Yayın öncesi test süreçleri
Sözleşmeler özelliği: şema/enum/nullable, SLA tazeliği.
Veri: DQ testleri, zaman noktası, hedef sızıntısı.
Model: birim/entegrasyon, kalibrasyon, stres/yük.
Güvenlik: sırlar, mTLS, günlüklerde Sıfır PII.
Etik/gizlilik: adalet kontrolü, saldırı paketi.
Gözlemlenebilirlik: panolar/uyarılar, SLO yapılandırmaları.
Belgeler: Sürüm Notları + geri alma planı.
15) RACI (örnek)
ML Lead (A/R): kalite, sürümler, metrikler.
Veri Platformu (R): Özellik Deposu, kayıt, orkestrasyon, gözlemlenebilirlik.
Domain Owners (R): Kaynak sözleşmeler/özellik.
Güvenlik/DPO (A/R): erişim, gizlilik, tokenization, TEE.
SRE/SecOps (R): Olaylar, SLO, Autoscale, SOAR.
Analytics/Finans (C): KPI'lar ve raporlar üzerindeki etkisi.
Destek/RG/Risk (C): Döngüde insan ve açıklanabilirlik.
16) Uygulama Yol Haritası
0-30 gün (MVP)
1. Model Kayıt Defteri + yüksek etkili modeller için kartlar (RG/ödeme/sahtekarlığa karşı).
2. Temel izleme: gecikme, hatalar, tazelik, sürüklenme girişleri.
3. Yeni versiyonların gölge koşuları, kanarya konturları.
4. Günlüklerde sözleşmeler özelliği ve Sıfır PII.
5. Çalışma kitapları ve # ml-durum kanalı.
30-90 gün
1. Champion-Challenger ve kriterlere göre otomatik promosyon.
2. CI/CD'de adalet/gizlilik kapıları, saldırı paketi.
3. Önbelleğe alma, niceleme, otomatik ölçekleme; SLO/maliyet bütçesi.
4. KPI'ların ve çevrimiçi metriklerin BI/ML koordinasyonu; Gösterge panoları SLO.
3-6 ay
1. Düzenli post-mortemler, üç aylık model incelemeleri.
2. Uç noktaların, anahtarların ve özelliklerin coğrafi/kiracı izolasyonu.
3. Özel ödeme çıkarımı/AML için TEE/MPC.
4. Soy ve diff'ten Sürüm Notlarının tam otomasyonu.
5. Süreçlerin dış denetimi (lisansın gerektirdiği durumlarda).
17) Anti-desenler
Gölge/kanarya ve geri alma planı olmadan serbest bırakın.
Tutarsız çevrimdışı/çevrimiçi özellikler - bozulma.
PII ile günlükler, belirteç politikasının yokluğu.
Revizyon olmadan "ebedi" eşikler; sürüklenme ve kalibrasyonu göz ardı ederek.
Yüksek riskli çözümler için döngüde insan eksikliği.
Tabakalaşma ve etik durdurma kuralları olmayan deneyler.
18) İlgili bölümler
DataOps Uygulamaları, Erişim Kontrolü, Veri Tokenizasyonu, Güvenlik ve Şifreleme, Denetim ve Sürüm Oluşturma, Yanlılığı Azaltma, Gizli ML, Federe Öğrenme, Veri Saklama Politikaları, Veri Kaynağı ve Yolu, Veri Etiği.
Toplam
Model kullanımı, üretim hizmeti düzeyinde bir mühendislik disiplinidir: açık sözleşmeler ve sürümler, öngörülebilir sürümler, 7/24 gözlemlenebilirlik, yönetilebilir etik/gizlilik riskleri ve şeffaf iş etkisi. Bu, ML'yi'bir dizüstü bilgisayardaki en iyi komut dosyası'değil, güvenilir bir ürün yapar.