MLOps：模型操作

1）操作在iGaming中的作用

在iGaming中，模型會影響真實貨幣和監管：RG幹擾，反欺詐行為，付款，KYC，限制，發行和推薦。可操作性是具有保證SLO，可追溯性和安全性的可靠預測。

目標是：

可預測的發布和回滾,沒有停機時間。
數據一致性和離線/在線信息。
可觀察性：質量，漂移，誠實，隱私。
降低TCO：性能，緩存，GPU/CPU混合。
合規性（審計/DSAR/法律保留/道德）。

2）伺服架構

Batch（離線）：每晚/每小時得分（限制、細分）。優點：更便宜，更穩定。缺點：沒有即時反應。
流（近實時）：處理帶有1-5分鐘窗口的事件（投註、異常）。
Online （sync API）： <100-300 ms p95用於UX/風險解決方案、緩存和降級。
混合體：「來自batch+在線澄清的基礎」（例如：7天的RG風險+在線會話觸發器）。

模式是：

Ensemble/Stacking在關鍵路徑上帶有輕量級的「門模特」。
模型故障時的倒退啟發式方法。
電路斷路器和rate限制在峰值或供應商降級時。

3）模型註冊和版本控制

模型註冊：版本，所有者，發布日期，度量（AUC/PR，校準），dataset_version，feature_set_version，使用限制。
模型卡（Model Card）：任務、數據/fichi, fairness/privacy分區,風險區,咆哮頻率。
發布策略：'MAJOR。MINOR.PATCH'+強制性滾動計劃。
Champion-Challenger：與報告並行運行的Challenger；滿足條件時自動提升。

4）在線攝影和連貫性

Feature Store：離線（培訓）和在線（地獄）店面,擁有嚴格的合同。
在培訓期間進行時間旅行和點對點合作。
偶然的上衣和防漏針。
一致性：「閱讀您的寫作」保修或SLA交付（例如，≤ 60秒）。
特征策略：allow/deny床單，蒙面，令牌化，禁止代理PII。

5）發布策略

影子：所有負荷→冠軍；挑戰者收到請求的副本，響應不會影響業務。
金絲雀：流量的1-10％ →新版本；KPI/度量比較，按閾值自動回滾。
Blue-Green：兩個服務器/端點池；DNS/路由切換。
標誌：通過市場/tenant/渠道進行微調。

6）可觀察性和異位

信號（在線）：

可靠性：error rate, timeouts, p50/p95/p99 latency, QPS, aturation。
數據/fichi：新鮮,完整,分布,異常,跳過,計劃漂移。
質量：校準，事後指標（AUC/PR，uplift），幹預響應。
漂移：在輸入（PSI/KS）和輸出（得分漂移）。
道德/正義：EO/EOp-delta，disparate impact。
隱私：Attack-AUC（membership/inversion）≈ 0。5、ε usage（如果DP）。
業務：chargeback，RG幹預，offer轉換-分段分解。

類型閾值：

p95 latency ≤ 200毫秒（在線評分RG/antifrod）。
Error rate ≤ 0.1%5分鐘。平均值。
Drift PSI ≤ 0.2次關鍵犯規；EOp-delta ≤ 3 p.p.
Freshness fich ≤ 60秒；錯過≤ 0。5%.
ACE ≤ 0校準。02.

7）事件和花花公子

Sev-level：P1（付款鎖定/RG錯誤），P2（錯誤增長>閾值），P3（質量降解）。
自動聯網：切換到冠軍，降低查詢頻率，啟用後退規則，隔離「有毒」的鏡頭。
Runbooks：「fichi已過時」，「漂移已經長大」，「fid類型已經改變」，「GPU已用盡」。
後太平間：RCA，假計劃，測試/閾值/合同更新。

8）實驗和變更控制

A/B和多臂樂隊-僅按關鍵組（國家/頻道/設備）分層。
道德停止規則：隨著RG風險/投訴的急劇增加。
在切換之前,雙奔跑店面和模型。
對KPI和定義（BI合同）進行驗證，以穩定地解釋結果。

9）銷售中的安全和隱私

mTLS/TLS 1.3、查詢簽名、反回復（nonce/idempotency）。
來自Secrets Manager、JIT發行、審核的秘密。
輸入/標誌化；在賽道上禁止PII。
VIP 付款/AML的TEE/機密地獄（根據需要）。
接入策略（RBAC/ABAC/JIT）到Fix和Endpoint。
DSAR/Legal Hold：通過令牌可解釋性和可刪除性解決方案。

10）性能和成本

具有TTL的緩存（功能/得分），尤其是對於穩定信號。
加速量化/蒸餾技術（INT8/FP 16）。
自動滑行：水平的QPS/latency,垂直的batch尺寸。
CPU/GPU混合體：對GPU持批評態度，對CPU具有「質量」。
通過加熱模型來跟蹤冷啟動。
針對緩存本地性的市場/tenant的模型池和「粘性路由」。

11）iGaming Case（參考）

RG得分：入場和會議中的在線得分；嚴格的overrides（自我排除）,目標指標是EOp+校準。
防胎付款：授權解決辦法<150毫秒；FPR的EO控制，機器人信號聚合器。
KYC/AML：文件支持；PSI/MPC與合作夥伴；DSAR兼容性。
個性化：uplift模型和頻率限制；從激進的offers中排除高風險。

12）操作度量和SLO（示例）

類別	度量標準	目標
可靠性	Job/Endpoint success rate	≥ 99.5%
潛伏期	p95 / p99	≤ 200毫秒/400毫秒
質量	AUC（在線）,ACE	≥目標/≤ 0。02
數據	Freshness Fich	≤ 60秒
漂流	PSI輸入	≤ 0.2
倫理學	EOp-delta	≤第3頁。
隱私權	Attack-AUC	~ 0.5
商業活動	FPR防凍劑	目標閾值≤

13）工件模板

13.1個發行註釋（草圖）

模型： 'rg_risk@2.1.0` (MINOR)

更改： 添加了「loss_streak_7d」字樣；校準更新

驗證： shadow 14天；delta KPI ≤ 0.3%;EOp三角洲正常

Rollout: canary 10% EU → 50% → 100%

Rollback： 標誌'rg。use_v1=true`

所有者/日期/tiket

13.2型號卡（片段）

任務： 付款反欺詐行為

數據： 'payments_gold v3.2',fich-set 'payout_signals v1.7`

度量： AUC=0。89, ACE=0.015，FPR@歌劇。閾值=1。2%

Fairness: EO TPR/FPR Δ ≤ 2 п.п. по «country/method»

局限性： VIP客戶-只有人文評論

隱私： TEE地獄；非PII編譯

Review： 每90天一次

13.3後端的SLO策略（片段）

yaml endpoint: /v1/score/rg slo:
latency_p95_ms: 200 success_rate: 0. 995 max_error_burst_per_5m: 50 data:
feature_freshness_s: 60 allowed_missing_pct: 0. 5 ethics:
eop_delta_pp: 3 privacy:
attack_auc_max: 0. 55

13.4 Runbook 「Fichi已過時」

1.檢查Feature Store中的故障和吹風機的來源。
2.切換到備用通道/緩存。
3.減少流量/啟用後退規則。
4.#ml-status中的通信；P2/P1 SLA事件。
5.RCA和合同/撤消編輯。

14）發布前的測試過程

Fich合同：schema/enum/nullable，SLA新鮮。
數據：DQ測試，點對點，目標泄漏。
模型：單位/整合，校準，壓力/負載。
Security： Security, mTLS, Zero-PII在日誌中。
道德/隱私：公平支票，攻擊套件。
可觀察性：dashbords/alerta，SLO configa。
文檔：Release Notes+滾回計劃。

15） RACI（示例）

ML Lead （A/R）：質量、發布、指標。
數據平臺（R）：功能商店，寄存器，編排，可觀察性。
Domain Owners （R）：來源/遠景合同。
安全/DPO （A/R）：可用性、隱私、令牌化、TEE。
SRE/SecOps（R）：事件，SLO，汽車軌道，SOAR。
分析/財務（C）：對KPI和報告的影響。
支持/RG/風險（C）：人為循環和可解釋性。

16）實施路線圖

0-30天（MVP）

1.高影響模型的Model Registry+卡（RG/付款/防凍劑）。
2.基本監控：latency, errors, freshness, drift輸入。
3.新版本的影子運行，金絲雀輪廓。
4.Logs中的Fich和Zero-PII合同。
5.Runbooks和#ml-status通道。

30-90天

1.Champion-Challenger和自動晉級標準。
2.CI/CD中的Fairness/privacy門，攻擊套件。
3.緩存，量化，自動軌道；SLO預算/成本。
4.BI/ML協調KPI和在線指標；SLO dashbords。

3-6個月

1.定期的後面模特，季度模型評論。
2.Geo/Tenant隔離末端，鑰匙和仙女。
3.私人支付地獄/AML的TEE/MPC。
4.從線性和diff完全自動化Release Notes。
5.外部流程審核（許可證要求）。

17）反模式

沒有影子/金絲雀和滾回計劃的版本。
不一致的離線/在線照片→降級。
Logi with PII，沒有令牌政策。
未經修訂的「永恒」閾值；忽略漂移和校準。
高風險解決方案缺乏人性化循環。
沒有分層和道德停止規則的實驗。

18）相關部分

DataOps實踐，訪問控制，數據令牌化，安全性和加密，審計和驗證，減少偏見，保密ML，聯合學習，存儲策略，數據來源和路徑，數據倫理。

底線

模型操作是生產服務級別的工程學科：明確的合同和版本，可預測的版本，24/7的可觀察性，可管理的道德/隱私風險以及對業務的透明影響。因此，ML成為可靠的產品而不是「筆記本電腦中的最佳腳本」。

MLOps：模型操作

底線

與我們聯繫

快速聯繫

影片即將更新

我們目前正忙於各項專案