MLops: 운영 모델

1) iGaming에서의 착취의 역할

iGaming에서 모델은 RG 중재, 사기 방지, 지불, KYC, 한도, 제안 및 권장 사항과 같은 실제 자금 및 규제에 영향을 미칩니다. 운영은 보장 된 SLO, 추적 성 및 안전성을 갖춘 신뢰할 수있는 예측 프레젠테이션입니다.

목표:

다운 타임없이 예측 가능한 릴리스 및 롤백.
데이터 일관성 및 오프라인/온라인 기능.
관찰 가능성: 품질, 드리프트, 정직, 프라이버시.
TCO 감소: 성능, 캐시, GPU/CPU 믹스.
준수 (감사/DSAR/법률 보유/윤리).

2) 아키텍처 제공

배치 (오프라인): 야간/시간당 득점 (제한, 세그먼트). 장점: 더 저렴하고 안정적입니다. 단점: 즉각적인 반응이 없습니다.
스트림 (거의 실시간): 1-5 분 창으로 이벤트 처리 (베팅, 이상).
온라인 (동기화 API): UX/위험 솔루션의 경우 <100-300 ms p95, 캐싱 및 성능 저하.
하이브리드: "배치 + 온라인 개선의 기준" (예: 7 일 RG 위험 + 온라인 세션 트리거).

패턴:

중요한 경로에 가벼운 "게이트 모델" 로 앙상블/스태킹.
모델 고장/기능의 경우 폴백 휴리스틱.
서킷 브레이커 및 피크 또는 공급자가 저하 될 때 속도 제한.

3) 모델 등록 및 버전 관리

모델 레지스트리: 버전, 소유자, 릴리스 날짜, 메트릭 (AUC/PR, 교정), 데이터 세트 _ 버전, figure _ set _ 버전, 사용 제한.
모델 카드: 작업, 데이터/기능, 공정성/개인 정보 보호 섹션, 위험 영역, 검토 빈도.
출시 정책: 'MAJOR. 미노르. PATCH '+ 필수 롤백 계획.
Champion-Challenger: 병렬 도전자는 보고서와 함께 실행됩니다. 기준이 충족되면 자동 프로모션.

4) 온라인 기능 및 일관성

Feature Store: 엄격한 계약이있는 오프라인 (교육) 및 온라인 (추론) 쇼케이스.
시간 여행 및 현장 교육에 참여하십시오.
Idempotent 업데이트 기능 및 대상 누출에 대한 보호.
일관성: 쓰기 읽기 또는 SLA 전달 보장 (예: PK60 초).
기능 정책: 목록 허용/거부, 마스킹, 토큰 화, 프록시 PII 금지.

5) 릴리스 전략

그림자: 모든로드 → 챔피언; 도전자는 요청 사본을 받고 답변은 비즈니스에 영향을 미치지 않습니다.
카나리아: 트래픽 → 새 버전의 1-10%; KPI/메트릭의 비교, 임계 값 별 자동 롤백.
Blue-Green: 2 개의 서버/엔드 포인트 풀; DNA/경로 전환.
깃발: 시장/테넌트/채널 별 미세 조정.

6) 관찰 및 경고

신호 (온라인):

신뢰성: 오류율, 타임 아웃, p50/p95/p99 대기 시간, QPS, 채도.
데이터/기능: 신선도, 완전성, 분포, 이상, 누락, 스키마 드리프트.
품질: 교정, 사후 지표 (AUC/PR, 향상), 중재 대응.
드리프트: 입력 (PSI/KS) 및 출력 (점수 드리프트).
윤리/공정성: EO/EOp-deltas, 이질적인 영향.
개인 정보 보호: Attack-AUC (멤버십/반전) 5, λ- 사용 (DP 인 경우).
비즈니스: 차지 백, RG 중재, 제안 변환-세그먼트.

일반적인 임계 값:

p95 대기 시간 약 200ms (온라인 점수 RG/사기 방지).
오류 속도 제곱 0. 1% 5 분 의미.
드리프트 PSI λ0. 주요 기능에서 2; EOp-delta는 3 p.p.
신선도 기능은 약 60 초입니다. 갭0 간격. 5%.
ACE 방식의 보정 02.

7) 사건 및 플레이 북

세브 레벨: P1 (지불 차단/RG 오류), P2 (오류 성장> 임계 값), P3 (품질 저하).
자동 완화: 챔피언으로 전환하고 요청 빈도를 낮추며 대체 규칙을 활성화하고 "독성" 기능을 격리합니다.
런북: "기능이 오래되었습니다", "드리프트가 커졌습니다", "피드 타이핑이 변경되었습니다", "GPU가 소진되었습니다".
사후 사후: RCA, 수정 계획, 업데이트 테스트/임계 값/계약.

8) 실험 및 변경 제어

A/B 및 다중 무장 산적-주요 그룹 (국가/채널/장치) 에 의해서만 계층화됩니다.
윤리적 정지 규칙: RG 위험/불만이 급격히 증가합니다.
전환하기 전에 듀얼 실행 쇼케이스 기능 및 모델.
결과의 안정적인 해석을위한 KPI 및 정의 (BI 계약) 의 검증.

9) 판매 보안 및 개인 정보 보호

mTLS/TLS 1. 3, 서명 요청, 재생 방지 (nonce/idempotency).
비밀 관리자, JIT 발행, 감사의 비밀.
입력/로그의 토큰 화; 트레일에서의 PII 억제.
TEE/기밀 VIP 지불 방지/AML (필요한 경우).
기능 및 엔드 포인트에 대한 액세스 정책 (RBAC/ABAC/JIT).
DSAR/Legal Hold: 토큰 별 설명 및 삭제를위한 솔루션 추적.

10) 성능 및 비용

특히 안정적인 신호를 위해 TTL의 캐시 (기능/점수).
가속을위한 양자화/증류 (INT8/FP16).
자동 검사: QPS/대기 시간으로 수평, 배치 크기로 수직으로.
CPU/GPU 하이브리드: GPU의 대기 시간이 중요하고 CPU의 "질량" 입니다.
콜드 스타트 추적, 모델 가열.
캐시 지역에 대한 시장/테넌트 별 모델 풀 및 "고정 라우팅".

11) iGaming 사례 (참조)

RG 점수: 참가 및 세션에서 온라인 점수; 엄격한 오버 라이드 (자체 제외), 대상 메트릭은 EOp + 교정입니다.
사기 방지/지불: 사전 승인 솔루션 <150 ms; FPR EO 제어, 강력한 신호 애그리 게이터.
KYC/AML: 얇은 파일 지원; 파트너와의 PSI/MPC; DSAR 호환성.
개인화: 고양 모델 및 주파수 제한; 공격적인 제안에서 고위험 제외.

12) 작동 측정 항목 및 SLO (예)

카테고리	메트릭	목적
신뢰성	직업/엔드 포인트 성공률	≥ 99. 5%
대기 시간	p95/p99	200ms/400ms
품질	AUC (온라인), ACE	제곱 대상/계수 0. 02
데이터	신선도 기능	× 60 초
드리프트	입력 PSI	≤ 0. 2
에티켓	EOp 델타	오후 3시
프라이버시	공격 -AUC	~ 0. 5
비즈니스	FPR 사기 방지	목표 임계 값

13) 아티팩트 패턴

13. 1 개의 릴리스 노트

모델: 'rg _ risk @ 2. 1. 0 '(MINOR)

변경 사항: 추가 기능 'loss _ streak _ 7d'; 교정 업데이트

검증: 그림자 14 일; 델타 KPI 방식 0. 3%; EOp 델타 정상

롤아웃: 카나리아 10% EU → 50% → 100%

롤백: flag 'rg. (PHP 3 = 3.0.6, PHP 4)

소유자/날짜/티켓

13. 모델 카드 2 개 (조각)

작업: 사기 방지 지불

데이터: 'payment _ gold v3. 2 ', 기능 세트' payout _ signs v1. 7`

측정 항목: AUC = 0. 89, ACE = 0. 015, FPR @ operas. 임계 값 = 1. 2%

공정성: EO TPR/FPR п. "국가/방법"

제한 사항: VIP 고객-인간 검토 만 가능

개인 정보 보호: TEE 추론; PII없이 로깅

검토: 90 일마다 한 번

13. 3 엔드 포인트 SLO 정책 (스 니펫)

yaml endpoint: /v1/score/rg slo:
latency_p95_ms: 200 success_rate: 0. 995 max_error_burst_per_5m: 50 data:
feature_freshness_s: 60 allowed_missing_pct: 0. 5 ethics:
eop_delta_pp: 3 privacy:
attack_auc_max: 0. 55

13. 4 개의 런북 "날짜가 지난 기능"

1. Feature Store 및 피드 소스의 지연을 확인하십시오.

2. 채널/캐시를 저장하도록 전환합니다

3. 트래픽 감소/대체 가능 규칙.
4. # ml 상태의 커뮤니케이션; SLA의 사건 P2/P1.
5. RCA 및 계약/리트레이 편집.

14) 시험판 테스트 프로세스

계약 기능: 스키마/에넘/널링 가능, SLA 신선도.
데이터: DQ 테스트, 현장 시간, 대상 누출.
모델: 단위/통합, 교정, 응력/부하.
보안: 로그의 비밀, mSL, Zero-PII.
윤리/개인 정보 보호: 공정성 확인, 공격 제품군.
관찰 가능성: 대시 보드/알림, SLO 구성.
문서: 릴리스 노트 + 롤백 계획.

15) RACI (예)

ML Lead (A/R): 품질, 릴리스, 메트릭.
데이터 플랫폼 (R): 피처 스토어, 레지스터, 오케스트레이션, 관찰 가능성.
도메인 소유자 (R): 소스 계약/기능.
보안/DPO (A/R): 액세스, 개인 정보 보호, 토큰 화, TEE.
SRE/SecOps (R): 사건, SLO, Autoscale, SOAR.
분석/금융 (C): KPI 및 보고서에 미치는 영향.
지원/RG/위험 (C): Human-in-the-loop 및 설명 불가능.

16) 구현 로드맵

0-30 일 (MVP)

1. 충격이 큰 모델을위한 모델 레지스트리 + 카드 (RG/지불/사기 방지).
2. 기본 모니터링: 대기 시간, 오류, 신선도, 드리프트 입력.
3. 새로운 버전, 카나리아 윤곽의 그림자 실행.
4. 로그의 계약 기능 및 Zero-PII.
5. 런북 및 # ml 상태 채널.

30-90 일

1. 기준에 따른 챔피언 챌린저 및 자동 프로모션.
2. CI/CD의 공정성/개인 정보 보호 게이트, 공격 스위트.
3. 캐싱, 양자화, 자동 스케일; SLO/비용 예산.
4. KPI 및 온라인 지표의 BI/ML 조정; 대시 보드 SLO.

3-6 개월

1. 정기적 인 사후 모템, 분기 별 모델 검토.
2. 엔드 포인트, 키 및 기능의 지리/테넌트 격리.
3. 개인 지불 추론/AML을위한 TEE/MPC.
4. 계보 및 diff에서 릴리스 노트의 전체 자동화.
5. 프로세스에 대한 외부 감사 (라이센스에 의해 요구되는 경우).

17) 반 패턴

섀도우/카나리아 및 롤백 계획없이 릴리스하십시오.
일관되지 않은 오프라인/온라인 기능 → 저하.
PII가있는 로그, 토큰 정책이 없습니다.
개정없이 "영원한" 임계 값; 드리프트와 교정을 무시합니다.
고위험 솔루션을위한 휴먼 인 루프 부족.
계층화 및 윤리적 정지 규칙이없는 실험.

18) 관련 섹션

DataOps 관행, 액세스 제어, 데이터 토큰 화, 보안 및 암호화, 감사 및 검증, Bias 완화, 기밀 ML, 연방 학습, 데이터 보존 정책, 데이터 원점 및 경로, 데이터 윤리.

합계

모델 악용은 명확한 계약 및 버전, 예측 가능한 릴리스, 24/7 관찰 가능성, 관리 가능한 윤리/개인 정보 보호 위험 및 투명한 비즈니스 영향 등 생산 서비스 수준의 엔지니어링 분야입니다. 이로 인해 ML은 "랩톱에서 최고의 스크립트" 가 아닌 신뢰할 수있는 제품이되었습니다.

MLops: 운영 모델

합계

문의하기

빠른 연결

영상이 곧 업데이트됩니다

현재 프로젝트로 매우 바쁜 상태입니다