이상 및 상관 관계 분석
1) 왜 iGaming인가
iGaming은 실시간으로 생활합니다. 예금이 지연되고 특정 게임 제공 업체가 "침몰" 하고 사기가 발생하여 트래픽 믹스가 변경되었습니다. 우리는 다음과 같은 훈련이 필요합니다
KPI와 수익이 보고서에서 떨어지기 전에 차이를 조기에 감지합니다.
계절/프로모션/토너먼트의 실패를 구별합니다.
"증상 치료" 대신 근본 원인 (RCA) 을 찾습니다.
PII를 포기하지 않고 개인 정보 보호 및 윤리 (RG/AML) 를 존중합니다.
2) 변칙적 유형학
포인트: 단일 피크/딥 (예: 스파이크 PSP 오류).
집단: 일련의 비정형 값 (긴 분해).
상황: 밤에는 정상, 낮에는 비정상 (상황에 따라 시간/국가/채널).
모드/추세 변화 (변경 점): 레벨, 분산, 계절성이 크게 변경되었습니다.
구조: 누락/복제의 급증, 스키마 드리프트.
원인과 결과: 인접 노드 (PSP/제공자) 를 변경하면 행이 "회전" 됩니다.
3) 데이터 준비 및 컨텍스트
달력 및 계절: 주말/공휴일/토너먼트/프로모션 → 개별 기준선.
집계 계층: 1 분/5 분/시간, 국가/브랜드/공급자/장치 별.
정규화: FX에 의한 1 인당 (플레이어/세션 당).
시간 기능: 롤링 평균/std, EWMA, 지연, 요일, "차단 시간".
품질: 늦은 이벤트/복제를 필터링하고 시간대 오류를 제거하십시오.
4) 탐지 방법 (간단한 하이브리드)
통계 및 시계열
견고한 z 점수 (중간/IQR), EWMA, STL- 분해 (추세/계절/유지).
CUSUM/ADWIN-평균/분산 이동에 민감합니다.
변경 지점 (예: PELT/BOCPD): 모드 변경 지점을 수정합니다.
선지자/ETS-예측 + 신뢰 복도 → 간격 이외의 배출.
다차원/밀도
격리 숲, LOF, 원 클래스 SVM - 표지판이 많은 경우 (PSP, 지오, 채널, 장치).
복잡한 패턴에 대한 자동 인코더 (재구성/오류).
온라인 스트림
슬라이딩 윈도우, 양자 스케치, EWMA + 히스테리시스; 워터 마크와 늦은 데이터를 설명합니다.
바운스를 억제하기위한 "이중 임계 값".
하이브리드
도메인 규칙 (SLO 의식) + 통계/ML → 더 높은 정확도 및 설명 할 수 없음.
5) 탐지 품질: 측정 방법
표시된 사건에 대한 정밀/리콜/F1.
ATTD (탐지하는 평균 시간) 및 TTR (정규화 시간).
기간 편향: "깜박임" 에 대한 페널티 (이상에서 빈번한 입력/출력).
전 포스트 비즈니스 지표: "얼마나 많은 라운드/예금이 절약되었는지", "얼마나 많은 P1을 방지했는지"
안정성: 억제 된 잘못된 경보의 비율; p95 "조용한 밤".
6) 상관, 인과 관계 및 함정
상관 및 인과 관계: 일반적인 드라이버 (재고/외부 다운) 는 두 메트릭을 모두 "드라이브" 할 수 있습니다.
링크가 비선형 인 경우 부분 상관 관계 (조건부), 상호 정보 (MI).
그레인저 인과 관계-한 줄은 다른 줄을 예측하는 데 도움이됩니다.
DAG/인과 적 발견-영향의 방향에 대한 가설.
심슨의 역설: 계층화없이 "거짓말" 집계 (국가/채널/장치).
누출: 향후 정보가 포함 된 표시는 잘못된 이유를 제시합니다.
7) 근본 원인 분석 (RCA)
의존성 그래프: 게임 제공 업체 → 로비 → 베팅 → 지불/PSP → KPI.
측정 스캔: 누가 '파산' 했습니까? (국가, 브랜드, 공급자, 결제 방법, 고정 자산).
대조 그룹: 이상/아니오 → 상대 위험/배당률이있는 경우.
다변량 이상 모델에 대한 Shapley/Feature 속성.
What-if 시나리오: 용의자 세그먼트 비활성화-KPI가 복원됩니까?
8) 소음 감소 및 우선 순위
히스테리시스: 확인을 위해 "5 개 중 3 개가 깨졌습니다".
동적 임계 값: 기준선
그룹화: 게임당 300 개의 경고 대신 "제공자 A" 당 하나의 사건.
SLO 인식: SLO/비즈니스 임계 값이 영향을받는 경우에만 경고합니다.
억제: 라벨 세트 당 최대 T 분 안에 N이 경고합니다.
9) Conveyor: 온라인 및 오프라인
온라인: Flink/Spark Streaming/CEP-미세한 창, 워터 마크, 중복 제거, demempotency.
오프라인: 역사의 해에 대한 백 테스트, "합성" 사건의 주입, 후보자의 비교.
ModelOps: 규칙/모델 버전 지정 (MAJOR/MINOR/PATCH), 섀도우/카나리아 및 규칙 롤백.
10) 개인 정보 보호, 윤리, 규정 준수
fiches 및 경고의 Zero-PII; 식별자 대신 토큰.
RG/AML: 개별 채널 및 액세스; 편집 텍스트.
Bias: 민감한 측정 (국가/방법/장치) 의 변화를 확인하십시오-이상을 차별로 바꾸지 마십시오.
Legal Hold/DSAR: 탐지/결정 기록 저장-WORM 로그.
11) iGaming 케이스 (기성품 템플릿)
결제/PSP
탐지: 기준선 _ 28d 아래의 'success _ rate _ deposits _ 5m °', 3/5 창 → P1 확인.
RCA: 'psp, 국가, 방법' 섹션; 대기열/복귀 확인.
게임 제공 업체
탐지: 공급자의 'round _ per _ min' 롤링 _ quantile의 <60% (0. 1) 28d → P1의 경우.
동작: 게임 A 타일을 숨기고 공급자에게 알리고 로비를 전환하십시오.
RG
탐지: 브랜드 B → P2에서 10 분 만에> 3 ppp의 'high _ risk _ share' ZHP.
RCA: 캠페인/보너스, 새로운 장치의 급증, 지오 시프트.
사기 방지
탐지: 'chargeback _ rate _ 60m> μ+ 3 λ' 및' new _ diche _ share TP '→ P1.
조치: 점수/인출 한도를 강화하십시오.
12) 유물과 패턴
12. 1 YAML 규칙 (온라인)
yaml rule_id: psp_success_drop severity: P1 source: stream:payments. metrics_1m baseline: {type: seasonal_quantile, period: P28D, quantile: 0. 1, by: [hour, dow, country, psp]}
detect:
type: ratio_below value: 0. 6 confirm: {breaches_required: 3, within: PT5M}
labels: {psp: "$psp", country: "$country"}
actions:
- route: pagerduty:payments
- soars: [{name: switch_psp, params: {backup: "PSP_B"}}]
privacy: {pii_in_payload: false}
version: 1. 4. 0
12. 2 오프라인 백 테스트 설정
yaml dataset: payments_gold period: {from: "2025-07-01", to: "2025-10-31"}
inject_scenarios:
- type: level_shift target: success_rate where: {psp: "PSP_A", country: "EE"}
from: "2025-09-15T12:00Z"
delta: -0. 02 metrics: [precision, recall, f1, attd_sec]
12. 3 RCA 사건 여권
사건: 드롭 라운드 @ provessor A
기간: 2025-11-01 18: 10-18: 35 (유럽/키예프)
루트 노드: '게임. 엔진. 공급자 _ A '(18:12 변경 점)
확인: 'roby _ clicks...', 'roby _ per _ min ° 45%', 'GGR/min28%'
이의 제기: 지불 확인, PSP OK, FX/통계 정상
동작: 타일 숨기기, 제공자 연락처, 상태 배너
결과: 복구 @ 18:34; X 손실 방지
13) 프로세스 성공 지표
P1/P2 사고에 대한 정밀/리콜/F1 (도메인 소유자에 의한 마크 업).
몇 분 안에 ATTD/MTTR (중간/p90).
노이즈: "잘못된 밤" 경보의 -X%, 경고/시프트.
RCA 시간: 근본 원인까지의 평균 시간.
저장된 사업: 유지 예금/라운드 평가.
적용 범위: 관찰중인 중요 경로의 95% 이상.
14) 프로세스 및 RACI
도메인 소유자 (R) -규칙/기준선/사건 표시.
데이터 플랫폼/관찰 성 (R) -감지 엔진, 스토리지, SLO.
ML Lead (R) -이상 모델, 교정, 공정성.
SRE/SecOps (R) -SOAR/PagerDuty 통합, 사건.
CDO/DPO (A) -개인 정보 보호/윤리 정책, Zero-PII.
제품/금융 (C) -SLO 임계 값 및 비즈니스 우선 순위.
15) 구현 로드맵
0-30 일 (MVP)
1. 중요한 경로: 지불, 게임 _ 라운드, 신선도 섭취.
2. 시간/일 및 키 치수 별 기본 라인 (국가/브랜드/psp/제공자).
3. 간단한 검출기: EWMA/robust z-score + 히스테리시스.
4. 경고 채널 및 3 개의 런북 (결제/게임/DQ).
5. 3-6 개월의 역사에 대한 백 테스트; 사건의 표시.
30-90 일
1. 변경 지점, 계절 양자, 복합 모달 시리즈.
2. 다차원 경우를위한 격리 산림/LOF; 그림자 모드.
3. RCA 종속성 그래프 및 반자동 속성.
4. SLO 의식 임계 값; 억제/그룹화; 자동 완성 티켓.
3-6 개월
1. 챔피언 챌린저 규칙/모델; 자동 튜닝 임계 값.
2. 서명 된 웹 후크가있는 외부 통합 (공급자/PSP).
3. "MTTR/수익에 대한 경고 기여" 보고; 분기 별 위생 세션.
4. 논쟁의 여지가있는 상관 관계에 대한 인과 실험 (A/B, Granger, 도구 변수).
16) 반 패턴
모든 국가/시간/채널에 공통적 인 눈으로 임계 값.
계절/주식을 무시하고 → 잘못된 경고의 폭풍.
사고에 대한 백 테스트 및 마크 업은 없습니다. 최적화 할 것이 없습니다.
층화/부분 corr → 잘못된 원인이없는 추격 상관 관계.
PII를 사용한 로그/경고, 공유 채널의 스크린 샷.
수정 및 소유자가없는 "영원한" 규칙.
17) 관련 섹션
데이터 흐름 경고, DataOps 관행, 분석 및 메트릭 애플리케이션, 감사 및 검증, MLop: 모델 탐색, 액세스 제어, 보안 및 암호화, 데이터 유지 정책, 바이어스 감소.
합계
변칙적 및 상관 분석은 "ML 매직" 이 아니라 엔지니어링 시스템: 올바른 컨텍스트와 계절성, 규칙과 모델의 하이브리드, 엄격한 품질 지표 및 관리 RCA. iGaming에서 이러한 시스템은 MTTR을 줄이고 수익을 보호하며 개인 정보 침해없이 플레이어와 규제 기관의 신뢰를 유지합니다.