수평 네트워크 확장
1) 네트워크를 수평으로 확장하는 이
수평 확장 (스케일 아웃) - 하나의 강력한 서버 또는 단일 통신 채널을 "펌핑" 하는 대신 병렬 노드/채널을 추가합니다. 라이브 베팅 피크, 토너먼트 및 대규모 제공 업체 릴리스에는 다운 타임없이 예측 가능한 대기 시간, 높은 가용성 및 탄력성이 필요합니다.
목표:- N × 하중에서 안정적인 p95 대기 시간.
- 단일 실패 지점 (SPOF) 이 없습니다.
- 경제: 제한된 비용 성장으로 선형 용량 성장.
2) 기본 규모 축소 원칙
1. 주변의 무국적 서비스: 토큰 인증, demempotency 키, 필요한 경우에만 끈적 끈적한 라우팅.
2. 조각 및 분할: 세그먼트별로 사용자/이벤트/트래픽 배포.
3. 네트워크 구성 요소의 첫 번째 수평: L4/L7 밸런서, 프록시, 중개인, 캐시.
4. 반복/시간 초과 정책 및 역압.
5. 자동 스케일링에 대한 피드백으로 관찰 및 SLO.
6. 제로 트러스트 및 미세 설정-노드 수에 따라 보안이 향상됩니다.
3) 네트워크 스케일링 패턴
3. 1 글로벌 (GSLB/애니 캐스트)
빠른 BGP 장애인 입력 포인트에 대한 모든 캐스트 주소
GSLB는 대기 시간/건강 지표별로 지역 (EU, LATAM, APAC) 별 사용자를 할당합니다.
지리 정책: 데이터 현지화 및 공급자/지불에 대한 액세스 규칙 설명.
3. 2 지역 수준 (L4/L7)
L4 밸런서 (ECMP, Maglev와 같은 해시) → 균일 한 커넥터 유통 업체.
L7 게이트웨이/WAF: 경로/버전/테넌트 라우팅, 속도 제한, 봇 방지.
서비스 메시: 회로 차단기, 지터로 다시 시도, 특이 치 배출.
3. 3 개의 동서 트래픽 (클러스터/데이터 센터 내)
Spine-Leaf 패브릭 + ECMP: 예측 가능한 지연.
mSL, 원격 측정 및 관리 정책을위한 사이드카 프록시.
"잡음 이웃" 으로부터 보호하기위한 서비스 할당량/제한 및 네임 스페이스
4) 데이터의 수평 스케일링
4. 1 케시
다단계 캐시: CNC/edge → L7 캐시 → Redis/in-process.
키 분포에 대한 일관된 해시, N 노드에 대한 복제.
큰 사건 이전의 TTL 및 온난화 층.
4. 2 개의 이벤트 중개인 (Kafka/comp.)
열쇠로 깎기 (플레이어, 세션) → 파티 내 순서.
배치를 선형으로 늘리면 소비자의 처리량이 증가합니다.
베팅, 결제, KYC, 게임 등 다양한 도메인에 대한 쿼터/레이어 주제.
4. 3 OLTP/OLAP
CQRS: 읽기/쿼리와 분리 된 쓰기/명령.
스케일링 읽기를위한 복제본을 읽으십시오. 레코드 스케일링을위한 샤딩.
허용 된 관할 구역에 대한 지역 데이터 격리 + 비동기 복제.
5) 세션 및 상태
짧은 TTL 및 회전을 가진 Stateless-JWT/불투명 토큰.
로컬 상태가 필요한 스트림 (예: 라이브 테이블) 에 대해서만 끈적 끈적한 세션.
안전한 재생을 위해 API/지갑 수준의 이념성 키.
이벤트 중복 제거 (키/사가를 통한 비즈니스 의미에서 정확히 한 번).
6) 버스트 관리 (피크 준비)
L7 게이트웨이 및 메시 정책에서 토큰 버킷/누출 버킷.
깨지기 쉬운 업스트림 (KYC, PSP) 전에 버퍼/큐.
메트릭 별 자동 스케일링: rps, p95, CPU, 브로커 지연, 대기열 길이.
실패 개방/실패 전략 (예: 중요하지 않은 기능의 저하).
7) 스케일 아웃 안전
제로 트러스트: 모든 서비스 간의 mTLS, 단기 인증서.
prod/stage/banders/payment를위한 Microsegmentation-Separate 네트워크.
S2S 서명 (HMAC/JWS), 엄격한 출구 제어, DLP/CASB.
키/비밀 회전은 자동화 (KMS, Vault), 엔드 투 엔드 감사입니다.
8) 관찰 및 SLO 관리
로그/메트릭/트레일 + 프로파일 링 (eBPF 포함).
SLO: 로그인/예금/요금/되돌의 p95 대기 시간, 지불 성공, 지역의 가용성.
"네이 키드" 메트릭이 아닌 예산 오류로 경고.
RCA 및 용량 계획에 대한 의존성 토폴로지.
9) 수평 성장을위한 결함 내성 및 DR
인증 및 지갑을위한 액티브 액티브 액티브, 스테이트를위한 액티브 스탠비.
대상이 <30-90 초인 GSLB/BGP-feilover.
혼돈 엔지니어링: 규정에 따라 판매시 무대에서 그리고 정기적으로 영역/파티/PSP 비활성화.
블랙 스타트 경로: 생태계를 높이기위한 최소 서비스 세트.
10) 경제 및 역량 계획
기준: 정상적인 날 + x3/x5 "챔피언스 리그 결승의 밤".
헤드 룸: 중요한 영역에서 30-50% 의 자유 전력.
단위 경제학: rps/topic/session의 비용, 하나의 GSLB-region-feilover의 가격.
봉우리 외부의 추가 노드를 자동으로 끄십시오.
11) 전형적인 건축 다이어그램
A) 글로벌 쇼케이스 및 API
GSLB (대기 시간 기반) → L4 밸런서 (ECMP) → L7 게이트웨이/WAF → 메시 서비스 → Redis 캐시 → Kafka → OLTP 파편/복제본 → OLAP/datalake.
B) 라이브 게임/라이브 베팅 (낮은 대기 시간)
모든 로그인 → WebRTC/QUIC → 우선 순위 채널이있는 지역 PoP는 테이블/세션 전용 → 로컬 캐시 및 빠른 건강 플립을 위해 RGS → 끈적 끈적합니다.
C) 지불 경계
분리 된 세그먼트 + PSP 오케 스트레이터 → dedempotency → SLI에 의한 우선 순위 및 컷 오버가있는 여러 공급자가있는 큐/트레이.
12) 반 패턴
단일 비 규모 L7 게이트웨이.
TTL/테넌트 격리없이 캐시 클러스터에서 공유 세션.
통제되지 않은 배상 → 교통 폭풍과 "아노 믹" 업스트림.
실시간으로 여러 지역에 걸친 글로벌 거래.
분석을 위해 개인 데이터를 "금지 된" 영역으로 복제합니다.
p95/대기열/지연과 상관 관계없이 CPU를 통한 자동 스케일.
13) 스케일 아웃 구현 체크리스트
1. 수평 탄성이 필요한 도메인 및 SLO를 식별합니다.
2. L4, L7 버전/테넌트 라우팅에서 GSLB 및 일관된 해시를 입력하십시오.
3. 외부 API를 무국적자로 변환하고 끈적 끈적한 것을 최소화하십시오.
4. 키 파티션으로 캐시 레이어 및 이벤트 브로커를 설정합니다.
5. OLTP 샤딩 및 복제본, 별도의 OLAP (CQRS) 를 설계합니다.
6. 외부 공급자 앞에서 속도 제한, 역압, 대기열을 사용합니다.
7. 복합 메트릭 (p95, rps, lag) 으로 HPA/VPA를 자동화합니다.
8. 관찰 가능성 확대, 오류 예산에 따른 경고, 토포카드
9. 정기적 인 DR 연습 및 혼돈 시나리오, 블랙 스타트 확인.
10. 디자인 별 보안 포함: mSL, 탈출 제어, 비밀 회전.
14) 건강 측정 및 스케일 제어
로그인/예금/베팅/스핀의 경우 p95/p99.
L7 게이트웨이 및 메시에서 오류가 발생합니다 (5xx/429/타임 아웃).
중개인 지연 및 대기열 깊이, 이벤트 처리 시간.
캐시의 적중 비율, 저장 대역폭.
지역/PoP, GSLB/BGP 전환 시간의 가용성.
rps 당 비용 및 어셈블리 처리.
15) 진화 로드맵
v1: GSLB + L4 ECMP, 정적 오토 스케일, 캐시 계층.
v2: 이벤트 브로커 인 메시 정책 (재 시도/회로 차단기), 복제본 읽기.
v3: OLTP 샤딩, 임계 영역에 대한 자산 자산, SLO에 의한 적응 형 오토 스케일.
v4: 데이터 메시, 예측 용량, 경로 자동 튜닝.
간단한 요약
수평 네트워크 확장은 무국적 핵심, 데이터 및 이벤트 샤딩, 다단계 밸런싱 (GSLB/L4/L7/mesh), 버스트 캐시 및 큐, SLO 관리, Zero Trust 및 DR 관행 등 시스템 분야입니다. 이러한 접근 방식을 통해 iGaming 생태계는 전 세계 교통 정점을 견뎌내고 다른 관할 구역에서 법률을 준수하며 관객이 증가함에 따라 거의 선형 적으로 확장됩니다.