지역 간 스케일링
(섹션: 생태계 및 네트워크)
1) 왜 필요한가
지역 간 스케일링은 다음을 위해 여러 지역에 걸쳐 생태계 (응용 프로그램, 데이터, 이벤트 버스 및 네트워크 서비스) 를 구성하는 것입니다
대기 시간을 줄이고 QoE (대기 시간 중심 라우팅) 를 늘리고
지역 수준의 결함 내성 (재해 클래스),
현지 요구 사항 준수 (데이터 현지화, 규정 준수),
교통 스파이크와 계절성에 대한 탄력성
별도의 영역에서 독립적 인 릴리스주기 및 실험.
2) 대상 SLO 및 기본
대기 시간 예산: 주요 경로 (승인, 지불, 게임 라운드, 웹 후크) 의 경우 p95/p99.
가용성: 99 이상. 지역 당 9% 및 99 이상. 전 세계 비행기에서 95%.
설계 별 일관성: RPO/RTO 모델의 명시 적 선택 및 도메인 별 일관성 수준.
Idempotency/정확하게 한 번 의미론: 지역 간 경계에 있습니다.
관찰 가능성: 엔드 투 엔드 흔적 및 지역 간 이벤트의 상관 관계.
3) 배치 및 트래픽 모델
A. Active-Active (멀티 마스터 읽기/쓰기)
장점: 최소 대기 시간, 수평 확장 성, 소프트 파이 오버.
단점: 갈등 해결의 복잡성, 비용 상승.
B. 액티브 패시브 (차가운/따뜻한 대기)
장점: 더 쉬운 구현, 예측 가능한 무결성.
단점: 원격 사용자의 대기 시간이 길어지고 시간이 바뀝니다.
C. Active-Read Replica (하이브리드)
장점: 한 지역의 로컬 빠른 읽기, 일관성 검문소.
단점: 지연 복제; 기록은 중심입니다.
4) 네트워크 평면 및 라우팅
GSLB/GeoDNA/Anycast: 사용자를 가장 가까운 건강한 지역으로 안내합니다.
건강 샘플 및 체중 정책: 대기 시간 인식, 용량 인식, 비용 인식.
가장자리/PoP 노드: SL 종료, WAF, 속도 제한, 정적 캐싱 및 API 응답.
본질적인 연결: 개인 지역 간 채널, 탈출 제어, 제로 트러스트.
5) 데이터: 일관성 전략
요구 사항별로 별도의 도메인:- 강력한 (결제 거래, 잔액, 한계): 단일 리더, 마스터 영역에 대한 "쓰기", 동기 불변.
- 타임 라인/세션 (게임 이벤트, 원격 측정): 비동기 복제, 업 세트/추가 전용.
- 카탈로그/참조 (내용, 구성): 다중 지역 캐시 + 소프트 일관성.
- 신뢰할 수있는 이벤트 게시를 위해 지역/테넌트, CRDT/도메인 잠금이있는 다중 기본, 전송/거래 로그를 조정합니다.
6) 이벤트 버스 및 대기열
연방 이벤트 버스: 지역 클러스터 (예: "지역 주제") + 지역 간 복제.
결정 론적 처리를 위해 키 (플레이어 _ id, 트랜잭션 _ id) 로 주문합니다.
재생/백필-이벤트 로그 스토리지, 메시지 키 중복 제거.
데드 레터/시작 정책: 지수 백오프, 독 메시지 검역.
7) 캐싱 및 코팅 매칭
계층 캐시: L1 (프로세스), L2 (영역), L3 (에지).
무효화: 핵심 및 변경 주제 (펍/하위 장애).
부동산 수정: 참고 도서 및 내용.
충돌을 피하기 위해 영역 및 스키마 버전의 캐시 키.
8) 사용자 별 식별, 세션 및 라우팅
지역 간 전환을 최소화하기 위해 user _ id/tentent _ id로 끈적 끈적한 라우팅.
글로벌 ID: 진단을위한 지역 접두사를 포함하여 고 엔트로피, 정렬 (ULID/KSUI).
세션: 지역 + 공통 추천 회로 (OIDC), 마이그레이션 중 재 인증.
9) 안전 및 준수
데이터 현지화: 해당 지역의 "신뢰 영역" 에있는 개인 및 재무 데이터.
암호화: 지역 키 분리, 명확한 회전 및 "엔벨로프 암호화" 가있는 KMS.
네트워크 세분화: 최소 권한의 원칙, 지역 역할을하는 서비스 계정.
감사: 불변의 로그, PII/PCI에 대한 추적 액세스.
10) 관찰 및 사건 관리
엔드 투 엔드 추적: 이벤트 버스를 통한 글로벌 트레이스 아이드, 컨텍스트 전파.
지표 및 경고: 지역당 개별 SLO 및 전세계 집계; "어느 지역이 저하되고 있는지" 와 관련하여 경고합니다.
대기 시간/오류/로드 대시 보드: p50/p95/p99, 채도, 대기열, 복제 지연.
혼돈 및 게임 일: 지역 중단, 채널 속도 저하, 용량 마크 다운.
11) 배포 및 버전
지역 청록색/카나리아: 폭발 반경 제한이있는 독립적 인 롤아웃.
지역 및 교통 세그먼트별로 지리 타겟팅이있는 기능 플래그.
스키마 진화: 양방향 호환성 (이전/앞으로), "확장 마이그레이션 계약".
12) 경제 및 비용 관리
용량 계획: 시간/일/계절별; 피크 이벤트를위한 버퍼.
비용 경로: 하이브리드 정책 (두 영역이 지연되는 경우 더 저렴한 영역을 선택합니다).
탈출 최적화: 로컬 집계/압축, 중복 제거, 캐시 적중.
단위 경제학: 지역별 요청/게임 라운드/거래 비용.
13) 위험 및 반 패턴
전체 도메인 → 중복 지역 간 동기화에 대한 "단일 글로벌 진실".
숨겨진 지역 간 종속성 (다른 사람의 색인/캐시 읽기).
지역 제한 및 회로 차단기 부족.
지역 간 일관되지 않은 체계/프로토콜 버전.
14) 구현 점검표
1. 도메인 및 일관성 요구 사항을 정의하십시오 (강력한/최종)
2. 도메인별로 모델 (Active-Active/Active-Passive/Hybrid) 을 선택하십시오.
3. 디자인 라우팅 (GSLB, 건강 검진, 끈적 끈적한 정책).
4. 디자인 스토리지 (샤딩, 복제, 아웃 박스).
5. dempotency 키와 중복 제거를 입력하십시오.
6. 글로벌 상관 관계자와 관찰 가능성 (추적/메트릭/로그) 을 구축하십시오.
7. 규정 준수 및 데이터 현지화 설정
8. DR 일과 정기적 인 실패 훈련을 자동화하십시오.
9. 경제 지표 및 예산 보호 레일을 소개합니다.
10. 지역별 카탈로그 SLO/오류/사고.
15) 전형적인 참조 패턴
에지 레이어: Anycast + WAF + 글로벌 캐시.
지역당 게이트웨이 API: 인증, 할당량, 경로.
서비스 계층: 로컬 데이터베이스 및 지역 대기열이있는 마이크로 서비스.
데이터: 중요한 기록을위한 마스터 영역; 지역 복제본/파편 클러스터.
이벤트: 지역 주제, 지역 간 커넥터에 의한 복제; 소비자를 파괴하십시오.
관찰 가능성: 통합 원격 측정, 글로벌 미량 ID.
16) iGaming/fintech 생태계 신청
게임 라운드: 마스터 하우스의 결과를 수정하는 로컬 처리.
지불 및 KYC: 엄격한 일관성, 지역 "신뢰 영역".
프로모션 및 내용: 공격적인 캐싱 + SWR, 가장자리 장애.
파트너에게 웹 후크: 배송 대기열, 배송 보증 (수신기에서 최소 한 번 + dem 등장).
17) KPI 및 건강 지표
각 지역과 전 세계의 주요 경로에 의한 p95 대기 시간.
4xx/5xx 오류율, 캐시 적중 공유, 복제 로그.
DR 전환 시간, DR 교육 성공률.
지역별 1k 요청 당 비용, 노드 당 출구/침입.
18) 진화 계획 (반복)
1. Phase-0: 하나의 영역 + 에지 캐시.
2. 1 단계: 읽기 복제본으로서의 두 번째 영역, GSLB.
3. 2 단계: 하이브리드 쓰기 (부분 활성 도메인).
4. 3 단계: 대기 시간 크리티컬 도메인, 독립형 릴리스를위한 전체 형식 Active-Active.
19) FAQ
어디에서나 활동적인 활동을 할 수 있습니까? 필요하지 않습니다. 일관성과 경제로 도메인을 나눕니다.
녹음 충돌을 처리하는 방법? CRDT/verioning/비관적 lys-locks, 결정 론적 병합 규칙.
법적 요구 사항은 어떻습니까? 지역 "신탁 지역" 에 PII/재무 데이터를 저장하고 지역 간 분석을 위해 익명화하고 집계합니다.
테스트 방법? 정기적 인 게임 데이: 지역 격리, 채널 저하, 대규모 retrai.
짧은 요약: 지역 간 스케일링은 마술 버튼이 아니라 적절한 라우팅, 데이터 및 이벤트의 도메인 분리, 엄격한 원격 측정, 관리 일관성 및 경제 제어 등 일련의 분야입니다. 시스템을 도메인으로 나누고 각 도메인의 모델을 선택하고 정기적 인 DR 연습을 통해 팀 교육을 자동화하십시오.