GH GambleHub

DNA 라우팅 및 장애 조치

1) 결함 허용에서 DNS의 역할

DNS는 사용자의 첫 번째 "라우터입니다. "다음은 디자인에 따라 다릅니다

가용성 (빠른/신뢰할 수있는 장애);

성능 (지리/대기 시간 라우팅);

비용 (지역 간 탈출 및 타사 통화 최소화);

보안 (DNSSEC, 납치 방지, CAA/DMARC/SPF 제어).

키: 역학이 중요한 짧은 TTL과 안정적인 구역 아키텍처 (공공 + 개인, 분할 수평선).

2) 기록 및 관행의 종류

A/AAAA-주소; 가능하면 항상 IPv6을 게시하십시오.
CNAME vs ALIAS/ANAME: 도메인의 루트에서 ALIAS/ANAME (또는 공급자 정점 평탄화) 를 사용하십시오.
TXT-SPF/DMARC/DKIM, 검증; CAA-인증서 발급자의 제한.
SRV/NS-서비스 발견 및 위임.
SVCB/HTTPS는 우선 순위 및 매개 변수 (ALPN, 포트) 를 갖춘 최신 대체 메커니즘입니다.

권장 사항: 클래스별로 TTL 표준을 수정하십시오 (edge/API/static).

3) 경로 정책

가중-통제 된 트래픽 점유율 (카나리아/청록색).
대기 시간 기반-대기 시간에 가장 가까운 수영장을 선택하십시오.
지리 라우팅 - 국가/대륙/지역별; 데이터 레지던트에 중요합니다.
실패 (1 차/2 차) -능동 모니터링 및 전환.
다중 값 - 여러 A/AAAA; 고객이 스스로 선택합니다 (건강 검진을 대체하지 않음).
근접/ASN 라우팅-일부 공급자의 경우: 클라이언트의 네트워크를 통해.

결합: geo → 대기 시간 → 무게 → 건강.

4) TTL, 캐싱 및 전파

TTL API/스피커: 30-120 초 (페일러 속도와로드 사이의 균형).
정적/CDN이 있습니다.
네거티브 TTL (SOA 'Minimum') -λ60-300 초, 그렇지 않으면 NXwitter는 "고정" 됩니다.
캐시를 즉시 버릴 필요는 없습니다. "더러운 꼬리" 를 고려하십시오.

5) 건강 및 점검 엔드 포인트

여러 지역의 건강 점검: TCP/443 + HT2xx/3xx 및 lambda 비즈니스 기준 점검 (예: 람다 비즈니스 기준 점검) 성공적인 '/건강? 종속성 검사를 통한 deep = 참 ').
합성 (RUM/active): 주요 경로를 따라 API 샘플, SL/OCSP 검사, DNSSEC 검사.

노출 '/ready '(깊은) 및 '/live' (표면); (PHP 3 = 3.0.6, PHP 4)

6) 공개 vs 개인 DNA (분할 수평선)

공공 구역-클라이언트 액세스.
개인 영역-개인 엔드 포인트에 대한 내부 해상도 (VPC/VNet, on-prem).

조건부 전달

명명: 'api. <브랜드>. .internal. corp '년도' api. .com '.

7) 보안: DNSSEC 및 도메인 정책

DNSSEC: 영역 서명 (KSK/ZSK) 활성화, 키 회전 및 트러스트 체인 모니터링.
CAA: 유효한 CA를 나열하십시오. 경고에 대한 'iodef' 가 포함됩니다.
SPF/DMARC/DKIM: 우편의 명성 및 피싱 방지.
DNA 제공 업체 계정에 대한 레지스트라 잠금 및 MFA; 로그 변경 (WORM 상점).

8) 장애 해결 설계

8. 모델 1 개

활동 활동: 2 개 이상의 건강한 수영장; 대기 시간/체중을 통한 균형, 건강 검진은 건강에 해로운 것을 배제합니다.
액티브 패시브: 메인 풀 + 리저브 (사고 전 무게 0%).
지역 반지: 지역 재난으로 "인근" 지역으로의 트래픽.
악화 된 모드: 백엔드를 사용할 수없는 경우 "쉬운" 사이트/랜딩에 기록하십시오.

8. 2 단계별 시나리오

1. '/ready '의 모니터링 기록 저하.
2. DNS는 응답을 변경합니다 (풀을 제거하거나 가중치를 변경).
3. TTL은 건강한 지역으로 이동하여 속도를 결정합니다.
4. 안정화 후-유예 기간 (15-30 분) 과 저울의 귀환.

9) 설정 예

9. 1 AWS Route 53-대기 시간 + 건강 + 가중

hcl
Two latency aliases for different regions resource "aws_route53_record" "api_latency_eu" {
zone_id = var. zone_id name  = "api. example. com"
type  = "A"
set_identifier = "eu1"
latency_routing_policy { region = "eu-central-1" }
alias { name = aws_lb. api_eu. dns_name zone_id = aws_lb. api_eu. zone_id evaluate_target_health = true }
health_check_id = aws_route53_health_check. api_eu. id ttl = 60
}

resource "aws_route53_record" "api_latency_us" {
zone_id = var. zone_id name  = "api. example. com"
type  = "A"
set_identifier = "us1"
latency_routing_policy { region = "us-east-1" }
alias { name = aws_lb. api_us. dns_name zone_id = aws_lb. api_us. zone_id evaluate_target_health = true }
health_check_id = aws_route53_health_check. api_us. id ttl = 60
}

Canary in EU: 10% of the weight of the resource "aws_route53_record" "api_weighted_canary" {
zone_id = var. zone_id name  = "api. example. com"
type  = "A"
set_identifier = "eu1-canary"
weighted_routing_policy { weight = 10 }
alias { name = aws_lb. api_eu_canary. dns_name zone_id = aws_lb. api_eu_canary. zone_id evaluate_target_health = true }
ttl = 30
}

9. 2 Cloudflare-지리/ASN 및 failover pool (아이디어)

Balancer Pools c health-checks (해) 로드, Geo Steering (대륙/국가) 을 사용한 로드 Balancer 및 세션 친화력.
폴백: 5xx 피크에서 단순화 된 백엔드로 페이지 규칙/변환 규칙.

9. 3 Azure/GCP

푸른 트래픽 관리자: 우선 순위/가중/성능/지리.

Google 클라우드로드 밸런싱 + 클라우드 데이터 정책: 지리 정책 + 건강 검사

10) 관찰 가능성 및 DNA SLO

SLI: 성공률 해상도, 해상도 시간의 95% 백분위 수, TTL 내의 신선한 (비 부실) 응답의 비율.
SLO: 예를 들어 '99. 성공적인 응답의 95% 100 ms.
지표: NXwitcher-rate, SERVFAIL-rate, 건강 상태 풀, 지역 별 트래픽 점유율, 카나리아 점유율.
Exemplars: 합성에서 'trace _ id' 를 통해 SHT 추적과 SLI를 연결하십시오.

11) 테스트 및 작동

다른 ASN/지역의 합성 (RIPE Atlas, Catchpoint, k6-DNA).
DNSSEC를 확인하는 dnsviz/' delv ';' 이상에 대한 파기 + 추적 '.

준비 구역 ('stg. 예. feilover 리허설을위한 com '); 리허설 스크립트는 가중치/우선 순위를 변경하고 반

런북: 무게를 수동으로 올리거나 낮추는 사람, 수영장을 끄는 방법, "동결" 수행 방법.

12) 안티 패턴

중요한 A/AAAA → 느린/혼란스러운 feilover의 TTL = 3000 +.
비즈니스 불변자가 없으면 건강 검진 또는 TCP- 전용 포트 검사가 없습니다.
많은 CNAME 체인 → 느린 해상도, 캐시 혼돈.
보조/axfr 백업이없는 유일한 DNA 제공 업체.
DNSSEC가 필요한 서명되지 않은 영역; 관련없는 CAA.
개인 백엔드/데이터베이스의 공개 IP를 가리키는 항목.

13) iGaming/Finance의 세부 사항

관할권: 규정 준수를위한 지리/국가 라우팅 (로컬 도메인/프론트로 리디렉션).
PSP/KYC: 개별 TTL 및 feilover 정책이있는 전용 하위 도메인; 대기 PSP로의 빠른 전송.
책임있는 재생: 합법적 인 페이지가있는 하위 도메인을 항상 사용할 수 있습니다 (백업 정적/CNC).
감사-로그 영역이 WORM 상점으로 변경되고 변경 사항에 서명하고 정기적으로 검토됩니다.
블록 목록: 지역별 DNA 준수 규칙 (에지 필터링 + DNA 라우팅).

14) Prod 준비 점검표

  • 클래스 별 TTL 프로파일; 음의 TTL이 300 초입니다.
  • MFA/레지스트라 잠금 장치 두 개의 독립적 인 DNA 네트워크 (1 차/2 차).
  • 정책: 여러 지역의 지리/대기 시간/무게 + 건강 검진.
  • DNSSEC 활성화, CAA/DMARC/DKIM/SPF 최신.
  • 분할 수평선 (공공/개인), 내부 트래픽을위한 개인 구역.
  • 전단지/반품 런북, 리허설 스크립트, 카나리아 도메인.
  • SLI/SLO 모니터링, NXwitzer/SERVFAIL/RTT 성장에 대한 경고.
  • 준비 구역과 정기적 인 실패 "훈련".
  • iGaming의 경우: 관할권 별 라우팅, PSP/KYC에 대한 별도의 도메인, 변경 불가능한 감사.

15) TL; DR

지리/대기 시간 + 건강 검진 + 가중치와 TTL 30-120 초의 스피커가 결합 된 정책을 구축하십시오. DNSSEC 및 CAA를 활성화하고 보조 DNS를 유지하십시오. 리허설 연습을하고 SLI/SLO DNS를 관찰하십시오. iGaming의 경우 별도의 규칙과 WORM 변경 로그를 사용하여 관할 구역 및 PSP/KYC 도메인 예약을 고려하십시오.

Contact

문의하기

질문이나 지원이 필요하시면 언제든지 연락하십시오.우리는 항상 도울 준비가 되어 있습니다!

Telegram
@Gamble_GC
통합 시작

Email — 필수. Telegram 또는 WhatsApp — 선택 사항.

이름 선택 사항
Email 선택 사항
제목 선택 사항
메시지 선택 사항
Telegram 선택 사항
@
Telegram을 입력하시면 Email과 함께 Telegram에서도 답변드립니다.
WhatsApp 선택 사항
형식: +국가 코드 + 번호 (예: +82XXXXXXXXX).

버튼을 클릭하면 데이터 처리에 동의하는 것으로 간주됩니다.