GH GambleHub

가동 시간 추적

1) 가동 시간을 모니터링하는 이

가동 시간-사용자가 서비스를 이용할 수있는 시간 공유. 이것은 관찰 가능성의 "첫 번째 줄" 입니다. 즉시 접근하지 못함, 네트워크를 통한 저하, DNA/TLS 장애, 라우팅 또는 CNC 문제. 고 부하 및 규제 시스템 (fintech, iGaming) 의 경우 가동 시간은 수익, SLA 성능 및 페널티 위험에 직접적인 영향을 미칩니다.

2) 용어 및 공식

가용성 SLI: 'SLI = (성공적인 점검/모든 점검) × 100%'.
SLO: 창당 대상 가용성 (보통 28-30 일) (예: 99). 9%.
SLA: 외부 의무; 항상 내부 SLO.
MTBF/MTTR: 실패/평균 복구 시간 사이의 평균 시간.

나인 카드 (매월 ~ 43,200 분):

99. 0% → ~ 432 분 사용할 수 없음

99. 9% → ~ 43 분

99. 99% → ~4. 3 분

99. 999% → ~ 26 초

3) 수표가 필요한 것 (블랙 박스)

외부 지점 (다른 지역/공급자) 에서 시작하여 "클라이언트의 눈을 통해" 서비스를 볼 수 있습니다.

1. ICMP (ping) - 기본 네트워킹/노드 가용성. 빠르지 만 비즈니스 성공을 반영하지는 않습니다.
2. TCP연결 - 포트 청취? 중개인/DB/SMT에 유용합니다.
3. HTTPS/HTTPS-상태 코드, 헤더, 크기, 리디렉션, 시간을 첫 바이트로 리디렉션합니다.
4. TLS/인증서-유효 기간, 체인, 알고리즘, SNI, 프로토콜.
5. DNA-A/AAAA/CNAME, NS-health, 배포, DNSSEC.
6. gRPC-통화 상태, 마감일, 메타 데이터.
7. 웹 소켓/SSE-악수, 연결 유지 보수, 에코 메시지.
8. 프록시/라우팅/CDN- 다른 PoP, 캐시 해시, 지리 변형.
9. 거래 합성 시나리오 (클릭/양식): "로그인 → 검색 → 예금 (샌드 박스)".
10. 하트 비트/크론 모니터링-서비스는 "펄스" 해야합니다 (N 분마다 한 번 후크). 신호 없음-알람.

팁:
  • 실제 UX에 더 가까운 타임 아웃을 설정하십시오 (예: TTFB
  • 오류가있는 "200 OK" 가 성공한 것으로 간주되지 않도록 컨텐츠 자산 (키워드/JSON 필드) 을 확인하십시오.
  • 독립적 인 공급자 및 네트워크 (멀티 홉, 다른 ASN) 를 통한 중복 점검.

4) 화이트 박스 및 건강 서비스

오케 스트레이터의 활력/준비 테스트 (프로세스가 살아 있습니까? 트래픽을받을 준비가 되셨습니까?).
의존성 상태: DB, 캐시, 이벤트 브로커, 외부 API (지불/KYC/AML).
기능 플래그/분해: 문제가있는 경우 중요하지 않은 경로를 부드럽게 비활성화하십시오.

흰색 샘플은 외부 검사를 대체하지 않습니다. 서비스는 "내부가 건강하지만" 사용자가 사용할 수 없습니다.

5) 지리 및 다중 지역

주요 교통 지역 및 거의 중요한 의존성 제공 업체에서 합성을 실행합니다.
정원: 지역 이상 현상을 차단하지 못한 경우 (예: 3 개 중 2 개) 사고가 발생하면 사고가 기록됩니다.
코호트 별 임계 값: 중요한 세그먼트 (국가, VIP, 캐리어) 에 대한 별도의 SLI/SLO.

6) 경보 정책 (소음 최소)

다중 영역 + 다중 프로브: 일관된 고장이 발생한 경우에만 호출기

Debowns: 페이징 전 N 연속 고장 또는 2-3 분 창.

확장:
  • L1: 통화 중 (생산 서비스).
  • 실패 서명을 기반으로 한 L2 네트워크/플랫폼/보안.
  • 자동 폐쇄: 안정적인 M 성공 점검 후.
  • 조용한 시간/양보: 중요하지 않은 내부 서비스 용-티켓 만, 호출기 없음.

7) 상태 페이지 및 통신

공개 (클라이언트) 및 개인 (내부) 상태 페이지.
합성 + 수동 주석으로 인한 자동 사고.
메시지 템플릿: 검색 - 식별 - 영향 - 작업 - ETA - 해결 - 포스트 모뎀.
계획된 창: 미리 발표하고 SLO와 별도로 예외를 고려하십시오.

8) 외부 종속성 고려

각 제공 업체 (결제, KYC, 우편, CNC, 구름) 에 대해 여러 지역에서 자체 점검.
실패 경로: 합성 신호를 사용하여 대체 공급자로 자동 전환합니다.
공급자 수준에서 별도의 SLO 및 통합 e2e-SLO.
공급자 (상태 웹 후크, 지원 우선 순위) 와 SLA에 동의하십시오.

9) 대시 보드 및 키 위젯

수표 상태가있는 세계지도 (유형별: 신호음, 디스플레이, TLS).
릴리스/플래그 주석이있는 사건의 타임 라인.
지역별 P50/P95/P99 TTFB/TTL/대기 시간.
코호트 (국가/공급자/장치) 별 가용성.
MTTR/MTBF, 해당 달 가용성 예산의 "유휴 분" 및 "번 다운" 추세.
실패의 주요 이유 (TLS 만료, DNA 해결, 5xx, 타임 아웃).

10) 사건 절차 (일시적 시나리오)

1. 다중 지역/다중 유형 경고가 트리거됩니다.
2. 의무 담당관은 석방 동결을 확인하고 켜고 소유자에게 알립니다.
3. 빠른 진단: DNA/SL/CNC 상태, 최신 릴리스, 오류 일정.
4. 우회: 경로 변경, 폴백 컨텐츠/제공자, 저하 모드 활성화.
5. 복구: 합성/실제 트래픽이 녹색인지 확인하십시오.
6. 상태 페이지의 커뮤니케이션; 사건을 종결합니다.
7. RCA 및 동작 항목: 수정, 테스트, 경고, 플레이 북.

11) SLA/SLO보고

월간 보고서: 서비스/지역별 가동 시간, 가동 중지 시간, MTTR, 이유.
SLA와의 비교: 해당되는 경우 크레딧/보상.
분기 별 검토: 임계 값 업데이트, 합성 분포, 종속성 목록.

12) 검사 템플릿 (예)

모든 편지 선택 (c)

방법: 'GET/healthz/public' (비밀 없음).
시간 초과: 2 초, 재 시도: 1.
성공: '2xx', 헤더 'X-App-Version', JSON 필드 '"상태": "ok"'.

TLS 확인:
  • 기간> 14 일, 유효한 체인, 프로토콜 'SL 1. 2 + ', 올바른 SNI.
DNS를 확인하십시오:
  • 응답 시간 약 100 ms, A/AAAA 레코드는 계획대로 SERVFAIL/REFUSED가 없습니다.
하트 비트:
  • 웹 후크 '/비트/{ 서비스} '5 분마다; 연속으로 2 개의 신호가 없음-L2 경고 (배경 작업/ETL).

13) 구현 점검표

  • 다중 지역 외부 검사 (잘 보이지 않음).
  • 오케 스트레이터를위한 백색 준비/활력 샘플.
  • 중요한/중요하지 않은 경로의 분리, 열화 플래그.
  • Quorum 및 직불 경고, 에스컬레이션 및 자동 닫기.
  • 공개 및 내부 상태 페이지, 메시지 템플릿.
  • 외부 제공 업체에 대한 별도의 점검 및 SLO + 자동 장애.
  • 대시 보드: 맵, 타임 라인, 백분위 수, 유휴 분, MTTR/MTBF.
  • 정기적 인 SLA/SLO 보고서 및 사후 RCA.

14) 빈번한 오류

실제로 사용할 수없는 경우 HTT/컨텐츠가없는 핑/포트 만 녹색입니다.
하나의 모니터링 포인트-오 탐지/음성 결론.
지연/잘못된 구성으로 인한 정전이 발생하지 않습니다.
추가 노이즈: 동일한 영역/유형의 점검에서 단일 장애에 대한 경고.
변경 사항과 관련이 없습니다. 대시 보드에는 릴리스 및 플래그에 대한 주석이 없습니다.
설명되지 않은 종속성-결제 제공 업체가 떨어졌으며 전체 상태는 "녹색" 입니다.

15) 결론

가동 시간 추적은 단순히 "최대 탭" 에 관한 것이 아닙니다. "이것은 실제 지역의 합성 점검 시스템, 소음이없는 합리적인 경고, 상태 페이지를 통한 투명한 통신, 외부 종속성 및 엄격한보고를 설명하는 시스템입니다. 적절하게 구축 된 가동 시간 모니터링은 MTTR을 줄이고 SLA를 보호하며 사용자 경험의 예측 가능성을 유지합니다.

Contact

문의하기

질문이나 지원이 필요하시면 언제든지 연락하십시오.우리는 항상 도울 준비가 되어 있습니다!

통합 시작

Email — 필수. Telegram 또는 WhatsApp — 선택 사항.

이름 선택 사항
Email 선택 사항
제목 선택 사항
메시지 선택 사항
Telegram 선택 사항
@
Telegram을 입력하시면 Email과 함께 Telegram에서도 답변드립니다.
WhatsApp 선택 사항
형식: +국가 코드 + 번호 (예: +82XXXXXXXXX).

버튼을 클릭하면 데이터 처리에 동의하는 것으로 간주됩니다.