GH GambleHub

Autoscaling 및 SLA 균형

Autoscaling 및 SLA 균형

1) 목표와 원칙

오토 스케일링의 목표는 SLO (대기 시간/가용성) 를 최소 비용으로 유지하는 것입니다.
SLA SL SLO SLA 비용: 오류 및 금전적 한도 예산 내에서 "끝없는" 척도를 쫓지 마십시오.
오픈로드 모델: 들어오는 요청은 강도 스트림 'λ' 를 형성합니다. 이 시스템은 평균 병렬 처리 시간을 제공해야하며, 여기서 'W' 는 평균 서비스 시간입니다.


2) 트리거에 적합한 지표

기술:
  • CPU/RAM/IO (채도 프록시).
  • 기내 및 수영장 대기.
  • p95/p99 적용 대기 시간 (실제로 SLO 반영).
  • RPS/도착률.
  • 대기열: 깊이, 메시지 연령, 처리 속도.
비즈니스 SLI:
  • 성공적인 트랜잭션의 비율
  • 거래를 확인할 시간.

권장 사항: 2-3 개의 신호 (예: 서비스를위한 대기 시간 + 수영장 및 근로자를위한 대기열 깊이 + 연령) 를 결합하십시오.


3) 반응성 대 예측 척도

피드백: HPA/ASG는 실제로 신호를 증가/감소시킵니다. 간단하지만 지연이 있습니다.
예측 (피드 포워드): 캘린더/과거 원격 측정/시장 이벤트. 미리 따뜻하게 사용할 수 있습니다: 피크 전에 N 인스턴스를 올립니다.
실제로: 하이브리드-기준선 (최소), 이벤트 전의 예측 부스트, 반응성 가져옵니다.


4) 규모 정책 및 안정성 매개 변수

대상 추적: 메트릭을 대상 근처에 유지하십시오 (예: CPU 60%).
단계 스케일링: 초과 단계 (공격적으로 접착제).
안정화 창/쿨 다운: 부드러운 플랩 (예: 60-180 초).
최소/최대: 하한 및 상한; 최대 - DB/제공자 한도 내에서.


5) 레벨 조정 (건축 캐스케이드)

1. 주변/API 게이트웨이-탄력적이지만 한계와 배압이 있습니다.
2. 서비스-대기 시간/RPS/풀 대기 별 HPA.
3. 대기열/작업자-메시지 깊이/연령별 KEDA/ASG.
4. DB/캐시-미리 조심스럽게 스케일링 (복제/샤딩).

규칙: "데이터" 가 견딜 수있는 것보다 더 빨리 응용 프로그램을 성장시키지 마십


6) 대기열과 거의 법칙 (근로자를 세는 방법)

입력 'λ' (msg/s) 및 평균 처리 시간' W '(s) 가있는 대기열의 경우:
  • 필요한 동시성은 'N _ min
  • 피크/테일 마진: 'N 자체 × W × (1. 2–1. 5)`.
Contact

문의하기

질문이나 지원이 필요하시면 언제든지 연락하십시오.우리는 항상 도울 준비가 되어 있습니다!

통합 시작

Email — 필수. Telegram 또는 WhatsApp — 선택 사항.

이름 선택 사항
Email 선택 사항
제목 선택 사항
메시지 선택 사항
Telegram 선택 사항
@
Telegram을 입력하시면 Email과 함께 Telegram에서도 답변드립니다.
WhatsApp 선택 사항
형식: +국가 코드 + 번호 (예: +82XXXXXXXXX).

버튼을 클릭하면 데이터 처리에 동의하는 것으로 간주됩니다.