Autoscaling 및 SLA 균형

자동 스케일링 및 SLA 균형

1) 목표와 원칙

오토 스케일링의 목표는 SLO (대기 시간/가용성) 를 최소 비용으로 유지하는 것입니다.
SLA SL SLO SLA 비용: 오류 및 금전적 한도 예산 내에서 "끝없는" 척도를 쫓지 마십시오.
오픈로드 모델: 들어오는 요청은 강도 스트림 'λ' 를 형성합니다. 이 시스템은 평균 병렬 처리 시간을 제공해야하며, 여기서 'W' 는 평균 서비스 시간입니다.

2) 트리거에 적합한 지표

기술:

CPU/RAM/IO (채도 프록시).
기내 및 수영장 대기.
p95/p99 적용 대기 시간 (실제로 SLO 반영).
RPS/도착률.
대기열: 깊이, 메시지 연령, 처리 속도.

비즈니스 SLI:

성공적인 트랜잭션의 비율
거래를 확인할 시간.

권장 사항: 2-3 개의 신호 (예: 서비스를위한 대기 시간 + 수영장 및 근로자를위한 대기열 깊이 + 연령) 를 결합하십시오.

3) 반응성 대 예측 척도

피드백: HPA/ASG는 실제로 신호를 증가/감소시킵니다. 간단하지만 지연이 있습니다.

예측 (피드 포워드): 캘린더/과거 원격 측정/시장 이벤트. 미리 따뜻하게 사용할 수 있습니다: 피크 전에 N 인스턴스를 올리십시오

실제로: 하이브리드-기준선 (최소), 이벤트 전의 예측 부스트, 반응성 가져옵니다.

4) 규모 정책 및 안정성 매개 변수

대상 추적: 메트릭을 대상 근처에 유지하십시오 (예: CPU 60%).
단계 스케일링: 초과 단계 (공격적으로 접착제).
안정화 창/쿨 다운: 부드러운 플랩 (예: 60-180 초).
최소/최대: 하한 및 상한; 최대 - DB/제공자 한도 내에서.

5) 레벨 조정 (건축 캐스케이드)

1. 주변/API 게이트웨이-탄력적이지만 한계와 배압이 있습니다.
2. 서비스-대기 시간/RPS/풀 대기 별 HPA.
3. 대기열/작업자-메시지 깊이/연령별 KEDA/ASG.
4. DB/캐시-미리 조심스럽게 스케일링 (복제/샤딩).

규칙: "데이터" 가 견딜 수있는 것보다 더 빨리 응용 프로그램을 성장시키지 마십시오

6) 대기열과 거의 법칙 (근로자를 세는 방법)

입력 'λ' (msg/s) 및 평균 처리 시간' W '(s) 가있는 대기열의 경우:

필요한 동시성은 'N _ min
피크/테일 마진: 'N 자체 × W × (1. 2–1. 5)`.

Autoscaling 및 SLA 균형

자동 스케일링 및 SLA 균형

문의하기

빠른 연결

영상이 곧 업데이트됩니다

현재 프로젝트로 매우 바쁜 상태입니다