Avtoskeylinq və balans SLA
Avtoskeylinq və balans SLA
1) Məqsədlər və prinsiplər
Avtoskeylinqin məqsədi SLO-nu minimum qiymətə saxlamaqdır.
SLA, SLO, SLO, SLA Cost: «sonsuz» miqyasın ardınca getmirik - büdcə səhvləri və pul limitləri daxilində.
Açıq yük modeli: gələn sorğular 'λ' intensivlik axını yaradır; sistem 'N ≈ λ × W' (Little Law) orta paralelliyi təmin etməlidir, burada 'W' - orta xidmət vaxtıdır.
2) Hansı metrlər tetikləyicilərə uyğundur
Texniki:- CPU/RAM/IO (doyma üçün proxy).
- Rəqabət (in-flight) və pool wait.
- p95/p99 application latency (SLO real əks etdirir).
- RPS/arrival rate (müraciət sürəti).
- Növbələr: dərinlik, mesaj yaşı, emal sürəti.
- Uğurlu əməliyyatların payı ≤ T san (depozitlər, çek-aut).
- Əməliyyatların təsdiqlənməsi vaxtı.
Tövsiyə: 2-3 siqnalları birləşdirin: məsələn, xidmətlər üçün latency + pools və işçilər üçün queue depth + age.
3) Reaktiv vs qabaqcadan Skale
Reaktiv (feedback): HPA/ASG faktiki replikaları artırır/azaldır. Sadə, lakin laq var.
Predictive (feed-forward): təqvim/keçmiş telemetriya/market-events. pre-warm daxildir: zirvəsinə Δ t üçün N instants qaldırmaq.
Praktikada: hibrid - bazeline (minimum), hadisələrdən əvvəl proqnozlaşdırılan bust, reaktiv gətirir.
4) Skale siyasəti və sabitlik parametrləri
Hədəf izləmə: hədəfə yaxın metrik saxlamaq (məsələn, CPU 60%).
Step scaling: aşma mərhələləri (adaptasiyalarda aqressiv).
Stabilization window/cooldown: hamarlamaq (məsələn, 60-180 san).
Min/Max: aşağı və üst limitləri; max - DB/provayder limitləri çərçivəsində.
5) Səviyyələrin koordinasiyası (memarlıq kaskadı)
1. Perimetr/API-şlyuz - elastikdir, lakin limitləri və backpressure ilə.
2. Xidmətlər - latency/RPS/pool wait üzrə HPA.
3. Növbələr/işçilər - Mesajların dərinliyinə/yaşına görə KEDA/ASG.
4. BD/cache - qabaqcadan ehtiyatla (replika/şardlama) ölçmək.
Qayda: tətbiqetməni «məlumatlara» dözməkdən daha sürətli artırmayın.
6) Növbələr və Little qanunu (necə saymaq üçün)
Giriş 'λ' (msg/s) və orta müalicə müddəti 'W' (s) olan növbə üçün:- İstədiyiniz paralellik: 'N _ min ≈ λ × W'.
- Pik/quyruq ehtiyatı ilə: 'N ≈ λ × W × (1. 2–1. 5)`.