Otomatik ölçeklendirme ve SLA Dengesi
Otomatik ölçeklendirme ve SLA Dengesi
1) Hedefler ve ilkeler
Otomatik ölçeklemenin amacı, SLO'yu (gecikme/kullanılabilirlik) minimum maliyetle tutmaktır.
SLA↔SLO↔SLA Maliyet: "Sonsuz" ölçeği kovalamayın - hatalar ve parasal limitler bütçesi içinde ölçek.
Açık yük modeli: gelen istekler bir yoğunluk akışı 'λ' oluşturur; Sistem ortalama paralellik 'N ≈ λ × W' (Little yasası) sağlayacaktır, burada 'W' ortalama servis süresidir.
2) Hangi metrikler tetikleyiciler için uygundur
Teknik:- CPU/RAM/IO (doygunluk için proxy).
- Uçak içi ve havuz beklemek.
- P95/p99 uygulama gecikmesi (aslında SLO'yu yansıtır).
- RPS/varış oranı.
- Kuyruklar: derinlik, mesajların yaşı, işlem hızı.
- Başarılı işlemlerin payı ≤ T saniye (depozito, check-out).
- İşlemleri onaylama zamanı.
Öneri: 2-3 sinyali birleştirin: örneğin, hizmetler için gecikme + havuzlar ve kuyruk derinliği + çalışanlar için yaş.
3) Reaktif vs öngörücü ölçek
Geri bildirim: HPA/ASG aslında ipuçlarını arttırır/azaltır. Basit, ama bir gecikme var.
Tahmini (feed-forward): takvim/geçmiş telemetri/pazar etkinlikleri. Ön ısınmayı etkinleştirir: N örneklerini tepe noktasından önce t Δ yükseltin.
Uygulamada: hibrid - taban çizgisi (minimum), olaylardan önce öngörücü destek, reaktif getirir.
4) Ölçek politikaları ve istikrar parametreleri
Hedef izleme: metriği hedefin yakınında tutun (örn. CPU %60).
Adım ölçekleme: aşırı adımlar (yapışıklıklarda agresif).
Stabilizasyon penceresi/dolum süresi: pürüzsüz çırpma (örn. 60-180 sn).
Min/Max: alt ve üst limitler; maksimum - DB/sağlayıcı sınırları dahilinde.
5) Seviye koordinasyonu (mimari kaskat)
1. Çevre/API ağ geçidi - elastik, ancak sınırlar ve geri basınç ile.
2. Hizmetler - Gecikme/RPS/havuz bekleme HPA.
3. Kuyruklar/işçiler - KEDA/ASG mesaj derinliğine/yaşına göre.
4. DB/cache - önceden dikkatlice ölçeklendirme (replikalar/parçalama).
Kural: Uygulamayı "verilerin" dayanacağından daha hızlı büyütmeyin.
6) Kuyruklar ve Küçük Yasası (işçilerin nasıl sayılacağı)
Giriş 'λ' (msg/s) ve ortalama işlem süresi 'W' (s) olan kuyruk için:- Gerekli eşzamanlılık 'N _ min ≈ λ × W'dir.
- Tepe/kuyruk marjı: 'N ≈ λ × W × (1. 2–1. 5)`.