GH GambleHub

Otomatik ölçeklendirme ve SLA Dengesi

Otomatik ölçeklendirme ve SLA Dengesi

1) Hedefler ve ilkeler

Otomatik ölçeklemenin amacı, SLO'yu (gecikme/kullanılabilirlik) minimum maliyetle tutmaktır.
SLA↔SLO↔SLA Maliyet: "Sonsuz" ölçeği kovalamayın - hatalar ve parasal limitler bütçesi içinde ölçek.
Açık yük modeli: gelen istekler bir yoğunluk akışı 'λ' oluşturur; Sistem ortalama paralellik 'N ≈ λ × W' (Little yasası) sağlayacaktır, burada 'W' ortalama servis süresidir.


2) Hangi metrikler tetikleyiciler için uygundur

Teknik:
  • CPU/RAM/IO (doygunluk için proxy).
  • Uçak içi ve havuz beklemek.
  • P95/p99 uygulama gecikmesi (aslında SLO'yu yansıtır).
  • RPS/varış oranı.
  • Kuyruklar: derinlik, mesajların yaşı, işlem hızı.
İş SLI:
  • Başarılı işlemlerin payı ≤ T saniye (depozito, check-out).
  • İşlemleri onaylama zamanı.

Öneri: 2-3 sinyali birleştirin: örneğin, hizmetler için gecikme + havuzlar ve kuyruk derinliği + çalışanlar için yaş.


3) Reaktif vs öngörücü ölçek

Geri bildirim: HPA/ASG aslında ipuçlarını arttırır/azaltır. Basit, ama bir gecikme var.
Tahmini (feed-forward): takvim/geçmiş telemetri/pazar etkinlikleri. Ön ısınmayı etkinleştirir: N örneklerini tepe noktasından önce t Δ yükseltin.
Uygulamada: hibrid - taban çizgisi (minimum), olaylardan önce öngörücü destek, reaktif getirir.


4) Ölçek politikaları ve istikrar parametreleri

Hedef izleme: metriği hedefin yakınında tutun (örn. CPU %60).
Adım ölçekleme: aşırı adımlar (yapışıklıklarda agresif).
Stabilizasyon penceresi/dolum süresi: pürüzsüz çırpma (örn. 60-180 sn).
Min/Max: alt ve üst limitler; maksimum - DB/sağlayıcı sınırları dahilinde.


5) Seviye koordinasyonu (mimari kaskat)

1. Çevre/API ağ geçidi - elastik, ancak sınırlar ve geri basınç ile.
2. Hizmetler - Gecikme/RPS/havuz bekleme HPA.
3. Kuyruklar/işçiler - KEDA/ASG mesaj derinliğine/yaşına göre.
4. DB/cache - önceden dikkatlice ölçeklendirme (replikalar/parçalama).
Kural: Uygulamayı "verilerin" dayanacağından daha hızlı büyütmeyin.


6) Kuyruklar ve Küçük Yasası (işçilerin nasıl sayılacağı)

Giriş 'λ' (msg/s) ve ortalama işlem süresi 'W' (s) olan kuyruk için:
  • Gerekli eşzamanlılık 'N _ min ≈ λ × W'dir.
  • Tepe/kuyruk marjı: 'N ≈ λ × W × (1. 2–1. 5)`.
Contact

Bizimle iletişime geçin

Her türlü soru veya destek için bize ulaşın.Size yardımcı olmaya her zaman hazırız!

Entegrasyona başla

Email — zorunlu. Telegram veya WhatsApp — isteğe bağlı.

Adınız zorunlu değil
Email zorunlu değil
Konu zorunlu değil
Mesaj zorunlu değil
Telegram zorunlu değil
@
Telegram belirtirseniz, Email’e ek olarak oradan da yanıt veririz.
WhatsApp zorunlu değil
Format: +ülke kodu ve numara (örneğin, +90XXXXXXXXX).

Butona tıklayarak veri işlemenize onay vermiş olursunuz.