Αυτόματη κλιμάκωση και ισορροπία SLA
Αυτόματη κλιμάκωση και ισορροπία SLA
1) Στόχοι και αρχές
Στόχος της αυτόματης κλιμάκωσης είναι να διατηρηθεί η SLO (καθυστέρηση/διαθεσιμότητα) με το ελάχιστο κόστος.
Κόστος: μην κυνηγάτε την «ατελείωτη» κλίμακα - κλίμακα εντός του προϋπολογισμού των σφαλμάτων και των νομισματικών ορίων.
Μοντέλο ανοικτού φορτίου: εισερχόμενα αιτήματα σχηματίζουν ροή έντασης 'λ'. το σύστημα πρέπει να παρέχει μέσο παραλληλισμό «N ≈ λ × W» (νόμος του Little), όπου «W» είναι ο μέσος χρόνος υπηρεσίας.
2) Ποιες μετρήσεις είναι κατάλληλες για ενεργοποίηση
Τεχνικά:- CPU/RAM/IO (δικαίωμα ψήφου για κορεσμό).
- Εν πτήσει και πισίνα περιμένουν.
- p95/p99 καθυστέρηση εφαρμογής (στην πραγματικότητα αντικατοπτρίζει SLO).
- Συντελεστής RPS/άφιξης.
- Ουρές αναμονής: βάθος, ηλικία μηνυμάτων, ταχύτητα επεξεργασίας.
- Το μερίδιο των επιτυχών συναλλαγών ≤ T δευτερόλεπτα (καταθέσεις, check-out).
- Χρόνος επιβεβαίωσης των συναλλαγών.
Σύσταση: συνδυασμός σημάτων 2-3: για παράδειγμα, καθυστέρηση + δέσμες για υπηρεσίες και βάθος αναμονής + ηλικία για εργαζόμενους.
3) Αντιδραστική έναντι προγνωστικής κλίμακας
Ανατροφοδότηση: Η HPA/ASG αυξάνει/μειώνει τις ενδείξεις στην πραγματικότητα. Απλό, αλλά υπάρχει μια καθυστέρηση.
Πρόβλεψη (feed-forward): ημερολόγιο/προηγούμενη τηλεμετρία/γεγονότα της αγοράς. Επιτρέπει την προθέρμανση: αύξηση N περιπτώσεων Δ t πριν από την κορυφή.
Στην πράξη: υβριδικό - γραμμή βάσης (ελάχιστο), προγνωστική ώθηση πριν από τα γεγονότα, επιφέρει αντίδραση.
4) Πολιτικές κλίμακας και παράμετροι σταθερότητας
Παρακολούθηση στόχου: διατήρηση της μέτρησης κοντά στον στόχο (π.χ. CPU 60%).
Βαθμιδωτή κλιμάκωση: βήματα καθ "υπέρβαση (επιθετικά σε πρόσφυση).
Παράθυρο σταθεροποίησης/ψύξη: λείο πτερύγιο (π.χ. 60-180 sec).
Min/Max: κάτω και άνω όρια· μέγιστο - εντός των ορίων DB/παρόχου.
5) Συντονισμός επιπέδου (αρχιτεκτονικός καταρράκτης)
1. Περίμετρος/πύλη API - ελαστική, αλλά με όρια και αντίθλιψη.
2. Υπηρεσίες - HPA ανά καθυστέρηση/RPS/κοινοπραξία αναμονής.
3. Ουρές/εργαζόμενοι - KEDA/ASG ανά βάθος/ηλικία μηνύματος.
4. DB/cache - προσεκτική κλιμάκωση (αντίγραφα/θραύσματα), εκ των προτέρων.
Κανόνας: Μην αυξάνετε την εφαρμογή γρηγορότερα από ό, τι θα αντέξουν τα «δεδομένα».
6) Queues and Little 's Law (Πώς να μετρήσετε τους εργαζόμενους)
Για σειρά αναμονής με είσοδο 'λ' (msg/s) και μέσο χρόνο επεξεργασίας 'W' (s):- Το απαιτούμενο νόμισμα είναι 'N _ min ≈ λ × W'.
- Περιθώριο κορυφής/ουράς: 'N ≈ λ × W × (1. 2–1. 5)`.