ავტო სკეილინგი და SLA ბალანსი
ავტო სკეილინგი და SLA ბალანსი
1) მიზნები და პრინციპები
ავტო სკეილინგის მიზანია SLO- ს შენარჩუნება (ლატენტობა/წვდომა) მინიმალური ღირებულებით.
SLA - SLO - SLA Cost: ნუ გაივლით „გაუთავებელ“ მასშტაბს - ჩვენ გადავდივართ შეცდომების და ფულადი ლიმიტების ბიუჯეტში.
დატვირთვის ღია მოდელი: შემომავალი თხოვნები ქმნიან ინტენსივობის ნაკადს „“; სისტემამ უნდა უზრუნველყოს საშუალო პარალელიზმი 'N' -2× W '(პატარა კანონი), სადაც' W 'საშუალო მომსახურების დროა.
2) რომელი მეტრიკებია შესაფერისი ტრიგერებისთვის
ტექნიკური:- CPU/RAM/IO (გაჯერების პროქსია).
- კონკურენტუნარიანობა (in-flight) და აუზი wait.
- p95/p99 განაცხადი (რეალურად ასახავს SLO).
- RPS/arrival rate (განაცხადების სიჩქარე).
- რიგები: სიღრმე, შეტყობინებების ასაკი, დამუშავების სიჩქარე.
- წარმატებული გარიგების წილი - T წამი (ანაბრები, ჩეკი).
- ოპერაციების დადასტურების დრო.
რეკომენდაცია: დააკავშიროთ 2-3 სიგნალი: მაგალითად, latency + pools მომსახურებისთვის და queue depth + age ვორკერებისთვის.
3) თვითმფრინავი skale
თვითმფრინავი: HPA/ASG ზრდის/ამცირებს რეპლიკებს ფაქტობრივად. უბრალოდ, მაგრამ არის ლაგი.
Predication (feed-forward): კალენდარი/ბოლო ტელემეტრია/ivents ბაზარი. მოიცავს pre-warm: ამაღლება N ინსტანციების წინა პლანზე.
პრაქტიკაში: ჰიბრიდი - ბასელინი (მინიმალური), მოვლენების წინ პრედიკულური ბუჩქი, რეაქტიული.
4) სათხილამურო პოლიტიკა და სტაბილურობის პარამეტრები
Target tracking: შეინახეთ მეტრი სამიზნეზე (მაგალითად, CPU 60%).
ნაბიჯი სკალირება: ნაბიჯები ჭარბი რაოდენობით (აგრესიულად სპაიკებზე).
Stabilization window/cooldown: flapping (მაგ., 60-180 წ.).
Min/Max: ქვედა და ზედა ზღვრები; მაქსი - როგორც BD/პროვაიდერის ლიმიტის ნაწილი.
5) დონის კოორდინაცია (არქიტექტურული კასკადი)
1. პერიმეტრი/API კარიბჭე ელასტიურია, მაგრამ ლიმიტები და ზურგჩანთები.
2. მომსახურება - HPA latency/RPS/pool wait.
3. რიგები/შემსრულებლები - KEDA/ASG შეტყობინებების სიღრმეში/ასაკში.
4. BD/ქეში - ფრთხილად მასშტაბები (რეპლიკები/შარდვა), წინასწარ.
წესი: ნუ გაზრდის განაცხადს უფრო სწრაფად, ვიდრე გაუძლებს „მონაცემებს“.
6) Little ხაზები და კანონი (როგორც ვორკერები ითვლიან)
შეყვანის ხაზისთვის (msg/s) და საშუალო დამუშავების დრო 'W' (s):- სასურველი პარალელიზმი: 'N _ min - × W'.
- მწვერვალების/კუდების ზღვარი: 'N - × W × (1. 2–1. 5)`.