خودکار و تعادل SLA
خودکار و تعادل SLA
1) اهداف و اصول
هدف از Autoscaling این است که SLO (تاخیر/در دسترس بودن) را در حداقل هزینه نگه دارید.
هزینه SLA↔SLO↔SLA: مقیاس «بی پایان» را تعقیب نکنید - مقیاس در بودجه خطاها و محدودیت های پولی.
مدل بار باز: درخواست های دریافتی یک جریان شدت «λ» را تشکیل می دهند ؛ سیستم باید توازی متوسط «N ≈ λ × W» (قانون Little) را فراهم کند، جایی که «W» میانگین زمان سرویس است.
2) چه معیارهایی برای محرک ها مناسب است
فنی:- CPU/RAM/IO (پروکسی برای اشباع).
- در پرواز و استخر صبر کنید.
- p95/p99 تاخیر برنامه (در واقع SLO را نشان می دهد).
- RPS/نرخ ورود
- صف ها: عمق، سن پیام ها، سرعت پردازش.
- سهم معاملات موفق ≤ T ثانیه (سپرده، چک کردن).
- زمان برای تایید معاملات
توصیه: ترکیب 2-3 سیگنال: به عنوان مثال، تاخیر + استخر برای خدمات و عمق صف + سن برای کارگران.
3) مقیاس واکنشی در مقابل پیش بینی
بازخورد: نشانه های افزایش/کاهش HPA/ASG در واقع. ساده است، اما یک وقفه وجود دارد.
پیش بینی (خوراک به جلو): رویدادهای تقویم/گذشته تله متری/بازار. را قادر می سازد قبل از گرم: بالا بردن N نمونه Δ t قبل از اوج.
در عمل: ترکیبی - پایه (حداقل)، افزایش پیش بینی قبل از حوادث، واکنشی به ارمغان می آورد.
4) سیاست های مقیاس و پارامترهای ثبات
ردیابی هدف: متریک را در نزدیکی هدف نگه دارید (به عنوان مثال CPU 60٪)
مقیاس گام: مراحل بیش از حد (به شدت در چسبندگی).
پنجره تثبیت/cooldown: flapping صاف (به عنوان مثال 60 تا 180 ثانیه)
حداقل/حداکثر: حد پایین و بالا ؛ حداکثر - در محدوده DB/ارائه دهنده.
5) هماهنگی سطح (آبشار معماری)
1. محیط/API دروازه - الاستیک، اما با محدودیت و فشار پشتی.
2. خدمات - HPA توسط تاخیر/RPS/استخر صبر کنید.
3. صف/کارگران - KEDA/ASG توسط عمق پیام/سن.
4. DB/cache - مقیاس بندی با دقت (replicas/shardings)، در پیشبرد.
قانون: برنامه را سریعتر از «داده ها» مقاومت نکنید.
6) صف و قانون کوچک (نحوه شمارش کارگران)
برای صف با ورودی 'λ' (msg/s) و متوسط زمان پردازش 'W' (s):- همروندی مورد نیاز «N _ min ≈ λ × W» است.
- حاشیه اوج/دم: "N W (1. 2–1. 5)`.