איזון אוטומטי ו ־ SLA
איזון אוטומטי ו ־ SLA
1) מטרות ועקרונות
המטרה היא לשמור על SLO (זמינות/latency) במחיר מינימלי.
עלות SLA↔SLO↔SLA: אל תרדוף אחר קנה המידה ”האינסופי” בתקציב של טעויות וגבולות כספיים.
מודל עומס פתוח: בקשות נכנסות יוצרות זרם עוצמתי "Drown'; המערכת תספק מקביליות ממוצעת 'N' ו '(חוק קטן), שבו' W 'הוא זמן השירות הממוצע.
2) אילו מדדים מתאימים לגרירים
טכני:- מעבד/RAM/IO (פרוקסי לרוויה).
- בטיסה ובבריכה לחכות.
- p95/p99 latency יישום (למעשה משקף SLO).
- קצב הגעה של RPS.
- תורים: עומק, גיל ההודעות, מהירות עיבוד.
- נתח העסקאות המוצלחות כולל T שניות (פיקדונות, צ 'ק-אאוט).
- הגיע הזמן לאשר עסקאות.
המלצה: לשלב 2-3 אותות: לדוגמה, בריכות latency + בריכות עבור שירותים ו תור עומק + גיל לפועלים.
3) קנה מידה ריאקטיבי נגד ניבוי
משוב: HPA/ASG מגדיל/מקטין רמזים למעשה. פשוט, אבל יש פיגור.
חיזוי (הזנה-קדימה): לוח שנה/עבר טלמטריה/אירועי שוק. מאפשר טרום חם: להעלות N מקרים Tennest לפני השיא.
בפועל: היברידי ־ בסיס (מינימום), עידוד ניבוי לפני מאורעות, תגובתיות מביאה עימה.
4) מדיניות קנה מידה ופרמטרים ליציבות
איתור מטרות: שמרו על המשקל קרוב למטרה (למשל: מעבד 60%).
צעד בקנה מידה: צעדים עודפים (באגרסיביות על הדבקות).
חלון ייצוב/התקררות: תנופה חלקה (למשל 60-180 שניות).
מין/מקס: תחתון וגבולות עליונים; בתוך גבולות DB/ספק.
5) קואורדינציה רמה (מפל אדריכלי)
1. שער היקפי/API - גמיש, אבל עם גבולות ורפיסות גב.
2. שירותים - HPA על ידי איתור/RPS/בריכה לחכות.
3. תורים/עובדים - KEDA/ASG על ידי עומק הודעה/גיל.
4. DB/cache - מדדים בזהירות (העתקים/שרפים), מראש.
כלל: אל תגדל את היישום מהר יותר מ ”הנתונים”.
6) תורים וחוקי ליטל (כיצד לספור את העובדים)
עבור תור עם קלט (msg/s) וזמן עיבוד ממוצע (W):- נדרשת concurrency is 'N _ min industribution xW'.
- שולי שיא/זנב: 'N institution conduction × W × (1. 2–1. 5)`.