איזון אוטומטי ו ־ SLA

1) מטרות ועקרונות

המטרה היא לשמור על SLO (זמינות/latency) במחיר מינימלי.
עלות SLA↔SLO↔SLA: אל תרדוף אחר קנה המידה ”האינסופי” בתקציב של טעויות וגבולות כספיים.
מודל עומס פתוח: בקשות נכנסות יוצרות זרם עוצמתי "Drown'; המערכת תספק מקביליות ממוצעת 'N' ו '(חוק קטן), שבו' W 'הוא זמן השירות הממוצע.

2) אילו מדדים מתאימים לגרירים

טכני:

מעבד/RAM/IO (פרוקסי לרוויה).
בטיסה ובבריכה לחכות.
p95/p99 latency יישום (למעשה משקף SLO).
קצב הגעה של RPS.
תורים: עומק, גיל ההודעות, מהירות עיבוד.

עסקים SLI:

נתח העסקאות המוצלחות כולל T שניות (פיקדונות, צ 'ק-אאוט).
הגיע הזמן לאשר עסקאות.

המלצה: לשלב 2-3 אותות: לדוגמה, בריכות latency + בריכות עבור שירותים ו תור עומק + גיל לפועלים.

3) קנה מידה ריאקטיבי נגד ניבוי

משוב: HPA/ASG מגדיל/מקטין רמזים למעשה. פשוט, אבל יש פיגור.
חיזוי (הזנה-קדימה): לוח שנה/עבר טלמטריה/אירועי שוק. מאפשר טרום חם: להעלות N מקרים Tennest לפני השיא.
בפועל: היברידי ־ בסיס (מינימום), עידוד ניבוי לפני מאורעות, תגובתיות מביאה עימה.

4) מדיניות קנה מידה ופרמטרים ליציבות

איתור מטרות: שמרו על המשקל קרוב למטרה (למשל: מעבד 60%).
צעד בקנה מידה: צעדים עודפים (באגרסיביות על הדבקות).
חלון ייצוב/התקררות: תנופה חלקה (למשל 60-180 שניות).
מין/מקס: תחתון וגבולות עליונים; בתוך גבולות DB/ספק.

5) קואורדינציה רמה (מפל אדריכלי)

1. שער היקפי/API - גמיש, אבל עם גבולות ורפיסות גב.
2. שירותים - HPA על ידי איתור/RPS/בריכה לחכות.
3. תורים/עובדים - KEDA/ASG על ידי עומק הודעה/גיל.
4. DB/cache - מדדים בזהירות (העתקים/שרפים), מראש.
כלל: אל תגדל את היישום מהר יותר מ ”הנתונים”.

6) תורים וחוקי ליטל (כיצד לספור את העובדים) ‏

עבור תור עם קלט (msg/s) וזמן עיבוד ממוצע (W):

נדרשת concurrency is 'N _ min industribution xW'.
שולי שיא/זנב: 'N institution conduction × W × (1. 2–1. 5)`.

איזון אוטומטי ו ־ SLA

איזון אוטומטי ו ־ SLA

צרו קשר

חיבור מהיר

הווידאו יעודכן בקרוב

אנחנו עמוסים מאוד בפרויקטים כרגע