מדדי רשת נפוצים
1) מדוע אנו זקוקים ל ”ציונים כלליים”
תוצאות שונות ומחלוקות ”כנות”. אמות מידה נפוצות הן תרחישים סטנדרטיים, עומסים, שיטות מדידה וצורות דיווח המאפשרות:- השוואת תחומים/צמתים/ספקים על ידי SLO יחיד;
- ניהול הגדרות רשת (תעריפים, מכסות, מגבלות) בהתבסס על עובדות
- לזהות רגרסיות לפני תקריות בתוצר;
- הפוך תמריצים (בונוסים/עונשים) ואמון שקוף.
2) טקסונומיה של מדדים
2. ביצועים 1
Latency: p50/p95/p99, פלי, התחלה קרה.
דרך: msgs/s, tx/s, GB/s (DA/אחסון), RPS (API).
זמינות: SLO הצלחה, נתח של פסקי זמן/מגשים מחדש.
הזמנה ופעם אחת בדיוק: מחוץ לסדר%, יחס שכפול.
2. 2 אמינות ויציבות
אירועי SLA שברים/1k, MTBF/MTTR, הידלדלות QOS.
זמן ייצוב לאחר התפרצות.
2. 3 בטיחות
תקריות גניבת פקודות (גשר, x-domain).
איכות אימות/אישור: אחוז של סובלנות נדחית/שגויה.
אותות נגד הונאה: TPR/FPR דפוסי התנהגות.
2. 4 כלכלה
עלות לשרת/בקשה, מרווח/הודעה, הכנסות/DA בייט.
יעילות המשאבים: מעבד/GPU-util, IOPS/GB, יציאה/בקשה.
הגינות: ”שכן רועש” אינדקס, הקצאת מכסה.
2. 5pelm ו ־ Name Proc
מהירות התכנסות פרמטר, הצלחה של שחזור משחרר,
זמן עיבוד של הצעות, נתח של קולות עם R-משנה.
3) פרופילי תנועה ושיעורי QOS
Q4 (פקודות קריטיות): מסרים קטנים, מועדים מוקפדים.
Q3 (זרימות מסודרות): חלוקת מפתחות, הבטחת סדר.
Q2 (יעיל בדיוק-פעם): אידמפוטנטיות + Deadup.
Q1 (לפחות פעם אחת): טלמטריה, אירועים המוניים.
עבור כל מחלקה, אנו קובעים פרופילי התייחסות: גודל הודעה, תדרים, פרופורציה של קריאות סינכרוניות/אסינכרוניות, התפרצויות, קורלציות.
4) סוויטת ספסל
1. מסרים ליבה: 1 # N bustN # 1; צמיחת RPS לרוויה; מדידה של p95 ויחס שכפול.
2. API Low-Latency: תמהיל קריאה/כתיבה, מטמון קר/חם, גבולות והשפלה.
3. DA/Storage: Publishing Burches, Interput/GB metering and finelies.
4. X-Domain/Bridge: הוכחות, סופיות, תקופות אתגר, הפסדים/חזרות.
5. ML-Inference Edge: POP latency/skip, ירידה בעומס יתר.
6. Batch & Stream: חלונות ETL, lags צרכני, יעילות תרמיל גב.
7. אבטחה והתעללות: דפוסי הונאה סינתטיים, עומס נגד הונאה, FPR/TPR.
8. כשל/כאוס: AZ/בריכה off, stopcocks, SLO חזרה זמן.
5) מתודולוגיית מדידה
5. 1 שכפול
גרסאות קבועות של סכימות/הגדרות SDK; ”זרע” גנרטורים עומס.
חימום תוך דקות. מדידות בשלב האורווה-M דקות.
איתור/מרחב וקורלציה יומן.
5. 2 כנות ואנטי משחקים
שלב הגדרה מפוצל ו עיוור-לרוץ (פרופיל עומס נסתר).
משימות בקרה נסתרות (בדיקת מטמון ”עטיפות ”/אופטימיזציות מיוחדות לחתימות).
סט של בדיקות שחורות: שדות בלתי צפויים, מיקרו-פלייס, גדלים ”נדירים”.
5. 3 נוסחאות
קצב הצלחה = 1 - (פסקי זמן + שגיאות )/בקשות
Tailamplification = p99/p50, חדר הראש = (cap-curn )/cap
Cost/Req = Defence (הצעת משאב )/processive _ cost
Fairwealth Index (Jain) עבור מכסות/להקות.
6) SLO ומטרות ייחוס (benchmarks)
Q4 API: p95 nothered 200 ms, הצלחה -99. 99%, שגיאות 1/10⁴.
הודעה לקוורטרבק: הפרה של פקודת 10⁻⁶/soobshch, p95 500 ms.
פרסומי DA: finality looght 3 × T _ block, Breakput wing X GB/h.
גשר: אישורים שגויים = 0; חריגות MTTR סימון 1 h.
זרם: lag loogle 2 × window; טיפה = 0 עבור נושאים קריטיים.
אצווה: דקירות חלון מתאימות T_window עם מרווח של 20%.
7) חפצים ופורמט דיווח
דרכון הריצה: גרסאות, תצורות, תאריך/זמן, גיאו.
גרפים: latency (pXX), breadput, lags, uperation.
טבלאות מיפוי SLO: מעבר/כישלון + דלתא להתייחסות.
נסיגות הון: רשימה עם RCA ותוכנית תיקון.
כלכלה: עלות לשרת, מרווח/הודעה, קודקודים חמים.
מסקנה: ”מוכן לשחרור/התכווננות דרושה/חוסם”.
8) יחסים עם תעריפים ומגבלות
אם הטיילפליפיישן יגדל * אוטומטית תוריד את המכסות או תעלה את המחיר של דיירים ”רועשים”.
צמתים עם הפסקות SLA מאבדים את חלקם של פרסים (חיתוך) לפני ההחלמה.
דומיין באיכות יציבה מקבל מחיר נמוך (בונוס איכות).
9) יכולת תצפית של מדדים
איתור מקצה לקצה של כל הבקשות.
DLQ/Replay לאירועים כושלים ואישור אידמפוטנטיות.
Benchrun Live, Tail Heatmap, Backpressure Monitor, Bridge Risk, DA Bridput.
10) תהליכים של iLULI
שער שחרור מראש: ניתן לשחרר רק כאשר 'SLO _ pass> = סף המטרה' ואין מנעולי אבטחה.
שינוי השפעה: כל תצורה/גרסה משמעותית עוברת ספסל עשן קצר.
Sunset-SLO: זמנית הגדילו את הדרישות לטייסים; אוטומטית על ידי תאריך.
אר-משנה קולות: בסכסוכים על המטרי, למשתתפים עם מוניטין אר גבוה לאיכות יש משקל רב יותר.
11) פנקס ההשקה של Benchmark
1. אוסף של דרישות: מעגלי נתיב קריטיים, כיתות QOS, SLOS עסקי.
2. עיצוב פרופיל: גודל מסרים, מיקס R/W, התפרצויות, שיתוף X-domain.
3. כלים טעינה: גנרטורים, תיקוני נתונים, דפוסי הונאה סינתטיים.
4. תצפית: איתור, מדדים, יומני מדיניות, תקציב שגיאות.
5. מטרות Benchmark: SLOs, סף כלכלי, מסדרונות הגינות.
6. הפעלת טייס: כיול, זיהוי צוואר בקבוק, תיקון.
7. סדירות: נייטלי/שבועי benchi + דיווח בקזנצ 'יסטבו/lembersheystvo.
8. תקריות: תוספי כאוס, לאחר המוות, עדכוני בדיקה.
12) אתיקה נגד משחקים ומדידות
איסור על ”אופטימיזציה מיוחדת לחתימת הספסל” מבלי לשפר את תנועת הייצור האמיתית.
עומסים עיוורים, פרמטרים אקראיים של רעש, אירועי שליטה.
דיווחים ציבוריים עם מתודולוגיה; ועדת בוררות למקרים שנויים במחלוקת.
13) ”דגלים אדומים” טיפוסיים
p95 יציב, אבל p99. 9 גדל באופן חד תחרות חבויה על משאבים.
תפוקה היא גבוהה, אבל יחס שכפול = = אידמפוטנטיות שגויה.
Latency טוב, אבל Cost/Req לא להתכנס = = תלות חוצה/כניסה כפולה.
Low lag, אבל עומק DLQ גדל * שגיאות ב retras/הסגר.
14) תוכנית סימון הספסל KPI
כיסוי: הפרופורציה של נתיבים קריטיים עם ספסלים רגילים WIMX%.
דו "ח זמן סגר Y שעות לאחר הריצה.
איכות: מספר רגרסיות שנתפסו לפני התקרית מראש; כלומר דלתא ל-SLO לאחר תיקון.
כלכלה: עלות לשרת ירידה/חקירה ומספרי ”שכן רועש”.
שיעור התגובות על רגרסיית ספסל; שקיפות של דיווחים ציבוריים.
15) רשימת משלוחים
[ ] פרופילי טעינה קבועים ושיעורי QOS
[ ] עקבות מוגדרות, מטריצות, DLQ/הילוך חוזר
[ ] SLOS/סף ומסדרונות הגינות מוגדרים
[ ] הגנה מפני משחקים ומבחנים עיוורים
[ ] תבנית דיווח ושחרור תהליך השער המתואר
[ ] רגיל (לילה/שבועי) פועל
[ ] יחידת כאוס/כשל משולבת
[ ] לאחר המוות הציבורי ושיפור במבחן הביצועים
16) גלוסרי
סוויטת בנץ ': סט של תרחישי התייחסות ופרופילים טעינה.
הגברה זנב: יחס p99/p50 (חוזק זנב).
Index Faironwealth (Jain) - Resource Uniformity Metric.
DLQ/Replay: הסגר ועיבוד מחדש של אירועים.
SLO/SLA: רמות שירות היעד/ערבויות חוזיות.
התמודדות נסתרת נגד משחקים.
שורה תחתונה: המדדים המשותפים הופכים את ביצועי הרשת ואת היציבות לפרמטרים הניתנים לניהול, תרחישים סטנדרטיים, דיווחים שקופים ומדיניות אנטי-משחקים מבטיחים השוואת תוצאות, אמון חברים ואבולוציה של המערכת האקולוגית ללא ניחוש ו ”קסם”.