אופטימיזציה עלויות ענן
1) מדוע מבצעים פיננסיים ואילו מטרות
המטרה היא להפחית את COGS תוך שמירה על מהירות SLO/פיתוח. סוגיות מפתח:- כמה עולה הבקשה 1, המשתמש הפעיל 1, הדייר 1?
- מהי ההשפעה השולית של התכונה/התנועה החדשה?
- היכן ה ”הדלפות” (יציאה, יומנים מיותרים, תקורה של מעבד/זיכרון, משאבים בטלים)?
מדדים בסיסיים
עלות/Req, עלות/דקה פעילה, עלות/דייר/מותג, עלות/GB-מאוחסנת, עלות/GB-egress.
COGS%: נתח של עלות המכירות בהכנסות.
בזבוז%: (משאבים בתשלום אך לא בשימוש )/( כל המשאבים).
2) לסדר: תגיות, בעלות, תקציבים
תגיות/תוויות: ”env”, ”team”, ”service”, ”terenant',” product', ”cost _ center”, ”slo _ tier”.
בעלות: לכל משאב יש בעלים ו-TTL.
תקציבים/התראות: תקציבים חודשיים/שבועיים עם סף של 50/80/100% + גילוי אנומליה.
מדיניות כקוד: איסור ”ללא תגיות”, הגבלת גודל, אזורי ברירת מחדל, מכסות מוקצות.
hcl module "policy" {
source = "finops/policy/required-tags"
required_tags = ["env","team","service","cost_center","tenant"]
}
3) מנופים ארכיטקטוניים של הכלכלה
3. 1 ממדים נכונים וסולם אוטומטי
הגדלה נכונה: בחר מקרים עבור המעבד/RAM p95 בפועל.
הגדרה אוטומטית: אופקית> אנכית; Croster Autoscaler/Karpenter, חסר מרפסות - min/max concurncy.
דרכים קרות - בתור/באצ 'י; משימות ארוכות טווח לעובדים לפי לוח זמנים.
3. 2 ספוט/קיבולת נרכשת
Spot/Preempetable עבור ללא מדינה/רקע ומודיע; להחזיק את חוצץ על-דרישה.
RI/CUD/Supporting Plans: Book a stable 50-70% baseload, השאר אלסטי.
3. 3 אחסון נתונים ושיעורים
נפרד: חם (SSD), חם (סטנדרטי), קר/ארכיון (קרחון/ארכיון).
מדיניות אופן חיים: שיעורי משמרת, למחוק אחרי הסמסטר.
אפשר ורסינינג במקום הדרוש לנעילת אובייקט (תולעת) לצורך ביקורת בלבד.
3. 4 רשת ויציאה
CDN/edge + מעופש-בזמן-חידוש מפחית את היציאה הבין-אזורית.
ערוצים פרטיים (Private Link/PSC/Direct Connect) במקום האינטרנט ”גולמי”.
דחיסה (ברוטלי/Zstd), HTTP/3/QUIC - פחות חיבור/RTT.
3. 5 מסדי נתונים ומטמונים
בחר סכימה דו רמה: מטמון (Redis/Memcashed) + אחסון.
קרא העתקים עבור אנליטיקה, כולל אוטומטי ואקום/דחיסה, השתמש ב ־ PIGDS Bounder/RDS Proxy.
עבור שולחנות גדולים - מחיצה/TTL/ארכיון.
4) קוברנטס - כלכלה
בקשות/הגבלות על ידי כיתת SLO; 'limits: null' prohibition.
VPA (המלצות), Carpenter (בחירת מקרים ללבבות), Bin Arging (סובלנות/זיקה).
פרוד/שלב/dev נפרד ברמת אשכול/צומת (סוגים שונים ומדיניות).
כיתות רשת ואחסון: בחר SC/IOPS על ידי פרופיל טעינה, לא ”פרימיום בכל מקום”.
שיעורי QOS וסדרי עדיפויות: חיסכון בעבודות רקע.
פרופילי יומן: סוכני סירה עם חוצץ מקומי, שולח על ידי חבורות.
5) כלכלה ללא סרבלים
מקרים דקים/מותאמים לידיות חמות בלבד.
קטן לפרוס-צרור, עצלן-init, שיתוף קשרים.
דד-ליין ועמידה במשימות כבדות.
צביר פונקציות (מאוורר) במקום תריסר טיולים בהתאם.
6) יכולת תצפית: לשלם עבור טלמטריה יקרה
יומנים: מבניים, ללא מילוליות; מצגת לפי כיתה (שגיאות פרוד ארוכות יותר, דיבאג - קצר).
עקבות: מבוסס זנב - 100% שגיאות/p99, השאר 1-10%.
מדדים: צבירה/ירידה, שליחה דלילה.
סינון PII לפני שליחה (פחות בייטים וסיכונים).
7) רשת ספקים ושוק
השוואת המחירים של האזורים, השוליים של השירותים המנוהלים, חבילות השוק.
משא ומתן: הנחות נפח (RI/CUD), התחייבויות, תוכניות אשראי.
אל תשכפל את סאס עם פונקציונליות חופפת.
8) כלכלת יחידה ולוחות מחוונים
עלות גדולה SLI/SLO
עלות/Req לפי מסלולים (התחברות, קטלוג, הפקדה).
עלות/דייר/מותג/אזור.
יציאה/Req, אחסון/Req, חישוב/Req.
בזבוז% כיסוי RI/SP%.
לוחות מחוונים (סט מינימלי)
”מפת עלות” עבור שירותים/צוותים עם ירידה למשאב.
יציאת ”מפת חום” לפי כיוון.
”Service lag # SLO”: מתאם של p99 ו ־ Cost/Req.
”RI/CUD/Spot” כיסוי וחיסכון קו.
9) תהליכי פינוקס
ניתוח שבועי של חשבונות עם בעלי שירות.
שינוי סקירה עם הערכה של עלות התכונות לפני הכללת הייצור.
מעקות בטיחות: גבולות מכסה, השלמה אוטומטית של משאבי סרק, TTL לסביבות מבחן.
GameDays of Value: Artificial Spades/Feature Flages, Checking Butter Ceriability.
10) תרופות אנטי ־ פטריות
משאבים ”זמניים” ללא TTL = לנצח.
`0. 0. 0. 0/0 &fospostachegress + אין חשבונות CDN # egress להתפוצץ.
ללא תגיות/תוויות, בלתי אפשרי להקצות עלויות.
רישומי DEBUG במכירות, 100% עקבות - טרה-בייט חסרי משמעות.
”ליתר ביטחון” ללא מדדי שימוש.
כל העומס הוא רק על פי דרישה, אין RI/Spot/מתחייב.
11) פרטים של iGaming/Finance
PSP/דמי תשלום - חלק מ COGS: לייעל ניתוב חכם לספקים זולים/אמינים; סטטוסים מטמון, להימנע חזרות ללא אידמפוטנציה.
ספקי KYC/AML: בקשות חבילות, מטמון תוצאות שימוש (TTL לפי מדיניות), מדד עלות/KYC.
”דרכים כספיות” (הפקדה/משיכה): SLOs נפרדים ותקציב; עתודות לאירועי שיא, דגימות חמות רק שם.
תוכן/CDN: קצה מקומי ותחומים אזוריים להפחתת היציאה ולציית לתושבות נתונים.
דרישות חוקיות: אחסון תולעת עבור היקף ביקורת - הגבלה (צבירה, TTL, דחיסה).
12) מתכונים קטנים
12. מדיניות שימור יומן 1
שגיאות פרוד: 30-90 ימים; מידע: 7-14; דיבאג: 24-72 שעות.
ארכיון רק על בקשת ציות.
12. 2 טלמטריה קנרית
עבור תכונה חדשה - 100% של עקבות במשך 24 השעות הראשונות.
12. 3 גלגלי חיים של אובייקט
json
[
{"prefix": "raw/", "days_to_warm": 30, "days_to_cold": 90, "days_to_delete": 365},
{"prefix": "audit/", "lock": "WORM-365d"}
]
12. 4 תקציבים/התראות (רעיון)
תקציב חודשי לכל קבוצה; מתריע 50/80/100%; גילוי אנומליה> 30% של המגמה מעל 24 שעות
13) רשימת מוכנות תומכת
[ ] 100% משאבים; פוליטיקאים לחסום אלה שלא מתוגרים.
[ ] תקציבים והתראות + גילוי אנומליה; דיווחים על זנים/מותגים/אזורים.
[ ] RI/CUD/Spot כיסוי בזלת; יש חוצץ על פי דרישה.
[ ] K8s: בקשות/גבולות מוגדרים; VPA/Karpenter; אריזה של בן; כיתות אחסון/IOPS נפרדות.
[ ] Serverless: provised/min עבור שבילים חמים בלבד; קר - דרך תורים.
[ ] CDN/Edge מופעל; ערוצים פרטיים PaaS; לוח מחוונים ליציאה.
[ ] רישומים/שבילים: דגימת זנב, חזרות לפי רמה; סינון PII.
[ ] אחסון גלגלי חיים וארכיון; מחלקים שולחנות גדולים.
[ ] לוחות מחוונים פיננסיים עלות/Req, עלות/דייר, בזבוז%, כיסוי RI/SP%.
[ ] עבור iGaming: PSP/KYC/AML הוצאות חשבונאות, SLO ותקציבי נתיב כסף, ביקורת תולעת.
14) TL; DR
ראשית, ראות (תגיות, תקציבים, לוחות מחוונים), אחר כך מנופים מבניים: מימדים נכונים, קנה מידה אוטומטי, RI/Spot/מתחייב, CDN/Edge וערוצים פרטיים, כיתות אחסון וחציצות חיים. לשלם עבור טלמטריה יקרת ערך (דגימת זנב, חזרות קצרות) ומעקות בטיחות אוטומטיים. ב-iGaming, שקול את PSP/KYC/AML כחלק מ-COGS והדגיש את ”נתיבי הכסף” עם SLOS ותקציבים נפרדים.