بهینه سازی هزینه ابر
1) چرا FinOps و چه اهدافی
هدف این است که برای کاهش COGS در حالی که حفظ SLO/سرعت توسعه. مسائل کلیدی:- 1 درخواست، 1 کاربر فعال، 1 مستاجر چقدر است ؟
- اثر حاشیه ای ویژگی/ترافیک جدید چیست ؟
- «نشت» (خروج، سیاهههای اضافی، سربار CPU/حافظه، منابع بیکار) کجاست ؟
معیارهای پایه
هزینه/Req، هزینه/دقیقه فعال، هزینه/مستاجر/نام تجاری، هزینه/GB ذخیره شده، هزینه/GB خروج.
COGS٪: سهم هزینه فروش در درآمد.
٪ ضایعات (منابع پرداخت شده اما استفاده نشده )/( تمام منابع).
2) مرتب کردن: برچسب ها، مالکیت، بودجه
برچسب ها/برچسب ها: 'env'، 'تیم'، 'خدمات'، 'مستاجر'، 'محصول'، 'هزینه _ مرکز'، 'slo _ tier'.
مالکیت: هر منبع دارای مالک و TTL است.
بودجه/هشدار: بودجه ماهانه/هفتگی با آستانه 50/80/100٪ + تشخیص ناهنجاری.
سیاست ها به عنوان کد: ممنوعیت «بدون برچسب ها»، محدودیت اندازه، مناطق پیش فرض، سهمیه های اختصاص یافته.
hcl module "policy" {
source = "finops/policy/required-tags"
required_tags = ["env","team","service","cost_center","tenant"]
}
3) اهرم های معماری اقتصاد
3. 1 ابعاد صحیح و مقیاس خودکار
Rightsizing: نمونه هایی را برای CPU/RAM واقعی p95 انتخاب کنید.
مقیاس خودکار: افقی> عمودی ؛ для K8s - خوشه Autoscaler/کارپنتر، для serverless - حداقل/حداکثر همزمانی.
راه های سرد - در خط/batchi ؛ وظایف بلند مدت - به کارکنان در یک برنامه.
3. 2 ظرفیت نقطه/خریداری شده
نقطه/قابل پیش بینی برای بدون دولت/پس زمینه و CI ؛ بافر On-Demand را نگه دارید.
RI/CUD/برنامه های پس انداز: 50-70٪ پایه پایدار را رزرو کنید، بقیه الاستیک است.
3. 3 ذخیره سازی داده ها و کلاس ها
جداگانه: گرم (SSD)، گرم (استاندارد)، سرد/بایگانی (یخچال/بایگانی).
سیاست های چرخه عمر: تغییر کلاس ها، حذف پس از مدت.
فعال کردن نسخه بندی در صورت نیاز و قفل شی (WORM) فقط برای حسابرسی.
3. 4 شبکه و خروج
CDN/edge + stale-while-revalidate خروجی بین منطقه ای را کاهش می دهد.
کانال های خصوصی (PrivateLink/PSC/Direct Connect/Interconnect) به جای اینترنت «خام».
فشرده سازی (Brotli/Zstd)، HTTP/3/QUIC - RTT کمتر/اتصال مجدد.
3. 5 پایگاه داده ها و انبارها
یک طرح دو سطحی را انتخاب کنید: cache (Redis/Memcached) + ذخیره سازی.
خواندن کپی برای تجزیه و تحلیل، شامل خودکار خلاء/تراکم، استفاده از pgBouncer/RDS پروکسی.
برای جداول بزرگ - پارتیشن بندی/TTL/آرشیو.
4) کوبرنتیز-اقتصاد
درخواست ها/محدودیت های کلاس SLO ؛ 'limits: null' prohibition.
VPA (توصیه ها)، کارپنتر (انتخاب موارد برای قلب)، بسته بندی بن (تحمل/وابستگی).
prod/stage/dev را در سطح خوشه/گره جدا کنید (انواع و سیاست های مختلف).
کلاس های شبکه و ذخیره سازی: SC/IOPS را با مشخصات بار انتخاب کنید، نه «حق بیمه در همه جا».
کلاس ها و اولویت های QoS: صرفه جویی در کارهای پس زمینه.
پروفایل های ورود: عوامل جانبی با بافر محلی، ارسال توسط دسته.
5) اقتصاد بدون سرور
موارد حداقل/ارائه همزمان - فقط برای دسته های داغ.
کوچک استقرار بسته نرم افزاری، تنبل init، به اشتراک گذاری اتصالات.
مهلت و صف وظایف سنگین.
تابع جمع (فن در) به جای یک دوجین سفر بسته به.
6) قابلیت مشاهده: پرداخت هزینه برای تله متری ارزشمند
سیاهههای مربوط: ساختاری، بدون کلامی ؛ ارائه شده توسط کلاس (خطاهای prod طولانی تر، اشکال زدایی - کوتاه).
نمونه برداری ردیابی: مبتنی بر دم - 100٪ خطاها/p99، بقیه 1-10٪.
معیارها: جمع آوری/downsampling، ارسال پراکنده.
فیلتر کردن PII قبل از ارسال (بایت و خطرات کمتر).
7) شبکه تامین کننده و بازار
مقایسه قیمت های مناطق، حاشیه خدمات مدیریت شده، بسته های بازار.
مذاکرات: تخفیف حجم (RI/CUD)، تعهدات، برنامه های اعتباری.
اجتناب از تکرار SaaS با قابلیت همپوشانی.
8) اقتصاد واحد و داشبورد
هزینه عمده SLI/SLO
هزینه/Req توسط مسیرها (ورود، کاتالوگ، سپرده).
هزینه/مستاجر/نام تجاری/منطقه.
خروج/Req، ذخیره سازی/Req، محاسبه/Req.
ضایعات٪ پوشش и RI/SP٪.
داشبورد (حداقل مجموعه)
«نقشه هزینه» برای خدمات/تیم با فرود به منبع.
خروج «نقشه گرما» توسط جهت.
«خدمات → هزینه → SLO»: همبستگی p99 و هزینه/Req.
پوشش «RI/CUD/Spot» و صرفه جویی در خط.
9) فرآیندهای FinOps
تجزیه و تحلیل هفتگی حساب ها با صاحبان خدمات.
بررسی تغییرات با ارزیابی هزینه ویژگی های قبل از ورود به تولید.
Guardrails: محدودیت سهمیه، تکمیل خودکار منابع بیکار، TTL برای محیط های آزمایش.
GameDays از ارزش: پیک مصنوعی/ویژگی های پرچم، چک کردن پایداری بودجه.
10) ضد گلوله
منابع «موقت» بدون TTL → برای همیشه.
`0. 0. 0. 0/0 'خروج + بدون CDN → حساب های خروجی منفجر می شوند.
بدون برچسب ها، تخصیص هزینه ها غیرممکن است.
DEBUG log در فروش، 100٪ ردیابی - ترابایت بی معنی است.
ارائه شده/serverful «فقط در مورد» بدون معیارهای استفاده.
تمام بارها فقط بر اساس تقاضا هستند، بدون RI/Spot/commits.
11) ویژگی های iGaming/امور مالی
هزینه های PSP/پرداخت - بخشی از COGS: بهینه سازی مسیریابی هوشمند به ارائه دهندگان ارزان/قابل اعتماد ؛ وضعیت حافظه پنهان، اجتناب از تکرار بدون idempotency.
فروشندگان KYC/AML: درخواست بسته، استفاده از حافظه پنهان نتایج (TTL توسط سیاست)، اندازه گیری هزینه/KYC.
«راه های پول» (سپرده/برداشت): SLO ها و بودجه جداگانه ؛ ذخایر برای حوادث اوج، نمونه های گرم تنها وجود دارد.
محتوا/CDN: دامنه های محلی و منطقه ای برای کاهش خروج و مطابق با اقامت داده ها.
الزامات قانونی: ذخیره سازی WORM برای حسابرسی - محدوده محدود (جمع آوری، TTL، فشرده سازی).
12) دستور العمل های کوچک
12. 1 سیاست نگهداری ورود
تولید خطاها: 30-90 روز ؛ اطلاعات: 7-14 ؛ اشکال زدایی: 24-72 ساعت.
بایگانی فقط در صورت درخواست انطباق.
12. 2 تله متری قناری
برای یک ویژگی جدید - 100٪ از آثار برای 24 ساعت اول → سپس نمونه برداری دم.
12. 3 چرخه عمر شیء
json
[
{"prefix": "raw/", "days_to_warm": 30, "days_to_cold": 90, "days_to_delete": 365},
{"prefix": "audit/", "lock": "WORM-365d"}
]
12. 4 بودجه/هشدار (ایده)
بودجه ماهانه برای هر تیم ؛ هشدار 50/80/100٪ ؛ تشخیص ناهنجاری> 30٪ از روند بیش از 24 ساعت
13) تولید لیست آمادگی
- برچسب ها و صاحبان منابع 100٪ ؛ سياستمدارها جلوي اونايي که برچسب ندارن رو ميگيرن.
- بودجه و هشدار + تشخیص ناهنجاری ؛ گزارش در tanants/مارک ها/مناطق.
- RI/CUD/پایه پوشش نقطه ؛ یک بافر On-Demand وجود دارد.
- K8s: درخواست/محدودیت مجموعه ؛ VPA/کارپنتر ؛ بسته بندی بن ؛ جداگانه کلاس های ذخیره سازی/IOPS.
- Serverless: ارائه شده/دقیقه فقط برای مسیرهای داغ ؛ سرد - از طریق صف.
- CDN/لبه فعال ؛ کانال های خصوصی به PaaS; خروج از داشبورد
- سیاهههای مربوط/مسیرهای پیاده روی: نمونه برداری دم، retentions توسط کلاس ؛ فیلتر کردن PII
- چرخه عمر ذخیره سازی و آرشیو ؛ تقسیم کردن میزهای بزرگ
- داشبورد مالی هزینه/Req، هزینه/مستاجر، زباله٪، پوشش RI/SP٪.
- برای iGaming: حسابداری هزینه PSP/KYC/AML، SLO و بودجه مسیر پول، حسابرسی WORM.
14) TL ؛ دکتر متخصص
اول، دید (برچسب ها، بودجه ها، داشبورد)، سپس اهرم های ساختاری: ابعاد صحیح، مقیاس بندی خودکار، RI/Spot/commits، CDN/edge و کانال های خصوصی، کلاس های ذخیره سازی و چرخه های عمر. پرداخت برای تله متری با ارزش (دم نمونه برداری، retentions کوتاه) و گاردریل خودکار. در iGaming، PSP/KYC/AML را به عنوان بخشی از COGS در نظر بگیرید و «مسیرهای پول» را با SLO ها و بودجه های جداگانه برجسته کنید.