معیارهای شبکه
1) چرا ما به معیارهای شبکه نیاز داریم
معیارهای شبکه اندازه گیری های قابل تکرار از عملکرد و ثبات ارتباطات بین گره های اکوسیستم هستند: اپراتور استودیو/RGS پرداخت/PSP/APM KYC/AML وابسته/رسانه ها تجزیه و تحلیل/کارگزاران CDN/لبه.
هدف این است که برای به دست آوردن تضمین عددی برای SLOs، ظرفیت برنامه، کاهش هزینه به خدمت، و با خیال راحت مقیاس مبارزات/انتشار/مسابقات.
- P95 قابل پیش بینی/تاخیر اوج در حوادث اوج.
- به موقع در مسیرها و ارائه دهندگان.
- کاهش تلفات در CCD/پرداخت و کاهش «نشت» در قیف.
- مقایسه شفاف از تامین کنندگان توسط SLI و قیمت.
2) محدوده
1. L3-L4: RTT، جرقه، از دست دادن، پهنای باند، رفتار BGP/Anycast برای حوادث.
2. L7/API: تأخیر و موفقیت درخواست ها (ورود، واریز، شرط بندی، چرخش)، کدهای خطا، بازپرداخت.
3. جریان (کازینو زندگی می کنند/WebRTC): پایان به پایان تاخیر, ثبات نرخ فریم, از دست دادن بسته.
4. پرداخت/PSP/APM: زمان مجوز/چک، سهم معاملات موفق، ریسک بازپرداخت.
5. KYC/AML: مدت تأیید سناریو، کسر گذر/شکست، صف.
6. اتوبوس رویداد (کافکا مشترک): تاخیر بخشی، توان عملیاتی، تعادل مجدد، E2E زمان تحویل رویداد.
7. Caches/DB: نسبت ضربه، p95 دریافت/تنظیم، تاخیر ماکت، TPS در قطعات.
8. GSLB/DNS: وضوح/زمان تعویض، صحت جغرافیایی مسیر.
9. حفاظت WAF/bot: عبور از ترافیک قانونی، مثبت کاذب، سربار.
10. قابلیت مشاهده: کامل بودن ردیابی، تاخیر در تزریق معیارها/سیاهههای مربوط.
3) معیارها و SLO (حداقل مجموعه)
API ها (معاملات مهم):- ورود: p95 ≤ 300-500 ms ؛ خطا ≤ 0 3%.
- سپرده (PSP ارکستراسیون): p95 ≤ 1. 5-2. 0 ثانیه ؛ موفقیت ≥ 96-98٪ (APM)
- شرط/چرخش: p95 ≤ 150-250 میلی ثانیه ؛ مدت زمان ≤ 0. 2%.
- جریان کازینو زندگی می کنند: تاخیر E2E ≤ 300-800 میلی ثانیه, قطره قاب ≤ 0. 5%.
- کارگزار رویداد: تاخیر مصرف کننده p95 ≤ 200-500 ms در بار پیک ؛ ≥ 99. 9٪ تحویل
- Cache/DB: p95 ≤ 2-5 ms (Redis)، رکورد p95 SQL ≤ 10-30 ms در هر shard دریافت می کند.
- GSLB/Anycast: منطقه سوئیچینگ ≤ 30-90 ثانیه، خطای وضوح ≤ 0. 01%.
- فیلتر WAF/ربات: مثبت کاذب ≤ 0. 1٪ در نمونه هدف.
- قابلیت مشاهده: پوشش ردیابی ≥ 95٪ برای مسیرهای بحرانی، تاخیر متریک ≤ 5 ثانیه.
مقادیر برای جغرافیا/ارائه دهندگان شما انتخاب شده و در لیست SLO ثبت می شوند.
4) حجم کار مخلوط
یک معیار واقع گرایانه سهم عملیات در پنجره های معمولی را شبیه سازی می کند: خط پایه:- 60٪ نمایش/محتوای خوانده شده، 30٪ اقدام بازی (شرط/چرخش)، 8٪ پرداخت، 2٪ KYC.
- + 2-3 × RPS در نرخ/بازگشت ؛ + 1. 5 × برای پرداخت موج در سوکت های وب.
- + 3-5 درخواست نرخ × در 15-30 دقیقه، افزایش لغو/تغییر در ضرایب.
- افزایش کوتاه اما شدید در پرداختها/برداشتها ؛ چک های ضد تقلب
هر نمایه باید stochastics داشته باشد: ناهموار «سنبله»، مکث، تلاش های مکرر، فریم ها را در ویدیو رها کنید.
5) روش معیار
5. 1 اصول
تکرارپذیری: تنظیمات نیمکت در IaC، نسخه های ثابت.
خلوص آزمایش: انزوا از مشاغل پس زمینه/پشتیبان گیری، مجموعه دانه های پایدار.
قابلیت مشاهده: end-to-end trace-id، همبستگی معیارهای L3-L7.
کنترل Retray: محدودیت/jitter، idempotency - در غیر این صورت «طوفان» نتایج را تحریف می کند.
اندازه گیری های دو فاز: شروع سرد (گرم شدن انبارها) و حالت گرم.
5. 2 پایه (توپولوژی)
جهانی: Anycast DNS + GSLB → PoP منطقه ای → تعادل L4/L7 → مش سرویس.
منطقه ای: پارچه ستون فقرات برگ، ورود/WAF، کارگزار، سطح حافظه پنهان، قطعات پایگاه داده.
حلقه های فروشنده: مستقیم VPN/priv. پشتیبانی از PSP/KYC/ارائه دهندگان
مدار هرج و مرج: تزریق خطای کنترل شده (تاخیر، اتصالات تنظیم مجدد، افت AZ).
5. 3 ابزار (نمونه های کلاس)
ژنراتور: بار HTTP/gRPC, شبیه ساز WebSocket/WebRTC, شبیه ساز پرداخت/KUS, تولید کنندگان/مصرف کنندگان کافکا.
Sniffers و profilers: نمونه eBPF، pcap، پروفایل CPU/℃، ردیابی.
نظارت: سری زمان، سیاهههای مربوط، مسیرهای پیاده روی، اشتباهات در بودجه.
(محصولات خاص توسط پشته شما انتخاب می شوند.)
6) مجموعه تست (کاتالوگ)
6. 1 L3-L4
RTT/jitter/تلفات بین مناطق و قبل از فروشندگان.
BGP/Anycast failover: پیشوند زمان حرکت، تخریب مسیر.
6. 2 L7/API
ورود/تأیید/تازه کردن توکن در زیر چلپ چلوپ.
شرط/Spin Idempotency: درخواست های مکرر با کلید، محافظت در برابر تکراری.
سازگاری کیف پول/تعادل: ورودی های رقابتی، اعتبار سریال سازی.
6. 3 جریان/WebRTC
تأخیر مسیر رسانه با از دست دادن بسته 0. 1-1٪، تغییر میزان بیت، تغییر PoP.
بیننده طرفدار: پوسته پوسته شدن لایه های SFU/CDN.
6. 4 پرداخت ها
پرداخت تحت 3-DS: مجوز اوج، افت گره PSP، مسیر برگشت.
درج ضد تقلب: تاخیر تصمیم، مثبت/منفی کاذب.
6. 5 KYC/AML
بررسی بارانداز و ضد آفتاب: SLA برای پاسخ، صف، تخریب به «بررسی دستی».
6. 6 رویدادها/کارگزار
توان و تاخیر: رشد حزب، تعادل، تاخیر مصرف کننده.
دقیقا یک بار با حس کسب و کار: deduplication، تحویل مجدد.
6. 7 کش/DB
تخریب نسبت ضربه: تاثیر بر API P95، استراتژی گرم کردن.
Sharding/replicas: failover, delayed reads, write amplification.
6. 8 ایمنی/WAF
Bot-mix: محافظت در برابر سناریوهای تقلب/کلیک بدون آسیب تبدیل.
7) آمار و گزارش
معیارهای توزیع: p50/p90/p95/p99، MAD/jitter، فواصل اطمینان.
همبستگی: لینک L3 (RTT/از دست دادن) به L7 (تاخیر API)، تبدیل پرداخت به SLI PSP.
رگرسیون/پایه: مقایسه انتشار/تنظیمات A/B، ساخت نمودار رگرسیون.
معناشناسی حادثه: برچسب های قانون ارائه دهنده/منطقه/AZ/نسخه/WAF.
فرمت گزارش: 1) ایستاده/مخلوط ؛ 2) SLO در مقابل واقعیت ؛ 3) تنگناها ؛ 4) توصیه ها ؛ 5) تاثیر اقتصادی
8) معیارهای ارائه دهنده (مقایسه و رتبه بندی)
برای هر ارائه دهنده PSP/KYC/محتوا، موارد زیر ثبت می شود:- SLI: آپ تایم، پاسخ p95، نرخ خطا، ثبات در بار x3/x5.
- DR-ready: زمان برش برای حفاظت، حضور محدودیت های نرخ/سهمیه/بازپرداخت.
- Juridics: جغرافیایی محدودیت، ذخیره سازی داده ها، DPIA.
- اقتصاد: قیمت هر معامله/1000 رویداد/دقیقه ویدئو، مجازات/اعتبار.
- نمره نهایی: ارزیابی وزن برای بازارهای هدف.
9) هزینه برای خدمت
هر معیار به پول ترجمه می شود:- هزینه در هر RPS (API, کارگزار), هزینه در هر TXN (پرداخت/CCR), هزینه در هر جریان (میزان ارسال بیت × دقیقه).
- حاشیه: چگونه p95/خطاها بر تبدیل (FTD، سپرده، نرخ) → GGR.
- بودجه ظرفیت: چه تعداد PoP/گره برای ضریب پیک هدف مورد نیاز است.
- توصیه های بهینه سازی: که در آن ارزان تر است - برای افزایش کش/احزاب/RoR و یا تغییر مسیر.
10) انطباق، امنیت و حریم خصوصی
PII-minimization: نشانه گذاری شناسه ها در نیمکت ها، storaji فردی.
DPA/DPIA: اهداف آزمون، عمر مفید، حذف مصنوعات.
Zero Trust: mTLS، امضای JWS/HMAC، جدا از داده های تولید است.
جنبه های RG: سناریوهایی که تحریک گروه های آسیب پذیر را حذف می کنند (فقط فنی). متریک).
11) ضد الگوهای
نیمکت غیر retray/idempotent → نتایج بهتر از زندگی.
مخلوط کردن مواد غذایی و ایستاده، آزمایش برای PD زنده.
تنها مسیر/ارائه دهنده در آزمایشات (بدون SPOF شناسایی شده).
معیارهای «متوسط» بدون دم (بدون p95/p99).
ایستادن بدون قابلیت مشاهده و پوشش ردیابی <80٪.
آزمون محلی بدون جغرافیای جهانی و GSLB.
12) چک لیست راه اندازی نیمکت
1. اهداف و SLO ها: لیستی از معاملات مهم و آستانه های هدف.
2. استراتژی بار: پروفیل های پایه/پیک/نهایی/Payday.
3. Stand and IaC: مناطق، PoP، مسیرها، نسخه ها، sids.
4. قابلیت مشاهده: مسیرها/معیارها/سیاهههای مربوط، اتاق جنگ، هشدارهای بودجه خطا.
5. امنیت: نشانه گذاری، mTLS، جداسازی منطقه فروشنده.
6. سناریوهای DR: GSLB/BGP شکست خورده، AZ/PSP/KYC/ارائه دهنده قطره.
7. اقتصاد: جدول هزینه برای خدمت و آستانه بازپرداخت.
8. گزارش: قالب، مهلت، صاحبان و RACI.
13) قالب گزارش (1 صفحه)
زمینه: هدف، تاریخ، ایستاده، مناطق.
مخلوط بار: بخش عملیات، مدت زمان فاز.
نتایج SLO: واقعیت در مقابل هدف، مناطق قرمز.
علل ریشه: بالا 3 تنگناها (شبکه/نرم افزار/فروشنده).
توصیه ها: رفع سریع (0-7 روز)، رفع متوسط (≤ 30 روز)، رفع استراتژیک (> 30 روز).
اثر اقتصادی: پیش بینی FTD/ARPU/LTV uplifta و کاهش هزینه برای خدمت.
برنامه DR/Chaos: چه چیزی بررسی می شود و چه زمانی اجرا می شود.
14) نقشه راه تکامل معیار
v1 (بنیاد): اجرای دستی، پروفایل های پایه، لیست SLO.
v2 (اتوماسیون): اجرا می شود شبانه/هفتگی، گزارش های خودکار تولید شده، guardrails در انتشار.
v3 (Adaptive): خودکار ترافیک بیش از SLI، هشدار پیش بینی، مصنوعی نزدیک به واقعیت است.
v4 (حاکمیت شبکه ای): نیمکت های متقابل وابسته، معیارهای کل و مجازات ها/اعتبارات SLA.
خلاصه ای کوتاه
معیارهای شبکه یک «اندازه گیری یک بار» نیست، بلکه یک رشته ثابت است که SLA های شریک، SLO های محصول و اقتصاد را به هم متصل می کند. پروفایل های بار را استاندارد کنید، p95/p99 را در معاملات بحرانی اندازه گیری کنید، تست های شکست خورده و سناریوهای هرج و مرج را در نظر بگیرید، هزینه های خدمت را در نظر بگیرید - و اکوسیستم شما حتی در روزهای قله های جهانی قابل پیش بینی خواهد بود.