گسترش شبکه افقی
1) چرا گسترش شبکه به صورت افقی
گسترش افقی (scale-out) - اضافه کردن گره ها/کانال های موازی به جای «پمپاژ» یک سرور قدرتمند یا یک کانال ارتباطی واحد. این برای iGaming بسیار مهم است: قله شرط بندی زنده، مسابقات و انتشار ارائه دهنده بزرگ نیاز به تاخیر قابل پیش بینی، در دسترس بودن بالا و کشش بدون خرابی.
اهداف:- p95-latency پایدار در بار × N.
- عدم وجود نقطه شکست (SPOF)
- اقتصاد: رشد ظرفیت خطی با رشد هزینه محدود.
2) اصول پایه مقیاس
1. خدمات بدون حالت در حاشیه: مجوز نشانه، کلیدهای بی نظیر، مسیریابی چسبنده فقط در صورت لزوم.
2. Sharding and partitioning: توزیع کاربران/رویدادها/ترافیک توسط بخش ها.
3. اول افقی برای اجزای شبکه: متعادل کننده های L4/L7، پروکسی ها، کارگزاران، کش ها.
4. سیاست های تکرار/زمان بندی و فشار پشتی.
5. قابلیت مشاهده و SLO به عنوان بازخورد برای مقیاس خودکار.
6. اعتماد صفر و microsegmentation - امنیت با تعداد گره ها رشد می کند.
3) الگوهای مقیاس پذیری شبکه
3. 1 جهانی (GSLB/Anycast)
GSLB کاربران را بر اساس منطقه (EU، LATAM، APAC) با معیارهای تأخیر/سلامت اختصاص می دهد.
آدرس های Anycast برای نقاط ورودی (DNS، API، WebSocket)، شکست سریع BGP.
سیاست های جغرافیایی: حسابداری برای محلی سازی داده ها و قوانین دسترسی به ارائه دهندگان/پرداخت ها.
3. 2 سطح منطقه ای (L4/L7)
تعادل L4 (ECMP، هش Maglev مانند) → یک توزیع کننده اتصال یکنواخت.
L7 دروازه/WAF: مسیر/نسخه/مستاجر مسیریابی، محدود کردن نرخ، ضد ربات.
مش سرویس: قطع کننده مدار، تلاش مجدد با لرزش، تخلیه بیرونی.
3. 3 ترافیک شرق به غرب (در داخل خوشه/مرکز داده)
پارچه ستون فقرات + ECMP: تاخیر قابل پیش بینی.
پروکسی های جانبی برای mTLS، تله متری و سیاست های مدیریت شده.
سهمیه خدمات/محدودیت ها و فضای نام برای محافظت در برابر «همسایگان پر سر و صدا».
4) مقیاس افقی داده ها
4. 1 کشی
حافظههای چند سطحی: CDN/edge → L7 cache → Redis/in-process.
هش سازگار برای توزیع کلید، تکرار به N گره.
TTL و لایه های گرم شدن قبل از رویدادهای بزرگ.
4. 2 کارگزاران رویداد (کافکا/کامپ)
Sharding by key (شناسه بازیکن، شناسه جلسه) → سفارش در حزب.
افزایش دسته ها به صورت خطی باعث افزایش توان مصرف کنندگان می شود.
موضوعات سهمیه ای/لایه ای برای دامنه های مختلف: شرط ها، پرداخت ها، KYC، بازی ها.
4. 3 OLTP/OLAP
CQRS: نوشتن/دستورات جدا از خواندن/نمایش داده شد.
خواندن کپی برای خواندن پوسته پوسته شدن ؛ شاردینگ برای مقیاس رکورد.
جداسازی داده های منطقه ای + تکرار ناهمزمان به حوزه های مجاز.
5) جلسات و وضعیت
نشانه های بدون حالت-JWT/مات با TTL کوتاه و چرخش.
جلسات چسبنده فقط برای جریانهایی که در آن یک حالت محلی مورد نیاز است (به عنوان مثال، یک جدول زنده).
کلید های idempotency در سطح API/کیف پول برای تکرار امن.
deduplication رویداد (دقیقا یک بار در یک حس کسب و کار از طریق کلید/ساگا).
6) مدیریت پشت سر هم (آمادگی پیک)
سطل/سطل نشتی در دروازه L7 و در سیاست های مش.
بافر/صف قبل از بالادست شکننده (KYC، PSP).
مقیاس بندی خودکار با معیارهای: rps، p95، CPU، تاخیر کارگزار، طول صف.
استراتژی های شکست باز/شکست بسته (به عنوان مثال، تخریب ویژگی های غیر بحرانی).
7) ایمنی مقیاس
اعتماد صفر: mTLS بین تمام خدمات، گواهینامه های کوتاه مدت.
Microsegmentation-شبکه های جداگانه برای تولید/مرحله/فروشندگان/پرداخت.
امضای S2S (HMAC/JWS)، کنترل خروج شدید، DLP/CASB.
چرخش کلید/راز خودکار است (KMS، خرک)، پایان به پایان حسابرسی.
8) قابلیت مشاهده و مدیریت SLO
سیاههها/معیارها/مسیرها + پروفایل (از جمله eBPF).
SLO: تأخیر ورود/واریز/نرخ/برگشت، موفقیت پرداخت ها، در دسترس بودن مناطق.
هشدار با خطاهای بودجه، نه با معیارهای «برهنه».
توپولوژی وابستگی برای RCA و برنامه ریزی ظرفیت
9) تحمل خطا و DR برای رشد افقی
Active-Active برای احراز هویت و کیف پول، Active-Standby برای حالت سنگین.
GSLB/BGP-feilover با اهداف <30-90 ثانیه.
مهندسی هرج و مرج: غیر فعال کردن مناطق/احزاب/PSP در صحنه و به صورت دوره ای - در فروش با توجه به مقررات.
Black-start-path: حداقل مجموعه ای از خدمات برای بلند کردن اکوسیستم.
10) اقتصاد و برنامه ریزی ظرفیت
پایه: روز عادی + x3/x5 «شب فینال لیگ قهرمانان».
اتاق سر: 30-50٪ قدرت آزاد در حوزه های بحرانی.
اقتصاد واحد: هزینه rps/topic/session، قیمت یک GSLB-region-feilover.
خودکار کردن گره های اضافی خارج قله، امور مالی ≈ کنترل SLO.
11) نمودارهای معماری معمولی
الف) نمایشگاه جهانی و API
GSLB (مبتنی بر تأخیر) → تعادل L4 (ECMP) → دروازه های L7/WAF → خدمات مش → کش Redis → Kafka → قطعات OLTP/کپی → OLAP/datalake.
ب) بازی های زنده/شرط زنده (تاخیر کم)
ورود Anycast → PoPs منطقه ای با WebRTC/QUIC → کانال های اولویت به RGS → چسبنده فقط برای جدول/جلسه → حافظه های نهان محلی و تلنگر سریع سلامت.
ج) محیط پرداخت
بخش جدا شده + ارکستر PSP → صف/retray با idempotency → ارائه دهندگان متعدد با اولویت بندی و برش توسط SLI.
12) ضد الگوهای
تنها، دروازه L7 بدون مقیاس.
جلسه مشترک در خوشه کش بدون جداسازی TTL/مستاجر.
Retrays کنترل نشده → طوفان ترافیک و «anomic» بالادست.
معاملات جهانی در سراسر مناطق مختلف در زمان واقعی.
تکثیر اطلاعات شخصی به مناطق «ممنوع» به خاطر تجزیه و تحلیل.
مقیاس خودکار بیش از CPU بدون ارتباط با p95/صف/تاخیر.
13) چک لیست پیاده سازی مقیاس
1. شناسایی دامنه ها و SLO ها که در آن کشش افقی مورد نیاز است.
2. GSLB و هش سازگار در L4، نسخه L7/مسیریابی مستاجر را وارد کنید.
3. ترجمه API های خارجی به بی حالت + idemotency, به حداقل رساندن چسبنده.
4. پیکربندی لایه های حافظه پنهان و کارگزار رویداد با پارتیشن بندی کلید.
5. طراحی OLTP sharding و خواندن کپی، OLAP جداگانه (CQRS).
6. محدود کردن نرخ، فشار پشتی، صف در مقابل ارائه دهندگان خارجی را فعال کنید.
7. خودکار HPA/VPA توسط معیارهای کامپوزیت (P95، RPS، تاخیر).
8. قابلیت مشاهده، هشدارها را با بودجه خطا، topocard گسترش دهید.
9. تمرینات منظم DR و سناریوهای هرج و مرج، تأیید شروع سیاه.
10. قراردادن امنیت توسط طراحی: mTLS، کنترل خروج، چرخش اسرار.
14) معیارهای سلامت و کنترل مقیاس
p95/p99 برای ورود/واریز/شرط/چرخش.
نرخ خطا در دروازه L7 و مش (5xx/429/timeout).
تاخیر کارگزار و عمق صف، زمان پردازش رویداد.
Hit-ratio of caches, پهنای باند ذخیره سازی.
در دسترس بودن مناطق/PoP، زمان تعویض GSLB/BGP.
هزینه در هر RPS و دفع مجامع.
15) نقشه راه تکامل
v1: GSLB + L4 ECMP، مقیاس خودکار استاتیک، لایه کش.
v2: سیاست های مش (retries/circuit-breaker)، کارگزار رویداد، خواندن کپی.
v3: اشتراک گذاری OLTP، دارایی برای دامنه های بحرانی، مقیاس خودکار تطبیقی توسط SLO.
v4: داده مش، ظرفیت پیش بینی، خودکار سازی مسیر.
خلاصه ای کوتاه
گسترش شبکه افقی یک رشته سیستم است: هسته بدون حالت، داده ها و رویداد sharding، تعادل چند سطح (GSLB/L4/L7/مش)، انبارها و صف برای انفجار، به علاوه مدیریت SLO، صفر اعتماد و شیوه های DR. با این رویکرد، اکوسیستم iGaming در برابر اوج ترافیک جهانی مقاومت می کند، در حوزه های مختلف قضایی باقی می ماند و تقریبا به صورت خطی به عنوان مخاطب رشد می کند.