GH GambleHub

بازگشت خودکار از نسخه های

1) چرا شما نیاز به یک بازگشت خودکار دارید

در iGaming، انتشار به طور مستقیم بر درآمد و مقررات تاثیر می گذارد: مجوز پرداخت، محاسبه شرط/حل و فصل، KYC/AML، RG. بازگشت خودکار به حداقل رساندن آسیب با حرکت پلت فرم به آخرین حالت پایدار بدون انتظار برای یک راه حل دستی:
  • کاهش CFR و MTTR ؛
  • محافظت از SLO (auth-success, p99 «stavka → setl», error-rate);
  • جلوگیری از حوادث انطباق (PII/RG/AML).

2) اصول

1. Revert یک ویژگی است: Rollback برای طراحی انتشار برنامه ریزی شده است.
2. سیاست به عنوان کد: آستانه ها، پنجره ها، استثنائات - اعتبار سنجی در خط لوله.
3. قناری اول: شستشو در امتداد مراحل، عقب - مراحل آینه.
4. داده های امن: مهاجرت برگشت پذیر/جمع بندی هستند ؛ پیکربندی - قابل قبول.
5. SLO-دروازه: SLI قرمز/guardrails → بازگشت خودکار فوری.
6. توضیح: جدول زمانی، پخش، دلایل - به ورود به سیستم WORM.
7. هیچ یک از دکمه های عذاب: محدودیت ها، تایید برای اقدامات ریسک، SoD.


3) راه اندازی خودکار بازگشت (سیگنال)

3. 1 SLI فنی/KRI

افت auth_success_rate توسط GEO/PSP/BIN (به عنوان مثال − 10٪ در TR ≥10 دقیقه).
تاخیر p99/خطا نرخ مسیرهای کلیدی (سپرده/خروجی/حل و فصل).
صف تاخیر/نرخ DLQ/سعی کنید طوفان.
DB تکرار تاخیر/کش افزایش خانم.

3. 2 سیگنال های کسب و کار

deposit_conversion − X pp در قناری در مقابل کنترل.
حل و فصل افت توان از پایه.
شارژ/کاهش سنبله (نرم/سخت).

3. 3 رویدادهای مهم

شکست SRM در فعال A/B (اعوجاج ترافیک).
راه اندازی امنیت/گارد محافظ PII.
ناسازگاری مدارها/پیکربندی ها (اعتبار سنج/لاینتر).

💡 سیگنال ها به قوانین گارد محافظ جمع می شوند، هر کدام با هیسترزیس، میانگین پنجره و استثنائات تعطیلات/اوج.

4) الگوهای برگشت پذیری معماری

قناری → رمپ → کامل: 5٪ → 25٪ → 100٪ ارتقاء ؛ عقبگرد - در جهت معکوس (100 → 25 → 5 → 0).
آبی سبز: سوئیچ ترافیک اتمی بین آبی و سبز، بازگشت - بازگشت فوری.
ویژگی پرچم: کشتن سوئیچ برای تغییر رفتار (TTL، guardrails، SoD).
پیکربندی به عنوان داده: ارتقاء GitOps/ارتقاء مجدد نسخه قبلی ؛ عکس های زمان اجرا.

مهاجرت ها:
  • دو فاز (گسترش → قرارداد)،
  • برگشت پذیر (پایین اسکریپت),
  • write-shadow (فیلدهای جدید کپی میشوند)
  • read-compat (کد قدیمی طرح جدید را درک می کند).

5) موتور سیاست

شبه قوانین:
  • اگه auth_success_rate عقب نشینی کن ین. قطره (جغرافیایی =» TR»)> 10٪ برای 10 متر و پوشش> = 5٪'
  • 'auto _ بازگشت اگر bet_settle_p99> SLO1. 25 برای 15 میلیون
  • 'auto _ pause _ flag اگر api_error_rate> 1. 5٪ برای 5 میلیون
  • 'deny _ promote if slo_red in {«auth _ success «, «withdraw _ tat _ p95»} '
  • 'require _ dual _ control اگر تغییر کند. بر روی {«PSP _ ROUTING «،» PII _ EXPORT»} 'تاثیر می گذارد

تمام قوانین نسخه، آزمایش و بررسی شده است.


6) جریان پایان به پایان

1. آشکارساز رگرسیون فعال می شود (متریک/هشدار/اعتبار سنج).
2. بررسی استثنائات (اوج تعطیلات، پنجره های تست).

3. راه حل ماشین: "بازگشت _ استراتژی = step_downfull_switchkill_switch' است.
4. عملیات برگشت:
کد: تغییر ترافیک (آبی-سبز) یا کاهش پوشش قناری ؛
پرچم: گزینه/پرچم خاموش ؛
پیکربندی: ارتقاء عکس فوری قبلی ؛
مهاجرت: پایین/ویژگی گارد.
5. ارتباطات: ربات حادثه منتشر به روز رسانی به var-اتاق، آماده یک پیش نویس برای صفحه وضعیت (از طریق CL).
6. پس از نظارت: 15-30 دقیقه ؛ اگر تثبیت - تثبیت.
7. تشدید: هنگامی که دوباره باعث می شود - IC/SEV افزایش می یابد، RCA دستی.

7) ادغام

ربات حادثه: '/release rollback <id> '، جدول زمانی خودکار، لینک به داشبورد و منتشر شده است.

معیارهای API: نمایش SLO آماده و وضعیت guardrail ؛ نمونه هایی از RCA

ویژگی های پرچم: '/پرچم خاموش <id> '، autopause توسط guardrail.
GitOps/پیکربندی: '/config rollback <snapshot> '; ردیاب رانش نتیجه را تأیید می کند.
صفحه وضعیت: به روز رسانی عمومی اختیاری (از طریق CL/سیاست).


8) قابلیت مشاهده و تله متری برگشت

داشبورد انتشار: موفقیت آمیز، نرخ خطا، p95/p99، توان عملیاتی، PSP по GEO/BIN.
Guardrail Board: قوانین فعال/فعال، پنجره ها، هیسترزیس.
تاریخچه پوشش:٪ از قناری/پرچم/مناطق در طول زمان.
حسابرسی: چه کسی/چه چیزی/چه زمانی/چرا ؛ پخش مصنوعی ؛ نسخه سیاست ؛ نتیجه گیری.


9) امنیت، SoD و انطباق

4-eyes/JIT برای فعالیت های موثر بر پرداخت/PII/RG.
Geo-fences: رولبک هایی که بر الزامات قانونی تأثیر می گذارند، به صورت محلی اعمال می شوند.
گزارش WORM: ردیابی غیر قابل تغییر برای چک.
بسته های Comm عمومی: مطابق با CL/حقوقی ؛ جزئیات آزمایش به بیرون فاش نشد.


10) نمونه هایی از مصنوعات

10. 1 سیاست بازگشت خودکار (YAML)

yaml apiVersion: policy.platform/v1 kind: AutoRollbackRule metadata:
id: "payments-auth-success-tr"
spec:
scope: { tenants: ["brandA","brandB"], regions: ["EU"], geo: ["TR"] }
signal:
metric: "auth_success_rate"
condition: "drop > 10% for 10m"
compareTo: "canary_control"
action:
strategy: "step_down"  # 100%->25%->5%->0%
cooldown: "15m"
exceptions:
calendar: ["2025-11-29:black_friday"]
manualOverride: false audit:
owner: "Payments SO"
riskClass: "high"

10. 2 مانیفست بازگشت پیکربندی

yaml apiVersion: cfg.platform/v1 kind: ConfigRollback metadata:
id: "psp-routing-revert-2025-11-01"
spec:
from: "payments-routing-2025-11-01"
to:  "payments-routing-2025-10-29"
criteria:
- metric: "auth_success_rate"
where: "geo=TR"
condition: "drop>10% for 10m"
notify:
incidentBot: true stakeholders: ["Payments","SRE","Support"]

10. 3 کشتن سوئیچ پرچم

yaml apiVersion: flag.platform/v1 kind: KillSwitch metadata:
id: "deposit.flow.v3"
spec:
guardrails: ["api_error_rate<1.5%","latency_p99<2s","slo_green:auth_success"]
autoPauseOnBreach: true ttl: "30d"

11) کار با مهاجرت داده ها

گسترش → مهاجرت → قرارداد:
  • گسترش: ستون ها/شاخص های جدید را بدون شکستن خواندن اضافه کنید.
  • مهاجرت: دو ورودی/پخش، بررسی سازگاری.
  • قرارداد: حذف قدیمی تنها پس از انتشار موفقیت آمیز + پنجره مشاهده.
  • پایین اسکریپت: مورد نیاز ؛ ارزیابی زمان و قفل ها
  • خواندن سایه: مقایسه نتایج مسیر قدیمی/جدید (بدون عوارض جانبی).
  • لغو قرارداد معیارهای: هر گاردریل «قرمز».

12) فرآیندها و RACI

مدیر انتشار: مالک خط لوله و سیاست ها.
مالک سرویس: قوانین دامنه را تصویب می کند، خطر را می پذیرد.
SRE: پیاده سازی آشکارسازها، مکانیک پولبک، داشبورد.
امنیت/انطباق: کنترل SoD، PII/RG، حسابرسی.
در تماس با IC/CL: ارتباطات، صفحه وضعیت.
CAB: مرور کلی پس از بازپرداخت خودکار، تنظیمات قانون.


13) توابع KPI/KRI

نرخ بازگشت خودکار (Auto-Rollback Rate): نسبت انتشارهایی که به صورت خودکار برگشت داده می شوند (نرمال: کم، اما نه صفر).
زمان بازگشت: detekt → otkat (میانه/p95).
اجتناب از SLO-Breach: مواردی که ردیابی خودکار مانع از نقض اهداف می شود.
مثبت کاذب: نسبت «غلط» عقبگرد (هدف - ↓).
CFR قبل/بعد از اجرای بازگشت خودکار.
هزینه برگشت: وقت اضافی، قناری ها، منابع محاسباتی.
حسابرسی کامل:٪ رویدادها با جدول زمانی کامل و منتشر شده است.


14) نقشه راه پیاده سازی (6-10 هفته)

«ند». 1-2: کاتالوگ معیارهای بحرانی و آستانه های اساسی ؛ انتخاب استراتژی (قناری/آبی سبز/پرچم) ؛ موجودی برگشت پذیری مهاجرت.
«ند». 3-4: پیاده سازی آشکارسازها و سیاست موتور ؛ ادغام با ربات حادثه ؛ GitOps-rollback برای پیکربندی ؛ داشبورد گارد محافظ.

«ند». 5-6: خلبان در دامنه پرداخت (auth-success، PSP-routing)، آموزش تبلت ؛ گزارش ها و گزارش های WORM

«ند». 7-8: توسعه در بازیها/KYC ؛ توقف خودکار پرچم ؛ تمرینات DR با رنگ آبی-سبز

«ند». 9-10: کالیبراسیون آستانه، کاهش مثبت کاذب، برآورد هزینه FinOps، RACI و رسمی سازی یادگیری.


15) ضد گلوله

«به نوعی به عقب برگردید»: فقدان برنامه و برگشت پذیری مهاجرت ها.
فعال سازی/غیرفعال سازی لحظه ای جهانی بدون مراحل.
معیارهای خام بدون زمینه (بدون طبقه بندی GEO/PSP/BIN).
نادیده گرفتن SRM و زیرچشمی نگاه کردن در آزمایش.
هشدارهای انتشار بدون هیسترزیس → چرخش عقب.
ویرایش دستی تنظیمات در محصول بدون Git/Audit.
طرحوارۀ قدیمی را قبل از عبور از پنجرۀ مشاهده حذف میکند.


نتیجه گیری

بازگشت آزاد خودکار شبکه محافظ پلت فرم است: سیاست ها به عنوان کد، سیگنال ها و آستانه ها به درستی انتخاب شده، راه حل های معماری برگشت پذیر (قناری/آبی سبز/پرچم/مهاجرت برگشت پذیر)، ارتباطات داخلی و حسابرسی کامل. این حلقه به طور چشمگیری خطر انتشار را کاهش می دهد، از SLO و درآمد محافظت می کند و اعتماد به نفس تنظیم کننده ها و شرکا را افزایش می دهد.

Contact

با ما در تماس باشید

برای هرگونه سؤال یا نیاز به پشتیبانی با ما ارتباط بگیرید.ما همیشه آماده کمک هستیم!

شروع یکپارچه‌سازی

ایمیل — اجباری است. تلگرام یا واتساپ — اختیاری.

نام شما اختیاری
ایمیل اختیاری
موضوع اختیاری
پیام اختیاری
Telegram اختیاری
@
اگر تلگرام را وارد کنید — علاوه بر ایمیل، در تلگرام هم پاسخ می‌دهیم.
WhatsApp اختیاری
فرمت: کد کشور و شماره (برای مثال، +98XXXXXXXXXX).

با فشردن این دکمه، با پردازش داده‌های خود موافقت می‌کنید.