هماهنگی وظایف
1) چرا ارکستر
پلت فرم iGaming ده ها تن از زنجیره های پایان به پایان (سپرده ها، نتیجه گیری، KYC/AML، شرط/حل و فصل، پاداش، حوادث) است. ارکستراسیون تماس های متفاوتی را به فرآیندهای قابل مدیریت با زمان، کیفیت و حسابرسی قابل پیش بینی تبدیل می کند:- کاهش MTTR و «روال دستی» ؛
- اجرای SLA ها و مهلت های قانونی ؛
- توزیع عادلانه ظرفیت ها بین مستاجران و مناطق ؛
- شفافیت وضعیت و مسئولیت (RACI)
2) اصول
زنجیره های انتقادی (پرداخت، نتیجه گیری، حل و فصل) - تحت یک ارکستر متمرکز ؛ ثانویه - رویداد (میخانه/زیر).
SLA-اول. هر وظیفه دارای اولویت، SLO، مهلت و استراتژی تشدید است.
بی نظمی و حداقل یک بار. هر عمل بدون عوارض جانبی تکرار می شود.
جبران به جای برگشت پایگاه داده. Sagas برای اثرات خارجی.
تقسیم عادلانه و انزوا سهمیه در هر مستاجر/منطقه/کلاس کار، حفاظت در برابر «شکم پرستی».
سیاست به عنوان کد قوانین برای مسیریابی، retrays، تحمل - سیاست های نسخه.
قابل مشاهده بودن توسط طراحی معیارها/مسیرها/سیاههها در هر مرحله.
3) مدل دامنه ارکستراسیون
وظیفه → فعالیت → فرآیند/گردش کار.
وضعیتهای تکلیف «queued → leased → running → (succeeded | failed | timed_out | cancelled) → archived» هستند.
ویژگی های کلیدی: «اولویت»، «مهلت»، «مستاجر»، «منطقه»، «هزینه _ کلاس»، «ریسک _ کلاس»، «idempotency _ key».
4) معماری
ارکستر: فروشگاه پردازش نمودار، صف، تایمر، مهلت، RACI، مسیریابی.
مجریان: بدون وضعیت، مشترک صف های دامنه (پرداخت/KYC/بازی/Infra). اجاره مدل + ضربان قلب.
دروازه رویداد: صندوق خروجی/صندوق ورودی برای ادغام تضمین شده با سیستم های خارجی.
فروشگاه وضعیت: ورود به سیستم فرآیند (قطعات WORM/غیر قابل تغییر برای ممیزی).
کاتالوگ سیاست: اولویت بندی، سهمیه، بازپرداخت، بازپرداخت، SoD.
5) صف ها، اولویت ها و زمانبندی
کلاس های QoS:- A (زمان واقعی): سپرده/شرط/حل و فصل - تاخیر p95 ثانیه، صف های فردی و استخر.
- B (عملیاتی): KYC، گزارش به ارائه دهندگان - دقیقه.
- C (دسته/تجزیه و تحلیل): جمع آوری/صادرات - ساعت.
- زمانبندی: چند صف با اولویت + مهلت ؛ الگوریتم ها: اولویت + EDF، سهم عادلانه وزن در هر مستاجر/منطقه.
- سرقت کار: استخرهای اجرای وظایف «سرقت» از صف های همسایه در همان کلاس QoS.
- مهلت: در معرض خطر تاخیر → افزایش اولویت و یا کاهش شاخه.
6) تضمین و پایداری
حداقل یک بار + idemotency. 'idempotency _ key' (کلید کسب و کار) و ثابت کردن نتیجه.
قابل بازیابی توسط سیاست: عقب نشینی نمایشی + jitter ؛ بودجه تلاش ؛ قطع کننده مدار به وابستگی های خارجی.
وقفه ها: 'task _ timeout <SLA_step',' process _ deadline <regulatory'.
DLQ: صف های جداگانه برای وظایف «سمی» ؛ تجزیه دستی با متن کامل.
جبران خسارت (حماسه): برای هر عملیات «قوی» (ضبط/بازپرداخت، ledger_post/revert و غیره) تعریف شده است.
7) حفاظت از فشار پشتی و پلت فرم
سهمیه ها و محدودیت ها: در هر مستاجر/منطقه/نوع کار (QPS، همزمان، حافظه/CPU).
کنترل پذیرش: شکست/فرار از اولویت کم هنگام پر کردن استخر.
ریختن: کاهش بار نرم (نتایج جزئی، ویژگی های کاهش) به جای شکست کامل.
محدودیت نرخ: در ورودی، در ارائه دهنده (PSP/KYC)، در بانک/BIN.
Hysteresis: جلوگیری از روشن/خاموش flapping.
8) تحمل چند منطقه و گسل
محلی سازی ترافیک: هماهنگ کننده فرایندها را به داده ها/ارائه دهندگان نزدیک تر می کند.
feilover بین منطقه ای: فقط برای مراحل idempointent و پس از چک حد نصاب.
ذخیره سازی حالت: تکرار با اهداف RPO/RTO ؛ نوشتن حصار در مقابل تقسیم مغز.
انزوای منطقه ای حوادث: «توقف خونریزی» - متوقف کردن وظایف جدید در منطقه آسیب دیده، از بین بردن شاخه های موجود به شاخه های امن.
9) انسان در حلقه и RACI
وظایف انسانی: مراحل ساخته شده با چک لیست، SLA، پیوست ها.
SoD/4-eyes: نقش های ناسازگار برای اقدامات حساس (نتیجه گیری، محدودیت پاداش، مسیریابی PSP).
تشدید: تایمر «تلنگر دوباره IC».
حسابرسی: چه کسی/چه چیزی/چه زمانی/چرا، پیوند به بلیط/سیاست.
10) سیاست ها به عنوان کد
مثالها (شبه رگو):- مسیریابی PSP: 'مسیر = PSP2 در صورت PSP1. سلامت
- تشدید اولویت: 'priority = P1 if deadline <10m & & process in {withdrawal, payout}'
- بلوک صادرات PII: اگر صادرات را انکار کند. نرخ> baselineK &! بلیط و data_class=PII'
سیاست ها نسخه بندی شده، آزمایش شده، مانند کد معمولی بررسی می شوند.
11) قابلیت مشاهده
SLI فرآیند: میزان موفقیت، مدت زمان p95/p99، درصد تاخیر.
SLI صف: سن وظایف، توان عملیاتی، شکست پذیرش، نرخ DLQ.
ردیابی: در هر مرحله (همبستگی 'trace _ id' با پرداخت/نرخ/ACC).
سیاهههای مربوط: ساختار، بدون PII ؛ دلایل بازپرداخت/زمان بندی/جبران.
داشبورد: Exec (SLA/بزهکاری/ارزش)، Ops (تاخیر/reties/DLQ)، دامنه (شاخه های PSP، KYC SLA).
هشدارها: مهلت سوختگی، افزایش DLQ، رشد زمان گام، صف های داغ.
12) هزینه (ارکستراسیون FinOps)
KPI: $/process، $/task، $/retray، $/min نقض SLA.
بهینه سازی: دسته ای برای کلاس C، تجمع سیگنال، downsampling از سیاهههای مربوط طولانی، محدودیت در فرآیندهای «طولانی».
Show/charge-back: مستاجر علامت خود را می بیند (صف/ذخیره سازی/عقب نشینی).
13) ایمنی و انطباق
ABAC/RBAC: دسترسی به فرآیندهای نقش/مستاجر/منطقه/محیط زیست.
JIT/PAM: افزایش موقت برای مراحل دستی.
Webhook Signature/mTLS: یکپارچگی رویداد.
حسابرسی WORM: سیاهههای مربوط غیر قابل تعویض ؛ TTL/سیاست پوشش برای PII.
SoD: «initsirovat → odobrit → provesti» را در یک نفر ترکیب نکنید.
14) کاتالوگ ارکسترهای معمولی (iGaming)
1. : init → → capture → → notify
جبران خسارت: 'ledger _ revert, refund_capture'.
سیاست ها: توزیع مجدد PSP زمانی که موفقیت auth سقوط می کند.
2. Вывод: «درخواست → risk_score → 4-چشم تایید → پرداخت → اطلاع → رجیستری».
تشدید SLA، بلوک برای ناهنجاری های سرعت.
3. KYC/AML: «collect → providerA → (ارائه دهنده fallbackB) → بررسی دستی → finalize».
مهلت قانونی ؛ DLQ برای خطاهای اسکن.
4. Rate/settl: 'reserve → fix_odds → confirm → settlement payout'.
کاهش شاخه زمانی که صف تاخیر (محدودیت از ویژگی های ثانویه).
5. Инцидент: 'detect → classify (P1-P4) → war-room → actions → close → post-mortem'.
15) قالب (قطعات)
مشخصات وظیفه (YAML):yaml id: payments. capture qos: A priority: P1 deadline: 2m timeout: 2s retry:
strategy: exponential_jitter max_attempts: 5 idempotency_key: ${payment_id}
saga:
compensate: payments. refund_capture
سیاست اولویت:
yaml rule: "priority-escalation"
if: "deadline < 5m && qos == 'A'"
then: "priority = P1"
کار انسان (4 چشم):
yaml id: withdrawal. approval type: human sod: true approvers: [Risk, Finance]
sla: 2h on_timeout: escalate:L2
16) فرآیندهای عملیاتی
Release-Gates: بلوک نسخه های خطرناک با صف/فرآیندهای SLI قرمز.
تبلت/هرج و مرج روز: قطع PSP/کپی/صف ؛ بررسی مجدد/جبران.
بررسی سه ماهه: آستانه، سهمیه، هزینه، روند DLQ، استثنائات SoD.
17) نقشه راه پیاده سازی (8-12 هفته)
«ند». 1-2: موجودی زنجیره (سپرده/خروجی/CCL/حل و فصل)، اهداف SLA، کلاس QoS، اولویت و ماتریس سهمیه.
«ند». 3-4: ارکستر + صف، MVP از فرآیندهای «سپرده/خروجی»، دستگیره های idempotent، DLQ، سیاست های اساسی retray/timeout.
«ند». 5-6: ساگا و جبران خسارت، وظایف انسانی (4 چشم)، سهم عادلانه برای هر مستاجر، داشبورد و صف SLI.
«ند». 7-8: چند منطقه (محلی سازی/feilover)، دروازه های انتشار، هشدارها (مهلت های سوختگی)، پانل FinOps.
«ند». 9-10: گسترش کاتالوگ (CCM/پاداش/حوادث)، برش. سیاست ها (مسیریابی PSP/صادرات PII)، حسابرسی WORM.
«ند». 11-12: دریل هرج و مرج، بهینه سازی ارزش، مقررات RACI/SoD، آموزش در تماس.
18) ارکستراسیون KPI/KRI
فرآیندهای SLA (اجرای به موقع)، مدت زمان p95/p99.
بزهکاری و سهم خود را با دامنه/مستاجر.
نسبت بازیابی/وظیفه، نرخ DLQ، نرخ جبران خسارت.
رعایت سهم عادلانه (مستاجر «گرسنه» نیست).
هزینه: $/فرآیند، $/وظیفه، $/retray.
حوادث ناشی از ارکستراسیون (flapping، بن بست، اضافه بار صف).
19) ضد گلوله
یک اولویت «جهانی» بدون کلاس QoS.
Retrays without idempotency → پرداخت های تکراری.
آغاز مجدد زندگی کارگران در صورت شکست خارجی → بهمن.
هیچ سهمیه ای برای هر مستاجر/منطقه وجود ندارد → همسایه کل استخر را خورد.
گام های طولانی بدون وقفه/مهلت → حلق آویز فرآیندهای.
عدم وجود sagas → «برش» دستی و خطرات مالی.
سیاهههای مربوط خالی/هیچ اثری → ثابت نمی کند درست است.
مجموع
هماهنگی کار یک کارخانه فرایند مدیریت شده است: تقسیم بندی مناسب توسط QoS و اولویت ها، تضمین تحویل و توانایی، جبران خسارت و مهلت، جداسازی عادلانه مستاجران/مناطق، به علاوه قابلیت مشاهده و ایمنی به عنوان بخشی از طراحی. چنین مدار فراهم می کند عملیات قابل پیش بینی، انعطاف پذیری به شکست ارائه دهنده و انطباق با الزامات قانونی - بدون هزینه «دستی» مدیریت میکرو.