Тапшырмаларды топтоо
1) Эмне үчүн оркестр
iGaming платформасы - бул ондогон чынжырлар (депозиттер, корутундулар, KYC/AML, коюмдар/сеттл, бонустар, окуялар). Оркестр алдын ала убакыт, сапат жана аудитория менен башкарылуучу жараяндарга ар түрдүү чакырыктарды айлантат:- MTTR жана "кол тартибин" азайтуу;
- SLA жана жөнгө салуу мөөнөттөрүн аткаруу;
- тенанттар менен аймактардын ортосунда кубаттуулуктарды адилеттүү бөлүштүрүү;
- статустардын жана жоопкерчиликтин ачык-айкындуулугу (RACI).
2) Принциптер
Orchestrate the critical, choreograph the rest. Критикалык чынжырлар (төлөмдөр, корутундулар, сеттл) - борборлоштурулган оркестратордун астында; экинчилик - окуя (pub/sub).
SLA-first. Ар бир тапшырманын артыкчылыгы, SLO, мөөнөтү жана эскалация стратегиясы бар.
Демпотенттик жана at-least-once. Ар кандай иш-аракеттер эч кандай терс таасирлери кайталанат.
ДБ кайтаруунун ордуна компенсация. тышкы таасирлер үчүн сагалар.
Fair-бөлүшүү жана изоляция. Квоталар per-tenant/аймак/класс тапшырмалар, "күйүп" коргоо.
Policy-as-Code. Багыттоо, ретрациялоо, уруксат берүү эрежелери - версиялануучу саясат.
by design байкоо. Метрика/соода/логи ар бир кадам.
3) Оркестрдин домен модели
Task (атомдук иш) → Activity (жараяндын кадам) → Process/Workflow (толук чынжыр).
Тапшырма шарттары: 'queued → leased → running → (succeeded | failed | timed_out | cancelled) → archived'.
Негизги атрибуттар: 'priority', 'deadline', 'tenant', 'region', 'cost _ class', 'risk _ class', 'idempotency _ key'.
4) Архитектура
Orkestrator: жол-жоболорун, кезек, убакыт, мөөнөтү, RACI, багыттоо сактайт.
Воркеры (executors): stateless, домен кезеги боюнча жазылган (Payments/KYC/Games/Infra). Lease модели + heartbeat.
Окуя шлюзы: тышкы системалар менен кепилденген интеграция үчүн outbox/inbox.
мамлекеттик сактоо: жараяндар журналы (аудит үчүн WORM/immutable бөлүктөрү).
Саясат каталогу: артыкчылык, квота, ретра, артка чегинүү, SoD.
5) Кезектер, артыкчылыктар жана пландоочу
QoS класстары:- A (Real-Time): депозиттер/чендер/сеттл - p95 экинчи кечигүү, өзүнчө кезек жана пулдар.
- B (Operational): KYC, провайдерлерге отчеттор - мүнөт.
- C (Batch/Analytics): Агрегация/экспорт - саат.
- Планировщик: priority + deadline менен multi-queue; алгоритмдер: priority + EDF, weighted fair-share per-tenant/аймак.
- Work-stealing: аткаруучу пулдар ошол эле QoS классынын ичиндеги кошуна кезектерден тапшырмаларды "уурдап".
- Мөөнөтү: кечигүү коркунучу менен → артыкчылыкты же degrade-бутагын жогорулатуу.
6) Кепилдиктер жана туруктуулук
At-least-once + демпотенттик. 'idempotency _ key' (бизнес ачкычы) жана натыйжаны бекитүү.
Retriable by policy: экспоненциалдык backoff + jitter; аракет бюджети; тышкы көз карандылыкты circuit-breaker.
Timeouts: 'task _ timeout <SLA_step',' process _ deadline <жөнгө салуучу '.
DLQ: "уулуу" милдеттери үчүн өзүнчө кезек; толук контекст менен кол менен талдоо.
Компенсация (сага): ар бир "күчтүү" операция үчүн аныкталган (capture/refund, ledger_post/revert ж.б.).
7) Backpressure жана платформа коргоо
Квоталар жана лимиттер: per-tenant/аймак/тапшырма түрү (QPS, concurrent, memory/CPU).
Admission control: бассейнди толтурууда төмөн артыкчылыктуу ката/дефер.
Shedding: жумшак жүктү азайтуу (partial results, degrade-fich) ордуна жалпы жасалма.
Rate-limits: кирүүгө, провайдерге (PSP/KYC), банкка/BIN.
Histeresis: Fapping киргизүү/өчүрүү алдын алуу.
8) Көп аймак жана бузулууга туруктуулук
Трафиктин локализациясы: оркестр процесстерди берилиштерге/провайдерлерге жакын кармап турат.
Cross-регионалдык Feylover: гана Empotent кадамдар жана quorum-текшерүү кийин.
Storage абалы: RPO/RTO максаттары менен репликациялоо; write-fence vs split-brain.
Регионалдык обочолонуу окуялар: "stop the bleed" - жабыр тарткан аймакта жаңы милдеттерди токтотуу, коопсуз бутактарына бар агып.
9) Human-in-the-loop и RACI
Human-tasks: чек тизмеси менен камтылган кадамдар, SLA, салымдар.
SoD/4-eyes: сезимтал иш-аракеттерге шайкеш келбеген ролдор (корутундулар, бонустардын лимиттери, PSP-роутинг).
Эскалация: таймерлер "nudge → reassign → L2/L3 → IC".
Аудит: ким/эмне/качан/эмне үчүн, билетке/саясатка шилтеме.
10) Код катары саясат (Policy-as-Code)
Мисалдар (psevdo-Rego):- PSP багыттоо: 'route = PSP2 if PSP1. health < SLO && tenant in {A,B} && within_quota(PSP2)`
- Артыкчылыкты жогорулатуу: 'priority = P1 if deadline <10m & & process in {withdrawal, payout}'
- PII экспорттук блогу: 'deny if export. rate > baselineK &&!ticket && data_class=PII`
Саясатчылар версияланат, сыналат, кадимки код катары рецензияланат.
11) Байкоо
Процесс SLI: ийгиликтүү аяктоо үлүшү, p95/p99 узактыгы, кечигүү пайызы.
SLI кезектери: милдеттердин жашы, throughput, admission боюнча баш тартуу, DLQ-rate.
Соодалар: ар бир кадамда уктап ('trace _ id' корреляциясы төлөм/коюм/КУС менен).
Логи: структураланган, PII жок; retray/тайм-аутс/компенсация себептери.
Dashbord: Exec (SLA/кечигүү/наркы), Ops (lag/reties/DLQ), Domain (PSP бутактары, KYC SLA).
Alerty: burn-rate мөөнөтү, DLQ өсүшү, кадам убакыттын өсүшү, "ысык" кезек.
12) Наркы (FinOps оркестр)
KPI: $/процесс, $/тапшырма, $/retray, $/мин SLA бузуулар.
оптималдаштыруу: Class-C үчүн batch, сигналдарды топтоо, узак журналдарды downsampling, "узун" жараяндарга чектөөлөрдү.
Шоу/чардж-бэк: тенант өзүнүн изин көрөт (кезек/сактоо/ретра).
13) Коопсуздук жана комплаенс
ABAC/RBAC: ролу/тенант/аймак/айлана-чөйрө боюнча жараяндарга жетүү.
JIT/PAM: кол кадамдар үчүн убактылуу жогорулатуу.
Webhook/mTLS кол тамгасы: окуянын бүтүндүгү.
WORM аудит: өзгөрүлбөгөн журналдар; PII үчүн TTL/жашыруу саясаты.
SoD: бир адам "демилгелөө → бекитүү → өткөрүү" айкалыштырууга тыюу салуу.
14) Типтүү оркестрлердин каталогу (iGaming)
1. Депозит: `init → 3DS/auth → capture → ledger_post → bonus_credit → notify`.
Компенсация: 'ledger _ revert, refund_capture'.
Саясат: auth-success кулаганда PSP кайра бөлүштүрүү.
2. Вывод: `request → risk_score → 4-eyes approve → payout → registry → notify`.
SLA боюнча эскалация, velocity-аномалиялар менен блок.
3. KYC/AML: `collect → providerA → (fallback providerB) → manual review → finalize`.
контролдоо мөөнөтү; DLQ сканер каталар үчүн.
4. Коюм/сеттл: 'reserve → fix_odds → confirm → settle → payout'.
lag кезек Degrade-бутагы (экинчилик fich чектөө).
5. Инцидент: `detect → classify (P1–P4) → war-room → actions → close → post-mortem`.
15) Үлгүлөр (үзүндүлөр)
Атайын тапшырмалар (YAML):yaml id: payments. capture qos: A priority: P1 deadline: 2m timeout: 2s retry:
strategy: exponential_jitter max_attempts: 5 idempotency_key: ${payment_id}
saga:
compensate: payments. refund_capture
Артыкчылыктуу саясат:
yaml rule: "priority-escalation"
if: "deadline < 5m && qos == 'A'"
then: "priority = P1"
Human-task (4-eyes):
yaml id: withdrawal. approval type: human sod: true approvers: [Risk, Finance]
sla: 2h on_timeout: escalate:L2
16) иштетүү жараяндар
Release-gates: кызыл SLI кезек/жараяндар менен коркунучтуу релиздер блогу.
Tabletop/chaos-күн: PSP өчүрүү/реплика/кезек; retrains/ордун текшерүү.
Чейректик review: босоголор, квоталар, наркы, DLQ тенденциялары, SoD өзгөчөлүктөрү.
17) Жол картасы киргизүү (8-12 жума)
Нед. 1-2: тизмектерди (депозиттик/акча чыгаруу/CUS/сеттл), SLA максаттары, QoS класстары, артыкчылыктар жана квоталар матрицасы.
Нед. 3-4: Оркестр + кезек, MVP жараяндар "Депозиттик/чыгаруу", Idempotent иштеп, DLQ, базалык retrai/тайм-ауту саясаты.
Нед. 5-6: сагалар жана ордун толтуруу, human-tasks (4-eyes), fair-share per-tenant, дашборддор жана SLI кезек.
Нед. 7-8: көп аймак (локализация/Feylover), release-gates, alerts (burn-rate мөөнөтү), FinOps панелдер.
Нед. 9-10: Каталог кеңейтүү (KUS/бонустар/окуялар), кат. саясат (PSP-роутинг/PII-экспорт), аудит WORM.
Нед. 11-12: chaos-машыгуу, чыгымдарды оптималдаштыруу, RACI/SoD регламенттери, он-колла окутуу.
18) KPI/KRI оркестр
SLA жараяндар (өз убагында аткаруу), p95/p99 узактыгы.
Кечигүүлөр жана алардын домендер/тенанттар боюнча үлүшү.
Retried/Task ratio, DLQ-rate, Compensation-rate.
Fair-Share сактоо (Тенант "ачка" эмес).
Баасы: $/жараян, $/тапшырма, $/retray.
Оркестрден улам болгон окуялар (флаппинг, дедлок, кезекти ашыкча жүктөө).
19) Антипаттерндер
QoS класстары жок бир "универсалдуу" артыкчылык.
Демпотенттик жок Retrais → эки төлөмдөр.
Тышкы каталар → кар көчкү учурунда тиричилик-кайра.
Эч кандай квота per-tenant/аймак → кошуна "жеп" бүт бассейн.
Тайм-аутсуз/мөөнөтсүз узак кадамдар → илинип турган процесстер.
Сагдын жоктугу → кол менен "жөнгө салуу" жана каржылык тобокелдиктер.
Бош журналдар/эч кандай жолдор → туура эмес далилдөө.
Жыйынтык
Тапшырмаларды топтоо - бул башкарылуучу процесстер фабрикасы: QoS жана артыкчылыктар боюнча туура сегменттөө, жеткирүү кепилдиктери жана демпотенттүүлүк, компенсация жана мөөнөт, тенанттарды/аймактарды адилеттүү изоляциялоо, плюс байкоо жана коопсуздук дизайндын бир бөлүгү катары. Мындай контур болжолдонгон операцияларды, провайдерлердин ийгиликсиздигине туруктуулукту жана "кол" микроменеджментинин баасысыз жөнгө салуучу талаптардын сакталышын камсыз кылат.