GH GambleHub

Պլանավորողը և ֆոնային խնդիրները

(Բաժին ՝ Վիրահատություններ և կառավարում)

1) Նշանակումներ

Պլանավորողը և ֆոնային առաջադրանքները ապահովում են պլատֆորմի չօգտագործողական աշխատանքը 'պարբերական հաշվարկներ, արտեֆակտների հրատարակություններ, կլիրինգ և հերթափոխի վերամշակումներ։ Նպատակներն են դետերմինալը, ձախողումների դիմադրությունը և անհաջողության զգացումը։


2) Առաջադրանքների տաքսոնոմիա

Time-based: ժամանակացույցի (com/օրացույց) 'կլիրինգ, RTP պատուհաններ, դուրս, արխիվներ։

Event-driven: Settled (Paymant Settled, PricListed)։

One-off/Ad-hoc: տարբեր ջոբներ TTL-ից։

Long-running: becof/sagi, striming նվագախմբեր։

Maintena.ru 'պարտատոմսեր, repaced, ինդեքսներ, տաքացնելով քեշը։


3) Ճարտարապետություն (հանրաքվե)

Բաղադրիչները

1. Շչեդուլերը (www.l-plane), պահպանում է գրաֆիկները, CAL/cript, ծառայության պատուհանները, թայմզոնները, սահմանափակիչները։

2. Propatcher: Սկզբնական փուլի պլանը (per-priority/tenae/region), տեղադրում է dedlins, idempotent բանալիներ։

3. Workers: Stational/autocayl առաջադրանքների փամփուշտի տակ; heartbeats, leases.

4. Queue/Bus: FIFO/proretization, DLQ, հետաձգված հաղորդագրություններ։

5. Disker/Coordination: բաշխված արգելափակումները (leases), առաջնորդը-էլեկտիան (Raft/ZK/Consul)։

6. Vox/KFC: JIT գաղտնիքները, կարճ TTL։

7. Observability: traces/metrance/logs, dashbords, alerts։

8. Audit/WORM 'անփոփոխ քվիտանտներ կատարման համար, Merkle-կտրվածքներ։

Patterns: wwww.box/CDC, idempotency, փոխհատուցում (sagi), backpressure, circuit-breakers։


4) Գծապատկերներ ՝ com և օրացույցներ

Cultv3: վայրկյան/րոպե/ժամ/օր/ամիս/շաբաթ; աջակցություն «/5 », միջակայքներ, ցուցակներ։

Օրացույցներ/բացառություններ ՝ բիզնես օրացույց, «լռության պատուհաններ», արձակուրդներ/DST։

Թայմզոններ 'պահեք «tz» առաջադրանքի վրա։ գործարկումը տեղական ժամանակով tenault.

Multiregion 'per-region-ի կամ «հաղորդավար + ֆոլլերայի» օրինակները dreen/վերընտրությամբ։


5) Գծեր, գերակայություններ, SLA

Առաջնահերթության դասարանները ՝ P0 (քննադատական), P1, P2, P3; գողերի առանձին փամփուշտներ։

SLA/dedline: «must _ start _ by», «must _ finish _ by»; 1942 - էսկալացիա/ռետրա։

Քվոտաները և fairness: caps առաջադրանքների/րոպե/ստենանտ, ցնցված են «փոթորիկների» վրա, մեկուսացումը medisy-neighbors։

Հետաձգված առաջադրանքները ՝ «ոչ շուտ, քան» (wwww.ay/visibility timeout)։


6) Մրցակցությունն ու արգելափակումը

Leases 'ավտոմեքենայի երկարացման հետ աշխատելու վարձույթ (heartbeat); Time-utu-ը վերաթողարկումն է։

Mutex/սեմաֆորներ ՝ per ռեսուրս (օրինակ ՝ «Masters-Lister-ը գրում է միայն մեկ գողեր»)։

Շարդինգը '«tenault/region/hash (key)»; sticky-routing քեշի և տեղանքի համար։

Առաջնորդը էլեկտիա է, մեկ առաջնորդը հրապարակում է «ռուսական» ջոբա (օրինակ ՝ «փակել բոլոր RTP պատուհանները»), ֆոլլերը տաք standby են։


7) Lenta.ru: Retrai, idempotenty, dedup, dedup

Idempotent բանալին '«(task _ type, business _ id, windows)»; կրկնությունները նույն քվիտանիան են։

Retrai: էքսպոնենցիալ back փլեյ + ջիտթեր, փորձերի սահմանափակում, on-error ռազմավարություն (retry/cancel/comporate)։

Poison-pill: Արագ թարգմանություն DLQ-ում N ձախողումներից հետո, սեփականատիրոջ ալերտը։

Dedup: seen-cache (in-memory + KV) TTL պատուհանի վրա։

Exactly-once ազդեցությունները 'կողմնակի էֆեկտների հաստատումը գործարքային ամսագրի/քվիտանիայի միջոցով։


8) Երկար և ծանր խնդիրների կառավարումը

Chunking 'կոտրվածք, chekpoints/շարունակություն։

Time-boxing: CPU/IO/ցանցային egress սահմանափակումը; ընդհատումը առաջընթացի պահպանմամբ։

Սագին/փոխհատուցումը '«undo» սեմանտիկան' հղի քայլերի համար։

Concurrency-caps: Միաժամանակ առաջադրանքների սահմանները տիպ/տենանտ/տարածք։


9) Դիտողությունն ու չափումները

Traces: «trace _ id», սագայի քայլերը, արտաքին մարտահրավերները։

Metrics (SLI):
  • Lag մինչև սկսելը, հերթը (երկարությունը, p95 տարիքը)։
  • Success Rate, error-rate, retry-rate.
  • Latency p50/p95, time-to-complete.
  • Cost per 1k առաջադրանքներ, egress/ingress։
  • DLQ rate, poison-pill rate.

SLO (օրինակ)

P0-ի սկիզբը 60-ից, P1-5 րոպե; Success ≥ 99. 5%; DLQ ≤ 0. 1%; Freshness (operstina) 3830 p95-ից։


10) Աուդիտ և ապացույցներ

Քվիտանզիա ՝ «receipt _ hash» սկսելու/հաջողության/սխալի, DSSE ստորագրություններ կրիտիկական տեսակների համար (վճարումներ, ռուսական թերթիկներ, RTP)։

WORM 'առաջադրանքների կատարման և մանիֆեստների պահպանում։

Chain-of-custody: Ո՞ վ է տեղադրել/2019/փոխեց կայունությունը։ SoD ստուգումներ։


11) Անվտանգություն և հասանելի

RBAC/ABAC/ReBAC: Ով ստեղծում/հաստատում/սկսում է; SoD: «Ստեղծել» ռուսական «հաստատել»։

JIT-գաղտնիքները 'գողերը պահանջում է ցնցումներ կարճ TTL-ի հետ խնդրի արագ։

Մեկուսացում 'per-ten.ru/region/ցանցի պուլեր; sandbox կատարումը։

PII-հիգիենան 'դիմակավորում/թունավորում, առաջնային տրամաբանության արգելք։


12) FinOps-ը և արժեքը

Բյուջեներ/cap-alerts compation/storage/egress-ում։

Worker-ը և SLO-ն։

Պահեստավորման դասարանները 'տաք (7-30 օր) no OLAP (6-24 մեզ) ռուսական արխիվ։

Cost-a.ru պլանավորումը '«էժան ժամացույցի» գործարկման պատուհանը, egress-ի սահմանները։


13) Տվյալների մոդելը (պարզեցված)

`schedule` `{id, tenant, region, tz, croncalendar, window, enabled, owner, policy_version}`
`job` `{id, schedule_id?, type, payload_hash, idempotency_key, priority, must_start_by, attempts, status, receipt_hash}`
`lease` `{job_id, worker_id, acquired_at, ttl}`
`run_log` `{job_id, started_at, finished_at, outcome, trace_id, metrics{}, receipts[]}`
`dlq_item` `{job_id, reason, attempts, last_error, owner_notified}`

14) API պայմանագրեր (կառավարում/ինտեգրում)

«POST/schedules» - ստեղծել կոմպոզիցիա (com/cal, tz, պատուհաններ)։

«POST/jobs» - տեղադրել ad-hoc; վերադարձնել «jb _ id», «receipt _ hash»։

"GET/jobs/+ id + - կարգավիճակը/լոգ/քվիտանիա։

«POST/jobs/+ id/cancel» - փոխհատուցման վերացում։

«GET/queues/stats» - երկարություն, բայեր, p95։

Вебхуки: `JobStarted`, `JobSucceeded`, `JobFailed`, `JobDroppedToDLQ`, `SLOViolated`.


15) Պլեյբուկի (տիպիկ սցենարներ)

Retry-storm: ներառել գլոբալ back-փլեյ, բարձրացնել կախվածության թայմաուտները, ներառել circuit-breaker, կռիվների թուլացում։

DLQ-լավինը 'դադարեցնել ընդունումը, գերակայել DLQ-ի վերլուծությունը, բուֆալացնել նոր առաջադրանքները։

Առաջնորդը ընկավ 'վերընտրում, «երկակի հրապարակումների» հավատարմագրում' գաղափարախոսության, աուդիտի միջոցով։

Պրովայդերի (PFC/KYC) 'պահեստային երթուղին, նվազեցնել poling/webhuks հաճախությունը, փոխանցել գործարքները կարանտինով։

Գողերի գաղտնիքների արտահոսքը 'վերանայումը, նավարկումը, 30 օրվա ընթացքում «աննորմալ» սկսելու որոնումը, իրավունքների խանդը։


16) iGaming/fintech առանձնահատկությունները

Վճարումներ/վճարումներ 'ասինխրոն ջոբներ քվիտացիաներով, «մոխրագույն» գործարքների կարանտինով, դեդուպով հերթափոխով։

RTP պատուհաններ/լիմիտներ ՝ vs-ի տեսական RTP-ի դիտարկված օրացույցը, պրոտո-դադարը։

Systs-թերթերը/FX/Tax: Հրապարակումներ ըստ ժամանակացույցի, արտեֆակտների տարբերակները, քեշի ֆորս-հաշմանդամությունը։

Աֆֆիլիատներ 'փոխադարձությունների իջեցում, webhuks, ակտեր/ստորագրություններ, վեճերի ուղեկցորդ։


17) Որակի մետրերը (հավաքածուի օրինակը)

Schedule Adherence-ը այն խնդիրների մասն է, որոնք սկսել են պատուհանում 3699 տոկոսը։

Queue Lag p95: P0 2460 c, P1 245 ռուբլի

Success/Retry/DLQ Rate: ≥ 99. 5% / ≤ 0. 4% / ≤ 0. 1%.
Idempotency Errors: ≤ 0. 01%.

Cost/1k jobs և Egress/job - բյուջեի սահմաններում։

Audit Completeness: 100 տոկոսը քննադատական առաջադրանքներ են քվիտացիաների հետ։


18) RACI

ՏարածքըRACI
Պլանավորման ճարտարապետությունըPlatform/SRECTOData, SecurityProduct
Քաղաքական/SoD/օրացույցCompliance/IAMCCO/CISOLegal, OpsԲոլորը
Դիտարկումը/SLOSREHead of EngData, FinOpsSupport
Տնտեսագիտություն/քվոտաներFinOpsCFO/CTOSRE, ProductBU Leads
Քննադատական պլեյբուսներIR TeamCOOPartners, LegalAudit

19) Ներդրման չեկի ցուցակ

  • Ընտրել առաջադրանքների դասեր, գերակայություններ և SLA; որոշել օրացույցներն ու թայմզոնները։
  • Տեղակայեք Scheduler/Winpatcher/Queue/Workers-ը առաջնորդի էլեկացիայի և շարդիզացիայի հետ։
  • Մուտքագրեք Idempotention, retrai, DLQ, փոխհատուցում (sagi)։
  • Տեղադրել RBAC/ABAC/ReBAC, SoD և JIT գաղտնիքները գողերի համար։
  • Ներառեք traces/metr.ru/logs, dashbords և alerts; SLO и error-budget.
  • Ստորագրված քվիտանտներ (DSSE) և WORM ամսագրեր կրիտիկական տեսակների համար։
  • Autscayl և kap-alerts արժեքով (compation/storage/egress)։
  • Պլեյբուկի 'retry-storm, DLQ-լավինա, առաջնորդի հրաժարվելը, պրովայդերի քայքայումը։
  • Թեստեր ՝ GameDay յուրաքանչյուր պլեյբուքի համար, հետաձգում/սխալ։
  • Նկարների, հերթերի և ROI ավտոմատացման նախաշեմին։

20) FAQ

Ինչու՞ com բավարար չէ։

Առանց հերթերի, կուռքերի, կողպեքների և կողպեքների կոտրվում է ձախողումների և ժամացույցի գոտիների վրա։

Կարո՞ ղ եք միավորել Time-based և event-driven։

Այո 'com - catch-up ապահովագրություն; իրադարձությունները ռեակտիվության համար են։

Ինչպե՞ ս հասնել «հենց մի անգամ»։

Դեդուպը բանալիով, գործարքային էֆեկտների, քվիտանզիայի և կուռքերի կողմնակի գործողությունների ամսագիրը։

Ի՞ նչ անել ջոբսի հետ։

Chank, chekpoints, time-boxing, հնարավորություն ընդհատել և շարունակել։

Ինչպե՞ ս «ուտել» բյուջեն։

Ինքնաձիգը հերթերով և SLO-ով, էժան ժամացույցներ ծանր ջոյի համար, ծանր egress/compation կաթիլներ։


Ռեզյումե 'Պլանավորողը և ֆոնային խնդիրները պլատֆորմի արտադրողական փոխակրիչն են։ Ներկառուցելով ժամանակացույցներն ու գծերը, գաղափարախոսությունը, արգելափակումը և դիտարկումը, ավելացնելով քվիտանտներ/աուդիտ, ստենանտների մեկուսացում և FinOps վերահսկողություն, դուք կստանաք կանխատեսելի ժամկետներ, արագ կրկնապատկումներ և իրավաբանորեն պահպանված գործողություններ ցանկացած տարածաշրջաններում և բեռներում։

Contact

Կապ հաստատեք մեզ հետ

Կապ հաստատեք մեզ հետ ցանկացած հարցի կամ աջակցության համար։Մենք միշտ պատրաստ ենք օգնել։

Սկսել ինտեգրացիան

Email-ը՝ պարտադիր է։ Telegram կամ WhatsApp — ըստ ցանկության։

Ձեր անունը ըստ ցանկության
Email ըստ ցանկության
Թեմա ըստ ցանկության
Նամակի բովանդակություն ըստ ցանկության
Telegram ըստ ցանկության
@
Եթե նշեք Telegram — մենք կպատասխանենք նաև այնտեղ՝ Email-ի дополнение-ով։
WhatsApp ըստ ցանկության
Ձևաչափ՝ երկրի կոդ և համար (օրինակ՝ +374XXXXXXXXX)։

Սեղմելով կոճակը՝ դուք համաձայնում եք տվյալների մշակման հետ։