Պլանավորողը և ֆոնային խնդիրները
(Բաժին ՝ Վիրահատություններ և կառավարում)
1) Նշանակումներ
Պլանավորողը և ֆոնային առաջադրանքները ապահովում են պլատֆորմի չօգտագործողական աշխատանքը 'պարբերական հաշվարկներ, արտեֆակտների հրատարակություններ, կլիրինգ և հերթափոխի վերամշակումներ։ Նպատակներն են դետերմինալը, ձախողումների դիմադրությունը և անհաջողության զգացումը։
2) Առաջադրանքների տաքսոնոմիա
Time-based: ժամանակացույցի (com/օրացույց) 'կլիրինգ, RTP պատուհաններ, դուրս, արխիվներ։
Event-driven: Settled (Paymant Settled, PricListed)։
One-off/Ad-hoc: տարբեր ջոբներ TTL-ից։
Long-running: becof/sagi, striming նվագախմբեր։
Maintena.ru 'պարտատոմսեր, repaced, ինդեքսներ, տաքացնելով քեշը։
3) Ճարտարապետություն (հանրաքվե)
Բաղադրիչները
1. Շչեդուլերը (www.l-plane), պահպանում է գրաֆիկները, CAL/cript, ծառայության պատուհանները, թայմզոնները, սահմանափակիչները։
2. Propatcher: Սկզբնական փուլի պլանը (per-priority/tenae/region), տեղադրում է dedlins, idempotent բանալիներ։
3. Workers: Stational/autocayl առաջադրանքների փամփուշտի տակ; heartbeats, leases.
4. Queue/Bus: FIFO/proretization, DLQ, հետաձգված հաղորդագրություններ։
5. Disker/Coordination: բաշխված արգելափակումները (leases), առաջնորդը-էլեկտիան (Raft/ZK/Consul)։
6. Vox/KFC: JIT գաղտնիքները, կարճ TTL։
7. Observability: traces/metrance/logs, dashbords, alerts։
8. Audit/WORM 'անփոփոխ քվիտանտներ կատարման համար, Merkle-կտրվածքներ։
Patterns: wwww.box/CDC, idempotency, փոխհատուցում (sagi), backpressure, circuit-breakers։
4) Գծապատկերներ ՝ com և օրացույցներ
Cultv3: վայրկյան/րոպե/ժամ/օր/ամիս/շաբաթ; աջակցություն «/5 », միջակայքներ, ցուցակներ։
Օրացույցներ/բացառություններ ՝ բիզնես օրացույց, «լռության պատուհաններ», արձակուրդներ/DST։
Թայմզոններ 'պահեք «tz» առաջադրանքի վրա։ գործարկումը տեղական ժամանակով tenault.
Multiregion 'per-region-ի կամ «հաղորդավար + ֆոլլերայի» օրինակները dreen/վերընտրությամբ։
5) Գծեր, գերակայություններ, SLA
Առաջնահերթության դասարանները ՝ P0 (քննադատական), P1, P2, P3; գողերի առանձին փամփուշտներ։
SLA/dedline: «must _ start _ by», «must _ finish _ by»; 1942 - էսկալացիա/ռետրա։
Քվոտաները և fairness: caps առաջադրանքների/րոպե/ստենանտ, ցնցված են «փոթորիկների» վրա, մեկուսացումը medisy-neighbors։
Հետաձգված առաջադրանքները ՝ «ոչ շուտ, քան» (wwww.ay/visibility timeout)։
6) Մրցակցությունն ու արգելափակումը
Leases 'ավտոմեքենայի երկարացման հետ աշխատելու վարձույթ (heartbeat); Time-utu-ը վերաթողարկումն է։
Mutex/սեմաֆորներ ՝ per ռեսուրս (օրինակ ՝ «Masters-Lister-ը գրում է միայն մեկ գողեր»)։
Շարդինգը '«tenault/region/hash (key)»; sticky-routing քեշի և տեղանքի համար։
Առաջնորդը էլեկտիա է, մեկ առաջնորդը հրապարակում է «ռուսական» ջոբա (օրինակ ՝ «փակել բոլոր RTP պատուհանները»), ֆոլլերը տաք standby են։
7) Lenta.ru: Retrai, idempotenty, dedup, dedup
Idempotent բանալին '«(task _ type, business _ id, windows)»; կրկնությունները նույն քվիտանիան են։
Retrai: էքսպոնենցիալ back փլեյ + ջիտթեր, փորձերի սահմանափակում, on-error ռազմավարություն (retry/cancel/comporate)։
Poison-pill: Արագ թարգմանություն DLQ-ում N ձախողումներից հետո, սեփականատիրոջ ալերտը։
Dedup: seen-cache (in-memory + KV) TTL պատուհանի վրա։
Exactly-once ազդեցությունները 'կողմնակի էֆեկտների հաստատումը գործարքային ամսագրի/քվիտանիայի միջոցով։
8) Երկար և ծանր խնդիրների կառավարումը
Chunking 'կոտրվածք, chekpoints/շարունակություն։
Time-boxing: CPU/IO/ցանցային egress սահմանափակումը; ընդհատումը առաջընթացի պահպանմամբ։
Սագին/փոխհատուցումը '«undo» սեմանտիկան' հղի քայլերի համար։
Concurrency-caps: Միաժամանակ առաջադրանքների սահմանները տիպ/տենանտ/տարածք։
9) Դիտողությունն ու չափումները
Traces: «trace _ id», սագայի քայլերը, արտաքին մարտահրավերները։
Metrics (SLI):- Lag մինչև սկսելը, հերթը (երկարությունը, p95 տարիքը)։
- Success Rate, error-rate, retry-rate.
- Latency p50/p95, time-to-complete.
- Cost per 1k առաջադրանքներ, egress/ingress։
- DLQ rate, poison-pill rate.
SLO (օրինակ)
P0-ի սկիզբը 60-ից, P1-5 րոպե; Success ≥ 99. 5%; DLQ ≤ 0. 1%; Freshness (operstina) 3830 p95-ից։
10) Աուդիտ և ապացույցներ
Քվիտանզիա ՝ «receipt _ hash» սկսելու/հաջողության/սխալի, DSSE ստորագրություններ կրիտիկական տեսակների համար (վճարումներ, ռուսական թերթիկներ, RTP)։
WORM 'առաջադրանքների կատարման և մանիֆեստների պահպանում։
Chain-of-custody: Ո՞ վ է տեղադրել/2019/փոխեց կայունությունը։ SoD ստուգումներ։
11) Անվտանգություն և հասանելի
RBAC/ABAC/ReBAC: Ով ստեղծում/հաստատում/սկսում է; SoD: «Ստեղծել» ռուսական «հաստատել»։
JIT-գաղտնիքները 'գողերը պահանջում է ցնցումներ կարճ TTL-ի հետ խնդրի արագ։
Մեկուսացում 'per-ten.ru/region/ցանցի պուլեր; sandbox կատարումը։
PII-հիգիենան 'դիմակավորում/թունավորում, առաջնային տրամաբանության արգելք։
12) FinOps-ը և արժեքը
Բյուջեներ/cap-alerts compation/storage/egress-ում։
Worker-ը և SLO-ն։
Պահեստավորման դասարանները 'տաք (7-30 օր) no OLAP (6-24 մեզ) ռուսական արխիվ։
Cost-a.ru պլանավորումը '«էժան ժամացույցի» գործարկման պատուհանը, egress-ի սահմանները։
13) Տվյալների մոդելը (պարզեցված)
14) API պայմանագրեր (կառավարում/ինտեգրում)
«POST/schedules» - ստեղծել կոմպոզիցիա (com/cal, tz, պատուհաններ)։
«POST/jobs» - տեղադրել ad-hoc; վերադարձնել «jb _ id», «receipt _ hash»։
"GET/jobs/+ id + - կարգավիճակը/լոգ/քվիտանիա։
«POST/jobs/+ id/cancel» - փոխհատուցման վերացում։
«GET/queues/stats» - երկարություն, բայեր, p95։
Вебхуки: `JobStarted`, `JobSucceeded`, `JobFailed`, `JobDroppedToDLQ`, `SLOViolated`.
15) Պլեյբուկի (տիպիկ սցենարներ)
Retry-storm: ներառել գլոբալ back-փլեյ, բարձրացնել կախվածության թայմաուտները, ներառել circuit-breaker, կռիվների թուլացում։
DLQ-լավինը 'դադարեցնել ընդունումը, գերակայել DLQ-ի վերլուծությունը, բուֆալացնել նոր առաջադրանքները։
Առաջնորդը ընկավ 'վերընտրում, «երկակի հրապարակումների» հավատարմագրում' գաղափարախոսության, աուդիտի միջոցով։
Պրովայդերի (PFC/KYC) 'պահեստային երթուղին, նվազեցնել poling/webhuks հաճախությունը, փոխանցել գործարքները կարանտինով։
Գողերի գաղտնիքների արտահոսքը 'վերանայումը, նավարկումը, 30 օրվա ընթացքում «աննորմալ» սկսելու որոնումը, իրավունքների խանդը։
16) iGaming/fintech առանձնահատկությունները
Վճարումներ/վճարումներ 'ասինխրոն ջոբներ քվիտացիաներով, «մոխրագույն» գործարքների կարանտինով, դեդուպով հերթափոխով։
RTP պատուհաններ/լիմիտներ ՝ vs-ի տեսական RTP-ի դիտարկված օրացույցը, պրոտո-դադարը։
Systs-թերթերը/FX/Tax: Հրապարակումներ ըստ ժամանակացույցի, արտեֆակտների տարբերակները, քեշի ֆորս-հաշմանդամությունը։
Աֆֆիլիատներ 'փոխադարձությունների իջեցում, webhuks, ակտեր/ստորագրություններ, վեճերի ուղեկցորդ։
17) Որակի մետրերը (հավաքածուի օրինակը)
Schedule Adherence-ը այն խնդիրների մասն է, որոնք սկսել են պատուհանում 3699 տոկոսը։
Queue Lag p95: P0 2460 c, P1 245 ռուբլի
Success/Retry/DLQ Rate: ≥ 99. 5% / ≤ 0. 4% / ≤ 0. 1%.
Idempotency Errors: ≤ 0. 01%.
Cost/1k jobs և Egress/job - բյուջեի սահմաններում։
Audit Completeness: 100 տոկոսը քննադատական առաջադրանքներ են քվիտացիաների հետ։
18) RACI
19) Ներդրման չեկի ցուցակ
- Ընտրել առաջադրանքների դասեր, գերակայություններ և SLA; որոշել օրացույցներն ու թայմզոնները։
- Տեղակայեք Scheduler/Winpatcher/Queue/Workers-ը առաջնորդի էլեկացիայի և շարդիզացիայի հետ։
- Մուտքագրեք Idempotention, retrai, DLQ, փոխհատուցում (sagi)։
- Տեղադրել RBAC/ABAC/ReBAC, SoD և JIT գաղտնիքները գողերի համար։
- Ներառեք traces/metr.ru/logs, dashbords և alerts; SLO и error-budget.
- Ստորագրված քվիտանտներ (DSSE) և WORM ամսագրեր կրիտիկական տեսակների համար։
- Autscayl և kap-alerts արժեքով (compation/storage/egress)։
- Պլեյբուկի 'retry-storm, DLQ-լավինա, առաջնորդի հրաժարվելը, պրովայդերի քայքայումը։
- Թեստեր ՝ GameDay յուրաքանչյուր պլեյբուքի համար, հետաձգում/սխալ։
- Նկարների, հերթերի և ROI ավտոմատացման նախաշեմին։
20) FAQ
Ինչու՞ com բավարար չէ։
Առանց հերթերի, կուռքերի, կողպեքների և կողպեքների կոտրվում է ձախողումների և ժամացույցի գոտիների վրա։
Կարո՞ ղ եք միավորել Time-based և event-driven։
Այո 'com - catch-up ապահովագրություն; իրադարձությունները ռեակտիվության համար են։
Ինչպե՞ ս հասնել «հենց մի անգամ»։
Դեդուպը բանալիով, գործարքային էֆեկտների, քվիտանզիայի և կուռքերի կողմնակի գործողությունների ամսագիրը։
Ի՞ նչ անել ջոբսի հետ։
Chank, chekpoints, time-boxing, հնարավորություն ընդհատել և շարունակել։
Ինչպե՞ ս «ուտել» բյուջեն։
Ինքնաձիգը հերթերով և SLO-ով, էժան ժամացույցներ ծանր ջոյի համար, ծանր egress/compation կաթիլներ։
Ռեզյումե 'Պլանավորողը և ֆոնային խնդիրները պլատֆորմի արտադրողական փոխակրիչն են։ Ներկառուցելով ժամանակացույցներն ու գծերը, գաղափարախոսությունը, արգելափակումը և դիտարկումը, ավելացնելով քվիտանտներ/աուդիտ, ստենանտների մեկուսացում և FinOps վերահսկողություն, դուք կստանաք կանխատեսելի ժամկետներ, արագ կրկնապատկումներ և իրավաբանորեն պահպանված գործողություններ ցանկացած տարածաշրջաններում և բեռներում։