Ցանցի առողջության գնահատում
1) Ի՞ նչ է «ցանցի առողջությունը» և ինչո՞ ւ չափել այն։
Ցանցի առողջությունը էկոհամակարգի կարողության վիճակն է կայուն ապահովել տեխնոլոգիական մակարդակները (SLO), անվտանգությունը, տնտեսական արդյունավետությունը և կանխատեսելի էվոլյուցիան բարձրացումների, կրճատումների և պահանջարկի փոփոխության ժամանակ։
Գնահատման նպատակները
դեգրադացիաների և ռիսկերի վաղ հայտնաբերումը.
բաս-բաս կառավարումը, քվոտաները, դրդապատճառները և գերակայությունները։
թափանցիկությունը մասնակիցների համար (կոմպոզիցիաներ, պրովայդերներ, օպերատորներ, ստեղծողներ, աֆֆիլիատներ);
ստորգետնյա լուծումներ և փոստ-մորտեմներ։
2) Առողջության կանոնների քարտեզը
1. Արտադրողականությունը և հասանելիությունը 'latency/throughput, error rate, finality, գծեր։
2. Կայունությունը և կայունությունը ՝ MTBF/MTTR, backpressure, QoS-ի քայքայումը։
3. Անվտանգությունն ու վստահությունը 'վավերացում/հեղինակային, ամբողջականության, սլեշինգի, ֆրոդի։
4. Տնտեսությունը և արդյունավետությունը 'cost-to-serve, մարջա/հաղորդագրություն, ռեսուրսների արդարություն։
5. պարամետրեր և գործընթացներ 'պարամետրային փոխակերպման արագություն, անպատասխան օրինագծեր, հաշվետվությունների կարգապահություն։
6. Կոմպլասենսը և գաղտնիությունը 'գեո/տարիքը, սանկցիաները, տվյալների պահպանումը/հեռացումը, ZK-պրուֆները։
3) Taksonomia metric (ստանդարտ)
3. 1 Արտադրողականություն (QoS դաս)
Latency p50/p95/p99, TailAmplification = p99/p50.
Throughput (msgs/s, tx/s, GB/s DA), queue depth, consumer lag.
Success rate, timeouts/retries%, duplicate ratio, out-of-order%.
Finality lag (x-chain/bridge), challenge-окна.
3. 2 Lenta.ru
SLA-Brack/1k իրադարձություններ, MTBF/MTTR, flap-rate հավասարակշռողներ։
Backpressure recovery time, DLQ depth, replay success%.
3. 3 Անվտանգություն
Ամբողջական/գողություն, կասկածելի ազդանշաններ/1k,
False Accept/Reject-ը կոմպլասենսում, գործընկերների/ստորագրությունների միջև։
Slashing events, oracules, MEV էքսպոզիա (եթե կիրառելի է)։
3. 4 Տնտեսագիտություն
Cost/Req, Cost/GB DA, մարժան/հաղորդագրություն, եկամուտ/բայթ,
NRR/GRR, ARPU/ARPPU, ռուսական եկամուտների մասը,
FairnessIndex (Jain) по CPU/GPU/IO/egress, noisy neighbor index.
3. 5.1.1 և գործընթացներ
Օրինագծերի հաջողությունը առանց արձագանքի, պրոպագանդաների հաստատման ժամանակը,
պարամետրի արագությունը (փոխակերպումը), բենչարներով ծածկելը։
3. 6 Համակարգչային և մասնավոր
Ստուգված DID/VC-ի մասնաբաժինը, գեո/տարիքով արգելափակումը,
պատասխանելու ժամանակը կարգավորողի խնդրանքին, պահեստավորման/փորձարկման դեպքերին։
4) Կոմպոզիտ «Ցանցի առողջության ինդեքսը» (IZS)
IZS - ռոբոտ կոմպոզիտ sab ինդեքսներից ՝ Performae (PFI), Reliability (RLI), Pro & Trust (STI), Economics (ECI), Gernovice (GVI), Clipliance (Ciplipliance (), Clipe (Cht), Comice (Ciple (), Ciple (), ClanCiple (Ciple (eme (el), CFI)։
Մետրի նորմալացումը
robust z-score կամ robust min-max [P5, P95]; EWMA հարթեցում; www.sorization պոչեր։
Համախմբումը
[
\text{SubIndex}k=\sum_i w{k,i},\hat m_{k,i},\quad
\text{ИЗС}=\sum_k W_k,\text{SubIndex}k,\ \sum W_k=1,
]
որտեղ քաշը (W _ k) և (w + k, i) պահվում են Governational Registry-ում և փոխվում են sunset ընթացակարգով։
Գոտիների ուղեցույցները
Կանաչ 'ISS 240։ 70-ը քվոտ/105-ի աճն է, որակի բոնուսները։
Դեղին '0։ 50–0. 70 - կետային թյունինգ, հետազոտություններ։
Կարմիր '<0։ 50 - stop-rins, լիմիտների նվազեցում, MTTR/2019 վրա։
5) Շեմի SLO և «դարպաս» (gates)
SLO կոդավորման օրինակները (wwww.ytyanium)
Q4 API: success ≥ 99. 99%, p95-200 ms, DLQ = 0։
Q3 Draging-ը '10 հազար ռուբլիներ/105, p95-500 մզ։
Bridge/Finality: Կեղծ ապացույցներ = 0; MTTR anomalia 241
DA: եզրափակիչ 243 TT _ block; throughput ≥ X GB/ч.
Batch/Stream: Պատուհանը T տեղավորվում է 20 տոկոսով։ lag ≤ 2×window.
Գրանցում ՝ ամբողջականության պատահարներ = 0; FPR/FNR միջանցքներում։
SLO-ի խախտումը կատարվում է ավտոմատ ձգումներ (388)։
6) Տվյալների հավաքումը, որակը և պաշտպանությունը
Idempotention/dedup: ULID/trace, seen աղյուսակներ TTL-ից։
E2E-ի ուղին 'հարաբերակցությունը' x _ 24g _ id 'ալյումինի/բրիջիի/DA-ի միջոցով։
Anti-gaming: blind-run պատուհաններ, թաքնված վերահսկողական առաջադրանքներ, սինթետիկ թեստեր։
Գաղտնիությունը 'DID/VC, ընտրական բացահայտումներ, ZK-պրուֆներ։
Հուսալիությունը 'իրադարձությունների ստորագրությունները, մարտերի մերկացումը, լոգարանների աուդիտը։
7) «առողջություն»
Network Health Overview: IZS և sab ինդեքսներ, մետրի ներդրումը։
Latency & Tail: pXX, TailAmplifment heatmap-ը։
Reliability Panel: SLA-брейки, MTTR, DLQ/Replay, backpressure.
Express & Trust: Կասկածելի ազդանշաններ, սլեշինգ, oracule տարբերություններ։
Economy: Cost-to-Serve, մարջա/հաղորդագրություն, fairness ռեսուրսներով։
Finality & Bridge Risk: finality lag, challenge, կամուրջի միջադեպեր։
Compliance: գեո բլոկներ, տարիքը, հաշվետվությունները, կարգավորողի հարցումները։
8) Աուտո ռեակցիաների քաղաքականությունը (policy hooks)
SLO-դարպասը 'error-բյուջեի փոխակերպումը Q0/Q1 համար, Q4 գերակայությունը։ 24circuit-breakers.
Թարիֆներ 'TailAmplif.ru աճը կայուն պահանջարկի դեպքում ռուսական գինը «աղմկոտ» հոսքեր է։ կայուն որակը take-rate է։
Ռիսկերը ՝ Peter/Compliance-ի բարձրացումը wwww.fail-closed-ի, S-գրավչության բարձրացումը։
Դրդապատճառներ ՝ կայուն PFI/RLI ալգորիթմներ, որոնք համապատասխանում են ծավալի բոնուսին/տեսանելիության։ խախտողները տուգանքներ են/clawback։
Релизы: regression detector → auto rollback/feature flag.
9) Պատահականության կառավարումը
1. Մանկական 'անոմալիաներ r95/վերջնական/սխալներ/արժեքներ։
2. Դասակարգումը ՝ Integrity/Availability/Performator/Compliance։
3. Մեկուսացում ՝ trip per-rope, հերթերի, limits, ձեռքի կվորում։
4. Փոխհատուցում 'ապահովագրության փամփուշտից RNFT քաղաքականներով։
5. Փոստի մորտեմը 'հանրային զեկույցը, ազդանշանների նորարարությունը, քաշների/սահմանների ճշգրտումը։
10) Պայմանագրերի և դերերի հետ կապը
RNFT իրավունքները 'անհատական SLO/limits հանգույցների/պրովայդերների/աֆֆիլիատների համար։
R-հեղինակություն 'հասանելիության/ձայների և գնի փոփոխող; կայուն որակը համապատասխանում է S.-ի պահանջներին։
S-գրավը 'ծածկումը, սլեշինգը խախտումների ժամանակ։
11) Բանաձևեր և արժեքներ
SuccessRate = 1 − (timeouts + errors)/requests
TailAmplifox = p99/p50 (առաջադրանքների միջանցքներ)
Cost/Req = Lenta.ru (ռեսուրսը համապատասխան տոկոսադրույքը )/հաջողակ _ հարցումներ
FairnessIndex (Jain) = (Systx) Nox/( n Nox Nox) քվոտաների/ռեսուրսների վրա
Headroom = (cap − current)/cap, FinalityScore = f(lag, variance, reorgs)
12) Ներդրման պլեյբուկը (քայլերով)
1. Քննադատական տրակտների և QoS դասարանների կարիվացումը։ www.SLO։
2. Հեռուստաչափության սխեման 'հետք, մետրեր, քաղաքականության լոգներ, իրադարձությունների անձնագրեր։
3. Նորմալացում 'ռոբաստիկ մասշտաբներ, EWMA պատուհաններ, www.sorization։
4. ISS v1։ 0: մեկնարկային քաշը, գոտիների շեմերը, sunset-ընթացակարգերը։
5. Դաշբորդներն ու ալերտները ՝ error-բյուջեներ, policy hooks։
6. Բենչմարկները և չաոսը 'ռուսական պրոգոններ, failover ուսուցումներ։
7. Միջադեպերը 'փոստի մորտեմների օրինակները, ապահովագրության ֆոնդը, RNFT տուգանքները։
8.07: SLO/կշիռների/միջանցքների փոփոխության գործընթացը, զանգվածային բջիջները։
9. Ավտոմատիզացիա 'կապ միկրոօրգանիզացիայի, քվոտաների, ֆորումների և ռելիզի խաղացողների հետ։
10. Օդաչուն բացատրում է մասշտաբը 'մեկ տիրույթից մինչև մուլտիմեդիա։
13) KPI «առողջության» ծրագիրը
Կանաչ SLO 24X տոկոսով տրակտորների մասնաբաժինը։ MTTR mediana No. Z
TailAmplifts-ի նվազումը Կազախստանում կայուն throughput-ի հետ։
Cost/Req-ի և DLQ depth-ի նվազումը առանց success rate-ի վատացման։
NRR/GRR աճը անփոփոխ կամ ավելի լավ ապահովությամբ։
Հաճախորդի ժամանակացույցը (TTC զեկույցը www.Y ժամ), բենչարներով ծածկելը KK%։
Արդարություն ՝ FairnessIndex-ը միջանցքում, «neighbor» նվազումը։
14) Չեկի թուղթ, պատրաստակամություն
- Որոշվում են SLO/SLA դասարաններում QoS դասարաններում և կատալոգներում։
- Իրականացվել է E2E, idempotention և dedup երթուղին
- Ներդրվել են ռոբոտ նորմալացում և IZS-ի մասեր։
- Alerts, error-բյուջեներ և Auto-Stugers
- Հասանելի են Perform.ru/Reliability/Windows/Economy/Compliae dashbords։
- Աշխատում են բենչարկներ և chaos-progons; նկարագրված է post-mortemes
- Ինտեգրված RNFT իրավունքները, R/S քաղաքականությունը և ապահովագրության ֆոնդը
- Կանոնավոր հանրային հաշվետվություն և քաշի բարձրացում
15) Գլոսարիա
ISS 'Սաբ ինդեքսներից ցանցի առողջությունն է։
SLO/SLA: Ռուսական/պայմանագրային մակարդակներ։
Error budget 'սխալների թույլատրելի մասը արձագանքներին։
TailAmplif.ru: 105 ուշացումներ։
DLQ/Replay: կարանտին/վերամշակում։
Sunset-ընթացակարգը 'ժամանակավոր փոփոխությունները կատարվում են մեքենայի-ռեպատի հետ։
16) Արդյունքը
Ցանցի առողջության գնահատումը ոչ թե «հետևի համարի» զեկույցն է, այլ կառավարման գործառնական տեմպերը 'ռոբաստային մետրերը, որոնք պարունակում են SLO-ի շեմի ստեղները։ Այս համակարգը էկոհամակարգ է դարձնում կանխատեսելի, կայուն ցնցումների և բոլոր դերերի համար 'հանգույցներից և պրովայդերից մինչև ստեղծողներ և օպերատորներ։