Ağ sağlığı değerlendirmesi
1) "Ağ sağlığı'nedir ve neden ölçülür?
Ağ sağlığı, bir ekosistemin hedef hizmet seviyelerini (SLO'lar), güvenliği, maliyet verimliliğini ve ani artışlar, arızalar ve talepteki değişiklikler sırasında öngörülebilir evrimi tutarlı bir şekilde sunma yeteneğinin durumudur.
Değerlendirme hedefleri:- Bozulma ve risklerin erken tanımlanması;
- Tarifelerin, kotaların, teşviklerin ve önceliklerin olgu tabanı yönetimi;
- Katılımcılar için şeffaflık (düğümler, sağlayıcılar, operatörler, içerik oluşturucular, bağlı kuruluşlar);
- podpitka治理 çözümler ve post mortemler.
2) Sağlık etki alanı haritası
1. Performans ve kullanılabilirlik: gecikme/iş hacmi, hata oranı, kesinlik, kuyruklar.
2. Sağlamlık ve sağlamlık: MTBF/MTTR, geri basınç, QoS bozulması.
3. Güvenlik ve güven: kimlik doğrulama/yetkilendirme, bütünlük olayları, kesme, dolandırıcılık.
4. Ekonomi ve verimlilik: Hizmet maliyeti, marj/mesaj, kaynak eşitliği.
5. 治理 ve süreçler: parametre yakınsama hızı, geri tepmesiz bültenler, raporlama disiplini.
6. Uyumluluk ve gizlilik: coğrafi/yaş, yaptırımlar, veri depolama/silme, ZK kanıtları.
3) Metriklerin taksonomisi (referans)
3. 1 Performans (QoS sınıfı başına)
Gecikme süresi p50/p95/p99, TailAmplification = p99/p50.
Verim (msgs/s, tx/s, GB/s DA), kuyruk derinliği, tüketici gecikmesi.
Başarı oranı, zaman aşımları/yeniden denemeler %, yinelenen oran, sıra dışı %.
Nihai gecikme (x zinciri/köprü), meydan okuma - окна.
3. 2 Güvenilirlik
SLA kırar/1k olaylar, MTBF/MTTR, flep oranı dengeleyiciler.
Geri basınç kurtarma süresi, DLQ derinliği, tekrar oynatma başarısı %.
3. 3 Güvenlik
Bütünlük/hırsızlık olayları, şüpheli sinyaller/1k,
Uyumlulukta Yanlış Kabul Etme/Reddetme, anahtar/imza çakışmaları.
Kesme olayları, kahin tutarsızlıkları, MEV maruziyeti (varsa).
3. 4 Ekonomi
Maliyet/Req, Maliyet/GB DA, marj/mesaj, gelir/bayt,
NRR/GRR, ARPU/ARPPU, tekrarlanan gelirin payı,
FairnessIndex (Jain) по CPU/GPU/IO/çıkış, gürültülü komşu dizini.
3. 5治理 ve Süreçler
Geri dönüşsüz sürümlerin başarısı, onayların zamanlaması,
Hız ayarı (yakınsama), benchmark ile kapsama.
3. 6 Uyumluluk ve gizlilik
Doğrulanmış DID/VC, coğrafi/yaş kilitlerinin oranı,
Regülatörün talebine cevap verme süresi, depolama/silme olayları.
4) Kompozit "Ağ Sağlığı Endeksi" (SSI)
IZS, alt endekslerin sağlam bir bileşimidir: Performans (PFI), Güvenilirlik (RLI), Güvenlik ve Güven (STI), Ekonomi (ECI), Yönetişim (GVI), Uyumluluk (CFI).
Metriklerin normalleştirilmesi:[P5, P95]'e göre sağlam z-skoru veya sağlam min-max; EWMA yumuşatma; Kuyruk winization.
Toplama:
[
\ text {SubIndex} k =\sum _ i w {k, i} ,\hat m_{k,i},\quad
\ text{ИЗС}=\sum_k W_k,\text{SubIndex}k,\\sum W_k=1,
]
Ağırlıklar (W_k) ve (w {k, i}) Yönetim Kayıt Defterinde saklanır ve gün batımı prosedürüne göre değişir.
Bölge yer işaretleri:- Yeşil: IS ≥ 0. 70 - kotaların/hacimlerin büyümesi, kaliteli bonuslar.
- Sarı: 0. 50–0. 70 - spot ayar, araştırmalar.
- Kırmızı: <0. 50 - stopcocks, limitleri düşürme, MTTR/düzeltmeye odaklanma.
5) Eşik SLO'lar ve kapılar
Hedef SLO'lara (reguliruyutsya治理) örnekler:- Q4 API: 99 ≥ başarı. 99 %, p95 ≤ 200 ms, DLQ = 0.
- Q3 Mesajlaşma: ≤ 10⁻⁶/soobshch sırasının ihlali., p95 ≤ 500 ms.
- Köprü/Kesinlik: yanlış onaylar = 0; MTTR anormallikleri ≤ 1 h.
- DA: son ≤ 3 × T _ blok; Verim ≥ X GB/ч.
- Batch/Stream: Pencere T %20 ≥ bir marjla uyuyor; Gecikme ≤ 2 × pencere.
- Güvenlik: bütünlük olayları = 0; Koridorlarda FPR/FNR.
SLO ihlali - otomatik tetikleyiciler (§ 8).
6) Veri toplama, kalite ve koruma
Idempotence/dedup: ULID/trace, TTL ile görülen tablolar.
E2E izleme: alanlar/köprüler/DA aracılığıyla korelasyon 'x _ msg _ id'.
Anti-oyun: kör çalıştırma pencereleri, gizli kontrol görevleri, sentetik örnekler.
Gizlilik: DID/VC, seçici açıklamalar, ZK eşik kanıtları.
Güvenilirlik: olay imzaları, toplu mercification, günlük denetimi.
7) "Sağlık" panoları
Ağ Sağlığına Genel Bakış: SIS ve alt endeksler, metriklerin katkısı.
Gecikme ve Kuyruk: pXX, TailAmplification ısı haritası etki alanına/rotaya göre.
Güvenilirlik Paneli: SLA- брейки, MTTR, DLQ/Replay, geri basınç.
Güvenlik ve Güven: şüpheli sinyaller, kesme, kahin tutarsızlıkları.
Ekonomi: Hizmet Maliyeti, marj/mesaj, kaynaklar üzerinde adalet.
Kesinlik ve Köprü Riski: kesinlik gecikmesi, meydan okuma, köprü olayları.
Uyumluluk: Coğrafi bloklar, yaş, raporlama, regülatör talepleri.
8) Politika kancaları
SLO-gate: hata bütçesi aşımı - ↓ için Q0/Q1 kotaları, öncelikli Q4; Devre kesiciler etkinleştiriliyor.
Tarifeler: TailAmplification istikrarlı bir taleple büyüme - "gürültülü" akışlar için ↑ fiyat; sustainable quality ↓ take-rate Sürdürülebilir kalite.
Riskler: Güvenlik/Uyum olaylarında artış - başarısızlık-kapalı, S-taahhütlerinde artış.
Teşvikler: sürekli PFI/RLI içeren alanlar - hacim/görünürlük bonusu; İhlal edenler - para cezaları/clawback.
Релизы: regresyon dedektörü - otomatik geri alma/özellik bayrağı.
9) Olay yönetimi
1. Algılama: p95/kesinlik/hata/maliyet anomalileri.
2. Sınıflandırma: Bütünlük/Kullanılabilirlik/Performans/Uyumluluk.
3. İzolasyon: rota başına yolculuk, kuyruk drenajı, limitler, manuel çoğunluk.
4. Tazminat: RNFT poliçelerine göre sigorta havuzundan.
5. Ölüm sonrası: genel rapor, imza güncellemesi, ağırlıkların/sınırların ayarlanması.
10) Sözleşmeler ve roller ile ilişki
RNFT hakları: Düğümler/sağlayıcılar/bağlı kuruluşlar için bireysel SLO'lar/limitler.
R-itibar: erişim/oy ve fiyatların değiştiricisi; sürdürülebilir - kalite ↓ S gereksinimleri.
S-taahhütleri: Olayların kapsamı, ihlal durumunda kesinti.
11) Formüller ve yer işaretleri
SuccessRate = 1 − (zaman aşımları + hatalar )/istekler
TailAmplifikasyon = p99/p50 (zadayet治理 koridorları)
Maliyet/Req = Σ (kaynak × teklif )/successful _ requests
Adalet Endeksi (Jain) = (Σ x) ²/( n· Σ x ²) kota/kaynağa göre
Headroom = (cap − current )/cap, FinalityScore = f (lag, variance, reorgs)
12) Uygulama oyun kitabı (adımlar halinde)
1. Kritik yolların ve QoS sınıflarının eşlenmesi; SLO pazarlığı.
2. Telemetri şeması: izleme, metrikler, politika günlükleri, olay pasaportları.
3. Normalleştirme: sağlam ölçekler, EWMA pencereleri, winsorization.
4. IZS v1. 0: başlangıç ağırlıkları, bölge eşikleri, gün batımı prosedürleri.
5. Panolar ve uyarılar: hata bütçeleri, politika kancaları tetikleyicileri.
6. Kıyaslamalar ve kaos: düzenli koşular, yük devretme egzersizleri.
7. Olaylar: ölüm sonrası şablonlar, sigorta fonu, RNFT cezaları.
8. 治理: SLO/ağırlıklar/koridorlar değişim süreci, üç aylık revizyonlar.
9. Otomasyon: Yönlendirme, kotalar, tarifeler ve serbest bırakma kapıları ile birlikte.
10. Pilot - ölçeklendirme: bir etki alanından çok zincirli bir alana.
13)'sağlık "programının KPI'sı
Yeşil SLO'lu yolların yüzdesi ≥ % X; MTTR medyan ≤ Z h.
TailAmplifikasyonda sabit iş hacminde Δ oranında azalma.
Başarı oranında bozulma olmadan Maliyet/Req ve DLQ derinliğinde azalma.
Değişmemiş veya daha iyi güvenlik ile NRR/GRR büyümesi.
Raporların güncelliği (TTC raporu ≤ Y saatleri), ölçütlerle kapsama ≥ % K.
Adalet: Koridorda FairnessIndex, "gürültülü komşu" olaylarında düşüş.
14) Teslimat kontrol listesi
- QoS sınıfı ve etki alanına göre tanımlanmış SLO'lar/SLA'lar
- Uygulanan E2E izleme, idempotency ve deadup
- Sağlam normalleştirmeler ve s治理 ağırlıklar tanıtıldı
- Uyarıları, hata bütçelerini ve otomatik tetikleyicileri ayarlama
- Performans/Güvenilirlik/Güvenlik/Ekonomi/Uyumluluk panoları mevcuttur
- Kıyaslamalar ve kaos çalışmaları çalışır; Açıklanan post-mortemler
- Entegre RNFT, R/S politikaları ve sigorta fonu
- Düzenli kamu raporu ve denge revizyonları kuruldu
15) Sözlük
IS: alt endekslerden ağ sağlığının bir bileşimi.
SLO/SLA: Hedef/sözleşmeli hizmet seviyeleri.
Hata bütçesi - Reaksiyonlardan önce izin verilen hata oranı.
TailAmplification: kuyruk amplifikasyonunu geciktirir.
DLQ/Replay: Karantina/Yeniden İşleme.
Gün batımı prosedürü: otomatik geri alma ile geçici parametre değişiklikleri.
16) Alt satır
Ağ sağlığı değerlendirmesi bir "arka görüş" raporu değil, operasyonel bir kontrol döngüsüdür: sağlam metrikler - kompozitler - eşik SLO'lar - otomatik eylemler - kamu raporlama i治理. Böyle bir sistem, ekosistemi, düğümlerden ve sağlayıcılardan yaratıcılara ve operatörlere kadar tüm roller için öngörülebilir, darbeye dayanıklı ve dürüst kılar.