Redystrybucja ruchu
1) Co to jest redystrybucja i dlaczego jest ona potrzebna
Redystrybucja ruchu to kontrolowana zmiana tras/dostawców/kolejek dla części obciążenia (przepływy, klucze przyczynowości, klasy QoS) podczas przeciążeń, incydentów, wstrząsów cenowych lub zmian stanu zgodności. Cele:- trzymać SLO (p95/p99, wskaźnik sukcesu) podczas wybuchów;
- skrócenie czasu amplifikacji ogona i czasu końcowego;
- zminimalizować koszty do obsługi bez utraty jakości i zamówienia;
- zapewnienie nieudanego zachowania w przypadku ryzyka i naruszeń.
2) Obiekty QoS, role i klasy
Obiekty redystrybucji: trasy, mosty, sekwencery, puli DA, POP/krawędź, klastry GPU/CPU, kolejki usług.
Рола: Operator/Router, Dostawca (дев/брид, DA/GPU), Compliance Gate, Orchestrator, Auditor/Regulator, Treasury/,
Klasy QoS:- Q4 - polecenia terminowe (kluczowe dla zamówienia/finalności).
- Q3 - uporządkowane przepływy (klucz przyczynowy).
- Q2 - dokładnie raz skutecznie (migawki/rozliczenia).
- Q1/Q0 - telemetria/analityka/najlepszy efekt.
3) Kiedy rozpocząć redystrybucję (wykrywanie)
Wyzwalacze (którykolwiek z warunków):- p95/p99 nad korytarzem, TailAmplifikacja = p99/p50 wzrasta.
- Głębokość kolejki lub opóźnienie konsumenckie przekraczają progi.
- Koniec lag/mostek błędy wzrosną, reorg/sierota powyżej normalnego.
- Koszt/Req na trasie przewyższa budżet.
- Zdarzenie dotyczące zgodności: geo/age/sanctions → block/restriction.
- Sygnały degradacji: SLA-бребка, szybkość klapowa, spalanie błędów w budżecie.
4) Decyzja w sprawie nowej trasy (funkcja użyteczności publicznej)
Trasa/dostawca jest wybierany według minimalnego oczekiwanego „kosztu”, z zastrzeżeniem stałych:
Utility(route) =
wL·Latency_p95_EWMA
+ wJ·Jitter
+ wQ·QueueDepth
+ wC·Cost_per_unit (gas + DA + egress + compute)
+ wF·FinalityTime
+ wR·RiskScore
+ wA·AvailabilityPenalty
+ wG·Geo/CompliancePenalty
Profile wagi zależą od klasy QoS: dla Q4 wL, wF, wR; dla Q1 w wC, wF
Twarde niezmienne: "Porządek (prawdziwy)" Idempotencja (prawdziwa) "Kwoty (prawdziwa)" Zgodność (prawdziwa) ".
5) Algorytmy i mechanika redystrybucji
Spójne hashing per key → minimalizuje permutacje;
Hot-Shard Relief to tymczasowa subegacja gorących kluczy.
Routing świadomy percentyla - rozwiązania na p95/p99, nie p50.
EDF/LLF дла Q4 (Earliest Deadline/Least Laxity First).
Ważona kolejka targowa/DRR - uczciwy udział w wszystkich kolejkach.
Wiadra nieszczelne/żetonowe - kwoty na klasę/trasę/dostawcę.
Wyłączniki - wycieczka → przekierowanie; półotwarta próbka odzysku.
Adaptacyjne próby - ograniczone rekolekcje z jitterem i terminami.
Poziomy spillover - odchylenie: Q0/Q1 pozostawić do partii/krawędzi, uwalniając pasek Q3/Q4.
6) Porządek, idempotencja, finalność
Ścisłe zamówienie na klucz (Q3/Q4) na wybranej trasie; z zakończeniem awaryjnym - „stop barrier” + replay from outbox/inbox, then „defrost”.
Klucz idempotencji + tablice widzialne (TTL) - dedup na redelivery.
Finalność łańcucha X: uwzględnienie okna „Czas finalny ”/wyzwanie; operacje krytyczne otrzymują ścieżkę o minimalnej całkowitej końcowości.
7) Ekonomia redystrybucji
Surge dopłaty: gdy kolejki/ogonki rosną wwC na zatłoczonych trasach.
Współczynnik jakości dostawcy (QF) wpływa na wielkość i płatność.
Limity budżetowe: dzienne/godzinne pułapy kosztów i wyjście.
Haczyki skarbowe: zrównoważone domeny jakości otrzymują oprocentowanie.
8) Zgodność i zasady geograficzne
Fail-closed: status doubt → block, manual quorum.
ZK passes: age/geo docs bez ujawniania PD.
Polityka eksportu/zatrzymywania: DA/egress w podziale na regiony, odliczenia podatkowe w formie płatności.
Ochrona przed oszustwami: podpisy obwodnicy → kwarantanna + audyt.
9) Obserwowalność i ostrzeganie
Ślad: 'x _ msg _ id',' route _ id', 'provider _ id', stage bridge/DA, finality.
Metryka: p50/p95/p99, retry%, timeout%, duplikat/out-of-order%, głębia kolejki, opóźnienie finalności, koszt/req, wskaźnik przepięć.
Даборна: Reroute Live, Tail Heatmap, Monitor kolejki/finalności, Cost-per-Route, Panel uczciwości.
Wpisy: błąd-budżet oparzenia, szybkość klap, głębokość DLQ, bloki zgodności.
10) Incydenty (RCA) i protokół degradacji
1. Wykrywanie (patrz § 3) → izolacja trasy (wycieczka), redystrybucja akcji.
2. Łagodzenie: Q0/Q1 w dół, zwiększenie priorytetu Q4/Q3, odcięcie ograniczeń od „hałaśliwych” przepływów.
3. Rekompensaty: z puli ubezpieczeń (zastawu S, zasad RNFT).
4. pośmiertnie: przyczyny, regulacja wagi/limitu, aktualizacja podpisu, próba.
11) Wzory i punkty orientacyjne
SuccessRate = 1 − (timeouts + errors )/requests
TailAmplifikacja = p99/p50 (cel: , korytarze na QoS)
Zagłówek = (nasadka − prąd )/nasadka
Koszt/Req = Α (resource × bid )/successful _ requests
Wskaźnik Fairi (Jain) = (x) ²/( N· x ²) według kontyngentu/zasobu
Dostawca Współczynnik: (QF = f (\text {success}, p95, DLQ, finalność))
Punkty orientacyjne SLO (przykład):- P4: sukces ≥ 99. 99%, p95 ≤ 200 ms, DLQ = 0, MTTR ≤ 15 min.
- P3: naruszenie rzędu ≤ 10⁻⁶/soobshch., p95 ≤ 500 ms.
- DA/Bridge: końcowość ≤ 3 × T _ block, fałszywe potwierdzenia = 0.
12) : zasady zmiany wagi/kwot/cen
Zmiany (w), kontyngenty, taryfy i premie QF.
Modyfikator R głosów na role jakościowe (korytarz [0. 8..1. 2]).
Modyfikacje zachód słońca: tymczasowe zmiany z auto-rollback.
Sprawozdawczość publiczna: kwartalne wskaźniki realokacji i audyty rzetelności.
13) Plan realizacji (w etapach)
1. Mapowanie przepływów i kluczy przyczynowości (według QoS/region/zgodność).
2. Telemetria i próbki: OWD/RTT/jitter/kolejka/finalność/koszt (EWMA + p95/p99).
3. Polityka użyteczności publicznej: na profile wagi QoS, budżety kosztów, korytarze przepięć.
4. Kwoty i kształtowniki: wiadra na trasę/dostawcę/klasę.
5. Gwarancje dostawy: skrzynka odbiorcza/skrzynka odbiorcza, idempotencja, bariery szeregowe.
6. Uczciwość i ciśnienie wsteczne: WFQ/DRR, anty-hałas, poziomy rozlania.
7. Obserwowalność: deski rozdzielcze, alerty, budżety błędów, DLQ/Replay.
8. Gra-days/chaos: domain/bridge/DA drop, price shock, geo-block.
9. " : procedury zmiany wagi/limitów/cen (wnioski, zachód słońca).
10. Pilot → skalowanie: profile A/B, rekalibracja, raport publiczny.
14) KPI programu redystrybucji
Dostawa: sukces według klas QoS, DLQ = 0 (Q3/Q4), duplikat/out-of-order.
Opóźnienie: p95/p99 i TailAmplifikacja w korytarzach docelowych.
Odporność: mediana MTTR ≤ docelowa, szybkość klapowa
Gospodarka: Koszt/Req i utrzymanie SLO; wzrost udziału „tanich” tras.
Sprawiedliwość: Jain w korytarzu; Ograniczenie „hałaśliwego sąsiada” incydentów.
Finalność/bezpieczeństwo: opóźnienie końcowe, 0 fałszywych potwierdzeń.
Zgodność: 100% przejść geo/wiek/sankcje, zero naruszeń.
15) Lista kontrolna dostawy
- QoS, SLO/SLA, klucze przyczynowości i zdefiniowane budżety błędów
- Realizowana polityka użyteczności publicznej, kwoty i wiadra na trasę/dostawcę
- W tym konsekwentne hashing, hot-shard relief, EDF/LLF (Q4)
- Skonfigurowane skrzynki odbiorczej/skrzynki odbiorczej, bariery idempotencji i ordynatywne
- WFQ/DRR, backpressure i spillover poziomy pracy
- Dostępne są tablice rozdzielcze opóźnienia/ogon/kolejka/finalność/koszt i wpisy
- Włączone wyłączniki, DLQ/Replay i kompensacja (S-escrow)
- Trzymane dni gry/chaos i pośmiertne
- Zgodność Brama i odliczenia podatkowe od płatności są połączone
- Utverzhdenε- proces zmiany wagi/limitów/cen (zachód słońca)
16) Słownik
Redystrybucja ruchu: zarządzanie przekierowaniem/przeniesieniem kolejek/dostawców.
Amplifikacja ogona: p99/p50 - wytrzymałość „ogona” opóźnień.
Czas: czas do nieodwracalności zdarzenia międzysieciowego.
Utility-routing: wybór ścieżki według zagregowanego narzędzia.
WFQ/DRR: Fair Queue Maintenance Discipline.
Poziomy rozlania: obniżenie klas miękkich w partii/krawędzi po przeciążeniu.
Wyłącznik: automatyczne wyłączenie zdegradowanej trasy.
17) Sedno sprawy
Redystrybucja ruchu to operacyjna pętla stabilności: mierzymy → rozwiązać → przekierować bez naruszania zamówienia, finalności i zasad. Połączenie tras użyteczności, uczciwości/kwot, rygorystycznych gwarancji dostawy i kontroli zamienia ekosystem wielobiegunowy w system adaptacyjny, który może wytrzymać szczyty popytu, incydentów i wstrząsów cenowych - szybko, uczciwie i ekonomicznie.