Redistribution du trafic
1) Qu'est-ce que la redistribution et pourquoi il est nécessaire
La redistribution du trafic est une modification gérée des itinéraires/fournisseurs/files d'attente pour les parties de charge (flux, clés de causalité, classes QoS) en cas de surcharge, d'incidents, de chocs de prix ou de modification des statuts de conformité. Objectifs :- Retenir le SLO (p95/p99, taux de réussite) en cas de surtension ;
- réduire l'amplitude de Tail et le temps de finalité ;
- Minimiser le Cost-to-Serve sans perte de qualité et d'ordre ;
- fournir un comportement fail-closed pour les risques et les irrégularités.
2) Objets, rôles et classes QoS
Objets de redistribution : itinéraires, bridges, séquenceurs, pools DA, POP/edge, clusters GPU/CPU, files d'attente de service.
Роли: Operator/Router, Provider (узел/бридж/DA/GPU), Compliance Gate, Orchestrator, Auditor/Regulator, Treasury/治理.
- Q4 sont des équipes de deadline (critiques à l'ordre/finalité).
- Q3 - flux ordonnés (clé de causalité).
- Q2 - exactly-once efficace (snapshots/facturation).
- Q1/Q0 - télémétrie/analyse/best-effort.
3) Quand lancer la redistribution (détail)
Déclencheurs (toutes les conditions) :- p95/p99 au-dessus du corridor, TailAmplification = p99/p50 est en croissance.
- Queue depth ou consumer lag dépasse les seuils.
- Finality lag/bridge errors croissent, reorg/orphan au-dessus de la normale.
- Cost/Req sur la route dépasse le budget.
- Événement de conformité : géo/âge/sanctions → bloc/restriction.
- Degradation signals: SLA-брейки, flap-rate, error-budget burn.
4) Décision sur la nouvelle route (fonction utilitaire)
L'itinéraire/fournisseur est choisi en fonction du « coût » minimum attendu, tout en respectant les invariants :
Utility(route) =
wL·Latency_p95_EWMA
+ wJ·Jitter
+ wQ·QueueDepth
+ wC·Cost_per_unit (gas + DA + egress + compute)
+ wF·FinalityTime
+ wR·RiskScore
+ wA·AvailabilityPenalty
+ wG·Geo/CompliancePenalty
Les profils de poids dépendent de la classe QoS : pour Q4, ↑wL, ↑wF, ↑wR ; pour Q1 ↑wC, ↓wF.
Invariants rigides : 'Order (true) ∧ Idempotency (true) ∧ Quotas (true) ∧ Compliance (true)'.
5) Algorithmes et mécanique de redistribution
Consistent hashing per key → minimise les permutations ;
Hot-Shard Relief est une sous-segmentation temporaire des clés « chaudes ».
Percentile-aware routing - solutions p95/p99, pas p50.
EDF/LLF для Q4 (Earliest Deadline / Least Laxity First).
Weighted Fair Queuing/DRR - juste part dans les files d'attente générales.
Leaky/Token buckets - quotas par classe/route/fournisseur.
Circuit breakers — trip → reroute; échantillon half-ouvert pour la récupération.
Les retraits adaptatifs sont des retraits limités avec jitter et deadlines.
Spillover tiers - downshift : les Q0/Q1 partent en batch/edge, libérant la bande de Q3/Q4.
6) Ordre, idempotence, finalité
Strict order per key (Q3/Q4) sur l'itinéraire sélectionné ; en cas d'échec, « barrière d'arrêt » + replay de l'outbox/inbox, puis « décongélation ».
Idempotency key + seen-tables (TTL) - dedup lors de la remise.
X-chain finalité : nous prenons en compte la fenêtre 'FinalityTime '/challenge ; les opérations critiques obtiennent le chemin avec une finalité totale minimale.
7) L'économie de la redistribution
Surge-suppléments : avec une augmentation des files d'attente/queues de ↑ wC sur les itinéraires surchargés.
Quality Factor (QF) du fournisseur affecte le volume et le paiement.
Limites de budget : plafonds de coût journaliers/horaires et egress.
Treasury hooks : les domaines de qualité durables obtiennent des ↓take - rate/↑obyem.
8) Conformité et géo-règles
Fail-closed : doute sur le statut → bloc, quorum manuel.
ZK-laissez-passer : doc wa age/geo sans divulgation PDn.
Politiques d'exportation/de retrait : DA/egress par région, retenues fiscales sur le chemin des paiements.
Geo-evasion guard : signatures de contournement → quarantaine + audit.
9) Observabilité et alerting
Trace : 'x _ msg _ id', 'route _ id', 'provider _ id', étapes bridge/DA, finalité.
Métriques : p50/p95/p99, retry %, timeout %, duplicate/out-of-order %, queue depth, finality lag, cost/req, surge-index.
Дашборды: Reroute Live, Tail Heatmap, Queue/Finality Monitor, Cost-per-Route, Fairness Panel.
Alert : error-budget burn, flap-rate, DLQ depth, bloc de conformité.
10) Incidents (RCA) et protocole de dégradation
1. Detect (voir § 3) → isolation de la route (trip), redistribution des parts.
2. Assouplissement : downshift Q0/Q1, renforcement de la priorité des Q4/Q3, coupe des limites des flux « bruyants ».
3. Indemnisation : du pool d'assurance (caution S, règles RNFT).
4. Post-mortem : causes, ajustement des poids/limites, mise à jour des signatures, rehearsal.
11) Formules et repères
SuccessRate = 1 − (timeouts + errors)/requests
TailAmplification = p99/p50 (objectif : ↓, couloirs per QoS)
Headroom = (cap − current)/cap
Cost/Req = Σ (ressource × taux )/requêtes réussies _
FairnessIndex (Jain) = (Σ x) ²/( n· Σ x ²) pour les quotas/ressources
QualityFactor du fournisseur : (QF = f (\text {success}, p95, DLQ, finality))
Repères SLO (exemple) :- Q4: success ≥ 99. 99 %, p95 ≤ 200 ms, DLQ = 0, MTTR ≤ 15 min.
- Q3 : violation de l'ordre de ≤ 10⁻⁶/soobshch., p95 ≤ 500 ms.
- DA/Bridge : finalité ≤ 3 × T _ block, fausses confirmations = 0.
12) 治理 : règles de variation des poids/quotas/prix
Proposals pour remplacer (w), quotas, tarifs et bonus QF.
Le modificateur de voix R pour les rôles qualitatifs (couloir [0. 8..1. 2]).
Modifications de sunset : modifications temporaires avec un retour automatique.
Rapports publics : métriques trimestrielles de redistribution et vérification équitable.
13) Pleybuk de mise en œuvre (par étapes)
1. Cartographie des flux et des clés de causalité (par QoS/région/conformité).
2. Télémétrie et échantillons : OWD/RTT/jitter/queue/finality/cost (EWMA + p95/p99).
3. Politiques d'utilité : profils de balance per QoS, budgets de coût, couloirs de surge.
4. Quotas et shapers : jetons-baquets per route/fournisseur/classe.
5. Garanties de livraison : outbox/inbox, idempotence, barrières décentes.
6. Fairness & backpressure: WFQ/DRR, anti-noise, spillover tiers.
7. Observabilité : Dashboards, alertes, error-budgets, DLQ/Replay.
8. Jeux-jours/chaos : chute du domaine/pont/DA, choc des prix, géo-bloc.
9. 治理 : procédures de variation des poids/limites/prix (poposals, sunset).
10. Pilote → mise à l'échelle : Profils A/B, rétrocalibrage, rapport public.
14) KPI du programme de redistribution
Livraison : success par classe QoS, DLQ = 0 (Q3/Q4), duplicate/out-of-order ↓.
Retard : p95/p99 et TailAmplification dans les couloirs cibles.
Résilience : MTTR médiane ≤ cible, taux-flap ↓.
Économie : Cost/Req ↓ tout en maintenant le SLO ; augmentation de la part des itinéraires « bon marché ».
Justice : Jain dans le couloir ; diminution des incidents « noisy neighbor ».
Finalité/sécurité : finality lag ↓, 0 fausses confirmations.
Conformité : 100 % passage geo/age/sanctions, zéro violation.
15) Chèque-liste de préparation
- Défini par QoS, SLO/SLA, clés de causalité et budgets d'erreurs
- Politiques d'utilité, quotas et tokens par route/fournisseur mis en œuvre
- Inclus consistent hashing, hot-shard relief, EDF/LLF (Q4)
- Mis en place outbox/inbox, idempotence et barrières d'ordre
- WFQ/DRR, backpressure et spillovers fonctionnent
- Dashboards laticy/tail/queue/finality/cost et alerties disponibles
- Inclus circuit breakers, DLQ/Replay et indemnisation (S-Eskrow)
- Organisé par game-days/chaos et décoré post-mortem
- Gate de conformité connectée et retenues d'impôt sur les paiements
- Utverzhden治理 processus de variation des poids/limites/prix (sunset)
16) Glossaire
Redistribution du trafic : reroute gérée/réaffectation des files d'attente/fournisseurs.
Tail Amplification : p99/p50 est la force de la « queue » des retards.
FinalityTime : le temps avant l'irréversibilité de l'événement cross-chain.
Utility-routing : sélection du chemin par utilité agrégée.
WFQ/DRR : juste discipline pour le service des files d'attente.
Spillover tiers : déclasse les classes « molles » en batch/edge en cas de surcharge.
Circuit breaker : Désactivation automatique d'un itinéraire dégradé.
17) Résultat
La redistribution du trafic est un circuit opérationnel de durabilité : nous mesurons → nous décidons → nous redirigeons sans perturber l'ordre, la finalité et les règles. La combinaison de routage utilitaire, de fairness/quotas, de garanties strictes de livraison i治理 de contrôle transforme un écosystème multitâche en un système adaptatif capable de résister aux pics de demande, aux incidents et aux chocs de prix - rapide, honnête et économique.