Topología de redes y rutas
Resumen breve
La red se estructura en torno a tres pilares: topología, segmentación, enrutamiento. La fábrica moderna es Leaf-Spine (fat-tree) con ECMP, overlay VXLAN/EVPN para extensiones L2 y BGP como «pegamento universal». Los SLOs correctamente definidos por latencia/pérdida, QoS y fast-failover hacen que el comportamiento sea predecible bajo los picos de RPS.
Modelos básicos de topologías
Core/Distribution/Access (clásico)
Pros: comprensible, bueno para pequeñas redes/oficinas.
Contras: «cuello de botella» en Core, peor escala horizontal.
Leaf-Spine (fat-tree, CLOS)
Spine - Troncal, Leaf - Thor Switches para servidores.
Todos los Leaf están conectados a todos los Spine → ECMP y un retraso predecible.
Escala: agregue Leaf/Spine sin refactorizar el plan de direcciones.
Ring/Mesh/Star
Se utilizan puntualmente (PoP, campus). Para DC - limitado.
Recomendación: para centros de datos y grandes sitios - Leaf-Spine. Para sucursales/oficinas: simplificado Core/Access + SD-WAN.
Segmentación y espacio de direcciones
VLAN - Segmentación L2 (dominios Broadcast).
VRF - Segmentación L3 (multiarrendamiento, dev/stg/prod).
IPAM/sumarización: planifique en bloques '/24 'por servicio/zona, agregue en '/20' y arriba para políticas de ruta simples.
Dual-stack: IPv4 + IPv6, SLAAC/DHCPv6, RA-guardianes, políticas prefijadas.
Overlay/Underlay: VXLAN/EVPN
Underlay: una fábrica IP (Leaf-Spine) con iBGP/OSPF/IS-IS.
Overlay: VXLAN transporta L2 sobre L3; EVPN (BGP) es un control pline para enrutamiento MAC/IP, multi-tenencia a través de VNI/VRF.
Ventajas: estiramiento L2 sin STP, convergencia rápida, políticas centralizadas.
- Leaf - VTEP con loopback para VTEP-IP.
- Spine — route-reflector для EVPN.
- Los tipos de rutas EVPN (MAC/IP, IMET, interacción L3) proporcionan ARP-supression y escala.
Protocolos de enrutamiento y roles
IGP (dentro del dominio)
OSPF/IS-IS: convergencia rápida, metrización simple. Bueno para underlay.
iBGP: encima o sin IGP (BGP-only mod) con un reflector de ruta.
EGP (entre dominios)
eBGP: peering con proveedores/PSP/CDN, política de comunidades/LP/AS-Path.
Anycast: las mismas IP en varios PoP, enrutamiento «al más cercano» (BGP + health-check para anuncios).
ECMP и fast-failover
ECMP distribuye flujos entre rutas iguales.
Cuidado con el flow-hash (5-tuple), evite la asimetría para el stateful middlebox's.
BFD/fast-hellos para cambios rápidos (<1 s).
Políticas de enrutamiento (TE)
LocalPref/Med/AS-Path - Selección de Aplinks.
Comunidades: note el tráfico (prod/stg, PSP de pago, CDN) para soluciones diferenciadas.
Blackhole/Sinkhole es un rápido «agujero negro »/32 en ataques.
uRPF/RTBH - anti-spoofing y agujero negro remoto con el proveedor.
Conectividad de oficina ↔ DC/Cloud
SD-WAN: selección dinámica de canales (MPLS/INTERNET/LTE), encriptación, PI-APP.
MPLS L3VPN: VRF aislados entre sitios, latencia determinista.
IPSec/GRE over IPSec/WireGuard: inicio rápido, pero planifique MTU/Fragmentation y QoS.
NAT, CGNAT y acceso a Internet
NAT44/NAT66 (raramente) y NPTv6. Para integraciones de pago, almacene grupos IP de origen y listas blancas.
Balance de egresos: varias gateways NAT detrás de ECMP, sticky por hash.
Hairpin/Policy-Based Routing - para las características específicas de DMZ/inspección.
QoS y clases de tráfico
Clases: real-time (Fid VoIP/exchange), interactivo (API), bulk (backups/ETL).
Marking (DSCP), policing/shaping, LLQ/WRR.
Protección de API/pagos - clase dedicada con garantía de retraso mínimo; bulk limitar en picos.
Seguridad de enrutamiento
BGP: TTL security, max-prefix, RPKI (route-origin validation), prefix-filters en el proveedor.
IGP: autenticación de vecinos (HMAC), aislamiento de plano de gestión (OOB).
Segmentación: VRF para zonas de «pago», «operador», «público»; ACL entre VRF sólo en los puertos deseados.
Servicios Anycast: la salud → el anuncio de withdraw en la degradación.
Observabilidad y SLO
SLO (ejemplos)
Dentro del centro de datos: RTT p95 ≤ 200-300 μ s, pérdida ≤ 0. 01%.
Entre sitios (L3VPN/SD-WAN): RTT p95 ≤ X ms (según su perfil), pérdidas ≤ 0. 1%.
Convergencia en caso de fallo: ≤ 1 s (IGP/BFD), ≤ 5 s (eBGP).
Mé
'RTT', 'loss',' jitter ',' ECMP entropy ',' BFD state ',' BGP prefixes/changes ',' CPU/TCAM 'en los conmutadores, llenando colas de Qo S.
Prueba activa: IP-SLA/SmokePing, clase QoS.
Telemetría flow: sFlow/NetFlow/IPFIX para perfiles de tráfico y DDoS.
Configuraciones típicas (fragmentos)
FRR (BGP underlay + EVPN)
conf router bgp 65000 bgp router-id 10. 0. 0. 1 neighbor SPINE peer-group neighbor SPINE remote-as 65000 neighbor 10. 0. 0. 11 peer-group SPINE neighbor 10. 0. 0. 12 peer-group SPINE
!
address-family l2vpn evpn neighbor SPINE activate advertise-all-vni exit-address-family
!
interface lo ip address 10. 0. 0. 1/32
Linux (ECMP egress)
bash ip route add 0. 0. 0. 0/0 \
nexthop via 203. 0. 113. 1 weight 1 \
nexthop via 203. 0. 113. 2 weight 1
BFD al vecino (estilo Cisco, concepto)
bfd interval 50 min_rx 50 multiplier 5 interface Po1 bfd echo ip ospf network point-to-point
Operaciones y DR
Change-control: entrada por etapas (una Leaf/Spine), canario de una VNI/VRF.
Auto-withdraw (auto-withdraw): degradar el servicio - review Anycast-/32.
Runbooks: pérdida de Spine, bucles EVPN, cierre de ruta ECMP, degradación de apline, inserción de blackhole.
Documentación de IPAM: quién es propietario de la subred/AS, dónde está el anuncio, dónde está NAT.
Lista de comprobación de implementación
- Se ha seleccionado la topología (Leaf-Spine), se ha calculado la sobreescripción y el ancho fat-tree.
- IPAM: sumarización, reserva para crecimiento, bloques individuales bajo overlay loopback 'y.
- Underlay IGP/iBGP, BFD; Overlay EVPN/VXLAN, RR на Spine.
- VRF/ACL para zonas, políticas del este-oeste y del norte-sur.
- Egress-design: NAT-pools, listas blancas PSP/CDN, Anycast donde sea necesario.
- Clases de QoS y SLO (RTT/loss/jitter), monitoreo de clase PER.
- Detección y protección: RPKI, prefix-filters, uRPF, RTBH.
- Observabilidad: cambios BGP, BFD, IP-SLA, sFlow; dashboards/alertas.
- Planes de DR: falla de Spine/link/aplink, withdraw Anycast, migración de tráfico.
Errores típicos
Estiramiento L2 sin EVPN/VXLAN → tormentas STP y falla impredecible.
No hay BFD/fast-hellos → cambios largos y tiempos de espera de las aplicaciones.
Un plan IP «manual» sin sumarización → la explosión de las tablas de rutas.
ECMP-hash sobrecargado → asimetría y problemas con los filtros stateful.
La ausencia de archivos RPKI/prefix en eBGP → el riesgo de haijec.
QoS «por defecto» → API compite con los backups.
Anycast sin health-driven withdraw → agujeros negros en fallas parciales.
Características específicas para iGaming/Fintech
Bajo p95 para API/pagos: QoS-class dedicado, Anycast-endpoints, latency-routing en DNS/GSLB.
Listas blancas de PSP/proveedores: egress-IP fijos, grupos de respaldo, conmutación rápida.
Eventos pico: headroom ≥ 30% en links de Spine↔Leaf, bolígrafos para desconectar la clase bulk.
Regulación/PII: aislamiento VRF, encriptación e2e, ACL estrictos entre zonas.
Minibuses
1) Rápido withdraw Anycast en la degradación
1. Health-check
2) Transferencia de tráfico a un applink de respaldo
1. Bajar el LocalPref principal → 2) subir en el → de respaldo 3) observar las pérdidas/RTT → 4) registrar los cambios.
3) Extensión de fábrica «caliente»
1. Añadir Spine, conectar todos los Leaf → 2) añadir pares Leaf en racks → 3) iBGP/OSPF de vecindad, comprobación de entropía ECMP → 4) transferencia de cargas.
Resultado
La red sostenible es Leaf-Spine + ECMP, EVPN/VXLAN para flexibles L2/L3-multiarrendamiento, políticas BGP y failover rápido bajo control métrico. Agregue un IPAM competente, QoS, RPKI/filtros, comunicaciones health→routing automatizadas y runbook en vivo y - y su plataforma previsiblemente entregará tráfico incluso en la hora más caliente.