Stocare și NAS
Scurt rezumat
Stocarea este o combinație de suporturi (SSD/NVMe/HDD), rețele (Ethernet/IB/FC), protocoale (NFS/SMB/iSCSI/S3) și software (ZFS, Ceph, NetApp, TrueNAS etc.) care oferă performanță, fiabilitate, securitate și economie. Alegerea corectă depinde de profilul I/O (aleatoriu/secvențial, bloc/fișier/obiect), RPO/RTO și SLO latență/debit cerințe.
Taxonomie de stocare
DAS (Direct Attached Storage) - discuri "lângă server. "Latență minimă, fără blocaje în rețea, dar mai greu de împărțit resurse.
SAN (Storage Area Network) - stocare în bloc prin FC/iSCSI/NVMe-oF. Înaltă performanță, LUN-uri partajate, management centralizat.
NAS (Network Attached Storage) - bile de fișiere peste NFS/SMB. Convenabil pentru directoare partajate, jurnale, artefacte, conținut media.
Stocarea obiectelor - API-uri S3-compatible (Ceph RGW/MinIO/nori). Pentru copii de rezervă, busteni, arhive, mass-media, artefacte model.
Soluții hiperconvergente (HCI) - Combină calculul și stocarea (Ceph, vSAN, StarWind etc.) pentru scară orizontală.
Protocoale de acces
Fişier:- NFSv3/v4 - Unix/Posix mediu, încuietori statefull, Kerberos/KRB5i/KRB5p.
- SMB 3. x - Domenii Windows/AD, criptare/semnături, multicanal, DFS.
- iSCSI - prin Ethernet, LUN, multe căi (MPIO), convenabile pentru virtualizare/bază de date.
- FC/NVMe-oF - latență scăzută, fabrici/hărți specializate.
- S3 API - versiuni de obiect, ciclu de viață, modul WORM/Conformitate, încărcare multipart.
- Maşinile DB/virtuale → bloca (iSCSI/NVMe-oF).
- Foldere partajate/artefacte CI → NFS/SMB.
- Busteni/backup-uri/media/modele → S3-compatible obiect.
Date și codificare: RAID, ZFS, Codificare ștergere
RAID
RAID1/10 - latență scăzută și IOPS ridicat/random-read/write.
RAID5/6 - economii de capacitate, dar scrie penalizare.
ZFS - copy-to-write (CoW), piscine și vdev, ARC/L2ARC cache, ZIL/SLOG pentru operații de sincronizare, instantanee/replica și integritate încorporată (checksums).
Codificarea ștergerii (CE) în sistemele distribuite (Ceph/MinIO): Codul Reed-Solomon „k + m” - economii de peste 3x replicare cu o degradare acceptabilă a performanței de scriere.
- Încărcări aleatorii la cald (metadate, fișiere mici) → oglinzi RAID10/ZFS pe NVMe.
- CE rece/arhiva →, HDD-uri mari, cache-uri agresive.
- Pentru înregistrări de sincronizare (export NFS) - SLOG dedicat pe NVMe cu brevet scăzut de încredere (PLP).
Performanţă: IOPS, debit, latenţă
IOPS sunt importante pentru operații aleatorii mici (DB/metadate).
Lățime de bandă - pentru fișiere mari (videoclipuri, copii de rezervă).
Latența p95/p99 - critică pentru baze de date, cozi, API-uri cache.
Cozi şi concurenţă: multithreading pe client, 'rsize/wsize' pentru NFS, 'rw, queue _ depth' pentru iSCSI.
Reţea: 25/40/100 GbE (sau IB) + RSS/RPS, jumbo MTU în interiorul centrului de date.
Caching și bifarea
ARC/L2ARC (ZFS) - memorie cache de citire RAM și NVMe; SLOG - istoria înregistrărilor de sincronizare.
Write-back/Write-through controller caches - atent, baterie/supercapacitor numai (BBU/PLP).
Tiering: NVMe (fierbinte) → SSD (cald) → HDD (rece) → obiect (arhivă). Politicile privind migrația și ciclul de viață.
Instantanee, clone, replicare, DR
Instantanee (CoW): puncte instant pentru rollback/backup; stoca directoare „în interiorul” depozitare, nu doar în hipervizor.
Replicare: sincron (RPO≈0, deasupra latenţei), asincron (RPO = N min).
Clone: mediu economic dev/test.
Scheme DR: 3-2-1 (trei copii, două tipuri de purtători, unul - off-site), exerciții DR regulate; Obiectivele RPO/RTO.
Siguranță, conformitate și multi-chirie
Autentificare/autorizare: LDAP/AD, Kerberos/NTLMv2 pentru SMB, AUTH_SYS/KRB pentru NFSv4.
Izolare: VLAN/VRF, politici de export, cote/cote de chiriași.
Criptare: în repaus (LUKS/ZFS nativ/SED) și în zbor (criptare NFS-krb5p/SMB/TLS pentru S3).
WORM/Conformitate pentru date semnificative din punct de vedere juridic (S3 Object Lock, analogi SnapLock).
Audit: jurnale de acces imuabile, integrare cu SIEM.
Monitorizare și SLO
Măsurători:- Prin piscine/volume: utilizare, 'p95/p99 latență', IOPS, debit, adâncime coadă, cache lovit, scrie amplificare.
- Peste rețea: picături, retransmiteri, PPS, MTU nepotrivire.
- Prin media: erori media, uzură, temperatură, SMART.
- Prin replicare/instantanee: lag/vârstă, succes de sarcină, durată.
- Minge NFS pentru CI: p95 latență ≤ 3 ms, disponibilitate ≥ 99. 95%.
- Baza de date LUN: p99 scrie ≤ 1. 5 ms, replică sincronă în regiune; RPO 0, RTO ≤ 5 min.
- Obiect: p95 PUT ≤ 50 ms, p95 GET ≤ 30 ms, 11 × 9 durabilitate (prin EU/replicare).
- Piscina de umplere> 80/90/95%, cache lovit picătură, scrie-amp creştere, disc de degradare, reţea drawdown, replicare jurnal> prag.
Backup și arhivă
Instantanee + replica la distanță + backup separat pentru obiect/bandă.
Politici de păstrare: zi/săptămână/lună.
Imutabilitate: S3 Object Lock (Guvernanță/Conformitate), „air-gap” (feed/conturi cu handicap).
Teste de recuperare - în mod regulat.
Șabloane practice (minime)
Exportul NFS (exemplu)
/pool/projects 10. 0. 0. 0/16(rw,async,no_root_squash,sec=krb5p)
Cota SMB (fragment smb. conf. univ. dr
[media]
path = /pool/media read only = no vfs objects = acl_xattr, recycle ea support = yes kernel oplocks = no smb encrypt = required
ZFS: crearea bazinului și a setului de date
bash zpool create tank mirror nvme0n1 nvme1n1 zfs set atime=off compression=lz4 tank zfs create tank/projects zfs set recordsize=1M tank/projects # большие файлы zfs set recordsize=16K tank/db # БД/мелкие I/O
iSCSI (idei)
Activați ALUA/MPIO, corectați termenele și adâncimea cozii pentru clienți.
Răspândiți rețelele iSCSI și traficul clienților, utilizați Jumbo MTU în interiorul fabricii de sute de yarzi.
Planificarea capacității și a performanței
Set de lucru și rata de creștere.
Marjă pentru IOPS și debit de 30-50% pentru vârfuri și reechilibrare.
Luați în considerare amplificarea scrierii (RAID/EC/CoW) și metadatele.
Pentru obiect - costul cererilor și traficul de ieșire, clase de stocare (standard/IA/ghețar).
Operații și actualizări
Rulare actualizări de controlere/OS/firmware.
Ferestre și priorități Scrubs/Resilver.
Rebild echilibrare: limitarea I/O pe recuperare, astfel încât să nu „ucide” prod.
Runbooks privind degradarea/pierderea nodurilor/rețelelor.
Lista de verificare a implementării
- Fișier/bloc/obiect + RPO/RTO/SLO profil de acces selectat.
- Schema de încărcare și de codificare a prețurilor (RAID/ZFS/CE).
- Rețele: VLANs individuale/VRFs, intra-tesatura MTU 9000, MPIO/ALUA.
- Cache/bifarea: mecanisme ARC/L2ARC/SLOG sau similare.
- Instantanee/replica/backup: programe, imutabilitate, exerciții DR.
- Monitorizare: piscine/mass-media/rețea/replicare metrici, alerte.
- Acces/securitate: ACL, Kerberos/AD, criptare, audit.
- Cote/limite pentru chiriași și directoare SLA/SLO.
- Documentație și runbooks, recuperare test.
Erori comune
Suprasolicitarea piscinei> 80% în sistemele ZFS/CE → o creștere bruscă a latenței.
Un controler/o rețea fără MPIO/protecție.
Seturile de lucru calde și reci sunt amestecate într-o singură clasă de transportatori.
Nu există SLOG pentru încărcările de sincronizare NFS → latență imprevizibilă.
Backup-uri numai „în interiorul” aceleiași matrice/cont → pierdere în cazul unui accident/compromis.
Lipsa frecării regulate și monitorizarea SMART.
Ignorarea modelelor mici I/O: mari 'recordsize' pentru DB.
iGaming/fintech specific
Baze de date și portofele tranzacționale: piscine individuale NVMe, oglinzi RAID10/ZFS, replică sincronă la zona B, sigilate independent.
Jurnale/evenimente brute și caracteristici antifraudă: obiect + ciclu de viață + clase ieftine, indici/vitrine - pe SSD.
Conținut și media (furnizori): NAS + CDN, memorie cache agresivă, deduplicare.
Raportare și PII: WORM/imutabilitate, criptare, audit de acces, geo-localizare a datelor.
Evenimente de vârf: cache-uri de încălzire, limite I/O, control de latență p99 pe piscine.
Total
Stocarea fiabilă este partiționarea clasei corecte (fișier/bloc/obiect), schema de codificare adecvată (RAID/ZFS/EC), rețeaua rapidă, cache/legare, instantanee + replica + backup, SLO-uri dure și operațiuni automate. Respectând aceste principii, obțineți performanțe previzibile, reziliență ridicată și o economie de stocare transparentă - cu considerente de securitate și reglementare.