Data saxlama sistemləri və NAS
Qısa xülasə
Depolama media (SSD/NVMe/HDD), şəbəkə (Ethernet/IB/FC), protokol (NFS/SMB/iSCSI/S3) və proqram təminatının (ZFS, Ceph, NetApp, TrueNAS və s.) birləşməsidir və iqtisadiyyat. Düzgün seçim I/O profilindən (random/ardıcıl, blok/fayl/obyekt), RPO/RTO və SLO latentlik/bant genişliyi tələblərindən asılıdır.
Anbarların taksonomiyası
DAS (Direct Attached Storage) - «serverin yanında» disklər. Minimum gizlilik, şəbəkə şüşə boyunları yoxdur, lakin resursları bölüşmək daha çətindir.
SAN (Storage Area Network) - FC/iSCSI/NVMe-oF bloklu anbar. Yüksək performans, ümumi LUN-lar, mərkəzləşdirilmiş idarəetmə.
NAS (Network Attached Storage) - NFS/SMB fayl topları. Ümumi direktoriyalar, qeydlər, artefaktlar, media məzmunu üçün əlverişlidir.
Obyekt saxlama - S3 uyğun API (Ceph RGW/MinIO/buludlar). Arxiv, log, arxiv, media, model artefaktlar üçün.
Hiperkonvergent həllər (HCI) - üfüqi miqyasda hesablama və saxlama (Ceph, vSAN, StarWind və s.) birləşdirir.
Giriş protokolları
Fayl:- NFSv3/v4 - Unix/Posix mühit, statful kilidi, Kerberos/KRB5i/KRB5p.
- SMB 3. x - Windows/AD domenləri, şifrələmə/imza, multichannel, DFS.
- iSCSI - Ethernet, LUN, bir çox yol (MPIO), virtualizasiya/DB üçün əlverişlidir.
- FC/NVMe-oF - aşağı gecikmə, xüsusi fabriklər/kartlar.
- S3 API - obyektlərin versiyaları, lifecycle, WORM/Compliance mode, multipart upload.
- BD/virtualki → blok (iSCSI/NVMe-oF).
- Birgə qovluqlar/CI artefaktlar → NFS/SMB.
- Log/backup/media/model → S3 uyğun obyekt.
Verilənlər və kodlaşdırma: RAID, ZFS, Erasure Coding
RAID
RAID1/10 - aşağı gecikmə və yüksək IOPS/random oxu/yazı.
RAID5/6 - tutum qənaət, lakin qeyd üçün cərimə (write penalty).
ZFS - kopiya-on-record (CoW), hovuzlar və vdev, ARC/L2ARC cache, sync əməliyyatları üçün ZIL/SLOG, snapshot/replika və daxili bütövlük (checksums).
Paylanmış sistemlərdə Erasure Coding (EC) (Ceph/MinIO): Reed-Solomon kodu 'k + m "- səsyazma performansının məqbul deqradasiyası ilə üç dəfə replikasiya ilə müqayisədə qənaət.
- Qaynar təsadüfi yüklər (metadata, kiçik fayllar) → NVMe-də RAID10/ZFS-mirror.
- Soyuq/arxiv → EC, böyük HDD, aqressiv caches.
- Sync qeydləri üçün (NFS export) - etibarlı aşağı patentli NVMe (PLP) üzərində xüsusi SLOG.
Performans: IOPS, bant genişliyi, gecikmə
IOPS kiçik təsadüfi əməliyyatlar (DB/metadata) üçün vacibdir.
Bant genişliyi - böyük fayllar (video, backup) üçün.
Gecikmə p95/p99 - DB, növbələr, API keşləri üçün kritik.
Növbələr və paralellik: müştəridə çoxaxın, NFS üçün 'rsize/wsize', iSCSI üçün 'rw, queue _ depth'.
Şəbəkə: 25/40/100 GbE (və ya IB) + RSS/RPS, məlumat mərkəzi daxilində jumbo MTU.
Caching və Tiring
ARC/L2ARC (ZFS) - RAM və NVMe-cache oxu; SLOG - sync-qeydlər jurnalı.
Write-back/Write-through cache controllers - ehtiyatla, yalnız batareya/super kondenser (BBU/PLP) ilə.
Tiering: NVMe (isti) → SSD (isti) → HDD (soyuq) → obyekt (arxiv). Miqrasiya və həyat siyasəti.
Snapshots, klonlar, replikasiya, DR
Snapshot (CoW): ani geri/backup nöqtələri; kataloqları yalnız hipervizorda deyil, anbar daxilində saxlayın.
Replikasiya: sinxron (RPO ≈ 0, daha yüksək latency), asinxron (RPO = N min).
Klonlar: iqtisadi dev/test mühiti.
DR sxemləri: 3-2-1 (üç nüsxə, iki növ daşıyıcı, biri - sayt xaricində), müntəzəm DR təlimləri; RPO/RTO məqsədləri.
Təhlükəsizlik, uyğunluq və çox icarə
Autentification/Authorization: LDAP/AD, SMB üçün Kerberos/NTLMv2, AUTH_SYS/KRB üçün NFSv4.
İzolyasiya: VLAN/VRF, export-policies, tenant-kvotalar/quotas.
Şifrələmə: dinc (LUKS/ZFS native/SED) və uçuş (S3 üçün NFS-krb5p/SMB encryption/TLS).
Qanuni əhəmiyyətli məlumatlar üçün WORM/Compliance (S3 Object Lock, SnapLock analoqları).
Audit: dəyişməz giriş qeydləri, SIEM ilə inteqrasiya.
Monitorinq və SLO
Metriklər:- Hovuzlar/cildlər üzrə: istifadə, 'p95/p99 latency', IOPS, throughput, queue depth, cache hit, write amplification.
- Şəbəkədə: drops, retransmits, PPS, MTU mismatch.
- Media errors, wear-level, temperatur, SMART.
- Replikasiya/snapshot üzrə: lag/yaş, tapşırıqların müvəffəqiyyəti, müddəti.
- CI üçün NFS top: p95 latency ≤ 3 ms, mövcudluğu ≥ 99. 95%.
- DB üçün LUN: p99 write ≤ 1. 5 ms, bölgə daxilində sinxron replika; RPO 0, RTO ≤ 5 dəq.
- Obyekt: p95 PUT ≤ 50 ms, p95 GET ≤ 30 ms, 11 × 9 davamlılıq (AB/replikasiyalar vasitəsilə).
- Hovuzun doldurulması> 80/90/95%, cache hit, write-amp artımı, disk deqradasiyası, şəbəkə çökməsi, replikasiya gecikməsi> eşik.
Ehtiyat və arxiv
Şəkillər + uzaqdan replika + obyekt/lent üçün ayrıca backup.
Retention siyasətləri: gündəlik/həftəlik/aylıq.
Immutability: S3 Object Lock (Governance/Compliance), «air-gap» (lent/off hesablar).
Bərpa testləri - mütəmadi olaraq.
Praktik şablonlar (minimal)
NFS ixracı (nümunə)
/pool/projects 10. 0. 0. 0/16(rw,async,no_root_squash,sec=krb5p)
SMB paylaşımı (smb fraqmenti. conf)
[media]
path = /pool/media read only = no vfs objects = acl_xattr, recycle ea support = yes kernel oplocks = no smb encrypt = required
ZFS: hovuz və dataset yaradılması
bash zpool create tank mirror nvme0n1 nvme1n1 zfs set atime=off compression=lz4 tank zfs create tank/projects zfs set recordsize=1M tank/projects # большие файлы zfs set recordsize=16K tank/db # БД/мелкие I/O
iSCSI (fikirlər)
Müştərilərdə ALUA/MPIO, düzgün vaxtlar və queue depth daxil edin.
iSCSI şəbəkələrini və müştəri trafikini yayın, storaj fabrikində Jumbo MTU-nu işə salın.
Tutum və performans planlaşdırma
Model working set (isti həcm) və growth rate (aylıq artım).
pik və rebbalans altında 30-50% IOPS və bant genişliyi ehtiyatı.
write amplification (RAID/EC/CoW) və metadata nəzərə alın.
Obyekt üçün - sorğuların və gedən trafikin dəyəri, saxlama sinifləri (standard/IA/glacier kimi).
Əməliyyat və yeniləmələr
Rolling-Updates Controller/OS/Firmware.
Scrubs/Resilver pəncərələr və prioritetlər.
rebild balans: «öldürmək» prod deyil, bərpa zamanı I/O məhdudlaşdırılması.
Düyün/şəbəkələrin deqradasiyası/itirilməsi üzrə Runbooks.
Giriş çek siyahısı
- Seçilmiş giriş profili: fayl/blok/obyekt + RPO/RTO/SLO.
- Yük və qiymət altında kodlaşdırma sxemi (RAID/ZFS/EC).
- Şəbəkələr: ayrı-ayrı VLAN/VRF, MTU 9000 zavod daxilində, MPIO/ALUA.
- Cache/Tire: ARC/L2ARC/SLOG və ya oxşar mexanizmlər.
- Snapshots/replika/backup: cədvəllər, immutability, DR-təlimlər.
- Monitorinq: hovuzlar/daşıyıcılar/şəbəkə/replikasiya metriklər, alertlər.
- Giriş/Təhlükəsizlik: ACL, Kerberos/AD, şifrələmə, audit.
- Tenant kvotaları/limitləri və SLA/SLO kataloqları.
- Sənədləşmə və runbooks, test bərpa.
Tipik səhvlər
ZFS/EC sistemlərində hovuzun aşılması> 80% → gecikmənin kəskin artması.
MPIO/rezervasiya olmadan bir nəzarətçi/bir şəbəkə.
Eyni sinif daşıyıcılarında isti və soyuq iş dəstlərini qarışdırın.
NFS → gözlənilməz gecikmələr üçün SLOG yoxdur.
Backaps yalnız eyni massiv/hesab → qəza/güzəşt itkisi.
Müntəzəm scrub və SMART monitorinqinin olmaması.
Kiçik I/O nümunələri: DB üçün böyük 'recordsize'.
iGaming/Fintech üçün xüsusiyyətlər
Əməliyyat DB və pul kisələri: ayrı-ayrı NVMe, RAID10/ZFS-mirrora hovuzları, B zonasına sinxron replika, müstəqil təchizatlar.
Log/xam hadisələr və antifrod fices: obyekt + lifecycle + ucuz siniflər, indekslər/vitrinlər - SSD-də.
Məzmun və media (provayderlər): NAS + CDN, aqressiv cache, deduplikasiya.
Hesabat və PII: WORM/immutability, şifrələmə, giriş auditi, məlumatların geo-lokalizasiyası.
Pik hadisələr: warm-up caches, giriş/çıxış limitləri, hovuzlarda p99 latency nəzarəti.
Yekun
Etibarlı saxlama sistemi düzgün siniflər (fayl/blok/obyekt), adekvat kodlaşdırma sxemi (RAID/ZFS/EC), sürətli şəbəkə, cache/tiring, snapshot + replika + backup, sərt SLO və avtomatlaşdırılmış əməliyyatlardır. Bu prinsiplərə əməl edərək, təhlükəsizlik və tənzimləyicilərin tələblərinə uyğun olaraq proqnozlaşdırıla bilən performans, yüksək sabitlik və şəffaf saxlama iqtisadiyyatı əldə edəcəksiniz.