Depolama ve NAS
Kısa Özet
Depolama, performans, güvenilirlik, güvenlik ve ekonomi sağlayan medya (SSD/NVMe/HDD), ağlar (Ethernet/IB/FC), protokoller (NFS/SMB/iSCSI/S3) ve yazılımların (ZFS, Ceph, NetApp, TrueNAS, vb.) birleşimidir. Doğru seçim, I/O profiline (rastgele/sıralı, blok/dosya/nesne), RPO/RTO ve SLO gecikme/işlem hacmi gereksinimlerine bağlıdır.
Depolama taksonomisi
DAS (Direct Attached Storage) - sunucunun yakınındaki diskler. Minimum gecikme, ağ darboğazı yok, ancak kaynakları paylaşmak daha zor.
SAN (Depolama Alanı Ağı) - FC/iSCSI/NVMe-oF aracılığıyla depolamayı engeller. Yüksek performans, paylaşılan LUN'lar, merkezi yönetim.
NAS (Ağa Bağlı Depolama) - NFS/SMB üzerinden dosya topları. Paylaşılan dizinler, günlükler, eserler, medya içeriği için uygundur.
Nesne depolama - S3-compatible API'leri (Ceph RGW/MinIO/clouds). Yedeklemeler, günlükler, arşivler, medya, model eserler için.
Hyperconverged solutions (HCI) - Yatay ölçek için hesaplama ve depolamayı (Ceph, vSAN, StarWind, vb.) birleştirin.
Erişim protokolleri
Dosya:- NFSv3/v4 - Unix/Posix ortamı, durum kilidi, Kerberos/KRB5i/KRB5p.
- SMB 3. X - Windows/AD etki alanları, şifreleme/imzalar, çok kanallı, DFS.
- ISCSI - Ethernet üzerinden, LUN, birçok yol (MPIO), sanallaştırma/veritabanı için uygundur.
- FC/NVMe-oF - düşük gecikme süresi, özel fabrikalar/haritalar.
- S3 API - nesne sürümleri, yaşam döngüsü, WORM/Uyumluluk modu, çok parçalı yükleme.
- DB/sanal makineler - blok (iSCSI/NVMe-oF).
- Paylaşılan Klasörler/CI Artifacts - NFS/SMB.
- Günlükler/yedeklemeler/medya/modeller - S3-compatible nesne.
Veri ve kodlama: RAID, ZFS, Silme Kodlama
RAID
RAID1/10 - düşük gecikme süresi ve yüksek IOPS/random-read/write.
RAID5/6 - kapasite tasarrufu, ancak yazma cezası.
ZFS - Yazımı kopyala (CoW), havuzlar ve vdev, ARC/L2ARC önbellek, senkronizasyon işlemleri için ZIL/SLOG, anlık görüntüler/çoğaltma ve yerleşik bütünlük (sağlama toplamı).
Dağıtılmış Sistemlerde (Ceph/MinIO) Silme Kodlaması (EC): Reed-Solomon'k + m 'kodu - kabul edilebilir yazma performansı düşüşü ile 3x çoğaltma üzerinde tasarruf.
- Sıcak rastgele yükler (meta veriler, küçük dosyalar) - NVMe üzerinde RAID10/ZFS aynalar.
- EC soğuk/arşiv -, büyük HDD'ler, agresif önbellekler.
- Senkronizasyon kayıtları için (NFS dışa aktarma) - güvenilir düşük patentli NVMe (PLP) üzerinde özel SLOG.
Performans: IOPS, iş hacmi, gecikme süresi
IOPS, küçük rastgele işlemler (DB/meta veriler) için önemlidir.
Bant genişliği - büyük dosyalar için (videolar, yedeklemeler).
Gecikme süresi p95/p99 - veritabanları, kuyruklar, önbellek API'leri için kritik önem taşır.
Kuyruklar ve eşzamanlılık: istemci üzerinde çoklu okuma, NFS için 'rsize/wsize', iSCSI için 'rw, queue _ depth'.
Ağ: 25/40/100 GbE (veya IB) + RSS/RPS, veri merkezi içinde jumbo MTU.
Önbelleğe alma ve tıklama
ARC/L2ARC (ZFS) - RAM ve NVMe okuma önbelleği; SLOG - senkronizasyon kayıtlarının geçmişi.
Write-back/Write-through denetleyici önbellekleri - dikkatli, yalnızca pil/süper kapasitör (BBU/PLP).
Katmanlama: NVMe (sıcak) - SSD (sıcak) - HDD (soğuk) - nesne (arşiv). Göç politikaları ve yaşam döngüsü.
Anlık görüntüler, klonlar, çoğaltma, DR
Anlık görüntüler (CoW): Geri alma/yedekleme için anlık puanlar; Dizinleri sadece hipervizörde değil, depolamanın "içinde'de saklayın.
Çoğaltma: Senkron (RPO≈0, gecikmenin üstünde), asenkron (RPO = N min).
Klonlar: ekonomik dev/test ortamları.
DR-şemaları: 3-2-1 (üç kopya, iki tip taşıyıcı, bir - saha dışı), düzenli DR-egzersizleri; RPO/RTO hedefleri.
Güvenlik, uyumluluk ve çoklu kiracılık
Kimlik doğrulama/yetkilendirme: LDAP/AD, SMB için Kerberos/NTLMv2, AUTH_SYS/KRB için NFSv4.
İzolasyon: VLAN/VRF, ihracat politikaları, kiracı kotaları/kotaları.
Şifreleme: Dururken (LUKS/ZFS native/SED) ve uçuşta (NFS-krb5p/SMB şifreleme/S3 için TLS).
Yasal olarak önemli veriler için WORM/Uyumluluk (S3 Object Lock, SnapLock analogları).
Denetim: değişmez erişim günlükleri, SIEM ile entegrasyon.
İzleme ve SLO
Metrikler:- Havuzlara/hacimlere göre: kullanım, 'p95/p99 gecikme', IOPS, işlem hacmi, kuyruk derinliği, önbellek isabeti, yazma amplifikasyonu.
- Ağ üzerinden: damlalar, yeniden iletimler, PPS, MTU uyumsuzluğu.
- Medya tarafından: medya hataları, aşınma seviyesi, sıcaklık, SMART.
- Çoğaltma/anlık görüntülerle: gecikme/yaş, görev başarısı, süre.
- CI için NFS topu: p95 gecikme süresi ≤ 3 ms, kullanılabilirlik ≥ 99. 95%.
- Veritabanı LUN: p99 yazma ≤ 1. 5 ms, bölge içinde senkron kopya; RPO 0, RTO ≤ 5 dk.
- Nesne: P95 PUT ≤ 50 ms, p95 GET ≤ 30 ms, 11 × 9 dayanıklılık (AB/çoğaltma yoluyla).
- Havuz doldurma> % 80/90/95, önbellek isabet düşüşü, yazma-amp büyümesi, disk bozulması, ağ çökmesi, çoğaltma günlüğü> eşik.
Yedekleme ve Arşiv
Anlık görüntüler + uzaktan çoğaltma + nesne/teybe ayrı yedekleme.
Saklama politikaları: gün/hafta/ay.
Değişmezlik: S3 Nesne Kilidi (Yönetişim/Uyumluluk), "hava boşluğu" (besleme/devre dışı hesaplar).
Kurtarma testleri - düzenli olarak.
Pratik şablonlar (minimum)
NFS'yi dışa aktarma (örnek)
/pool/projects 10. 0. 0. 0/16(rw,async,no_root_squash,sec=krb5p)
SMB payı (smb parçası. conf)
[media]
path = /pool/media read only = no vfs objects = acl_xattr, recycle ea support = yes kernel oplocks = no smb encrypt = required
ZFS: havuz ve veri kümesi oluşturma
bash zpool create tank mirror nvme0n1 nvme1n1 zfs set atime=off compression=lz4 tank zfs create tank/projects zfs set recordsize=1M tank/projects # большие файлы zfs set recordsize=16K tank/db # БД/мелкие I/O
iSCSI (fikirler)
ALUA/MPIO'yu etkinleştirin, istemcilerde zaman aşımlarını ve kuyruk derinliğini düzeltin.
ISCSI ağlarını ve istemci trafiğini yayın, yüz yarda fabrikasının içinde Jumbo MTU kullanın.
Kapasite ve performans planlaması
Çalışma seti ve büyüme oranı.
IOPS için marj ve zirveler ve yeniden dengeleme için %30-50 verim.
Yazma amplifikasyonunu (RAID/EC/CoW) ve meta verileri düşünün.
Nesne için - isteklerin ve giden trafiğin maliyeti, depolama sınıfları (standart/IA/buzul benzeri).
İşlemler ve Güncellemeler
Kontrolörlerin/OS/firmware'in yuvarlanan güncellemeleri.
Scrubs/Resilver pencereleri ve öncelikleri.
Rebild dengeleme: Dürtüyü "öldürmemek" için I/O'yu kurtarma konusunda sınırlamak.
Düğümlerin/ağların bozulması/kaybolması üzerine çalışma kitapları.
Uygulama kontrol listesi
- Dosya/Blok/Nesne + RPO/RTO/SLO erişim profili seçildi.
- Yük ve fiyat kodlama şeması (RAID/ZFS/EC).
- Ağlar: bireysel VLAN/VRF'ler, yapı içi MTU 9000, MPIO/ALUA.
- Önbellek/tıklama: ARC/L2ARC/SLOG veya benzeri mekanizmalar.
- Anlık görüntüler/çoğaltma/yedekleme: programlar, değişmezlik, DR egzersizleri.
- İzleme: havuzlar/medya/ağ/çoğaltma metrikleri, uyarılar.
- Erişim/güvenlik: ACL, Kerberos/AD, şifreleme, denetim.
- Kiracılar ve SLA/SLO dizinleri için kotalar/sınırlar.
- Dokümantasyon ve runbook'lar, test kurtarma.
Yaygın hatalar
Havuz taşması> ZFS/EC sistemlerinde %80 - gecikmede keskin bir artış.
MPIO/koruma olmadan bir denetleyici/bir ağ.
Sıcak ve soğuk çalışma setleri bir taşıyıcı sınıfında karıştırılır.
NFS senkronizasyon yükleri için SLOG yok - öngörülemeyen gecikme.
Yedeklemeler yalnızca aynı dizinin/hesabın "içinde" - bir kaza/uzlaşma durumunda kayıp.
Düzenli fırçalama ve SMART izleme eksikliği.
Küçük G/Ç desenlerini yok sayma: DB için büyük 'düzeltme'.
iGaming/fintech'e özel
İşlemsel veritabanları ve cüzdanlar: bireysel NVMe havuzları, RAID10/ZFS aynalar, B bölgesine senkronize kopya, bağımsız mühürlü.
Günlükler/ham olaylar ve dolandırıcılık önleme özellikleri: nesne + yaşam döngüsü + ucuz sınıflar, dizinler/vitrinler - SSD'de.
İçerik ve medya (sağlayıcılar): NAS + CDN, agresif önbellek, veri tekilleştirme.
Raporlama ve PII: WORM/değişmezlik, şifreleme, erişim denetimi, verilerin coğrafi lokalizasyonu.
Zirve olayları: ısınma önbellekleri, I/O limitleri, havuzlarda p99 gecikme kontrolü.
Toplam
Güvenilir depolama, doğru sınıf bölümleme (dosya/blok/nesne), yeterli kodlama şeması (RAID/ZFS/EC), hızlı ağ, önbellek/bağlama, anlık görüntüler + replika + yedekleme, sabit SLO'lar ve otomatik işlemlerdir. Bu ilkeleri izleyerek, öngörülebilir performans, yüksek esneklik ve şeffaf bir depolama ekonomisi elde edersiniz - güvenlik ve düzenleyici hususlarla.