Backup və replikasiya strategiyaları
Qısa xülasə
Etibarlı məlumat strategiyası üç dayaqda dayanır: backup, replikasiya, bərpa. Replica RTO (bərpa vaxtı) azaldır, backup RPO (məlumat itkisinə) zəmanət verir və məntiqi səhvlərdən/şifrəçilərdən qoruyur. Əsas prinsiplər: 3-2-1-1-0 (3 nüsxə, 2 tip daşıyıcı, 1 - offsayt, 1 - dəyişməz, yoxlamalarda 0 səhv), müntəzəm DR testləri və kritik dəstlərin immutabilliyi.
Şərtlər və məqsədlər
RPO - nə qədər məlumat itirmək mümkündür (məsələn, 5 dəqiqə ≤).
RTO - bərpa etmək üçün nə qədər vaxt lazımdır (məsələn, 15 dəqiqə ≤).
PITR (Point-in-Time Recovery) - jurnalların repleyləri ilə «X anda» bərpa.
SLO data - RPO/RTO və backup vəzifələrinin müvəffəqiyyəti üçün xidmət səviyyəsi müqaviləsi.
Uğursuzluq və replikasiya modelləri
Topologiya variantları
Active-Passive (isti/isti/soyuq): daha asan, proqnozlaşdırıla bilən fayloverlər.
Active-Active: Yüksək əlçatanlıq, lakin daha mürəkkəb münaqişə-qətnamə və tutarlılıq.
Multi-Zone/Region/Cloud: gecikmələr və egress dəyəri balans.
Sinxron vs asinxron
Sinxron: RPO ≈ 0, daha yüksək latency, məsafə məhdudiyyəti.
Asinhron: Kiçik RPO (dəqiqə) ilə sıfır RTO yaxındır, bölgələrə/buludlara dözür.
Hibrid: zonada sinxron, asinxron - uzaq bölgəyə.
Replika ≠ backup
Replika mənbədən sonra səhvləri/silmələri aparır. Backup - versiyalaşdırma, yoxlama və izolyasiya ilə off-path surəti.
3-2-1-1-0 siyasəti və immutability
3 nüsxə (prod + yerli ehtiyat + offsayt).
2 tipli daşıyıcılar (blok/NAS/obyekt/lent).
1 offsayt (digər platforma/bulud/lent).
1 dəyişməz nüsxə (WORM: Object Lock, immutable snapshots/tape).
0 səhv: müntəzəm inteqrit yoxlama (checksum/verify/bərpa testləri).
- Kritik backup obyekt üçün versiyalaşdırma və Object Lock (Compliance/Governance) daxil edin.
- NAS/bloklar üçün - gecikmə və müddətdən əvvəl silinməsini qadağan edən immutable snapshots.
Backup və cədvəl növləri
Full - tam surəti.
Incremental - yalnız keçmiş backup dəyişiklikləri.
Differential - son tam vaxtdan bəri dəyişikliklər.
GFS planı ilə Forever-incremental (Grandfather-Father-Son): gündəlik inkrementlər, həftəlik və aylıq «sintetik tam».
- Prod DD: gündəlik tam (və ya sintetik tam), hər 5-15 dəqiqədə bir artım/jurnal (PITR).
- Fayl serverləri: həftəlik full, gündəlik incremental, aylıq arxivlər.
- Obyekt: lifecycle + versiyası; soyuq - arxiv saxlama sinfinə/lentə.
Proqramlar və DB: PITR təcrübələri
PostgreSQL
WAL arxivləşdirmə və base backup daxil edin; 'restore _ command' vasitəsilə PITR.
Tools: 'pgBackRest', 'wal-g' (obyekt), 'pg _ basebackup' tam üçün.
Bölmələr: data və WAL; PLP ilə sürətli NVMe WAL yazın.
MySQL/MariaDB
«Percona XtraBackup» (hot backup) vasitəsilə tam PITR üçün Binary log.
GTID replikasiyası; DR üçün - regionda/buludda asinxron.
MongoDB
PITR üçün Oplog; Storage səviyyəsində snapshots + 'mongodump' məntiqi surətlər üçün.
Arxadan əvvəl replikanın sabitliyini test edin.
Redis/Caches
backup hesab deyil: RDB/AOF + offsite saxlamaq; warm-cache və ya həqiqət mənbəyi kimi bərpa.
Kubernetes və konteynerlər
etcd klasteri ayrı bir kritik hədəfdir (tez-tez snapshotlar, ofseyt).
Velero: manifestlərin/resursların arxası + CSI-snapshotlar/PV; S3 uyğun baketdə saxlama (Object Lock ilə).
Stateful-çubuqlar: app-consistent snapshots (pre/post hooks), əks halda - crash-consistent.
Obyekt artefaktlarının (model/media) versiyalaşdırılması - baket səviyyəsində.
Virtualizasiya və fayl serverləri
VM snapshots: CBT (Changed Block Tracking) istifadə, offsite saxlamaq, vaxtaşırı guest-aware quiesce (Windows üçün VSS) etmək.
Fayl serverləri (NAS): snapshots + replika və müntəzəm kataloq bərpa testləri (fayl seçimi).
Backup təhlükəsizliyi
Yalnız şifrələmə (LUKS/ZFS/bulud KMS/Vault) və ötürmə zamanı (TLS/mTLS).
Açarların idarə edilməsi: fərdi rollar, dual-control, rotasiya, master-açarların oflayn saxlanması.
İzolyasiya: immutable nüsxələrin silinməsi hüququ olmayan arxa proqram hesabları; fərdi şəbəkələr/VLAN.
Ransomware-stabillik: immutable, air-gap (lentlər/təcrid hesab/lab).
Audit: arxa sistem əməliyyatlarının jurnalı, retenşnanın çıxarılması/azaldılması barədə xəbərdarlıqlar.
Pəncərələrin və bant genişliyinin planlaşdırılması
Backup window vs yük: trottling I/O/şəbəkə, deduplication, sıxılma.
Şəbəkə: hər N dəqiqədə bir artım, ayrı-ayrı kanallar/VPN, gecə və ya daimi QoS ilə replika.
Trafikin azaldılması üçün Change Block Tracking/CDC.
Böyük bazalar: paralel axınlar/axınlar, obyektə çox kanallı multipart.
Monitorinq, metrika və SLO
Tech Metrics:- Backup/replikasiya tapşırıqlarının müvəffəqiyyəti (%), müddəti, sürəti, jurnal gecikməsi (WAL/binlog/oplog).
- Backup saxlama sahəsi, dedup əmsalı, digər xərclər.
- Test bərpa zamanı və müvəffəqiyyəti.
- Backup müvəffəqiyyəti ≥ 99. 9 %/30 gün.
- RPO zamanın 99% -ə ≥ (lag jurnalları ≤ hədəf).
- RTO (test-bərpa) ≤ cüzdan üçün 15 dəq, hesabat üçün ≤ 1 saat.
- Aylıq DR-drill: 100% tənzimləmə ssenariləri tamamlandı.
- Buraxılmış/uğursuz backup, lag PITR> eşik, deduplikasiya səviyyəsinin düşməsi, yer çatışmazlığı, retenshn siyasətinin dəyişməsi, təzə test-restoranın olmaması.
DR təlimləri və bərpa yoxlaması
Tablolar (table-top): rolların koordinasiyası, əlaqə, ünsiyyət.
Texniki: «qum qutusuna» bərpa, RTO ölçülməsi, nəzarət məbləğlərinin/məlumatlarının müqayisəsi.
Qara start: «çılpaq dəmir/təmiz klasterə» tam bərpa.
Verilənlər kataloqu: sistemlərin hər sinfi üçün əvvəlcədən təsvir edilmiş bərpa addımları (runbooks).
Avtomatika: dövri «kanar» bərpa və nəzarət məbləğlərinin müqayisəsi.
Praktik şablonlar
1) PostgreSQL (pgBackRest + WAL-arxiv obyekt)
ini
[global]
repo1-type=s3 repo1-path=/pgbackups repo1-s3-endpoint=minio. local:9000 repo1-s3-bucket=pg-wal repo1-s3-key=ACCESSKEY repo1-s3-key-secret=SECRET repo1-retention-full=8 start-fast=y compress-type=zst
2) wal-g (ENV nümunəsi)
bash export WALG_S3_PREFIX=s3://pg-wal/prod export AWS_ACCESS_KEY_ID=...
export AWS_SECRET_ACCESS_KEY=...
export WALG_COMPRESSION_METHOD=zstd
3) Velero (K8s - obyekt + baketin immutabilliyi)
yaml apiVersion: velero. io/v1 kind: BackupStorageLocation metadata: { name: default, namespace: velero }
spec:
provider: aws objectStorage:
bucket: k8s-backups config:
s3Url: https://minio. example s3ForcePathStyle: "true"
publicUrl: https://minio. example
4) Object Lock Siyasəti (nümunə 'mc')
bash mc version enable my/backups mc retention set --default COMPLIANCE 365d my/backups
5) GFS cədvəli nümunəsi (konsepsiya)
Daily: hər 15 dəqiqədə bir artım (jurnallar), gündəlik sintetik tam.
Weekly: bir «tam» (sintetik), 8 həftə saxlamaq.
Monthly: tam, 12-24 ay saxlamaq (arxiv/lent).
Giriş çek siyahısı
- Müəyyən edilmiş məlumat sinifləri, sahibləri, RPO/RTO/SLO.
- Replikasiya (sync/async) və topologiya (AZ/Region/Cloud) modelləri seçilmişdir.
- Xüsusi backaps: full/incremental/PITR, cədvəllər, kataloqlar.
- Daxil immutability (WORM/Object Lock/immutable snapshots) və offsite/air-gap.
- Şifrələmə və KMS/Vault, ayrı rollar və açar rotasiyası.
- Monitorinq: tapşırıqların müvəffəqiyyəti, jurnal gecikməsi, yer, test-bərpa; alertlər.
- Runbooks bərpa və Feylover; əlaqə, eskalasiya, kommunikasiya şablonları.
- Aylıq DR təlimləri + hesabat, düzəliş planları.
- Büdcə və FinOps: saxlama/egress dəyəri, arxiv/tirinq layihəsi.
Tipik səhvlər
«Replika var - backup lazım deyil»: məntiqi silinir və şifrələyicilər replikaya gedəcəklər.
Bərpa testləri yoxdur - arxa plan «nəzəri» mövcuddur.
İmmutabilliyin və ofsetin olmaması vahid risk nöqtəsidir.
Eyni hesab/prod və backup açarları - güzəşt = hər şeyi itirmək.
Çox uzun backup pəncərələri → zirvə konflikti; Trottling və QoS yoxdur.
Jurnalların laqasına nəzarət etmədən PITR.
Snapshot app-consistent - «çirkli» bərpa cildlər.
iGaming/Fintech üçün xüsusiyyətlər
Cüzdan/ödəniş nüvəsi: RPO ≤ 1-5 dəq, RTO ≤ 15 dəq; WORM ilə obyektə jurnallar (WAL/binlog); zonada sinxron + asinxron region.
Hesabat/tənzimləyici: dəyişməz anbarlar, uzun müddətli retenşn (illər), yoxlanıla bilən bütövlük, tənzimləyicilərə məlumatların verilməsinin dəqiq prosedurları.
Log/xam hadisələr/antifrod: ucuz uzun ömürlü saxlama (obyekt) + lifecycle; indekslər və vitrinlər - ayrıca.
Piklər (matçlar/turnirlər): pəncərələr arxa piklər, throttling; Hadisələr dövrü üçün DR planları; aksiyalardan əvvəl kanar restore.
Yekun
Məlumatların qorunması memarlıq intizamıdır: 3-2-1-1-0, versiyalaşdırma və immutability, SLO kimi RPO/RTO, müntəzəm DR təlimləri və «faktiki» bərpa yoxlaması. Aptime və sürətli feyler üçün replikasiyanı məntiqi səhvlər və güzəştlər üçün backaps ilə birləşdirin. Avtomatlaşdırın, ölçün, sənədləşdirin - və ən pis gündə belə həmişə iş yolunuz olacaq.