GH GambleHub

Backup və replikasiya strategiyaları

Qısa xülasə

Etibarlı məlumat strategiyası üç dayaqda dayanır: backup, replikasiya, bərpa. Replica RTO (bərpa vaxtı) azaldır, backup RPO (məlumat itkisinə) zəmanət verir və məntiqi səhvlərdən/şifrəçilərdən qoruyur. Əsas prinsiplər: 3-2-1-1-0 (3 nüsxə, 2 tip daşıyıcı, 1 - offsayt, 1 - dəyişməz, yoxlamalarda 0 səhv), müntəzəm DR testləri və kritik dəstlərin immutabilliyi.

Şərtlər və məqsədlər

RPO - nə qədər məlumat itirmək mümkündür (məsələn, 5 dəqiqə ≤).
RTO - bərpa etmək üçün nə qədər vaxt lazımdır (məsələn, 15 dəqiqə ≤).
PITR (Point-in-Time Recovery) - jurnalların repleyləri ilə «X anda» bərpa.
SLO data - RPO/RTO və backup vəzifələrinin müvəffəqiyyəti üçün xidmət səviyyəsi müqaviləsi.

Matris nümunəsi:
Verilənlər sinfiRPORTOQeydlər
Əməliyyatlar/cüzdan≤ 1-5 dəqiqə≤ 5-15 dəqiqəJurnallar + nüvənin sinxron replikası
Hesabat/PII≤ 1 saat≤ 1 saatWORM/immutability, arxivlər
Log/xam hadisələr≤ 24 saat≤ 4 saatObyekt, lifecycle

Uğursuzluq və replikasiya modelləri

Topologiya variantları

Active-Passive (isti/isti/soyuq): daha asan, proqnozlaşdırıla bilən fayloverlər.
Active-Active: Yüksək əlçatanlıq, lakin daha mürəkkəb münaqişə-qətnamə və tutarlılıq.
Multi-Zone/Region/Cloud: gecikmələr və egress dəyəri balans.

Sinxron vs asinxron

Sinxron: RPO ≈ 0, daha yüksək latency, məsafə məhdudiyyəti.
Asinhron: Kiçik RPO (dəqiqə) ilə sıfır RTO yaxındır, bölgələrə/buludlara dözür.
Hibrid: zonada sinxron, asinxron - uzaq bölgəyə.

Replika ≠ backup

Replika mənbədən sonra səhvləri/silmələri aparır. Backup - versiyalaşdırma, yoxlama və izolyasiya ilə off-path surəti.

3-2-1-1-0 siyasəti və immutability

3 nüsxə (prod + yerli ehtiyat + offsayt).
2 tipli daşıyıcılar (blok/NAS/obyekt/lent).
1 offsayt (digər platforma/bulud/lent).
1 dəyişməz nüsxə (WORM: Object Lock, immutable snapshots/tape).
0 səhv: müntəzəm inteqrit yoxlama (checksum/verify/bərpa testləri).

Təcrübə:
  • Kritik backup obyekt üçün versiyalaşdırma və Object Lock (Compliance/Governance) daxil edin.
  • NAS/bloklar üçün - gecikmə və müddətdən əvvəl silinməsini qadağan edən immutable snapshots.

Backup və cədvəl növləri

Full - tam surəti.
Incremental - yalnız keçmiş backup dəyişiklikləri.
Differential - son tam vaxtdan bəri dəyişikliklər.
GFS planı ilə Forever-incremental (Grandfather-Father-Son): gündəlik inkrementlər, həftəlik və aylıq «sintetik tam».

Tövsiyə (nümunə):
  • Prod DD: gündəlik tam (və ya sintetik tam), hər 5-15 dəqiqədə bir artım/jurnal (PITR).
  • Fayl serverləri: həftəlik full, gündəlik incremental, aylıq arxivlər.
  • Obyekt: lifecycle + versiyası; soyuq - arxiv saxlama sinfinə/lentə.

Proqramlar və DB: PITR təcrübələri

PostgreSQL

WAL arxivləşdirmə və base backup daxil edin; 'restore _ command' vasitəsilə PITR.
Tools: 'pgBackRest', 'wal-g' (obyekt), 'pg _ basebackup' tam üçün.
Bölmələr: data və WAL; PLP ilə sürətli NVMe WAL yazın.

MySQL/MariaDB

«Percona XtraBackup» (hot backup) vasitəsilə tam PITR üçün Binary log.
GTID replikasiyası; DR üçün - regionda/buludda asinxron.

MongoDB

PITR üçün Oplog; Storage səviyyəsində snapshots + 'mongodump' məntiqi surətlər üçün.
Arxadan əvvəl replikanın sabitliyini test edin.

Redis/Caches

backup hesab deyil: RDB/AOF + offsite saxlamaq; warm-cache və ya həqiqət mənbəyi kimi bərpa.

Kubernetes və konteynerlər

etcd klasteri ayrı bir kritik hədəfdir (tez-tez snapshotlar, ofseyt).
Velero: manifestlərin/resursların arxası + CSI-snapshotlar/PV; S3 uyğun baketdə saxlama (Object Lock ilə).
Stateful-çubuqlar: app-consistent snapshots (pre/post hooks), əks halda - crash-consistent.
Obyekt artefaktlarının (model/media) versiyalaşdırılması - baket səviyyəsində.

Virtualizasiya və fayl serverləri

VM snapshots: CBT (Changed Block Tracking) istifadə, offsite saxlamaq, vaxtaşırı guest-aware quiesce (Windows üçün VSS) etmək.
Fayl serverləri (NAS): snapshots + replika və müntəzəm kataloq bərpa testləri (fayl seçimi).

Backup təhlükəsizliyi

Yalnız şifrələmə (LUKS/ZFS/bulud KMS/Vault) və ötürmə zamanı (TLS/mTLS).
Açarların idarə edilməsi: fərdi rollar, dual-control, rotasiya, master-açarların oflayn saxlanması.
İzolyasiya: immutable nüsxələrin silinməsi hüququ olmayan arxa proqram hesabları; fərdi şəbəkələr/VLAN.
Ransomware-stabillik: immutable, air-gap (lentlər/təcrid hesab/lab).
Audit: arxa sistem əməliyyatlarının jurnalı, retenşnanın çıxarılması/azaldılması barədə xəbərdarlıqlar.

Pəncərələrin və bant genişliyinin planlaşdırılması

Backup window vs yük: trottling I/O/şəbəkə, deduplication, sıxılma.
Şəbəkə: hər N dəqiqədə bir artım, ayrı-ayrı kanallar/VPN, gecə və ya daimi QoS ilə replika.
Trafikin azaldılması üçün Change Block Tracking/CDC.
Böyük bazalar: paralel axınlar/axınlar, obyektə çox kanallı multipart.

Monitorinq, metrika və SLO

Tech Metrics:
  • Backup/replikasiya tapşırıqlarının müvəffəqiyyəti (%), müddəti, sürəti, jurnal gecikməsi (WAL/binlog/oplog).
  • Backup saxlama sahəsi, dedup əmsalı, digər xərclər.
  • Test bərpa zamanı və müvəffəqiyyəti.
SLO (nümunə):
  • Backup müvəffəqiyyəti ≥ 99. 9 %/30 gün.
  • RPO zamanın 99% -ə ≥ (lag jurnalları ≤ hədəf).
  • RTO (test-bərpa) ≤ cüzdan üçün 15 dəq, hesabat üçün ≤ 1 saat.
  • Aylıq DR-drill: 100% tənzimləmə ssenariləri tamamlandı.
Alertlər:
  • Buraxılmış/uğursuz backup, lag PITR> eşik, deduplikasiya səviyyəsinin düşməsi, yer çatışmazlığı, retenshn siyasətinin dəyişməsi, təzə test-restoranın olmaması.

DR təlimləri və bərpa yoxlaması

Tablolar (table-top): rolların koordinasiyası, əlaqə, ünsiyyət.
Texniki: «qum qutusuna» bərpa, RTO ölçülməsi, nəzarət məbləğlərinin/məlumatlarının müqayisəsi.
Qara start: «çılpaq dəmir/təmiz klasterə» tam bərpa.
Verilənlər kataloqu: sistemlərin hər sinfi üçün əvvəlcədən təsvir edilmiş bərpa addımları (runbooks).
Avtomatika: dövri «kanar» bərpa və nəzarət məbləğlərinin müqayisəsi.

Praktik şablonlar

1) PostgreSQL (pgBackRest + WAL-arxiv obyekt)

ini
[global]
repo1-type=s3 repo1-path=/pgbackups repo1-s3-endpoint=minio. local:9000 repo1-s3-bucket=pg-wal repo1-s3-key=ACCESSKEY repo1-s3-key-secret=SECRET repo1-retention-full=8 start-fast=y compress-type=zst

2) wal-g (ENV nümunəsi)

bash export WALG_S3_PREFIX=s3://pg-wal/prod export AWS_ACCESS_KEY_ID=...
export AWS_SECRET_ACCESS_KEY=...
export WALG_COMPRESSION_METHOD=zstd

3) Velero (K8s - obyekt + baketin immutabilliyi)

yaml apiVersion: velero. io/v1 kind: BackupStorageLocation metadata: { name: default, namespace: velero }
spec:
provider: aws objectStorage:
bucket: k8s-backups config:
s3Url: https://minio. example s3ForcePathStyle: "true"
publicUrl: https://minio. example

4) Object Lock Siyasəti (nümunə 'mc')

bash mc version enable my/backups mc retention set --default COMPLIANCE 365d my/backups

5) GFS cədvəli nümunəsi (konsepsiya)

Daily: hər 15 dəqiqədə bir artım (jurnallar), gündəlik sintetik tam.
Weekly: bir «tam» (sintetik), 8 həftə saxlamaq.
Monthly: tam, 12-24 ay saxlamaq (arxiv/lent).

Giriş çek siyahısı

  • Müəyyən edilmiş məlumat sinifləri, sahibləri, RPO/RTO/SLO.
  • Replikasiya (sync/async) və topologiya (AZ/Region/Cloud) modelləri seçilmişdir.
  • Xüsusi backaps: full/incremental/PITR, cədvəllər, kataloqlar.
  • Daxil immutability (WORM/Object Lock/immutable snapshots) və offsite/air-gap.
  • Şifrələmə və KMS/Vault, ayrı rollar və açar rotasiyası.
  • Monitorinq: tapşırıqların müvəffəqiyyəti, jurnal gecikməsi, yer, test-bərpa; alertlər.
  • Runbooks bərpa və Feylover; əlaqə, eskalasiya, kommunikasiya şablonları.
  • Aylıq DR təlimləri + hesabat, düzəliş planları.
  • Büdcə və FinOps: saxlama/egress dəyəri, arxiv/tirinq layihəsi.

Tipik səhvlər

«Replika var - backup lazım deyil»: məntiqi silinir və şifrələyicilər replikaya gedəcəklər.
Bərpa testləri yoxdur - arxa plan «nəzəri» mövcuddur.
İmmutabilliyin və ofsetin olmaması vahid risk nöqtəsidir.
Eyni hesab/prod və backup açarları - güzəşt = hər şeyi itirmək.
Çox uzun backup pəncərələri → zirvə konflikti; Trottling və QoS yoxdur.
Jurnalların laqasına nəzarət etmədən PITR.
Snapshot app-consistent - «çirkli» bərpa cildlər.

iGaming/Fintech üçün xüsusiyyətlər

Cüzdan/ödəniş nüvəsi: RPO ≤ 1-5 dəq, RTO ≤ 15 dəq; WORM ilə obyektə jurnallar (WAL/binlog); zonada sinxron + asinxron region.
Hesabat/tənzimləyici: dəyişməz anbarlar, uzun müddətli retenşn (illər), yoxlanıla bilən bütövlük, tənzimləyicilərə məlumatların verilməsinin dəqiq prosedurları.
Log/xam hadisələr/antifrod: ucuz uzun ömürlü saxlama (obyekt) + lifecycle; indekslər və vitrinlər - ayrıca.
Piklər (matçlar/turnirlər): pəncərələr arxa piklər, throttling; Hadisələr dövrü üçün DR planları; aksiyalardan əvvəl kanar restore.

Yekun

Məlumatların qorunması memarlıq intizamıdır: 3-2-1-1-0, versiyalaşdırma və immutability, SLO kimi RPO/RTO, müntəzəm DR təlimləri və «faktiki» bərpa yoxlaması. Aptime və sürətli feyler üçün replikasiyanı məntiqi səhvlər və güzəştlər üçün backaps ilə birləşdirin. Avtomatlaşdırın, ölçün, sənədləşdirin - və ən pis gündə belə həmişə iş yolunuz olacaq.

Contact

Bizimlə əlaqə

Hər hansı sualınız və ya dəstək ehtiyacınız varsa — bizimlə əlaqə saxlayın.Həmişə köməyə hazırıq!

Telegram
@Gamble_GC
İnteqrasiyaya başla

Email — məcburidir. Telegram və ya WhatsApp — istəyə bağlıdır.

Adınız istəyə bağlı
Email istəyə bağlı
Mövzu istəyə bağlı
Mesaj istəyə bağlı
Telegram istəyə bağlı
@
Əgər Telegram daxil etsəniz — Email ilə yanaşı orada da cavab verəcəyik.
WhatsApp istəyə bağlı
Format: ölkə kodu + nömrə (məsələn, +994XXXXXXXXX).

Düyməyə basmaqla məlumatların işlənməsinə razılıq vermiş olursunuz.