Բեքապների և վերարտադրման ռազմավարությունները
Live ռեզյումե
Տվյալների հուսալի ռազմավարությունը կանգնած է երեք հենարանների վրա 'bakap, կրկնօրինակումը, վերականգնումը։ Կրկնօրինակը նվազեցնում է RTO (վերականգնման ժամանակը), բեքապը երաշխավորում է RPO (տվյալների կորուստ) և պաշտպանում է տրամաբանական սխալներից/ծածկագրողներից։ Հիմնական սկզբունքները ՝ 3-2-1-0 (3 օրինակներ, 2 տեսակի կրիչներ, 1 - օֆսայթ, 1 - անփոփոխ, 0 սխալ ստուգման մեջ), DR թեստերը և կրիտիկական հավաքածուների իմուտաբելությունը։
Տերմիններ և նպատակներ
RPO-ը, քանի՞ տվյալներ կարող են կորցնել (օրինակ ՝ 355 րոպե)։
RTO-ը, որքա՞ ն ժամանակ թույլատրելի է վերականգնել (օրինակ, 15 րոպե)։
PITR (Point-in-Time Recovery) - վերականգնումը «X-ի պահին» ամսագրերով։
SLO տվյալները պայմանագիրն են RPO/RTO-ի համար և bakap խնդիրների հաջողությունը։
Մատրիցի օրինակ
Ձախողման և վերարտադրման մոդելներ
Տեղաբանության տարբերակները
Active-Passive (տաք/տաք/սառը) 'ավելի հեշտ, կանխատեսելի ֆեյլովերներ։
Active-Action: Բարձր հասանելիություն, բայց ավելի բարդ է հակամարտությունը-ռեզոնանսը և կոնսիստենտությունը։
Multi-Zone/Region/Cloud: Ձերբակալման հավասարակշռությունը և egress արժեքը։
Սինխրոն vs asinhron
Սինխրոն ՝ RPO 240, ավելի բարձր, քան latency, հեռավորության սահմանափակում։
Ասինհրոն 'մոտ է RTO-ի զրոյին փոքր RPO (րոպե), դիմանում է տարածաշրջաններին/ամպերին։
Հիբրիդ 'գոտու ներսում սինխրոն, ասինխրոն' հեռավոր ոլորտում։
Կրկնօրինակումը www.bakap
Կրկնօրինակը կորցնում է սխալները/108 աղբյուրից հետո։ Bakap-off-path-ն է, որը ունի տարբերակիչ, ստուգում և մեկուսացում։
Քաղաքականությունը 3-2-1-1-0 և իմութաբելությունը
3 օրինակ (prod + տեղական պահուստային + օֆսայթ)։
2 տեսակի կրիչներ (բլոկ/NAS/օբյեկտ/ժապավեն)։
1 օֆսայթ (մեկ այլ տարածք/ամպա/ժապավեն)։
1 անփոփոխ օրինակը (WORM: Object Prok, imutable proapshots/ժենտա)։
0: անկայուն ինտեգրիտետի ստուգում (www.ksum/verify/restore թեստեր)։
Պրակտիկա
Միացրեք տարբերակումը և Obpliance Disk (Compliance/Governations) օբյեկտների համար կրիտիկական baps։
NAS/բլոկների համար immutable medapshots-ն է, որը ունի ռենտեն և արգելում է մինչև ժամանակը։
Բեքապների և ժամանակացույցի տեսակները
Fox-ը ամբողջական օրինակ է։
Incremental-ը միայն անցյալ bakap-ի փոփոխությունն է։
Դելֆերենտիալ փոփոխությունը վերջին ամբողջական ժամանակից ի վեր։
Forever-incremental-ի հետ GMS պլանի հետ (Grandfather-Father-Son) 'ցերեկային ռեգենտներ, շաբաթական և ամսական «սինթետիկ ամբողջական»։
Առաջարկություն (օրինակ)
NoBD 'ամենօրյա fox (կամ սինթետիկ fox), Express/ամսագրեր յուրաքանչյուր 5-15 րոպե (PITR)։
Հիբրիդային սերվերներ 'շաբաթական fox, ամենօրյա incremental, ամսական արխիվներ։
Օբյեկտ ՝ lifecycle + տարբերակը; սառը - պահեստային/ժապավենի արխիվային դասարանում։
Ծրագրեր և BD 'PITR պրակտիկա
PostgreSQL
Միացրեք WAL արխիվացումը և bull backup; PITR-ն «restore _ command» -ի միջոցով։
Գործիքներ ՝ «pgBackRext», «wal-g» (օբյեկտ), «pg _ basebackup» ամբողջական համար։
Բաժանել հատորները ՝ տվյալները և WAL; Գրել WAL-ը արագ NVMe-ի վրա PLP-ի հետ։
MySQL/MariaDB
Binary log-ի համար, որը լի է «Percona XtraBackup» (hot backup) միջոցով։
GTID-ի կրկնօրինակումը; DR-ի համար ասինխրոն է տարածաշրջանում/ամպում։
MongoDB
Oplog PITR-ի համար; կեղտաջրերը, որոնք գտնվում են + 'mongodump- ի մակարդակի վրա, տրամաբանական օրինակների համար։
Փորձարկել կրկնօրինակի կոնսիստենտիվությունը bakam-ի առջև։
Redis/Kashi/
Bakam 'պահել RDB/AOF + www.site; վերականգնել որպես warm-cache կամ ճշմարտության աղբյուրից։
Kubernetes եւ բեռնարկղեր
etcd-ը առանձին կրիտիկական նպատակ է (հաճախակի դիպուկահարներ, օֆսայթ)։
Velero: bakap մանիֆեստներ/ռեսուրսներ + CSI-դիպուկահարներ/PV; պահեստավորում S3-համատեղելի բաքում (Object Prok-ի հետ)։
Stateful-մրցանակակիրներ 'ap-consistent crupshots (pre/post hooks), հակառակ դեպքում crash-consistent։
Օբյեկտի արտեֆակտների տարբերակումը (մոդելներ/մեդիա) տանկերի մակարդակում է։
Վիրտուալիզացիան և ալյումինե սերվերը
VM-դիպուկահարներ 'օգտագործել CBT (Changed Block Tracking), պահել site, պարբերաբար կատարել guest aj quiesce (VFC Windows-ի համար)։
Ալյումինե սերվերները (NAS) 'սարքավորումներ + կրկնօրինակներ և կատալոգային հետազոտական թեստեր (ֆայլերի ընտրություն)։
Բեքապների անվտանգությունը
Կոդավորումը հանգույցի մեջ (LUKS/ZMS/ամպային KFC/Vance) և փոխանցման ժամանակ (TFC/mTLS)։
Բաների կառավարումը 'առանձնահատուկ դերեր, drival-enterl, նավարկություն, օֆլեյն-պահեստավորում վարպետության ձեռնարկություն։
Մեկուսացում 'bekap-soft ձայնագրությունները առանց իմպուտաբային օրինակների հեռացման իրավունքի։ առանձին ցանցեր/MSAN։
Ransomics-կայունություն ՝ immutable, air-gap (ժապավեն/մեկուսացված հաշիվ/լաբ)։
Աուդիտ 'bakap համակարգի վիրահատությունների ամսագիր, հեռացման/կրճատման նախազգուշացում։
Պատուհանների պլանավորում և ընդունակություն
Backup 24vs 24: Trottling I/O/ցանցեր, deduplication, ագրեսիա։
Ցանցը 'Express յուրաքանչյուր N րոպե, առանձին ջրանցքներ/SNN, դիտողություններ գիշերը կամ անընդհատ QoS-ի հետ։
Change Block Tracking/CDC-ը նվազեցնելու համար։
Մեծ հիմքեր 'զուգահեռ հոսքեր/սթրիմինգ, բազմաբնույթ multipart օբյեկտի մեջ։
Մոսկվա, մետրեր և SLO
Այդ մետրիկները
Բեքապի/վերարտադրման առաջադրանքների հաջողությունը (%), տևողությունը, արագությունը, ամսագրերի լագը (WAL/binlog/oplog)։
Կղզիների տարածքը, dedup-գործակիցը, այլ ծախսերը։
Թեստային վերականգնումների ժամանակը և հաջողությունը։
SLO (օրինակ)
Բեքապների հաջողությունը 3699 է։ 9 %/30 օր։
RPO-ն պահպանվում է ժամանակի 3699 տոկոսը (ամսագրերի լագը 105)։
RTO (թեստային հետազոտություն) 15 րոպե դրամապանակի համար, 241 ժամ հաշվետվության համար։
Ամսական DR-medill-ը 'էքսպրեսիայի 100 տոկոսը ավարտված է։
Ալերտա
Բաց թողած/անհաջող bakap, PITR> շեմն է, դեդուպլիզացիայի աստիճանի անկումը, վայրի պակասը, ռենտեն քաղաքականության փոփոխությունը, թարմ թեստային-հետազոտման բացակայությունը։
DR ուսուցումները և վերականգնման ստուգումը
Պլաստիկ (table-top) 'դերերի, կապի, հաղորդակցության համակարգումը։
Տեխնիկական 'վերականգնումը «ավազի մեջ», RTO չափումը, համապատասխան գումարների/տվյալների համեմատությունը։
Մոսկվա-start: ամբողջական վերականգնումը «մերկ երկաթի/մաքուր կլաստերի» վրա։
Գրանցումները և տվյալները ՝ նախապես ընդունված վերականգնման քայլերը (runbooks) համակարգերի յուրաքանչյուր դասարանում։
Ավտոմատիկա 'պարբերական «կանարական» հետազոտություն և գումարների ավելացում։
Գործնական ձևանմուշներ
1) PostgreSQL (pgBackRext + WAL արխիվը օբյեկտի մեջ)
ini
[global]
repo1-type=s3 repo1-path=/pgbackups repo1-s3-endpoint=minio. local:9000 repo1-s3-bucket=pg-wal repo1-s3-key=ACCESSKEY repo1-s3-key-secret=SECRET repo1-retention-full=8 start-fast=y compress-type=zst
2) wal-g (օրինակ ENV)
bash export WALG_S3_PREFIX=s3://pg-wal/prod export AWS_ACCESS_KEY_ID=...
export AWS_SECRET_ACCESS_KEY=...
export WALG_COMPRESSION_METHOD=zstd
3) Velero (K8s - օբյեկտ + իմուտաբելություն բաքի)
yaml apiVersion: velero. io/v1 kind: BackupStorageLocation metadata: { name: default, namespace: velero }
spec:
provider: aws objectStorage:
bucket: k8s-backups config:
s3Url: https://minio. example s3ForcePathStyle: "true"
publicUrl: https://minio. example
4) Object Prock քաղաքականությունը (օրինակ ՝ «07»)
bash mc version enable my/backups mc retention set --default COMPLIANCE 365d my/backups
5) GMS գրաֆիկայի օրինակ (հայեցակարգ)
Daily: Rements յուրաքանչյուր 15 րոպե (ամսագրեր), ցերեկային սինթետիկ fox։
Weekly: մեկ «ամբողջական» (սինթետիկ), պահել 8 շաբաթ։
Monthly: ամբողջական, պահել 12-24 ամիս (արխիվ/ժենտա)։
Ներդրման թուղթ
- Տվյալների դասարանները, սեփականատերերը, RPO/RTO/SLO։
- Ընտրվել են վերարտադրման մոդելները (nc/async) և տեղաբանությունը (AZ/Region/Cloud)։
- Bakaps: fox/incremental/PITR, գրաֆիկներ, կոմպոզիցիաներ և։
- Ներառված են իմունաբելությունը (WORM/Object Systek/immutable apshots) և օֆսայթ/air-gap։
- Կոդավորում և KFC/Vance, առանձին դերեր և ռոտացիաներ։
- Lenta.ru 'առաջադրանքների հաջողությունը, ամսագրերի լագը, տեղը, թեստային հետազոտությունը։ ալերտներ։
- Runbooks վերականգնման և ֆեյլերի; կոնտակտներ, շարժասանդուղքներ, հաղորդակցման ձևանմուշներ։
- Ամսական DR ուսուցումները + զեկույցը, պլանների ավարտը։
- Բյուջե և FinOps: պահպանման/egress, արխիվավորման/տիրինգի նախագիծ։
Տիպիկ սխալներ
«Կրկնություն կա, բեքապը կարիք չունի», տրամաբանական պարամետրերը և ծածկագրիչները կգնան վերարտադրության։
Վերականգնման թեստեր չկան, բեքապը գոյություն ունի «տեսական»։
Իմպուտաբելության և օֆսայտի բացակայությունը ռիսկի միասնական կետ է։
Նույն հաշիվը/ստեղները և բափերը փոխզիջում են։
Bakapa-ի չափազանց երկար պատուհանները հաստատեցին հակամարտությունը պիկի հետ։ չկա trotling և QoS.
PITR-ն առանց ամսագրերի ճամբարի վերահսկման։
App-consistent crupschots - «կեղտոտ» վերականգնվող հատորները։
Հատուկ iGaming/fintech համար
Դրամապանակ/հիբրիդային միջուկը ՝ RPO 351-5 րոպե, RTO 3515 րոպե; ամսագրեր (WAL/binlog) WORM-ի հետ օբյեկտում։ սինխրոն գոտում + ասինխրոն տարածք։
Հաշվետվություններ/կարգավորիչներ 'անփոփոխ դեղամիջոցներ, երկար ռետենշն (տարիներ), ստուգված ամբողջականությունը, կարգավորողներին տվյալների փոխանցման հստակ ընթացակարգերը։
Լոգա/հում իրադարձություններ/հակաֆրոդ 'էժան երկար պահեստ (օբյեկտ) + lifecycle; ինդեքսները և վիտրինները առանձին են։
Պիկի (խաղեր/մրցույթներ) 'բեքապի պատուհանները գագաթներից դուրս, throttling; DR պլանները իրադարձությունների ժամանակահատվածի համար։ Կանարյան հետազոտություններ նախքան բաժնետոմսերը։
Արդյունքը
Տվյալների պաշտպանությունը ճարտարապետական առարկան է ՝ 3-2-1-0, տարբերակումը և իմուտաբելությունը, RPO/RTO որպես SLO, DR ուսուցումները և վերականգնման ստուգումը «իրականում»։ Համատեղեք կրկնօրինակումը aptaima-ի և արագ կեղծարարների համար 'տրամաբանական սխալների և փոխզիջումների համար։ Ավտոմատիզացրեք, չափեք, փաստարկեք, և միշտ աշխատանքային ճանապարհ կունենաք, նույնիսկ ամենավատ օրը։