Çoklu bulut stratejisi ve geçişler
1) Neden çoklu bulut ve ne zaman haklı?
Hedefler: iş sürekliliği (sağlayıcı rezervi), veri/yetki alanı egemenliği, değer/indirim optimizasyonu, en iyi yönetilen hizmetlere erişim (ML/dolandırıcılıkla mücadele/analitik).
Ödünler: operasyonların artan karmaşıklığı, yetkinliklerin çoğaltılması, ağ çıkış maliyetleri.
Anahtar: taşınabilirliğin nerede gerekli olduğunu ve satıcı kilitlenmesinin hız/fiyat için kabul edilebilir olduğunu önceden belirleyin.
2) Hedef mimari modeller
Taşınabilir Çekirdek: kritik çekirdek (API, etki alanı hizmetleri, veri) - taşınabilir (K8s, Postgres, Kafka, Redis, MinIO/Vault); Çevre - doğal olarak yönetilen.
Active-Active Multi-cloud: iki bulut aynı anda trafiğe hizmet eder (zor: veri çakışmaları, global yönlendirme).
Aktif-Pasif (Sıcak/Sıcak): bir - ana, ikinci - sıcak/sıcak DR.
Hibrid: bulutlarda he-prem/parça parçası (genellikle yasal/PII kısıtlamaları için).
3) Tolere edilebilirlik kalıpları
Temel platform olarak Kubernetes (takma adları: EKS/GKE/AKS/on-prem K8s).
Servis Mesh (mTLS, trafik kaydırma, yerellik/yük devretme; Istio/Linkerd).
IaC: Terraform + modüler soyutlamalar; для K8s - Dümen/Kustomize + GitOps (Argo/Flux).
Sırlar: HashiCorp Kasası/Dış Sırlar Operatörü; KMS/HSM üzerinden soyutlama.
Depolar: API tekdüzeliği için Postgres (operatörler/Patroni), Kafka (operatörler/MirrorMaker2), Redis (sentinel/cluster), S3-compatible (MinIO).
Gözlemlenebilirlik: OpenTelemetry + satıcı-nötr arka uçlar (Prometheus/Tempo/Loki/ClickHouse).
Kimlik doğrulama: OIDC/OAuth2 (Keycloak/Auth0/Entra/Google), birleşik federasyon.
API katmanı: Elçi/NGINX/Kontur + genel politikalar (CORS, zorunlu başlıklar, oran limitleri).
4) Göç stratejileri (7R - kısa)
Rehost (Lift-and-Shift): hızlı, geri dönüşüm yok; Vatansız/VM için iyi, maliyet için kötü.
Replatform: K8s/simplifying bağımlılıklara geçiş (refaktörden daha az riskli).
Refactor/Repurchase: Taşınabilir desenler için yeniden yazın veya SaaS servisi ile değiştirin.
Retain/Retire: Taşımak zorunda olmadığınız şeyleri bırakın/devreden çıkarın.
Uygulama: Hizmetlerin kaydı ile başlayın (kritiklik, RTO/RPO, SLO, bağımlılıklar), geçiş dalgalarını derleyin (etki alanına göre).
5) Veri ve tutarlılık
Replikasyon/CDC: Postgres/MySQL için Debezium/log zorlama; Kafka konular için MirrorMaker2.
Çift yönlü senkronizasyon: sadece katı idempotency ve sürüm tuşları (vektör clock/updated_at) ile.
Veri tekilleştirme ile çift yazma - Kayıtlar, garantili teslimat için 'Idempotency-Key'/' event _ id' + giden kutusu/gelen kutusu olarak işaretlenir.
Paylaşım sahipliği: Çatışmaları önlemek için anahtar/kiracı başına lider bölge/bulut.
Nakit: yerel-bölgesel; Yalnızca etkinlikler/TTL aracılığıyla global (güçlü tutarlılığa sahip "paylaşılan" global önbellek yok).
6) Küresel trafik ve ağ
GSLB/DNS: gecikme/coğrafi yönlendirme + sağlık kontrolleri, kanaryalar/feilover için ağırlıklar.
Kullanıcıya yakınlık için Anycast/Edge/CDN, daha sonra - en yakın sağlıklı bölgeye/buluta yerleştirin.
Doğrudan kanallar: Çıkış/gecikmeyi azaltmak için bulutlar/on-prem arasında ara bağlantı/ExpressRoute/Direct Connect.
İstemci politikaları: kısa zaman aşımları, üstel geri alma + titreme, yinelemeli geri alma, yazma işlemlerinin idempotensi.
7) Güvenlik ve uyumluluk
Her yerde mTLS (mesh + SPIFFE/SPIRE veya yerel PKI).
KMS/HSM: Vault aracılığıyla soyut API; Anahtar segmentasyon yetki alanı/kiracı.
IAM: Birleşik Rol ve Grup Modeli (SCIM/SSO), En Az Ayrıcalık Politikası, Geçici Kimlik Bilgisi (STS).
Sırlar/rotasyon: belirteçlerin/şifrelerin otomatik rotasyonu; "uzun" statik tuşları engelleme.
Uyumluluk: PCI DSS/GDPR - veri yerleşimi, yalıtılmış denetim günlükleri, coğrafi bloklar.
8) Gözlemlenebilirlik, SLO ve Hata Bütçeleri
KIRMIZI/KULLANIM sinyalleri + izleri + tüm bulutlarda profiller; Tek günlük formatı (JSON + 'trace _ id').
Trace örneklemesi kuyruk tabanlı: save errors/p99, segments by 'cloud', 'region', 'tenant'.
Bulut/bölge + toplam başına SLO; burn-rate (çoklu pencere) ile uyarılar.
Kanarya panoları "göçten önce/sonra", regresyon raporu.
9) CI/CD ve yapılandırma yönetimi
GitOps: görüntü artifaktları tek, configs - per-environment/region via Helm values/Kustomize overlays.
Dış Sırlar Operatörü aracılığıyla Sırlar (AWS/GCP/Azure gizli depolarına köprüler).
Promo streams: dev> evreleme -- kanarya (bulut A) -- kanarya (bulut B) -- tam.
Serbest bırakma kapıları: Trafik ağırlığı büyümesinden önce SLO/Sentetik/Sözleşme testleri ödeme.
10) Maliyet ve FinOps
Bulutlar arasındaki çıkış oranlarını, RI/CUD/Tasarruf Planları indirimlerini, pazar yeri paketlerini düşünün.
Kural 80/20: En büyük iş riskinin yalnızca %20'sini transfer edin; Gerisi daha ucuz/daha kolay olduğu yerdir.
Altörnekleme metrikleri, soğuk depolama günlükleri, yollar üzerindeki sınırlar (bütçeye duyarlı örnekleme).
Kaynak etiketleme: 'env', 'team', 'service', 'tenant', 'cost _ center' - şeffaf faturalandırma için.
11) Göç planları (oyun kitabı)
11. 1 Hazırlık
1. Hizmetlerin/verilerin/bağımlılıkların envanteri; Hedef RTO/RPO/SLO.
2. Model (aktif-aktif vs aktif-pasif) ve ağ katmanı (GSLB/Anycast) seçin.
3. Hedef bulutta sanal alan hazırlama: K8s küme, ağ, gözlemlenebilirlik, sırlar.
11. 2 Çalıştırma ve doğrulama
4. Gölge trafiği: satışları etkilemeden istekleri yansıtma
5. Sözleşme testleri (OpenAPI/gRPC/CDC) ve anahtar yollar boyunca sentetikler.
6. CDC/replikasyon: sıcak veri senkronizasyonu, tutarlılık mutabakatı.
11. 3 Anahtarlama
7. Sınırlı bir kullanıcı/kiracı yüzdesine çift yazma (idempotent).
8. SLO kapıları ile aşamalı trafik kayması (%1 - %10 - %50 - %100).
9. Dondurmak/stateful hareketli; Son kesim kiralama; Son uzlaştırmaya kadar eski döngüyü "salt okunur'olarak tutun.
11. 4 Geçişten sonra
10. Denetim günlüklerini/günlüklerini denetleme, eski anlık görüntüleri arşivleme, çıkış/önbelleği optimize etme.
11. Yükseltme runbooks ve on-call eğitim.
12) DR ve hata tolerans testleri
GameDay: Tüm bulut/bölgenin bağlantısını kesmek; Gerçek RTO/RPO ölçümü.
Kaos enjeksiyonları: paket kaybı/çapraz bağlantı gecikmesinde artış, broker/baz düşüşü.
Otomatik bozunma bayrakları: "pahalı" özellikleri devre dışı bırakma, "bayat while-revalidate" önbelleğine geçiş.
13) Antipatterns
Veri sahipliği sözleşmeleri olmadan "temiz'aktif-aktif - çakışmalar/kopyalar.
Güçlü tutarlılıkla paylaşılan global önbellek - gecikme/tıkanıklık.
Idempotency olmadan Retrays - tekrarlanan yazmalar/siparişler.
Bulutlarda farklı günlük/iz biçimleri - korelasyon kaybı.
Tek bir IAM/gizli model eksikliği.
Dalgalar ve kapılar olmadan'tek seferde "göç.
14) iGaming/Finansın Özellikleri
Yargı bölgeleri ve veri ikameti: PII/ödeme günlükleri "ülke/bölge içinde" kalır, çapraz bulut - yalnızca toplu/anonim.
Ödeme sağlayıcıları: Çoklu PSP ve bulut/bölgeye göre akıllı yönlendirme; Webhooks - veri tekilleştirme özelliğine sahip global bir broker aracılığıyla.
Yaptırım/uyum filtreleri: bölgesel profiller; İzin verilen PSP'de hızlı yük devretme.
Genel üzerinde SLO "para yolları"; Sağlayıcı/bölge başına bireysel uyarılar/deshboard'lar.
Denetim: değişmez işlem günlükleri, iki bağımsız depoya senkronize yazma (WORM/S3 Nesne Kilidi).
15) Prod Hazırlık Kontrol Listesi
- Seçilen hedef model (taşınabilir çekirdek/aktif-aktif/standby); RTO/RPO/SLO tanımlanmıştır.
- IaC/GitOps: modüler Terraform/Helm/Kustomize; Tek örgü ve güvenlik politikaları.
- Gözlemlenebilirlik: Tüm ortamlarda OTel; günlüklerin genel biçimi; hatalarla kuyruk örneklemesi/p99.
- Veri: CDC yapılandırılmış; Dual-write idempotent; bir çatışma çözüm planı var.
- GSLB/DNS/Anycast и sağlık kontrolleri; SLO kapıları ile aşamalı trafik kayması.
- Sırlar ve KMS: Vault aracılığıyla soyutlama; rotasyon; Bölgelere göre segmentasyon.
- FinOps: değer modelleri, çıkış limitleri, etiketler ve kotalar; Maliyet raporları.
- Yapılan DR egzersizleri; Gerçek RTO/RPO, güncellenmiş çalışma kitaplarını ölçtü.
- API/olay sözleşmeleri her iki bulutta da doğrulanır; Webhook'ları izliyorum.
- iGaming/Finans için: veri ikameti, çoklu PSP yönlendirmesi, WORM günlükleri.
16) TL; DR
Taşınabilir bir çekirdek oluşturun (K8s + IaC + mesh + OTel + Vault) ve RTO/RPO/SLO iş hedefleri ve maliyeti için çoklu bulut deseni seçin. Aktarımı dalgalar halinde yapın: gölge trafiği - CDC - çift yazma - SLO kapıları ile aşamalı trafik. Idempotency ve giden/gelen kutusu, GSLB/Anycast üzerinden trafik, mTLS/KMS/Vault üzerinden güvenlik aracılığıyla verileri yönetin. IGaming için - sıkı veri ikameti ve çoklu PSP kuralları, "para" yolları için ayrı SLO'lar.