Operasyonlar ve Yönetim - Değişim Yönetimi
Değişim Yönetimi
1) Amaç ve prensipler
Amaç, değişimi hızlı ve güvenli bir şekilde sağlamak, olay riskini, aksama süresini ve düzenleyici ihlalleri azaltmaktır.
İlkeler:- Öngörülebilir ve Geri Döndürülebilir: Her değişiklik planlı, doğrulanabilir ve geri döndürülebilir.
- Risk bazlı: Kontrol derinliği riske bağlıdır (yargı alanları, para, PII).
- Küçük ve Sık: Küçük artışların değerlendirilmesi ve geri alınması daha kolaydır.
- Önce otomasyon: kod olarak altyapı, testler, doğrulamalar, otomatik kontroller.
- Tek Gerçek Kaynağı: Tek bir RFC/bilet, tek bir takvim ve eylem günlüğü.
2) Kapsam
Ürün kodu (arka uç/ön uç, mobil SDK).
Altyapı (IaC, Kubernetes/VM/CDN/Edge).
Veriler (DB diyagramları, göçler, vitrinler/ETL).
Konfigürasyonlar ve özellik bayrakları.
Entegrasyonlar (PSP, KYC, oyun sağlayıcıları).
Güvenlik ve erişim politikaları.
3) Roller ve RACI
Sahibi-Sorumlu değiştir.
Release Curator/RelEng - Release Tren Koordinasyonu.
SRE/Ops - operasyon, SLO/SLA kapısı.
Güvenlik/Uyumluluk - Risk ve uyumluluğu gözden geçirin.
CAB (Değişim Danışma Kurulu) - normal/yüksek riskli değişikliklerin onaylanması.
İş Paydaşları/Destek - Bilgilendirilmiş.
4) Değişikliklerin sınıflandırılması
Standart (tipik, önceden onaylanmış): sık, düşük riskli, hazır oyun kitabı (örn. bayrak güncellemesi, tuş döndürme).
Normal: RFC, değerlendirme, olası CAB, testler ve geri alma planı gerektirir.
Acil durum: P1 olayları için acil düzeltmeler; Minimal bürokratik yol, post-factum incelemesi/SAW.
5) Yaşam döngüsünü değiştirin
1. Tetik (RFC): Amaç, kapsam, risk, etkilenen hizmetler/bölgeler, geri dönüş planı.
2. Risk değerlendirmesi: Etki × Olabilirlik matrisi, SLO/uyumluluk/değer üzerindeki etki.
3. Planlama: pencere, bağımlılıklar, geçişler, iletişim, doğrulama testleri.
4. Doğrulama: otomatik testler, statik analiz, güvenlik kontrolü, performans çalışması.
5. Dağıtım: ilerici strateji (§ 8'e bakınız), telemetri ve bahçıvanlar.
6. Gözlem: yanma oranı SLO, uyarılar, iş metrikleri (GGR/NGR, dönüşüm).
7. Tamamlama: sonuç kabulü, dokümantasyon güncellemesi, sapmalar için post-mortem.
6) RFC: minimum kompozisyon
Bağlam: Neden değişim, etki hipotezi.
Menzil: sistemler, bölgeler, müşteri versiyonları.
Risk: matris ve arıza senaryoları, patlama yarıçapı.
Dağıtım planı: adım adım, go/stop kriterleri ile.
Geri alma planı: komutlar/adımlar, başlangıç koşulları, RTO/RPO beklentileri.
Test planı: Önce/sonra kontrol ettiklerimiz (işlevsellik, performans, güvenlik).
İletişim: kime bildirdiğimiz, mesaj şablonları.
Denetim: Biletlere bağlantılar, taahhütler, CI/CD eserleri.
7) Takvimi ve pencereleri değiştirme
Tek takvim: tüm sürümler, geçişler, özellikleri kapatın, harici etkinlikler (spor/pazarlama/tatil).
Pencereleri dondurun: büyük satışlar/şampiyonluklar/yoğun saatler, vergi raporları.
Girişim politikası: Aynı kritik yollarda çakışan değişiklikleri önleyin.
Bölgesel dalgalar: önce "sıcak" bölgeler/düşük trafik, sonra - ana olanlar.
8) Teknik dağıtım stratejileri
Kanarya: trafiğin küçük payı - metriklerin karşılaştırılması (p95 gecikme, hata %, dönüşüm).
Mavi-Yeşil: Paralel ortamlar, atomik rota değiştirme.
Aşamalı Teslimat: Otomatik durdurma koşullarına sahip yüzde dağıtımı.
Özellik Bayrakları: fonksiyon anahtarları, kill-switch, A/B
Karanlık Başlatma/Gölge Trafiği: kullanıcıları etkilemeden gölgeleri kontrol etme.
Adım limitleri: QPS/rekabet gücünde kademeli artış.
Gardrails: p95/hata % eşikleri aşıldığında otomatik durdurma, geri dönüşler/ters ibrazlar artar, yetkiler/depozitolar düşer.
9) Veri ve şema değişiklikleri
Uyumluluk: eklemeli geçişler - hem eski hem de yeni şemayı okuyan kod.
İki fazlı geçişler: (1) yeni alanlar/indeksler ekleyin - (2) anahtar kodu - (3) eski silin.
Sözleşme sürümleri: Avro/Protobuf şemaları kayıt defteri ile; Geri/ileri uyumlu.
Büyük hacimli geçişler: gruplar, duraklamalar, idempotency, kontrol noktaları ve ilerleme.
Felaket toleransı: RPO/RTO testi, anlık görüntüler, kurtarma provaları.
BI verileri: vitrin/metrik değişimi - MR/SR ve metrikler sözlüğü (ID, formül) aracılığıyla.
10) Yapılandırma ve gizli yönetim
Veri Olarak Yapılandırma: sürüm yapılandırmaları, şema tarafından doğrulama, çevre yoluyla tanıtım.
Sırlar: anahtar rotasyon, minimum ayrıcalık ilkeleri, taleplerin denetlenmesi.
Bölgesel geçersiz kılmalar: sınırlar/ortaklar (PSP/KYC) - parametrelendirme yoluyla, kod çatalları yoluyla değil.
11) Uyumluluk ve denetim (iGaming bağlamı)
Değişikliklerin izleri: kim/ne zaman/ne değişti (bayraklar, yapılandırmalar, yollar, geçişler).
Görevlerin Ayrımı: Yazar, yorumcu ve deploer (SOX benzeri) için farklı roller.
Düzenleyici raporlar: sabit sürümler, yerleşimlerin sürüm kontrolü (GGR/NGR, bonuslar), PII'ye erişimin kontrolü.
Sağlayıcılar: SDK/sağlayıcı sertifikalarının sabit sürümleri, SLA yükümlülükleri.
12) İletişim
Uyarı şablonları: yayınlanmadan önce (ne/ne zaman/riskler), sırasında (durum, % trafik, metrikler), sonrasında (toplamlar).
Harici mesajlar: Müşterileri etkilerken afişler/durum sayfası.
Koordinasyon: # release-war-room kanalı, yayın sahibi, güncelleme frekansı.
13) Performans metrikleri
DORA: Dağıtım Frekansı, Değişiklikler için Teslim Süresi, Değişim Hatası Oranı (CFR), MTTR.
SLO Etkisi: SLO'da yayın öncesi/sonrası zaman paylaşımı.
Geri Dönüş Oranı - Değişim kategorisine göre geri dönüşlerin sıklığı.
Release Debt: bekleyen göçler/limbo özellik bayrakları.
İş Etkisi: dönüşüm, KYC TTV, yuvarlanırken başarı oranı PSP, GGR/NGR sürüklenme.
14) Anti-desenler
Big-bang bültenleri: Bir seferde birçok değişiklik - regresyonun nedenini anlamak zor.
Uyumsuz geçişler: alanları çift okumadan silme/yeniden adlandırma.
Sahipsiz bayraklar ve kaldırma için son tarihler: mantığın "ebedi" dalları.
Telemetri ve durdurma ölçütleri olmadan yayınlar: "gözle've hasarın geç tespiti.
Takvimi yok sayma: zirve olayları/kampanyaları olan kesişimler.
Oyun kitapları ve denetim olmadan manuel adımlar: yüksek değişkenlik ve risk.
15) Kontrol listeleri
Başlamadan Önce (RFC Ready)
- Değişim hedefi ve KPI'lar formüle edilmiştir
- Risk ve patlama yarıçapı değerlendirildi, değişim sınıfı seçildi
- Dağıtım planı ve Backout adım adım yazılır
- Sahne/kanarya üzerinde bir test planı ve sonuçları var
- İletişim ve takvim güncellendi, paydaşlar bilgilendirildi
Yuvarlanma sırasında
- p95/hata % metrikleri, iş sinyalleri ve günlükleri gerçek zamanlı olarak izlenir
- İlerleme adımları kontrol noktaları tarafından onaylanır
- Gardrails operasyonunda - otomatik durdurma ve geri alma
Sonra
- Kaydedilen yayın sonuçları (changelog, sürümler, eserler)
- Sapmalar için ölüm sonrası (≤ 5 iş günü)
- Borçlar (bayrak silme, son geçişler) sahipleriyle birlikte kaydedilir
16) Mini şablonlar
RFC Şablonu (Kısa):- Amaç/hipotez
- Kapsam ve etkiler (hizmetler, bölgeler, veriler, müşteriler)
- Etki × Olasılık ve azaltma önlemleri
- Rolling planı (adımlar, % trafik, go/no-go kriterleri)
- Geri çıkış planı (adımlar, RTO/RPO, veri)
- Test planı (fonksiyonel/performans/güvenlik)
- İletişim (kanallar, frekans)
- Eserler (biletler, PR, yapı numaraları)
- Değişiklik: "Ödemeler-Hizmet v2. 14 + psp_limits geçiş"
- Pencere: 2025-11-02 00: 00-01: 00 EET
- Etkilenen bölgeler: AB, LATAM (%10 - %50 - %100)
- Riskler/bahçıvanlar: hata %> 2 %10 dk - dur ve geri al
- İletişim: @ Owner, @ SRE-on-call, @ Support-lead
- Tetikleyiciler: p95> + %25 10 dakika, PSP başarısı <%97
- Adımlar: (1) trafik −→ v2'de %0. 14; (2) bayrakları v2'ye geçirin. 13; (3) anlık görüntü/kontrol noktası aracılığıyla geçiş geri alma; (4) duman testleri; (5) Rapor.
17) Serbest bırakma treni ile entegrasyon
Release Train: sabit yuvalar (örn. Haftada 2 ×), birleştirme kesim SLA.
Düzeltme politikası: bireysel trenler/şubeler, prod için hızlı yol.
Sürüm oluşturma: semver, yapıt ve ortamlarda etiketler, SBOM.
18) Alt satır
Değişim yönetimi hız freni değil, güvenli hızlanma mekanizmasıdır. Risk tabanlı sınıflandırma, iyi RFC'ler, aşamalı haddeleme, uyumlu veri geçişleri, net iletişim ve ölçülebilir etki, bültenleri yönetilebilir, tekrarlanabilir ve denetlenebilir bir sürece dönüştürür.