GH GambleHub

Operasyonel disiplin yönetimi

1) Amaç ve alan

Operasyonel disiplin, platformun günlük işleyişinin öngörülebilirliğini, güvenliğini ve verimliliğini garanti eden bir dizi kural, alışkanlık ve araçtır. Bu, iGaming için doğrudan geliri (mevduat/oranlar), mevzuata uygunluğu (KYC/AML/RG) ve itibarı (SLO, durum iletişimi) etkiler.

2) İlkeler

1. SLO-first: Kararlar erişilebilirlik/kalite hedefleri göz önünde bulundurularak verilir.
2. Standart Çalışma: Tüm kritik SOP'ta açıklanmıştır ve kontrol listeleriyle kontrol edilir.
3. Hata, sistemin sinyalidir: olaylar "suçluyu aramak" için değil, gelişmelere yol açar.
4. Asgari gerekli ayrıcalıklar ve SoD'lar: görevlerin ayrılması ve kanıtlanabilirlik.
5. Rutini otomatikleştirin, gerisini standartlaştırın.
6. Şeffaflık: gözlemlenebilirlik, durum sayfaları, açık metrikler.
7. Küçük değişiklikler: kısa döngüler, tersine çevrilebilirlik, kanarya sürümleri.

3) Roller ve Sorumluluklar (RACI)

Ops/SRE Başkanı - disiplin sahibi, bütçe, politika.
Hizmet Sahipleri (domain lead) - SLI/SLO, değişiklikler, risk değerlendirmesi.
On-call/IC (görev) - operasyonel çözümler, yükselmeler.
Comms Lead - harici/dahili güncellemeler, durum sayfaları.
Change Manager - Yayın ve değişim sürecini takip edin.
QA/Uyumluluk/Güvenlik - SoD kontrolü, denetimler, düzenleyici.
Eğitim Liderliği - eğitim, operatörlerin sertifikasyonu.

4) Dokümantasyon çerçevesi

SOP: adım adım prosedürler (başlatma/durdurma, planlı çalışma, PSP-feilover, fonların geri çekilmesi).
Runbooks: uyarılar üzerinde hızlı işlemler (diagnosis/fix/rollback).
Politikalar: SoD, erişimler (RBAC/ABAC), değişim yönetimi, post-mortemler, günlük depolama.
Kontrol listeleri: Serbest bırakılmadan/çalışmadan önce uçuş öncesi; Sonrası kontroller.
Kataloglar: sahipler, sağlayıcı kişileri, CMDB, SLI, SLO uyumluluğu.

5) Ritüeller ve döngüler

Her değişim:
  • Vardiya transferi (10-15 dakika), olayların/uyarıların/planlanan çalışmaların gözden geçirilmesi; Görev kontrol panellerinin kontrolü.
Günlük:
  • Stand-up Ops/SRE (15 dk): Yanma oranı, sıcak kuyruklar, risk pencereleri.
Haftalık:
  • 30-45 dakika için değişim kartı (CAB): serbest bırakma/iş planı, riskler/göçler.
  • uyarı incelemesi: yanlış/cevapsız, eşik ayarı.
Aylık:
  • Post-mortem kulübü: üst olayların analizi, geliştirmek için eylemler.
  • FinOps incelemesi: gözlemlenebilirlik/infra maliyeti, optimizasyonların verimliliği.
Üç ayda bir:
  • P1 egzersizleri (masa üstü/oyun günü), DR/Feilover doğrulaması, SLO revizyonu.

6) Değişim yönetimi

Sınıflar: Standart (önceden onaylanmış), Normal (CAB aracılığıyla), Acil Durum (IC/CL ve post-factum CAB aracılığıyla).
Kapılar: testler, güvenlik, uyumluluk, geri döndürülebilirlik, sürüm notları.
Teknikler: Kanarya/mavi-yeşil, özellik bayrakları, aşamalı haddeleme, zirve olayları için donlar.
Go/no-go kriterleri: Yeşil renkte SLO görünümü, yanma oranı yok, geri dönüş penceresi rezervi.
Kontrol listesi ile zorunlu yayın sonrası izleme (30-60 dakika).

7) Olaylar ve post-mortemler

P1-P4 sınıflandırılması, geçici SLA güncellemeleri (örneğin, P1: ≤10 dk ilk güncelleme, daha sonra 15-30 dk).
ChatOps/incident-bot: tek bir kart, var-room, timers, draft - durum sayfasında yayınla.
Suçlama olmadan ölüm sonrası: gerçekler, kök nedenler (bunlar, süreç, insanlar), önleme önlemleri; Yayın süresi ≤ D + 5.
Aktivite takibi: sahip, terim, ölçülebilir etki (SLO/gelir kolu).

8) Gözlemlenebilirlik ve kontrol

SLI/SLO: giriş, depozito, stavka - settl, para çekme; hata bütçeleri.
Altın sinyaller: gecikme, hata, trafik, doygunluk; İş SLI (auth-başarı, başarılı bahisler).
Uyarı: yanma oranı, dedup/histeresis/kotalar; Runbook demetleri.
Durum sayfaları: genel ve dahili; tarih, lokalizasyon, planlı çalışma.
Anormallikler: STL/CUSUM/CPD; bağlam (bültenler/bayraklar/sağlayıcılar).

9) Erişimler ve SoD'lar

En az ayrıcalık, JIT/PAM, denetlenmiş yükselme.
SoD/4-eyes: sonuçlar, bonuslar, PSP yönlendirme, PII dışa aktarma.
Telemetri erişim politikaları: PII yasağı, tokenizasyon, coğrafi sınırlar.
Üç aylık haklar ve anahtarlar incelemeleri; Sırların programa göre döndürülmesi.

10) Zahmet azaltma ve otomasyon

Otomatik işlem kataloğu: PSP-feiler, özellik bozulması, gecikmeye göre otomatik ölçeklendirme, PII dışa aktarma bloğu.
Korkulukları olan politikacılar: limitler, TTL, geri alma kriterleri.
Self servis araçları: sürüm şablonları, gösterge panoları, rapor üreteçleri, planlı çalışma biçimleri.
Tekrarlanan işlerin standardizasyonu - ROI ile otomasyon birikimleri.

11) Kalite kontrol ve denetim

Kalite KPI: MTTA/MTTR, zamanında post-mortemlerin %'si, şikayetlerden önce yakalanan olayların paylaşımı, durum güncellemelerinin doğruluğu, serbest bırakma disiplini (geri dönüşler olmadan).
KRI riski: DLQ büyümesi, yanma oranı süreci son tarihleri, PII ihracatındaki ani artışlar/SoD ihlalleri.
Denetim izi: WORM günlükleri, ilke sürümleri, durum mesajı dağıtımları.
Düzenleyici raporlar: SLA KYC/AML/sonuçları, ödeme işlemlerinin mevcudiyeti, olay geçmişi.

12) Eğitim ve sertifikasyon

Onboarding operatörleri: temel SOP'lar, uyarı, ChatOps, durum iletişimi.
Pratik alıştırmalar: P1 simülasyonları, DR-feilover, PSP-hatası.

Rol Sertifikası: IC/CL/Domain Lead - Sınav/Sertifika 12 ay

Malzemeler: video, adım adım simülatörler, test durumları, SSS.

13) Olgunluk modeli (L1 + L5)

L1 Reaktif: kaotik reaksiyon, SLO'lar yok, manuel sürümler.
L2 Yönetilen: SOP/uyarılar, CAB, durum sayfası, temel SLO'lar.
L3 Üretken: ChatOps, burn-rate, kanarya bültenleri, post-mortems.
L4 Önleyici: anomaliler, korkuluklarla otomatik işlemler, FinOps paneli.
L5 Kendi kendini iyileştirme: SLO-serbest bırakma kapıları, öngörücü sinyaller, "sıfır sürpriz" iletişim.

14) Operasyonel Disiplin Metrikleri (KPI/KRI)

İletişim disiplini: MTTA-İletişim, güncelleme aralıklarına uyum, kanal tutarsızlığı = 0.
Süreçler: Kanarya yuvarlama ile serbest bırakılanların yüzdesi, geri dönüşlerin payı, ortalama "izleme süresi".
Güvenilirlik: Sentetik/SLI ile tespit edilen olayların %'si, reaksiyon öncesi ortalama yanma hızı.
Otomasyon: Otomatik düzeltme oranı, operatör olmadan tamamlanan görevlerin oranı.
Finans: $/olay, RPS'de $/gözlemlenebilirlik, otomatik önlemlerden tasarruf.
Uyum: SoD ihlalleri, KYC/AML/sonuçları gecikme, denetim kusurları.

15) Uygulama Yol Haritası (6-10 hafta)

Ned. 1–2:
  • Mevcut süreçlerin denetimi, SLI/SLO kartı, SOP/politika kaydı, RACI rol ataması.
  • Vardiya iletim ve gün stand-up tanıtımı; Minimum CAB.
Ned. 3–4:
  • Durum sayfasının ve ChatOps botunun (MVP) başlatılması; İlk güncelleme şablonları; Yanma hızı uyarıları.
  • Post-mortemlerin katı şablonu, yayın süresi ≤ D + 5.
Ned. 5–6:
  • Kanarya sürümleri ve SLO sürüm kapıları; Korkuluklarla 5-7 otomatik işlem kataloğu.
  • FinOps gözlemlenebilirlik paneli; Üç aylık erişim/gizli incelemeler.
Ned. 7–8:
  • Egzersizler P1 (masa üstü), DR/Feilover şablonları; SOP/runbooks uzantısı.
  • Exec/Ops panolarındaki disiplin metrikleri; SLA durumu ve virgül kadansı.
Ned. 9–10:
  • Uyarı optimizasyonu (dedup/kotalar/histerezis), yanlış alarmların azaltılması.
  • IC/CL sertifikası; SoD/4-eyes düzenlemeler; Operasyonel bir rehber kitabın yayınlanması.

16) Eserler

Operasyonel El Kitabı: ilkeler, roller, ritüeller, metrikler, şablonlar.
SOP/Runbook Library: sürümlü, sahipleriyle ve inceleme tarihleriyle.
Politikayı Değiştir & CAB Charter: kriterler, formlar, kapılar, dondurulmuş takvim.
Olay İletişim Kiti: P1-P3 şablonları, yerelleştirme, ETA/ETR politikaları.
Erişim/SoD Matrix: Kim ne yapabilir, JIT/PAM, inceleme dönemi.
Eğitim ve Sertifika Paketi: planlar, testler, kontrol listeleri.

17) Antipatterns

Kapılar ve tersine çevrilebilirlik olmadan'bir hevesle "serbest bırakır.
"Ham" metriklerde çağrı cihazı, SLO/yanma oranı yok.
"Tip için" SOP - kontrol listeleri ve yürütme kontrolü olmadan.
Post-mortem ve eylemleri olmayan olaylar; Sistem değişiklikleri yerine suçu bulmak.
Günlüklerdeki/panolardaki/uyarılardaki PII; SoD yokluğu.
Durum sayfası ve güncelleme zamanlayıcıları olmadan monolitik iletişim.

Toplam

Operasyonel disiplin, bir organizasyonun çalışma şeklidir, bir dizi farklı düzenleme değildir. SLO düşüncesini, standartlaştırılmış SOP/Runbook'u, değişim disiplinini, gözlemlenebilirliği, ChatOps'u ve otomatik eylemleri korkuluklarla birleştirerek, öngörülebilir sürümler, hızlı olay yanıtları, sürdürülebilir gelir ve kanıtlanabilir uyumluluk elde edersiniz.

Contact

Bizimle iletişime geçin

Her türlü soru veya destek için bize ulaşın.Size yardımcı olmaya her zaman hazırız!

Entegrasyona başla

Email — zorunlu. Telegram veya WhatsApp — isteğe bağlı.

Adınız zorunlu değil
Email zorunlu değil
Konu zorunlu değil
Mesaj zorunlu değil
Telegram zorunlu değil
@
Telegram belirtirseniz, Email’e ek olarak oradan da yanıt veririz.
WhatsApp zorunlu değil
Format: +ülke kodu ve numara (örneğin, +90XXXXXXXXX).

Butona tıklayarak veri işlemenize onay vermiş olursunuz.