Operasyonlar ve Yönetim - Operasyonel Yönetim Etiği
Operasyonel Yönetim Etiği
1) Neden ihtiyacınız var
Operasyonlar sabit hız ↔ risk ↔ maliyet dengeleridir. Etik çerçeve, verilerin, paranın ve son teslim tarihlerinin baskısı altında, kullanıcıları ve paydaşları aldatmamak, gizliliği ihlal etmemek ve platformun uzun vadeli sürdürülebilirliğini baltalamamak için karar vermenize yardımcı olur.
Hedefler:- Takımlar ve he-calls için net kırmızı çizgiler ve davranış kuralları belirleyin.
- Olaylarda SLA'ların, metriklerin ve iletişimin bütünlüğünü sağlayın.
- Kullanıcıların/ortakların gizliliğini, verilerini ve haklarını korumak.
- Otomasyon ve yapay zekayı yönetilebilir, açıklanabilir ve güvenli hale getirin.
2) Temel ilkeler (çekirdek)
1. Önce güvenlik: Çözümler kullanıcılara/verilere zarar verme olasılığını artırmamalıdır.
2. Ölçüm dürüstlüğü: "Kozmetik" metrikleri yok, tek bir SSOT ve tekrarlanabilirlik.
3. Eylemlerin şeffaflığı: Kim ne yaptı, neden, hangi verilere dayanarak.
4. Sorumluluk ve hesap verebilirlik: rol - otorite - denetim - çıkarımlar.
5. Verileri en aza indirgemek: Yalnızca ihtiyacımız olanı topluyoruz, erişimi ve raf ömrünü sınırlıyoruz.
6. Açıklanabilir Ops/AI: Otomatik çözümler açık, geri dönüşümlü ve tartışılabilir.
7. Eşitlik ve ayrımcılık yapmama: Kural ve modellerde "önyargı yok" politikaları.
8. Suçsuz, ama öznesiz değil: hatalar sistemi değiştirmek için bir nedendir, gerçekleri gizlemek için değil.
3) Metrik Etiği, SLO/SLA ve Raporlama
Kurallar:- Metriklerin birleşik tanımları (pencereler, toplayıcılar), formül sürümleri.
- Bu yasaktır: Olayları "planlı çalışma'da gizlemek," güzel "SLA uğruna pencereleri/saat dilimlerini aktarmak, belgesel gerekçeler olmadan verileri hariç tutmak.
- Açık etiketleme: "tahmin", "tahmin", "gerçek", "istisna ve sebep".
- Postmortemler, "PR take'değil, gerçekler ve eylemlerle yayınlanır.
Anti-desenler: "p99'un iki versiyonu", raporların manuel olarak ayarlanması, "zirvesiz" seçici dönemler.
4) Gizlilik ve PII/ödeme verileriyle çalışma
Küçültme: varsayılan olarak, PII üretim döngüsünü terk etmez; günlüklerde/gösterge tablolarında maskeler.
Role göre erişim: en az ayrıcalık ilkesi; Hassas verilerin her okumasını denetleyin.
Saklama: net saklama, silme/anonimleştirme politikası.
Veri olayları: Düzenlemelere göre mal sahiplerinin/tüzel kişilerin derhal bildirilmesi.
Yasak: Gerçek PII'yi anonimleştirmeden sahne/analitiğe aktarmak; Sözleşme dışındaki satıcılarla paylaşın.
5) Olaylarda etik iletişim
Doğruluk ve zamanlama: ETA durumları, açık dil, ihmal yok.
Bireyleri suçlamayın: Gerçeklere ve sistemik nedenlere odaklanın.
"Sessiz" düzeltmeler yok: Kullanıcıyı etkileyen değişiklikler belirlenmelidir.
Spekülasyonu sınırlamak: "X'i kontrol ediyoruz, bir sonraki özet saat 20:15'te".
What is happening/who is affected/what we are doing/when the next update/where to follow
6) Operasyonlarda otomasyon ve AI etiği
Net çevre: AI/bot'un onay olmadan yapabileceği eylemlerin bir listesi (yalnızca geri dönüşümlü ve düşük riskli).
Açıklanabilirlik: her öneri için - kaynaklar ve argümanlar, yasak "referanssız".
HITL (döngüdeki kişi): Hassas eylemlerin onaylanması (trafik kaydırma, PSP değiştirme, limit değişikliği).
Denetim: Istemler/eylemler/kararlar günlüğü, kuru çalıştırma raporları.
Önyargı ve adalet: Bozulmalar için önerileri düzenli olarak kontrol etme (coğrafi, cihazlar, oyuncu türü).
AI için veriler: PII/sırlar "emme" yasağı; Kişisel olmayan vitrinlerin kullanımı.
7) Satıcı ilişkileri ve çıkar çatışmaları
SLO'da SLA/OLA: bağımlılıkların adil haritası; Satıcı kesintileri hakkında kamuya açık gerçekler.
Rakip çıkarlar: "Kişisel bonuslar/yönlendirme planları" nedeniyle mimari kararlar almamak.
İhalelerin ve pilotların etiği: karşılaştırılabilir testler, belgelenmiş zafer kriterleri.
Yasak: Sağlayıcı hatalarını'bizim'olarak gizleyin, karşılaştırma metriklerini "kazanan için" değiştirin.
8) Kırmızı Çizgiler (ayrık)
Verilerin ve raporların manipülasyonu.
Kullanıcıları/parayı etkileyen olayların gizlenmesi.
Korunmasız ortamlarda gerçek dünya PII'sinden yararlanın.
HITL ve geri alma planı olmadan geri dönüşü olmayan eylemlerin otomasyonu.
Çalışanlara metrikleri "süsleme" veya kapıyı atlama baskısı.
İhlal, durdurma bültenleri de dahil olmak üzere resmi bir soruşturma için bir tetikleyicidir.
9) Politikalar ve normlar (fragmanlar)
Dürüst Metrik Politikası:
- All metrics are described in the catalog with formula, window and owner.
- Formula change - via RFC and parallel run (old vs new).
- Any exceptions in the SLA are documented and signed by the parties.
Olay İletişim Politikası:
- First summary of 15 minutes, then ETA.
- Tone: facts, hypotheses are marked, references to artifacts.
- It is forbidden to promise deadlines without justification (progress/plan/resources).
AI/bot politikası:
- Allowed: summaries, tickets, requests for observability, annotations, pre-scale (reversibly).
- Requires confirmation: feilover, changing limits, enabling safe-mode, canary pause.
- Required: activity log, explainability, dry-run before use.
10) Roller ve sorumluluklar
Ops Başkanı: Etik politikaların sahibi, "durdurma vanası" yetkisi.
Olay yöneticisi: iletişimin kalitesi ve dürüstlüğü, post-mortemlerin kontrolü.
SRE/Gözlemlenebilirlik: SSOT metrikleri, denetim formülleri ve uyarıları, "kozmetiklere" karşı koruma.
DPO/Güvenlik: gizlilik, erişim, sızıntı soruşturmaları.
Yasal/PR: Yasalara/sözleşmelere uygunluk, dış iletişim.
Etki alanı komutları: kapılar, doğru veri ve eserler ile uyumluluk.
11) Gösterge panoları ve etik eserler
Metrik Bütünlüğü - Online↔DWH tutarsızlıklar, formül değişiklikleri, güncel olmayan paneller.
Olay İletişimi: ilk güncelleme zamanı, ETA uyumluluğu, özetlerin bütünlüğü.
Gizlilik ve Erişim: PII çağrıları, anormal talepler, saklama süreleri.
AI Yönetişim: Otomatik eylemlerin sayısı, kuru işlem payı, geri tepmeler, tartışmalı kararlar.
Satıcı Gerçeği: Sağlayıcıya göre olaylar, raporlarını ve SLO'larımızı harmanlamak.
12) Kontrol listeleri
Etik serbest bırakma kapısı:- Phicheflags ve bir geri dönüş planı vardır.
- SLO uyarıları ve ek açıklamaları dahil.
- Kapıları atlamak için "yukarıdan" baskı yoktur.
- Belgelenen riskler/istisnalar, kabul edildi.
- Zamanında ilk güncelleme ve ETA.
- Hipotezlerden ayrılan gerçekler, verilere yapılan referanslar.
- Ölçek/etkiyi küçümseme girişimi yok.
- Postmortem zamanında, eylemler planlandı.
- İzin verilen otomatik eylemlerin listesi onaylanmıştır.
- Log ve açıklanabilirlik etkin.
- PII kullanılmadı/maskelenmedi.
- Hassas işlemler için HITL.
13) Etik Olgunluk KPI
Metrik Bütünlük Puanı (sürüklenme Online↔DWH ≤ %2, sürüm formüllerinin payı ≥ %95).
Olay İletişim SLA'sı (ilk özet ≤ 15 dakika, ETA uyumluluğu ≥ %90).
Gizlilik İhlalleri = 0, PII'ye erişim payı = %100.
AI Güvenliği: Geri dönüşümlü otomatik eylemlerin payı = %100, geri tepme <%5, tartışmalı vakalar demonte = %100.
Islık Güvenliği Endeksi: anonim kanallar çalışır, çağrılar 7 gün ≤ sıralanır.
14) Anti-desenler
"Çimleri boyamak": metriklerde kozmetik, SLA'yı "geriye dönük olarak" yeniden tanımlıyor.
Son tarihler için "Bayraksız gece bültenleri".
Günlüğe kaydetmeden özel sohbetler ve çözümler.
Zehirli retro/ölüm sonrası, suçlama oyunu.
RAG/açıklanabilirliği olmayan AI, operasyonlarda kara kutu.
"Her ihtimale karşı" aşırı veri toplama.
15) Pratik dil (politikaya kopyalanabilir)
Operasyonel Etik Kuralları (alıntı):
We tell the truth about the state of the systems.
We do not hide incidents and do not distort metrics.
We protect user data and restrict access.
We automate only reversible and safe actions, the rest is through HITL.
We document decisions and respect the "stop crane."
Serbest bırakılması için Etik Hazır (DoER) Tanımı:
- SLO/guard rails are active; rollback plan checked.
- Changes of metrics/formulas are formalized by RFC and announced.
- No conflicts of interest, decisions made on data.
16) 30/60/90 - uygulama planı
30 gün:- "Kırmızı çizgileri", kodu, olay iletişimi ve gizlilik politikasını onaylayın.
- Sahipleri atayın (Ops Başkanı, DPO, Gözlemlenebilirlik).
- Metrics Integrity ve Incident Comms panellerini başlatın.
- Metrik formülleri ve SSOT için RFC uygulamak; Tartışmalı panelleri yeniden inşa edin.
- AI/botların çevresini resmileştirin (izin verilen eylemler, HITL, log).
- Çağrı üzerine ve alan yöneticileri için etik eğitimi yapmak.
- Denetim uyumluluğu, vaka/şikayetlerin gözden geçirilmesi, politikaların güncellenmesi.
- Etik KPI'ları takım OKR'leriyle ilişkilendirin (örn. Incident Comms SLA, Bütünlük Puanı).
- Verimlilikte retro ve "kırmızı çizgilerin" ayarlanması.
17) SSS
S: Bir işletme bir SLA raporunu'ince ayar "isterse ne olur?
C: Dürüst metrik politikasını ve SSOT'yi gerekçe göstererek reddedin. Bir alternatif sunun: Sözleşmeden kaynaklanan anlaşılabilir istisnalarla birlikte "kullanıcı deneyimi" metriği.
S: Yayın hızını ve etiği nasıl birleştiriyorsunuz?
C: Küçük artışlar, phicheflags, kanaryalar ve SLO autogates. Etik bir fren değil, pahalı hatalara karşı sigortadır.
S: Bir hatayı ne zaman alenen kabul etmek gerekir?
C: Etki her zaman kullanıcılar/ortaklar için aşikar olduğunda. Durum şablonu + eylem planı + son tarihler.