Karar zekası
Karar zekası
Karar Zekası (DI), verileri yönetilebilir kararlara ve ölçülebilir bir etkiye dönüştüren bir disiplindir. DI, nedensellik, tahmin, karar ekonomisi, politika tasarımı ve MLOps/operasyonlarını tek bir yaşam döngüsünde birleştirir.
1) DI Çerçevesi: OODA/SSDL
Gözlem (Sinyal): standartlaştırılmış olaylar, kalite/tazelik, dedup ve bağlam.
Orient (Sense): yorumlama: kohortlar, segmentler, nedensel grafikler, risk profilleri.
Karar verin: politika (kurallar/modeller/haydutlar), sınırlamaların dikkate alınması ve hataların maliyeti.
Eylem: eylemlerin düzenlenmesi, kanallar, idempotence, öncelikler.
Öğrenin: nedensel etki tahmini, eşikleri/politikaları/modelleri güncelleyin.
2) Çözümlerin ekonomisi
Değer fonksiyonu: gelir/muhafaza edilen hasarlar/elde tutma/hizmet kalitesi.
Hata maliyeti: Para ve riskte FP/FN (RG/uyumluluk/itibar).
[
EV = p_{\text{uspekh} }\cdot Value - p_{\text{vred} }\cdot Harm - Cost
]
'EV≥0've korkuluklar normalse harekete izin verilir.
Risk iştahı: FPR sınırları, müdahalelerin sıklığı, zarar/şikayet bütçesi, hata bütçesi.
3) Nedensellik ve prognoz
Tahmin yeterli olduğunda: düşük riskli tahsisler, olasılıklara göre sıralama.
Nedensellik gerektiğinde: ROMI, fiyat/limit politikası, güvenlik/uyumluluk. A/B, DiD, RDD, IV, sentetik kontrol kullanın; Hedefleme sırasında - yükseltme ve CATE.
Karşıolgusal döngü: Tahmin - etki - etki - yükselme/eşiklerin dönüşümü.
4) Politika türleri
Kurallar (kod olarak politika): deterministik, açıklanabilir; Üs ve emniyetli.
Skora dayalı: olasılıklar/oran, histerezis, maliyete duyarlı eşikler.
Bağlamsal (haydutlar): ε -greedy/Teklifleri/kanalları seçmek için Thompson.
Sıralı (RL): Çok adımlı kısıtlı (güvenli RL) stratejiler.
Bileşenler: kaskad - güvenlik/uyumluluk - ekonomi - UX.
5) DI mimarisi
Veri: kanonik olaylar (UTC, sürümler), fichestor (çevrimiçi/çevrimdışı eşlik), dizin.
Modeller: kayıt defteri/versiyonlar, kalibrasyon, sürüklenme izleme (PSI/KL), PR- % AUC/Recall@FPR≤x.
Semantik ve metrikler: tek bir KPI/korkuluk sözlüğü, SLO tazeliği.
Politika Motoru: karar tabloları, ABAC/bağlamlar, histerezis, oran sınırları, öncelikler.
Eylem orkestratörü: garantili teslimat, retrai, idempotency'action _ id ', DLQ.
Gözlemlenebilirlik: trace 'correlation _ id', huni "sinyal> karar> eylem> sonuç".
Güvenlik: RLS/CLS, PII maskeleme, erişim ve karar günlüğü.
6) DI Metrikleri
Çözümlerin kalitesi
Karar Hassasiyeti/Hatırlama: eylemlerin gerçek başarısı ile.
Pişmanlık/Fırsat Kaybı: Optimal politikanın gerisinde kalmak.
Kapsam: Eylem alan nesnelerin oranı.
Gecikme p95: Sinyal - Karar/Karar - Eylem.
Adalet/Zararlar: segment hata farkı, şikayetler, itirazlar.
İş etkisi
ROMI/ROI eylemleri, uplift @ k, Qini/AUUC.
Net Fayda: Etki − maliyet − zarar.
Etki Zamanı: Sinyalden ölçülebilir sonuca kadar geçen süre.
7) Karar tasarımı
1. Soruyu bir etki olarak çerçeveleyin: "Y bölü T'de X'in bekletme kazancı nedir?"
2. Bir DAG çizin, karıştırıcıları/çarpıştırıcıları tanımlayın.
3. Tasarım seçin: A/B, yarı deney veya net tahmin + ex-post puanı.
4. Eylem ve alternatifleri, kısıtlamaları ve korkulukları tanımlayın.
5. Değer fonksiyonunu ve risk bütçesini ayarlayın.
6. Karar tablosundaki politikayı açıklayın: koşullar - eylem - kanallar - dolum süresi.
7. Değerlendirmeyi planlayın: etki metrikleri, süre, CATE segmentleri.
8. Olay runbook ve fallback kurallarını tanımlayın.
8) Histerezis, frekans ve çarpışmalar
Histerezis: giriş/çıkış eşikleri farklıdır; Müdahalelerin "yanıp sönmesini" önler.
Bekleme süresi: aynı nesne üzerindeki kişiler/kısıtlamalar arasında duraklatır.
Politika çatışmaları: öncelik matrisi; "Güvenlik önceliklidir".
Kotalar/Oran sınırı: kanal, segment, kullanıcı başına; adil dağıtım.
9) Özerklik seviyeleri
1. Ad-hoc: Bir kişi yeterli veri olmadığına karar verir.
2. Destekli: Sistem bir çözüm + açıklama sunar.
3. Otomatik: Korkuluklarda otomatik çözümler.
4. Uyarlanabilir: otomatik ayarlama eşikleri/tekliflerin seçimi (haydutlar).
5. Güvenli Özerklik: Resmi kısıtlamalar ve denetim altında özerklik.
10) Belirsizlik altındaki çözümler
Senaryo planlama: temel/stres/aşırı; Etki aralıkları.
Sağlamlık: Parametrik hatalara karşı dayanıklı bir strateji.
POMDP sezgi: eksik bilgi ile hareket; Bilginin maliyetine değer verir (hangi deneyin yapılacağı).
Bayesian güncelleme: Tarihsel bilgi ve mevcut verileri birleştirin.
11) Model ↔ politika diyaloğu
Model, sonuçların oranını/dağılımını üretir.
Politika hataların maliyetini, sınırlamaları ve adaleti dikkate alır.
Bölüm satırı, bir sürüm günlüğü ile açık bir karar eşiği politikasındadır.
Eşik revizyonu - EV ile, sadece ROC/PR ile değil.
12) Belgeler ve eserler
Politika Pasaportu (şablon)
Kod/sürüm, amaç ve etkinin KPI'sı
Koşullar/özellikler/model, histerezis/cooldown
Eylemler ve kanallar, öncelikler ve karşılıklı istisnalar
Korkuluklar (% FPR≤x, gecikme p95≤y, RG/uyumluluk)
Puan: test tasarımı, metrikler, süre
Denetim/Kullanıcıya Açıklama, Sahipler
Karar Tablosu (örnek)
"Uçtan uca" çözüm günlüğü şeması
'signal _ id' - 'decision _ id' -'action _ id '-' outcome _ id '(+' correlation _ id ').
13) Yönetişim ve uyum
Metriklerin ve formül sürümlerinin birleştirilmiş sözlüğü.
Politika Komitesi: Risk Sorumlusu, Ürün, Veri, Uyumluluk.
Kararların denetimi: açıklamalar, reddedilme nedenleri, itiraz kanalları.
Etik ve adalet: Hataları gruba göre izlemek; Korunan özelliklerin yasaların gerektirdiği durumlarda kurallardan hariç tutulması.
14) Sık yapılan hatalar
İş etkisi yerine proxy metriklerinin optimizasyonu (Goodhart).
Kafa karıştırıcı tahminler ve nedensellik; ROMI "korelasyon ile".
Histerezis ve bekleme sürelerinin olmaması - spam/" yanıp sönme"
Hataların ve kullanıcı zararının hesaplanmamış maliyeti.
Sürümler ve changelog olmadan eşiklerin/formüllerin sessiz düzenlemeleri.
Etki değerlendirmesi ve "döngü kapatma" içermeyen eylemler.
15) Yayın Öncesi DI Politikası/Sistem Kontrol Listesi
- Amaç nedensel etki olarak belirtilir, değer fonksiyonu ve risk bütçesi verilir
- DAG çekildi; Değerlendirme tasarımı (A/B/DiD/SC) ve seçilen metrikler
- Politika karar tablosunda açıklanmıştır; Histeresis/cooldown/öncelikler var
- Modeller kalibre edilir; Hata maliyetinden elde edilen eşikler (EV)
- Eylemlerin orkestratörü idempotenttir; signal - karar - eylem - sonuç Log Enabled
- Korkuluklar ve uyarılar yapılandırılmıştır; Runbooks ve fallback kuralları hazır
- Gösterge tabloları: kararların hunisi, etkisi (yükseltme/YG), zarar/şikayetler, adalet
- Sürümler/sahipler/erişim hakları/uyumluluk belgelendi
Toplam
Karar zekası bir dizi model değil, bir sistemdir: tekdüze veri ve metrikler - etkinin nedensel ve ekonomik bir görünümü - açık politikalar ve güvenli orkestrasyon - titiz değerlendirme ve sürekli öğrenme. Böyle bir sistem riski azaltır, YG'yi arttırır ve kararları tekrarlanabilir, açıklanabilir ve yönetilebilir hale getirir.