Model eğitimi
1) Amaç ve prensipler
Eğitimin amacı, RG/AML/Legal ile uyumlu iken iş metriklerini (Net Gelir, churn↓, fraud↓) geliştiren sürdürülebilir, tekrarlanabilir ve uygun maliyetli bir model elde etmektir.
İlkeler:- Problem - Metrik - Veri: ilk görev ve operasyonel metrik/hata maliyeti, sonra veri kümesi.
- Zaman içinde nokta: Hiçbir özellik/etiket geleceği kullanmaz.
- Tekrarlanabilirlik: sabit tohumlar/versiyonlar, eser kontrolü.
- Önce basitlik: temel modeller/özellik ile başlayın; sadece kanıtlanmış fayda ile karmaşıklaştırır.
- Tasarımla gizlilik: PII-minimizasyonu, ikamet, denetim.
2) Görev ve metriklerin resmileştirilmesi
Sınıflandırma: Churn/deposit/fraud/RG ^ PR-AUC, F1 @ operas. Eşik, KS, beklenen maliyet.
Regresyon/tahmin: LTV/GGR - WAPE/SMAPE, P50/P90 hatası, PI kapsamı.
Sıralama/öneriler: NDCG @ K, MAP @ K, kapsama/çeşitlilik.
Çevrimiçi metrikler: Net Geliri yükseltmek, TO/CVR, görüşme süresi (RG), kötüye kullanım oranı.
python best_thr = argmin_thr(cost_fp FPR(thr) + cost_fn FNR(thr))
3) Veri kümeleri ve bölümler
Zaman içinde birleştirme ve SCD uyumlu ölçümler.
Sınıf dengesizliği: tabakalı örnekleme, class_weight, odak kaybı, aşırı örnekleme nadir olaylar.
Zaman/Pazar/Kiracı Bölümleri: Sızıntılar için boşluk train↔val↔test.
sql
SELECT FROM ds WHERE event_time < '2025-07-01' -- train
UNION ALL SELECT FROM ds WHERE event_time BETWEEN '2025-07-01' AND '2025-08-15' -- val
UNION ALL SELECT FROM ds WHERE event_time > '2025-08-15' -- test
4) Özellik hazırlama
Pencereler ve birimler: 10m/1h/1d/7d/30d, R/F/M, hızlar/kesirler.
Kategoriler: Hashing/one-hot; Hedef kodlama (zamana duyarlı).
Normalleştirme/ölçekleme: trenden parametreler, yapaylarda kaydet.
Grafik/NLP/geo: bir parti oluşturun, Feature Store'da yayınlayın (çevrimiçi/çevrimdışı).
5) Temel algoritmalar
GBDT: XGBoost/LightGBM/CatBoost tablo verileri için güçlü bir veritabanıdır.
Lojistik regresyon/ElasticNet: yorumlanabilir/ucuz.
Danışma: LambdaMART, çarpanlara ayırma, seq2rec.
Anomaliler: İzolasyon Ormanı, AutoEncoder.
Zaman serisi: Prophet/ETS/GBDT-by takvim özellikleri.
6) Yeniden eğitimin düzenlenmesi ve önlenmesi
GBDT: 'max _ depth', 'num _ leaves','min _ data _ in _ leaf ',' subsample ',' colsample _ bytree ',' lambda _ l1/l2 '.
NN: bırakma/kilo kaybı/erken durma.
Erken durma: sabır ve minimum iyileşme ile val üzerinde metrik ile.
7) Hiperparametrelerin seçimi
Taslak arama için Grid/Random; İnce ayar için Bayesian/Hyperband.
Sınırlamalar: yineleme/zaman/maliyet bütçesi, val'de "aşırı sığdırma yok" (çoklu zaman bölmelerinde çapraz kontrol).
python for params in sampler():
model = LGBMClassifier(params, random_state=SEED)
model. fit(X_tr, y_tr, eval_set=[(X_val, y_val)],
eval_metric="aucpr", early_stopping_rounds=200)
log_trial(params, pr_auc=pr_auc(model, X_val, y_val), cost=cost())
8) Olasılık kalibrasyonu
Platt/İzotonik на tutma; Kalibrasyon fonksiyonunu bir obje olarak saklayın.
ECE/Relayability kontrol edin; Beklenen maliyete göre eşikleri yeniden müzakere edin.
9) Yorumlanabilirlik ve açıklamalar
Global: özellik önemi/SHAP, permütasyon katkısı.
Yerel: Birim çözümleri için SHAP (RG/AML vakaları).
Çevrimiçi açıklamaları kullanmanın risklerini ve kabul edilebilirliğini belgeleyin.
10) Tekrarlanabilirlik ve eserler
Tohum her yerde: veri/model/fit/split.
Artifaktlar: veri sürümü, özellik boru hattı, ağırlıklar, kalibrasyon, eşikler, yapılandırmalar.
Deterministik yapılar: sabit konteynerler/bağımlılıklar.
11) İzleme deneyleri
Kayıt oluyoruz: git-commit, veri kümesi/özellik sürümleri, model yapılandırması, metrikler (kapalı/çevrimiçi), eserler ve yorumlar.
Deneyleri adlandırma kuralları, etiketler (domain/market/model).
12) Çevrimdışı - çevrimiçi transfer
Birleştirilmiş dönüşüm kodu (Feature Store); Çevrimiçi/çevrimdışı eşdeğerlik testi.
Servis: REST/gRPC, zaman aşımları/retrays/önbellek; kanarya/aşama aşama çekilme.
Eşik/politika: Yapılandırılabilir (özellik bayrakları), denetim ve geri alma.
13) İzleme ve sürüklenme
Veri/oran: PSI/KL; eşikler aşıldığında uyarı verir.
Kalibrasyon ve metrikler: ECE, akış etiketlerinde PR-AUC/KS.
İş metrikleri: Net Geliri yükseltmek, kaydedilen dolandırıcılık, RG müdahaleleri, SLA.
Retrain tetikleyicileri: Sürüklenme/Mevsimsellik/Bültenler/Son Kullanma Tarihine göre.
14) Gizlilik, ikamet, adalet
PII minimizasyonu: takma adlar, CLS/RLS, bireysel eşlemeler.
İkamet: bireysel dizinler/anahtarlar (EEA/UK/BR); Bölgeler arası birleşmeleri sebepsiz yasaklamak.
Adalet: dilim analizi (pazar/cihaz/hesap yaşı), farklı etki, eşitlenmiş oranlar; Özelliklerin/eşiklerin/ağırlıkların düzeltilmesi.
15) Maliyet mühendisliği
Eğitim maliyeti: CPU/GPU saatleri, I/O, çalışma sayısı.
Çıkarım maliyeti: istek başına gecikme/maliyet; Online özellikler ve model boyutu sınırları.
Materyalizasyon: ağır özellikler - çevrimdışı; Çevrimiçi hızlı, önbelleğe alınmış.
Chargeback: Deneysel/yeniden oynatma bütçeleri.
16) Örnekler (parçalar)
LightGBM (sınıflandırma, Python taslağı):python params = dict(
objective="binary", metric="average_precision",
num_leaves=64, learning_rate=0. 05, feature_fraction=0. 8,
bagging_fraction=0. 8, lambda_l1=1. 0, lambda_l2=2. 0
)
model = lgb. train(params, train_data,
valid_sets=[valid_data],
early_stopping_rounds=200, verbose_eval=100)
save_artifacts(model, scaler, feature_spec, cal_model)
Nokta-in-time örnekleme (SQL fikri):
sql
SELECT a. user_pseudo_id, a. asof, f. dep_30d, f. bets_7d, lbl. churn_30d
FROM features_at_asof f
JOIN asof_index a USING(user_pseudo_id, asof)
JOIN labels lbl USING(user_pseudo_id, asof);
Beklenen maliyet tahmini ve eşik seçimi:
python thr_grid = np. linspace(0. 01, 0. 99, 99)
costs = [expected_cost(y_val, y_proba >= t, cost_fp, cost_fn) for t in thr_grid]
t_best = thr_grid[np. argmin(costs)]
17) Süreçler ve RACI
R (Sorumlu): Veri Bilimi (modeller/deneyler), Veri Eng (veri kümeleri/özellikler/Özellik Deposu), MLOps (hizmet/izleme/CI-CD-CT).
A (Sorumlu): Veri/CDO Başkanı.
C (Consulted): Uyumluluk/DPO (PII/RG/AML/DSAR), Güvenlik (KMS/sırlar/denetim), SRE (SLO/değer), Finans (ROI).
I (Bilgilendirilmiş): Ürün/Pazarlama/Operasyon/Destek.
18) Uygulama Yol Haritası
MVP (3-6 hafta):1. Görevler ve metrikler dizini (beklenen maliyet), zaman içinde nokta veri kümeleri.
2. Temel modeller (LogReg/GBDT) + kalibrasyon + model kartlar.
3. İzleme deneyleri, sabit tohumlar/eserler, tekrarlanabilir yapılar.
4. Kanarya çevrimiçi sörf, yapılandırma gibi eşikler, uyarı metrikleri/sürüklenme.
Faz 2 (6-12 hafta):- Bayesian/Hyperband seçimi, dilim analizi/adalet, yeniden eğitim tetikleyicileri.
- Ekonomi özelliği/çıkarım, önbellek/TTL, ters ibraz.
- Metrik/eşik formüllerinin dokümantasyonu, what-if simülasyonları.
- Çok bölgeli boru hatları, DR/egzersizler, WORM-yayın arşivi.
- Kalite/kalibrasyon raporlarının otomatik olarak oluşturulması, olaylara göre otomatik eğitim.
- Sıralı test ve otomatik kapatma ile A/B/n deneyleri.
19) Satış öncesi kontrol listesi
- Görev ve metrik iş uyumlu; hataların maliyetini hesapladı.
- Datacet point-in-time; Zaman/pazar bölünmesi lösaj yok.
- Seçim/düzenlilik, erken durma, olasılık kalibrasyonu.
- Model kart: veri, özellikler, metrikler, riskler, adalet, sahibi.
- Kaydedilen eserler (ağırlıklar, özellik boru hattı, kalibrasyon, eşikler).
- Çevrimiçi/çevrimdışı eşdeğerlik testi geçti; Bir özellik bayrağı ile sörf.
- Sürüklenme/kalibrasyon/iş metriklerini izleme; Geri alma/geri alma planları.
- PII/DSAR/RTBF politikaları, ikamet ve erişim denetimi takip edilmektedir.
- Eğitim/çıkarım maliyeti bütçeye dahildir; SLA uyarıları.
20) Anti-kalıplar ve riskler
Lakage: Geleceğin özellikleri/etiketleri, koordine edilmemiş SCD.
Bir şaft numunesinde "maviye" ayarlama: geçici bölünme/çapraz kontrol yok.
Kalibrasyon ve maliyet eşikleri yok.
Uyumsuzluk çevrimiçi/çevrimdışı özelliği: prod üzerinde farklı sonuçlar.
Adalet/dilimleri yok sayar: pazarlarda/cihazlarda gizli hatalar.
Sınırsız tekrarlar ve pahalı özellikler: Fayda olmadan yükselen değer.
21) Alt satır
Model eğitimi yönetilebilir bir süreçtir: net görev ve metrik, zaman içinde disiplin, düzenli hale getirme, kalibrasyon ve tekrarlanabilirlik ile akıllı ayarlama, çevrimiçi ortama şeffaf aktarım ve kalite, maliyet ve riskin sürekli izlenmesi. Bu oyun kitabını izleyerek, ürün, saklama ve uyumluluğu hızlı, etik ve güvenilir bir şekilde iyileştiren modeller elde edersiniz.