Kişiselleştirme modelleri
Kişiselleştirme modelleri
Kişiselleştirme, verilerin, modellerin, görüntüleme politikasının, eylemin, geri bildirimin olduğu bir sistemdir. Amaç, kısıtlamaları (etik/RG, frekans kapakları, çeşitlilik, tazelik, SLA) karşılarken artan değeri (gelir/elde tutma/memnuniyet) en üst düzeye çıkarmaktır.
1) Veriler ve görüşler
Hammadde: olaylar (görünümler/tıklamalar/oyunlar/satın almalar/para yatırmalar), içerik kataloğu (öznitelikler), kullanıcı profilleri, bağlam (zaman/coğrafi/cihaz/kanal), kalite sinyalleri (bot/dolandırıcılık).
Fici:- Kullanıcı: RFM, kategori tercihleri, fiyat hassasiyeti, günün saati, cihaz.
- Öğe: tür/kategori, stüdyo/sağlayıcı, dil, fiyat/volatilite, "tazelik".
- Bağlam: Dow/hod, promosyon/etkinlikler, oturum, giriş kanalı.
- Gömme: kullanıcı/öğe ortak çalışma alanları (MF/Word2Vec2Rec/transformatörler), multimodal (metin/görüntüler).
- Kalite: point-in-time (yüzler olmadan), UTC-time, olayların idempotence, PII maskeleme.
2) Temel paradigmalar
1. İçerik tabanlı - adres ve kullanıcı profilinin özelliklerine göre yakınlık.
2. İşbirlikçi filtreleme (CF) - etkileşim sinyallerine dayalı benzer kullanıcılar/aytemler.
3. Matris çarpanlarına ayırma/gömme - gizli faktörler, puan için nokta çarpım/MLP.
4. Learning-to-Rank (LTR) - sıralama listeleri için degrade artırma/sinir ağları (pairwise/listwise).
5. Katmanın yeniden sıralanması - çeşitlendirme/yenilik/kısıtlamalar dikkate alınarak işlem sonrası.
6. Bağlamsal haydutlar - keşif-sömürü ile çevrimiçi öğrenme.
7. RL/seq-önerileri - yol/oturum optimizasyonu (çok adımlı ödül).
3) Karar boru hattı
1. Geri çağırma (hızlı aday seçimi, 200-5k): Gömme ile ANN, kural-taban/kategori, popülerlik.
2. Sıralama (tam puanlama, 20-200): Zengin özelliklere sahip LTR/MLP.
3. Yeniden Sıralama/Politika (Fin. list, 5-30): Çok amaçlı optimizasyon + kısıtlamalar ve çeşitlendirme.
4. Eylem: göstermek/itmek/e-posta/kişisel vitrin ağız korumaları ve "sessiz bir saat'ile.
5. Geribildirim: örtük/açık sinyaller - yeniden eğitim/haydut-güncelleme.
4) Çok amaçlı hedefler ve sınırlamalar
Hedefler: TO/CTCVR, tutma, gelir, marj, LTV, memnuniyet, hız.
Kısıtlamalar: temas sıklığı, RG/uyumluluk, kategori çeşitliliği, marka/sağlayıcı kotaları, adalet.
[
\ max\sum _ i w_i\cdot\text {Amaç} _ i\quad
\ text {s. t. }\text {caps, RG, diversity, SLA}
]
Uygulama: Hızın kurallarla birleştirildiği politikaya duyarlı yeniden sıralama (bkz. § 7) yapın.
5) Soğuk başlangıç ve küçük veriler
Yeni kullanıcılar: segmente/kanala/coğrafyaya göre popülerlik, ankete/ilk tıklamaya göre içerik tabanlı, geniş zekalı haydut.
Yeni aitemler: içerik gömme (metin/etiketler), meta veriler, sağlayıcıya/türe göre "benzer görünme".
Birkaç çekim: transfer/paylaşılan kule gömme.
6) Puanlama metrikleri
Çevrimdışı
Sınıflandırma/sıralama: AUC/PR-AUC, NDCG @ k, MAP, Recall @ k.
İş: eCPM/eRPM, beklenen gelir/marj, LTV proxy.
Çok amaçlı: ağırlıklı metrikler (örn. Kazanç = değer ile NDCG).
Kalibrasyon: Brier, ECE (olasılıklar için).
Списки: kapsam/çeşitlilik/yenilik/şans.
Online
A/B ve haydut testleri: TO, CTCVR, gelir/oturum, D1/D7 tutma, şikayetler/abonelikten çıkma (korkuluklar), gecikme/SLA.
Artış: kaldırma %, karmaşık randomizasyonda CUPED/yarı-deneyler.
7) Çeşitlendirme ve politikaya duyarlı yeniden sıralama
MMR/PM-2/xQuAD: "alaka düzeyi × yenilik" dengesi.
Kotalar: Tür/sağlayıcı/risk kategorisine göre min/max.
Adalet: Sistematik eğrilmekten kaçınmak için paylaşımları sınırlayın.
[
\ textstyle\text {Score} =\alpha\cdot\hat {p} _ {\text {click} +\beta\cdot\text {Value} -\gamma\cdot\text {Yorgunluk} +\delta\cdot\text {Yenilik}
]
Histerezis: listeleri "göz kırpmayın"; Atalet içeren öğeleri güncelleyin.
8) Bağlamsal Haydutlar ve RL'ler
Haydutlar (LinUCB, Thompson): hızlı çevrimiçi öğrenme, keşif kontrolü. İlk pozisyon/yaratıcı/kanal için iyi.
Basamaklı haydutlar: top-k optimizasyonu.
RL (DQN/Policy Gradient/SlateQ): oturum kişiselleştirme, çok adımlı ödül optimizasyonu (geri dönüş/gelir/uzun oturum).
Güvenlik: politika dışı değerlendirme (IPS/DR), simülatörler, araştırma için kapaklar, güvenli RL.
9) Nedensel etki için kişiselleştirme
Yükseltme modelleri: kime dokunulması gerektiği (ikna edilebilir), Qini/AUUC, yükseltme @ k.
Tedaviye duyarlı sıralama: Ham TO yerine artış olasılığını ekleyin.
Korkuluklar: Rahatsız Etmeyin segmentleri, RG kuralları, adalet.
10) Mimari ve MLOps
Feature Store: Oturum özellikleri için online/offline parite, point-in-time, TTL.
Aday hizmetler: ANN/FAISS/ScaNN, segmente göre önbelleğe alma/parçalama.
Ranker: gradyan artırma/MLP/kule mimarileri, kalibrasyon.
Politika/Yeniden sıralama: kurallar/kısıtlamalar, çeşitlendirme, haydut katmanı.
Orkestrasyon: talep idempotency, p95 gecikme ≤ 100-300 ms, DLQ/retray.
Gözlenebilirlik: Korelasyon _ id izi, PSI, kalite metrikleri, stopcock.
11) Güvenlik, gizlilik, etik
PII minimizasyonu: tokenizasyon, RLS/CLS, maskeleme.
Açıklanabilirlik: en iyi özellikler/gösterme nedenleri; Temyiz yolu.
Etik/RG: Frekans sınırları, "sessiz saatler", savunmasız gruplardan gelen agresif tekliflerin yasaklanması.
Uyum: Kararların/günlüklerin, politikaların ve reklam öğelerinin sürümlerinin denetimi.
12) Pasaportlar ve karar tabloları
Referans sertifikası (örnek)
ID/sürüm: 'REC _ HYBRID _ RANK _ v5'
Geri çağırma: ANN (kullanıcı/öğe gömme), top-500
Ranker: LTR-GBM + MLP (özellikler: kullanıcı RFM, öğe meta, bağlam)
Yeniden sıralama: PM-2 (çeşitlilik), marka kotaları, RG filtreleri, frekans kapakları
Hedefler/Metrikler: NDCG @ 10, eRPM, zhaloby≤Kh, gecikme süresi p95≤150 ms
A/B: 14 gün, CUPED; Korkuluklar - RG/teslim edilebilirlik
Sahipler/Günlükleme/Runibook
Karar tablosu
13) Sahte Kod (kroki)
A. Hibrit hatırlama + sıra + yeniden sıralama
python
Recall cands_emb = ann. recall(user_embed, topk=500)
cands_rule = rule_based. popular_by_segment(user, k=200)
cands = dedup(cands_emb + cands_rule)
Rank features = featurize(user, cands, context) # user/item/context scores = ranker. predict(features) # CTR/Value score
Re-rank (policy-aware)
final = rerank(
cands, scores,
constraints=dict(diversity_min={'category':3},
brand_quota={'A':0. 3,'B':0. 3},
rg_filter=True,
freq_caps=per_user_caps(user)),
objective_weights=dict(ctr=0. 6, value=0. 3, novelty=0. 1)
)
return final[:N]
Kreatifler için B. Thompson Örneklemesi
python beta priors per creative: (α, β)
for creative in creatives:
p_hat = np. random. beta(alpha[creative], beta[creative])
chosen = argmax(p_hat)
show(chosen)
update(alpha, beta, reward=click)
14) Teşhis ve izleme
Kalite: NDCG/Recall @ k, eRPM, kapsama/çeşitlilik, kalibrasyon.
Çevrimiçi: TO/CTCVR, gelir/oturum, tutma, şikayetler/abonelikten çıkma, gecikme/zaman aşımı.
Sürüklenme: Temel özelliklere göre PSI/KL, oflayn↔onlayn korelasyon düşüşü.
Kısıtlamalar: kotaların/çeşitliliğin yerine getirilmesi, RG filtrelerine etkileri, frekans sınırları.
Runibooks: geri çağırma bozulması (ANN düşüşü), şikayetlerde artış, zaman aşımlarında artış, acil folback (popüler güvenli).
15) Sık yapılan hatalar
Artım/değer yerine "ham TO'nun optimizasyonu.
Yeniden sıralama katmanı yoktur - yetersiz çeşitlilik, "vizyon tüneli".
Gelecekten yüzler, TZ karıştırma, tutarsız sinyal tanımları.
Kalibrasyon ve eşik eksikliği - bütçe ve frekans kapakları "bozulur".
RG/etik ve adaleti görmezden gelin - şikayetler, riskler, düzenleyici konular.
Çevrimiçi/çevrimdışı senkron olmayan özellik - satışlarda bir başarısızlık.
16) Yayın Öncesi Kişiselleştirme Kontrol Listesi
- Model pasaport (hedefler, sınırlamalar, metrikler, sahipler, sürümler)
- Recall/Rank/Re-rank postalandı; ANN ve önbellekler ısındı
- PIT özellikleri ve kalibrasyon, çevrimdışı kriterler (NDCG/PR-AUC) geçti
- A/B tasarımı ve korkuluklar; Karara hazır rapor
- RG/Frekans/Çeşitlilik/Kota Kısıtlamaları - Uygulanan ve İzlenen
- Gözlemlenebilirlik, uyarılar, stop-vinç, folbacks (popüler-güvenli)
- Dokümantasyon ve Runibooks, Artımlı İyileştirme Planı
Toplam
Kişiselleştirme modelleri yalnızca politikaya duyarlı bir sistem olarak etkilidir: zengin veriler ve gömmeler - bir Hatırlama/Sıralama/Yeniden sıralama hibriti - çevrimiçi adaptasyon için haydutlar/RL - sıkı kısıtlamalar ve etik için çok amaçlı hedefler - disiplinli MLOps ve izleme. Böyle bir devre sadece "öneriler'değil, aynı zamanda ROMI, LTV ve memnuniyeti artıran yönetilebilir çözümler sunar - güvenli, şeffaf ve tekrarlanabilir.