Kişiselleştirme modelleri

Kişiselleştirme, verilerin, modellerin, görüntüleme politikasının, eylemin, geri bildirimin olduğu bir sistemdir. Amaç, kısıtlamaları (etik/RG, frekans kapakları, çeşitlilik, tazelik, SLA) karşılarken artan değeri (gelir/elde tutma/memnuniyet) en üst düzeye çıkarmaktır.

1) Veriler ve görüşler

Hammadde: olaylar (görünümler/tıklamalar/oyunlar/satın almalar/para yatırmalar), içerik kataloğu (öznitelikler), kullanıcı profilleri, bağlam (zaman/coğrafi/cihaz/kanal), kalite sinyalleri (bot/dolandırıcılık).

Fici:

Kullanıcı: RFM, kategori tercihleri, fiyat hassasiyeti, günün saati, cihaz.
Öğe: tür/kategori, stüdyo/sağlayıcı, dil, fiyat/volatilite, "tazelik".
Bağlam: Dow/hod, promosyon/etkinlikler, oturum, giriş kanalı.
Gömme: kullanıcı/öğe ortak çalışma alanları (MF/Word2Vec2Rec/transformatörler), multimodal (metin/görüntüler).
Kalite: point-in-time (yüzler olmadan), UTC-time, olayların idempotence, PII maskeleme.

2) Temel paradigmalar

1. İçerik tabanlı - adres ve kullanıcı profilinin özelliklerine göre yakınlık.
2. İşbirlikçi filtreleme (CF) - etkileşim sinyallerine dayalı benzer kullanıcılar/aytemler.
3. Matris çarpanlarına ayırma/gömme - gizli faktörler, puan için nokta çarpım/MLP.
4. Learning-to-Rank (LTR) - sıralama listeleri için degrade artırma/sinir ağları (pairwise/listwise).
5. Katmanın yeniden sıralanması - çeşitlendirme/yenilik/kısıtlamalar dikkate alınarak işlem sonrası.
6. Bağlamsal haydutlar - keşif-sömürü ile çevrimiçi öğrenme.
7. RL/seq-önerileri - yol/oturum optimizasyonu (çok adımlı ödül).

3) Karar boru hattı

1. Geri çağırma (hızlı aday seçimi, 200-5k): Gömme ile ANN, kural-taban/kategori, popülerlik.
2. Sıralama (tam puanlama, 20-200): Zengin özelliklere sahip LTR/MLP.
3. Yeniden Sıralama/Politika (Fin. list, 5-30): Çok amaçlı optimizasyon + kısıtlamalar ve çeşitlendirme.
4. Eylem: göstermek/itmek/e-posta/kişisel vitrin ağız korumaları ve "sessiz bir saat'ile.
5. Geribildirim: örtük/açık sinyaller - yeniden eğitim/haydut-güncelleme.

4) Çok amaçlı hedefler ve sınırlamalar

Hedefler: TO/CTCVR, tutma, gelir, marj, LTV, memnuniyet, hız.
Kısıtlamalar: temas sıklığı, RG/uyumluluk, kategori çeşitliliği, marka/sağlayıcı kotaları, adalet.

İfade:

[
\ max\sum _ i w_i\cdot\text {Amaç} _ i\quad
\ text {s. t. }\text {caps, RG, diversity, SLA}
]

Uygulama: Hızın kurallarla birleştirildiği politikaya duyarlı yeniden sıralama (bkz. § 7) yapın.

5) Soğuk başlangıç ve küçük veriler

Yeni kullanıcılar: segmente/kanala/coğrafyaya göre popülerlik, ankete/ilk tıklamaya göre içerik tabanlı, geniş zekalı haydut.
Yeni aitemler: içerik gömme (metin/etiketler), meta veriler, sağlayıcıya/türe göre "benzer görünme".
Birkaç çekim: transfer/paylaşılan kule gömme.

6) Puanlama metrikleri

Çevrimdışı

Sınıflandırma/sıralama: AUC/PR-AUC, NDCG @ k, MAP, Recall @ k.
İş: eCPM/eRPM, beklenen gelir/marj, LTV proxy.
Çok amaçlı: ağırlıklı metrikler (örn. Kazanç = değer ile NDCG).
Kalibrasyon: Brier, ECE (olasılıklar için).
Списки: kapsam/çeşitlilik/yenilik/şans.

Online

A/B ve haydut testleri: TO, CTCVR, gelir/oturum, D1/D7 tutma, şikayetler/abonelikten çıkma (korkuluklar), gecikme/SLA.
Artış: kaldırma %, karmaşık randomizasyonda CUPED/yarı-deneyler.

7) Çeşitlendirme ve politikaya duyarlı yeniden sıralama

MMR/PM-2/xQuAD: "alaka düzeyi × yenilik" dengesi.
Kotalar: Tür/sağlayıcı/risk kategorisine göre min/max.
Adalet: Sistematik eğrilmekten kaçınmak için paylaşımları sınırlayın.

Puanlama örneği:

[
\ textstyle\text {Score} =\alpha\cdot\hat {p} _ {\text {click} +\beta\cdot\text {Value} -\gamma\cdot\text {Yorgunluk} +\delta\cdot\text {Yenilik}
]

Histerezis: listeleri "göz kırpmayın"; Atalet içeren öğeleri güncelleyin.

8) Bağlamsal Haydutlar ve RL'ler

Haydutlar (LinUCB, Thompson): hızlı çevrimiçi öğrenme, keşif kontrolü. İlk pozisyon/yaratıcı/kanal için iyi.
Basamaklı haydutlar: top-k optimizasyonu.
RL (DQN/Policy Gradient/SlateQ): oturum kişiselleştirme, çok adımlı ödül optimizasyonu (geri dönüş/gelir/uzun oturum).
Güvenlik: politika dışı değerlendirme (IPS/DR), simülatörler, araştırma için kapaklar, güvenli RL.

9) Nedensel etki için kişiselleştirme

Yükseltme modelleri: kime dokunulması gerektiği (ikna edilebilir), Qini/AUUC, yükseltme @ k.
Tedaviye duyarlı sıralama: Ham TO yerine artış olasılığını ekleyin.
Korkuluklar: Rahatsız Etmeyin segmentleri, RG kuralları, adalet.

10) Mimari ve MLOps

Feature Store: Oturum özellikleri için online/offline parite, point-in-time, TTL.
Aday hizmetler: ANN/FAISS/ScaNN, segmente göre önbelleğe alma/parçalama.
Ranker: gradyan artırma/MLP/kule mimarileri, kalibrasyon.
Politika/Yeniden sıralama: kurallar/kısıtlamalar, çeşitlendirme, haydut katmanı.
Orkestrasyon: talep idempotency, p95 gecikme ≤ 100-300 ms, DLQ/retray.
Gözlenebilirlik: Korelasyon _ id izi, PSI, kalite metrikleri, stopcock.

11) Güvenlik, gizlilik, etik

PII minimizasyonu: tokenizasyon, RLS/CLS, maskeleme.
Açıklanabilirlik: en iyi özellikler/gösterme nedenleri; Temyiz yolu.
Etik/RG: Frekans sınırları, "sessiz saatler", savunmasız gruplardan gelen agresif tekliflerin yasaklanması.
Uyum: Kararların/günlüklerin, politikaların ve reklam öğelerinin sürümlerinin denetimi.

12) Pasaportlar ve karar tabloları

Referans sertifikası (örnek)

ID/sürüm: 'REC _ HYBRID _ RANK _ v5'

Geri çağırma: ANN (kullanıcı/öğe gömme), top-500

Ranker: LTR-GBM + MLP (özellikler: kullanıcı RFM, öğe meta, bağlam)

Yeniden sıralama: PM-2 (çeşitlilik), marka kotaları, RG filtreleri, frekans kapakları

Hedefler/Metrikler: NDCG @ 10, eRPM, zhaloby≤Kh, gecikme süresi p95≤150 ms

A/B: 14 gün, CUPED; Korkuluklar - RG/teslim edilebilirlik

Sahipler/Günlükleme/Runibook

Karar tablosu

Durum	Bağlam	Eylem	Kısıtlamalar	Yorum yap
'new _ user' & 'low _ history'	onboarding	Popüler @ segment + içerik tabanlı tohum	Frekans kapakları, RG	Soğuk başlangıç
'session _ len> 3' & 'diversity _ düşük'	oturum	MMR с yeniden sıralama	Min 3 kategoriler	Serendipity
'uplift_push≥τ'	teklifler	Kişisel itme	Rahatsız Etme, zhaloby≤Kh	TO değil efektler

13) Sahte Kod (kroki)

A. Hibrit hatırlama + sıra + yeniden sıralama

python
Recall cands_emb = ann. recall(user_embed, topk=500)
cands_rule = rule_based. popular_by_segment(user, k=200)
cands = dedup(cands_emb + cands_rule)

Rank features = featurize(user, cands, context)  # user/item/context scores = ranker. predict(features)      # CTR/Value score

Re-rank (policy-aware)
final = rerank(
cands, scores,
constraints=dict(diversity_min={'category':3},
brand_quota={'A':0. 3,'B':0. 3},
rg_filter=True,
freq_caps=per_user_caps(user)),
objective_weights=dict(ctr=0. 6, value=0. 3, novelty=0. 1)
)
return final[:N]

Kreatifler için B. Thompson Örneklemesi

python beta priors per creative: (α, β)
for creative in creatives:
p_hat = np. random. beta(alpha[creative], beta[creative])
chosen = argmax(p_hat)
show(chosen)
update(alpha, beta, reward=click)

14) Teşhis ve izleme

Kalite: NDCG/Recall @ k, eRPM, kapsama/çeşitlilik, kalibrasyon.
Çevrimiçi: TO/CTCVR, gelir/oturum, tutma, şikayetler/abonelikten çıkma, gecikme/zaman aşımı.
Sürüklenme: Temel özelliklere göre PSI/KL, oflayn↔onlayn korelasyon düşüşü.
Kısıtlamalar: kotaların/çeşitliliğin yerine getirilmesi, RG filtrelerine etkileri, frekans sınırları.
Runibooks: geri çağırma bozulması (ANN düşüşü), şikayetlerde artış, zaman aşımlarında artış, acil folback (popüler güvenli).

15) Sık yapılan hatalar

Artım/değer yerine "ham TO'nun optimizasyonu.
Yeniden sıralama katmanı yoktur - yetersiz çeşitlilik, "vizyon tüneli".
Gelecekten yüzler, TZ karıştırma, tutarsız sinyal tanımları.
Kalibrasyon ve eşik eksikliği - bütçe ve frekans kapakları "bozulur".
RG/etik ve adaleti görmezden gelin - şikayetler, riskler, düzenleyici konular.
Çevrimiçi/çevrimdışı senkron olmayan özellik - satışlarda bir başarısızlık.

16) Yayın Öncesi Kişiselleştirme Kontrol Listesi

Model pasaport (hedefler, sınırlamalar, metrikler, sahipler, sürümler)
Recall/Rank/Re-rank postalandı; ANN ve önbellekler ısındı
PIT özellikleri ve kalibrasyon, çevrimdışı kriterler (NDCG/PR-AUC) geçti
A/B tasarımı ve korkuluklar; Karara hazır rapor
RG/Frekans/Çeşitlilik/Kota Kısıtlamaları - Uygulanan ve İzlenen
Gözlemlenebilirlik, uyarılar, stop-vinç, folbacks (popüler-güvenli)
Dokümantasyon ve Runibooks, Artımlı İyileştirme Planı

Toplam

Kişiselleştirme modelleri yalnızca politikaya duyarlı bir sistem olarak etkilidir: zengin veriler ve gömmeler - bir Hatırlama/Sıralama/Yeniden sıralama hibriti - çevrimiçi adaptasyon için haydutlar/RL - sıkı kısıtlamalar ve etik için çok amaçlı hedefler - disiplinli MLOps ve izleme. Böyle bir devre sadece "öneriler'değil, aynı zamanda ROMI, LTV ve memnuniyeti artıran yönetilebilir çözümler sunar - güvenli, şeffaf ve tekrarlanabilir.

Kişiselleştirme modelleri