Şahsylaşdyrma modelleri
Şahsylaşdyrma modelleri
Şahsylaşdyrma, maglumatlar → modeller → görkeziş syýasaty → hereket → seslenme bolan ulgamdyr. Maksat çäklendirmeleri (etika/RG, ýygylyk örtükleri, dürlülik, täzelik, SLA) berjaý etmek bilen, içerki gymmaty (girdeji/saklamak/kanagatlanma) ýokarlandyrmakdyr.
1) Maglumatlar we teklipler
Çig mal: wakalar (tomaşa etmek/basmak/oýunlar/satyn almak/goýumlar), mazmun katalogy (atributlar), ulanyjy profilleri, kontekst (wagt/geo/enjam/kanal), hil signallary (bot/frod).
Fiçler:- User: RFM, kategoriýalaryň islegleri, bahanyň duýgurlygy, günüň wagty, enjam.
- Item: reanr/kategoriýa, studiýa/üpjün ediji, dil, baha/üýtgewsizlik, "täzelik".
- Context: dow/hod, mahabat/çäreler, sessiýa, giriş kanaly.
- Embeddingler: user/item (MF/Word2Vec2Rec/transformers), multimodal (tekst/şekil) bilelikdäki giňişlikleri.
- Hil: nokat-in-time (ýüzsüz), UTC-wagt, wakalaryň idempotentligi, PII maskalanmagy.
2) Esasy paradigmalar
1. Content-based - aitem we ulanyjy profili boýunça ýakynlyk.
2. Hyzmatdaşlyk süzgüçleri (CF) - özara täsir signallary boýunça meňzeş ulanyjylar/aitemler.
3. Matrisa faktorizasiýasy/embeddingler - gizlin faktorlar, score üçin dot-product/MLP.
4. Learning-to-Rank (LTR) - sanawlary (pairwise/listwise) tertiplemek üçin gradient güýçlendiriji/nerw ulgamlary.
5. Re-ranking gatlagy - diwersifikasiýa/täzelik/çäklendirmeleri göz öňünde tutup post-processing.
6. Kontekstli garakçylar - exploration-exploitation bilen onlaýn okuw.
7. RL/seq-teklipler - ýoly/sessiýany optimizirlemek (köp basgançakly baýrak).
3) Karar kabul etmegiň konweýeri
1. Recall (dalaşgärleri çalt saýlamak, 200-5k): Embeddingler boýunça ANN, düzgün-bass/kategoriýa, meşhurlyk.
2. Rank (takyk skoring, 20-200): Baý şekilli LTR/MLP.
3. Re-rank/Policy (fin. sanaw, 5-30): köp maksatly optimizasiýa + çäklendirmeler we diwersifikasiýa.
4. Action :/push/e-mail/kaply we "asuda sagatly" şahsy penjire.
5. Feedback: implicit/explicit signallary → gaýtadan taýýarlamak/garakçy-täzelenme.
4) Köp maksatly maksatlar we çäklendirmeler
Maksatlar: CTR/CTCVR, saklamak, girdeji, marja, LTV, kanagatlanma, tizlik.
Çäklendirmeler: aragatnaşyklaryň ýygylygy, RG/complayens, kategoriýalaryň dürlüligi, markalaryň/üpjün edijileriň kwotalary, fairness.
[
\max \sum_i w_i \cdot \text{Objective}_i \quad
\text{s. t. } \text{caps, RG, diversity, SLA}
]
Amal: policy-aware re-ranking (§ 7 serediň), bu ýerde tizlik düzgünler bilen birleşdirilýär.
5) Sowuk başlangyç we kiçi maglumatlar
Täze ulanyjylar: segment/kanal/geo boýunça meşhurlyk, anketa/birinji gezek based, giň aňtaw bilen garakçy.
Täze atemler: mazmun-embeddingler (tekst/bellikler), meta-maglumatlar, üpjün ediji/reanr boýunça "look-alike".
Few-shot: embeddingi geçirmek/köp wezipe (shared tower).
6) Baha bermegiň ölçegleri
Awtonom
Klassifikasiýa/reýting: AUC/PR-AUC, NDCG @k, MAP, Recall @k.
Iş: eCPM/eRPM, garaşylýan girdeji/marja, LTV proxy.
Köp maksatly: deňagramly metrikler (mysal üçin, gain = gymmaty bolan NDCG).
Kalibrlemek: Brier, ECE (ähtimallyklar üçin).
Списки: coverage/diversity/novelty/serendipity.
Onlaýn
A/B we garakçy synaglary: CTR, CTCVR, girdeji/seans, D1/D7 saklamak, şikaýatlar/jogaplar (garawullar), latency/SLA.
Increment: lift%, CUPED/kwaziexperimentler çylşyrymly randomizasiýa edilende.
7) Diwersifikasiýa we policy-aware re-ranking
MMR/PM-2/xQuAD: "degişlilik × täzelik" deňagramlylygy.
Kwotalar: reanrlar/üpjün edijiler/töwekgelçilik kategoriýalary boýunça min/max.
Fairness: Yzygiderli bidüzgünçiliklerden gaça durmak üçin paýlary çäklendirmek.
[
\textstyle \text{Score} = \alpha \cdot \hat{p}_{\text{click}} + \beta \cdot \text{Value} - \gamma \cdot \text{Fatigue} + \delta \cdot \text{Novelty}
]
Gisterezis: sanawlary "ýakma"; inertiýa bilen pozisiýalaryňyzy täzeläň.
8) Kontekstli garakçylar we RL
Garakçylar (LinUCB, Thompson): çalt online-learn, exploration gözegçilik. Birinji pozisiýa/döredijilik/kanal üçin gowy.
Kaskadly garakçylar: optimizasiýa top-k.
RL (DQN/Policy Gradient/SlateQ): sessiýany şahsylaşdyrmak, köp basgançakly baýragy optimizirlemek (yzyna gaýtarmak/girdeji/uzyn sessiýa).
Howpsuzlyk: polisden daşary baha bermek (IPS/DR), simulýatorlar, gözleg üçin kaplar, safe RL.
9) Sebäp täsiri astynda şahsylaşdyrmak
Uplift modelleri: kime degmeli (persuadables), Qini/AUUC, uplift @k.
Treatment-aware reýtingi: "çig" CTR-iň ýerine inkrement ähtimallygyny goşuň.
Guardrails: Do-Not-Disturb segmentleri, RG düzgünleri, fairness.
10) Arhitektura we MLOps
"Feature Store": onlaýn/awtonom paritet, nokat-in-time, TTL sessiýa üçin.
Candidate services: ANN/FAISS/ScaNN, segmentler boýunça kesh/şarding.
Ranker: gradient güýçlendiriji/MLP/Tower-arhitektura, kalibrlemek.
Policy/Re-rank: düzgünler/çäklendirmeler, diwersifikasiýa, garakçy gatlagy.
Orkestr: haýyşlaryň idempotentligi, p95 latency ≤ 100-300 ms, DLQ/retra.
Syn edilişi: 'correlation _ id', fich-drift (PSI), hil metrikleri, "stop-kran".
11) Howpsuzlyk, gizlinlik, ahlak
PII-minimalizasiýa: tokenizasiýa, RLS/CLS, maskalama.
Düşündiriş ukyby: top-features/görkeziş sebäpleri; şikaýat ýoly.
Etika/RG: ýygylyk kaplary, "asuda sagatlar", ejiz toparlarda agressiw offerlere gadaganlyklar.
Ylalaşyk: çözgütleriň/bloglaryň, syýasatlaryň we döredijiligiň wersiýalarynyň barlagy.
12) Pasportlar we decision tables
Teklipçiniň pasporty (mysal)
ID/wersiýasy: 'REC _ HYBRID _ RANK _ v5'
Recall: ANN (user/item embeddings), top-500
Ranker: LTR-GBM + MLP (features: user RFM, item meta, context)
Re-rank: PM-2 (diversity), marka kwotalary, RG-süzgüçler, ýygylyk örtükleri
Maksatlary/metrikleri: NDCG @ 10, eRPM, şikaýatlar ≤ X, latency p95 ≤ 150 ms
A/C: 14 gün, CUPED; guardrails - RG/eltip bermek
Eýeleri/Logistika/Runibook
Decision table (eskiz)
13) Pseudo-kod (eskiz)
A. Gibrid recall + rank + re-rank
python
Recall cands_emb = ann. recall(user_embed, topk=500)
cands_rule = rule_based. popular_by_segment(user, k=200)
cands = dedup(cands_emb + cands_rule)
Rank features = featurize(user, cands, context) # user/item/context scores = ranker. predict(features) # CTR/Value score
Re-rank (policy-aware)
final = rerank(
cands, scores,
constraints=dict(diversity_min={'category':3},
brand_quota={'A':0. 3,'B':0. 3},
rg_filter=True,
freq_caps=per_user_caps(user)),
objective_weights=dict(ctr=0. 6, value=0. 3, novelty=0. 1)
)
return final[:N]
B. Thompson Sampling döredijilik üçin
python beta priors per creative: (α, β)
for creative in creatives:
p_hat = np. random. beta(alpha[creative], beta[creative])
chosen = argmax(p_hat)
show(chosen)
update(alpha, beta, reward=click)
14) Anyklaýyş we gözegçilik
Hil: NDCG/Recall @k, eRPM, coverage/diversity, kalibrlemek.
Onlaýn: CTR/CTCVR, girdeji/seans, saklamak, şikaýatlar/jogaplar, latency/timeout.
Drift: PSI/KL esasy aýratynlyklar boýunça, onlaýn onlaýn baglanyşygyň peselmegi.
Çäklendirmeler: kwotalary/diversity ýerine ýetirmek, RG-süzgüçlere, ýygylyk örtüklerine urmak.
Runibuki: recall degradasiýasy (ANN ýykylmagy), şikaýatlaryň köpelmegi, wagtlaryň köpelmegi, gyssagly folbek (popular-safe).
15) Ýygy-ýygydan ýalňyşlyklar
Inkrement/gymmatlygyň ýerine "çig CTR" -ni optimizirlemek.
Re-ranking gatlagy ýok → az dürlülik, "görüş tuneli".
Geljekdäki ýüzler, TZ garyşdyrylmagy, signallaryň utgaşdyrylmadyk kesgitlemeleri.
Kalibrlemegiň we bosagalaryň ýoklugy → Býudjet we ýygylyk kaplary "zaýalanýar".
Ignor RG/etika we fairness → şikaýatlar, töwekgelçilikler, kadalaşdyryjy meseleler.
Nesinhron onlaýn/oflayn → önümçiligiň şowsuzlygy.
16) Şahsylaşdyrma goýberilmezden öň çek-sanawy
- Modeliň pasporty (maksatlar, çäklendirmeler, metrikler, eýeler, wersiýalar)
- Recall/Rank/Re-rank dargadyldy; ANN we keshler gyzdyryldy
- PIT çyzgylar we kalibrlemek, awtonom bazarlar (NDCG/PR-AUC) geçdi
- A/B-dizaýn we garawullar; decision-ready hasabaty (täsiri we töwekgelçiligi)
- Çäklendirmeler: RG/ýygylyk/diversity/kwotalar - girizildi we gözegçilik edilýär
- Syn ediliş, aladalar, "dur-kran", folbekler (popular-safe)
- Resminamalar we runibuklar, inkremental gowulaşmalar meýilnamasy
Jemi
Şahsylaşdyrma modelleri diňe policy-aware ulgamy hökmünde täsirli: baý maglumatlar we embeddingler → Recall/Rank/Re-rank → onlaýn uýgunlaşmak üçin garakçylar/RL → berk çäklendirmeler we ahlak boýunça köp maksatly maksatlar → tertipli MLOps we gözegçilik. Şeýle konturlar diňe bir "teklipleri" däl, eýsem ROMI, LTV we kanagatlanmany ýokarlandyrýan dolandyrylýan çözgütleri - howpsuz, aç-açan we köpeldip bolýar.