Şahsylaşdyrma modelleri

Şahsylaşdyrma, maglumatlar → modeller → görkeziş syýasaty → hereket → seslenme bolan ulgamdyr. Maksat çäklendirmeleri (etika/RG, ýygylyk örtükleri, dürlülik, täzelik, SLA) berjaý etmek bilen, içerki gymmaty (girdeji/saklamak/kanagatlanma) ýokarlandyrmakdyr.

1) Maglumatlar we teklipler

Çig mal: wakalar (tomaşa etmek/basmak/oýunlar/satyn almak/goýumlar), mazmun katalogy (atributlar), ulanyjy profilleri, kontekst (wagt/geo/enjam/kanal), hil signallary (bot/frod).

Fiçler:

User: RFM, kategoriýalaryň islegleri, bahanyň duýgurlygy, günüň wagty, enjam.
Item: reanr/kategoriýa, studiýa/üpjün ediji, dil, baha/üýtgewsizlik, "täzelik".
Context: dow/hod, mahabat/çäreler, sessiýa, giriş kanaly.
Embeddingler: user/item (MF/Word2Vec2Rec/transformers), multimodal (tekst/şekil) bilelikdäki giňişlikleri.
Hil: nokat-in-time (ýüzsüz), UTC-wagt, wakalaryň idempotentligi, PII maskalanmagy.

2) Esasy paradigmalar

1. Content-based - aitem we ulanyjy profili boýunça ýakynlyk.
2. Hyzmatdaşlyk süzgüçleri (CF) - özara täsir signallary boýunça meňzeş ulanyjylar/aitemler.
3. Matrisa faktorizasiýasy/embeddingler - gizlin faktorlar, score üçin dot-product/MLP.
4. Learning-to-Rank (LTR) - sanawlary (pairwise/listwise) tertiplemek üçin gradient güýçlendiriji/nerw ulgamlary.
5. Re-ranking gatlagy - diwersifikasiýa/täzelik/çäklendirmeleri göz öňünde tutup post-processing.
6. Kontekstli garakçylar - exploration-exploitation bilen onlaýn okuw.
7. RL/seq-teklipler - ýoly/sessiýany optimizirlemek (köp basgançakly baýrak).

3) Karar kabul etmegiň konweýeri

1. Recall (dalaşgärleri çalt saýlamak, 200-5k): Embeddingler boýunça ANN, düzgün-bass/kategoriýa, meşhurlyk.
2. Rank (takyk skoring, 20-200): Baý şekilli LTR/MLP.
3. Re-rank/Policy (fin. sanaw, 5-30): köp maksatly optimizasiýa + çäklendirmeler we diwersifikasiýa.
4. Action :/push/e-mail/kaply we "asuda sagatly" şahsy penjire.
5. Feedback: implicit/explicit signallary → gaýtadan taýýarlamak/garakçy-täzelenme.

4) Köp maksatly maksatlar we çäklendirmeler

Maksatlar: CTR/CTCVR, saklamak, girdeji, marja, LTV, kanagatlanma, tizlik.
Çäklendirmeler: aragatnaşyklaryň ýygylygy, RG/complayens, kategoriýalaryň dürlüligi, markalaryň/üpjün edijileriň kwotalary, fairness.

Söz:

[
\max \sum_i w_i \cdot \text{Objective}_i \quad
\text{s. t. } \text{caps, RG, diversity, SLA}
]

Amal: policy-aware re-ranking (§ 7 serediň), bu ýerde tizlik düzgünler bilen birleşdirilýär.

5) Sowuk başlangyç we kiçi maglumatlar

Täze ulanyjylar: segment/kanal/geo boýunça meşhurlyk, anketa/birinji gezek based, giň aňtaw bilen garakçy.
Täze atemler: mazmun-embeddingler (tekst/bellikler), meta-maglumatlar, üpjün ediji/reanr boýunça "look-alike".
Few-shot: embeddingi geçirmek/köp wezipe (shared tower).

6) Baha bermegiň ölçegleri

Awtonom

Klassifikasiýa/reýting: AUC/PR-AUC, NDCG @k, MAP, Recall @k.
Iş: eCPM/eRPM, garaşylýan girdeji/marja, LTV proxy.
Köp maksatly: deňagramly metrikler (mysal üçin, gain = gymmaty bolan NDCG).
Kalibrlemek: Brier, ECE (ähtimallyklar üçin).
Списки: coverage/diversity/novelty/serendipity.

Onlaýn

A/B we garakçy synaglary: CTR, CTCVR, girdeji/seans, D1/D7 saklamak, şikaýatlar/jogaplar (garawullar), latency/SLA.
Increment: lift%, CUPED/kwaziexperimentler çylşyrymly randomizasiýa edilende.

7) Diwersifikasiýa we policy-aware re-ranking

MMR/PM-2/xQuAD: "degişlilik × täzelik" deňagramlylygy.
Kwotalar: reanrlar/üpjün edijiler/töwekgelçilik kategoriýalary boýunça min/max.
Fairness: Yzygiderli bidüzgünçiliklerden gaça durmak üçin paýlary çäklendirmek.

Skoring mysaly:

[
\textstyle \text{Score} = \alpha \cdot \hat{p}_{\text{click}} + \beta \cdot \text{Value} - \gamma \cdot \text{Fatigue} + \delta \cdot \text{Novelty}
]

Gisterezis: sanawlary "ýakma"; inertiýa bilen pozisiýalaryňyzy täzeläň.

8) Kontekstli garakçylar we RL

Garakçylar (LinUCB, Thompson): çalt online-learn, exploration gözegçilik. Birinji pozisiýa/döredijilik/kanal üçin gowy.
Kaskadly garakçylar: optimizasiýa top-k.
RL (DQN/Policy Gradient/SlateQ): sessiýany şahsylaşdyrmak, köp basgançakly baýragy optimizirlemek (yzyna gaýtarmak/girdeji/uzyn sessiýa).
Howpsuzlyk: polisden daşary baha bermek (IPS/DR), simulýatorlar, gözleg üçin kaplar, safe RL.

9) Sebäp täsiri astynda şahsylaşdyrmak

Uplift modelleri: kime degmeli (persuadables), Qini/AUUC, uplift @k.
Treatment-aware reýtingi: "çig" CTR-iň ýerine inkrement ähtimallygyny goşuň.
Guardrails: Do-Not-Disturb segmentleri, RG düzgünleri, fairness.

10) Arhitektura we MLOps

"Feature Store": onlaýn/awtonom paritet, nokat-in-time, TTL sessiýa üçin.
Candidate services: ANN/FAISS/ScaNN, segmentler boýunça kesh/şarding.
Ranker: gradient güýçlendiriji/MLP/Tower-arhitektura, kalibrlemek.
Policy/Re-rank: düzgünler/çäklendirmeler, diwersifikasiýa, garakçy gatlagy.
Orkestr: haýyşlaryň idempotentligi, p95 latency ≤ 100-300 ms, DLQ/retra.
Syn edilişi: 'correlation _ id', fich-drift (PSI), hil metrikleri, "stop-kran".

11) Howpsuzlyk, gizlinlik, ahlak

PII-minimalizasiýa: tokenizasiýa, RLS/CLS, maskalama.
Düşündiriş ukyby: top-features/görkeziş sebäpleri; şikaýat ýoly.
Etika/RG: ýygylyk kaplary, "asuda sagatlar", ejiz toparlarda agressiw offerlere gadaganlyklar.
Ylalaşyk: çözgütleriň/bloglaryň, syýasatlaryň we döredijiligiň wersiýalarynyň barlagy.

12) Pasportlar we decision tables

Teklipçiniň pasporty (mysal)

ID/wersiýasy: 'REC _ HYBRID _ RANK _ v5'

Recall: ANN (user/item embeddings), top-500

Ranker: LTR-GBM + MLP (features: user RFM, item meta, context)

Re-rank: PM-2 (diversity), marka kwotalary, RG-süzgüçler, ýygylyk örtükleri

Maksatlary/metrikleri: NDCG @ 10, eRPM, şikaýatlar ≤ X, latency p95 ≤ 150 ms

A/C: 14 gün, CUPED; guardrails - RG/eltip bermek

Eýeleri/Logistika/Runibook

Decision table (eskiz)

Şert	Kontekst	Hereket	Çäklendirmeler	Düşündiriş
`new_user` & `low_history`	onbording	popular@segment + content-based seed	ýygylyk örtükleri, RG	sowuk başlangyç
`session_len>3` & `diversity_low`	sessiýa	re-rank с MMR	min 3 kategoriýalary	serendiplik
`uplift_push≥τ`	offerler	şahsy push	Do-Not-Disturb, şikaýatlar ≤ X	CTR däl effektler

13) Pseudo-kod (eskiz)

A. Gibrid recall + rank + re-rank

python
Recall cands_emb = ann. recall(user_embed, topk=500)
cands_rule = rule_based. popular_by_segment(user, k=200)
cands = dedup(cands_emb + cands_rule)

Rank features = featurize(user, cands, context)  # user/item/context scores = ranker. predict(features)      # CTR/Value score

Re-rank (policy-aware)
final = rerank(
cands, scores,
constraints=dict(diversity_min={'category':3},
brand_quota={'A':0. 3,'B':0. 3},
rg_filter=True,
freq_caps=per_user_caps(user)),
objective_weights=dict(ctr=0. 6, value=0. 3, novelty=0. 1)
)
return final[:N]

B. Thompson Sampling döredijilik üçin

python beta priors per creative: (α, β)
for creative in creatives:
p_hat = np. random. beta(alpha[creative], beta[creative])
chosen = argmax(p_hat)
show(chosen)
update(alpha, beta, reward=click)

14) Anyklaýyş we gözegçilik

Hil: NDCG/Recall @k, eRPM, coverage/diversity, kalibrlemek.
Onlaýn: CTR/CTCVR, girdeji/seans, saklamak, şikaýatlar/jogaplar, latency/timeout.
Drift: PSI/KL esasy aýratynlyklar boýunça, onlaýn onlaýn baglanyşygyň peselmegi.
Çäklendirmeler: kwotalary/diversity ýerine ýetirmek, RG-süzgüçlere, ýygylyk örtüklerine urmak.
Runibuki: recall degradasiýasy (ANN ýykylmagy), şikaýatlaryň köpelmegi, wagtlaryň köpelmegi, gyssagly folbek (popular-safe).

15) Ýygy-ýygydan ýalňyşlyklar

Inkrement/gymmatlygyň ýerine "çig CTR" -ni optimizirlemek.
Re-ranking gatlagy ýok → az dürlülik, "görüş tuneli".
Geljekdäki ýüzler, TZ garyşdyrylmagy, signallaryň utgaşdyrylmadyk kesgitlemeleri.
Kalibrlemegiň we bosagalaryň ýoklugy → Býudjet we ýygylyk kaplary "zaýalanýar".
Ignor RG/etika we fairness → şikaýatlar, töwekgelçilikler, kadalaşdyryjy meseleler.
Nesinhron onlaýn/oflayn → önümçiligiň şowsuzlygy.

16) Şahsylaşdyrma goýberilmezden öň çek-sanawy

Modeliň pasporty (maksatlar, çäklendirmeler, metrikler, eýeler, wersiýalar)
Recall/Rank/Re-rank dargadyldy; ANN we keshler gyzdyryldy
PIT çyzgylar we kalibrlemek, awtonom bazarlar (NDCG/PR-AUC) geçdi
A/B-dizaýn we garawullar; decision-ready hasabaty (täsiri we töwekgelçiligi)
Çäklendirmeler: RG/ýygylyk/diversity/kwotalar - girizildi we gözegçilik edilýär
Syn ediliş, aladalar, "dur-kran", folbekler (popular-safe)
Resminamalar we runibuklar, inkremental gowulaşmalar meýilnamasy

Jemi

Şahsylaşdyrma modelleri diňe policy-aware ulgamy hökmünde täsirli: baý maglumatlar we embeddingler → Recall/Rank/Re-rank → onlaýn uýgunlaşmak üçin garakçylar/RL → berk çäklendirmeler we ahlak boýunça köp maksatly maksatlar → tertipli MLOps we gözegçilik. Şeýle konturlar diňe bir "teklipleri" däl, eýsem ROMI, LTV we kanagatlanmany ýokarlandyrýan dolandyrylýan çözgütleri - howpsuz, aç-açan we köpeldip bolýar.

Şahsylaşdyrma modelleri