Системаҳои тавсиядиҳӣ
Системаҳои тавсиядиҳӣ
Системаи тавсияҳо на танҳо "модели CTR. "Ин як лӯлаи маълумот → номзадҳо дар рейтинги → сиёсат → амал, § фикру мулоҳизаҳоест, ки арзиши афзоишро дар доираи маҳдудиятҳои воқеӣ (суръат, ҳадди басомад, гуногунрангӣ, ахлоқ/мувофиқат) оптимизатсия мекунад.
1) Маълумот, сигналҳо ва намояндагиҳо
Ҳодисаҳо: нуқтаи назар/клик/илова/харид/амонатҳо, вақти истироҳат, бекоркунӣ.
Мундариҷа/каталог: атрибутҳо (категорияҳо/жанрҳо/студияҳо/нарх/тару тоза/ноустуворӣ).
Профилҳои корбар: RFM, афзалиятҳо, дастгоҳҳо/каналҳо, вақтҳо.
Контекст: соат/рӯз/истироҳат/мувофиқат, маҳал/TZ, сайти намоишӣ.
Сифат: дорухатҳо дар вақти муайян, номутобиқатии рӯйдодҳо, deadup/antiboot, ниқоби PII.
Ҷобаҷогузорӣ: корбар/ашё/контекст дар фазои муштарак (MF/Word2Vec2Rec/transformers), мултимодалӣ (матн/тасвирҳо).
2) Меъморӣ: Ба хотир оред → Рутба → Рутба
1. Бозхонди номзадҳо (200-5000 номзад): ANN (FAISS/ScaNN), маъруфият/тамоюлҳо, филтрҳои бар қоидаҳо асосёфта.
2. Гурӯҳбандӣ (20-200): LTR (GBM/NN), меъмории манораҳо, ҳадафҳои бинарӣ/бисёрҷониба (клик, табдилдиҳӣ, арзиш).
3. Рутбаи такрории сиёсат (5-30 дар рӯйхати ниҳоӣ): диверсификатсия/навоварӣ/серендипитсия, квотаҳои бренд/категория, RG/мувофиқат, ҳадди басомад, адолат.
4. Амал: намоиш/тела/почтаи электронӣ/намоиши шахсӣ бо cooldowns ва "соатҳои ором".
5. Фикру мулоҳизаҳо: сабти 'таассурот → клик → амал → арзиш', фикру мулоҳизаҳои манфӣ (гузаштан, шикоят кардан).
3) Парадигмаҳои намунавӣ
Ба мундариҷа асос ёфтааст: наздикӣ аз рӯи хусусиятҳои IT ва профил; беҳтарин барои оғози хунук барои ашё.
Филтри муштарак: корбар-корбар/ашё-ашё аз рӯи матритсаи муштарак.
Омилсозӣ/ҷобаҷогузорӣ: MF/BPR/NeuMF, ду бурҷи MLP (бурҷи корбар × манораи ашё).
Омӯзиш-ба-дараҷа: ҷуфт/номувофиқ (Lambda-MART, Rank-Net), оптимизатсияи NDCG @ k.
Сеанс/пайдарпай: GRU4Rec, SASR ec, Трансформаторҳо (T5-style) - фармоиш/контекст дар сессия.
Бандитҳои контекстуалӣ: Lin UCB/Томпсон барои мутобиқшавӣ ва эҷодиёти фаврии онлайн.
RL: SlATE/DQN/Gradient Policy барои ҷоизаи бисёрқадама (нигоҳдорӣ/LTV).
Равишҳои Causal/uplift: тавсияҳое, ки афзоишро ба назар мегиранд, на "CTR хом".
4) Ҳадафҳо, маҳдудиятҳо ва таҳияи вазифа
Ҳадафҳо: CTR/CTCVR, даромад/маржа/LTV, нигоҳдорӣ, қаноатмандӣ, суръат.
Маҳдудиятҳо: диверсификатсия, квотаҳои провайдер/категория, ҳадди басомад, RG/мувофиқат, адолат/ахлоқ, SLA p95.
[
\ textstyle Score =\alpha\cdot\hat p_{\text{click}} +\beta\cdot\text {Value}
\ gamma\cdot\text {Хастагӣ} +\delta\cdot\text {Novelty} -\sum _ j\lambda _ j\cdot\text {Penge} _ j
]
ки дар он ҷаримаҳо квота/RG/басомад/монотон мебошанд.
5) Нишондиҳандаҳо ва баҳодиҳӣ
Офлайн
Аҳамият/рейтинг: AUC/PR-AUC, Recall @ k, MAP, NDCG @ k.
Тиҷорат: ERPM/eCPM, proxy-LTV, маржаи пешбинишуда.
Калибрченкунӣ: Brier, ECE (барои ҳадди ниҳоӣ/сиёсат муҳим аст).
Списки: фарогирӣ/гуногунрангӣ/навоварӣ/серендипитсия.
Онлайн
Санҷишҳои A/B/multi-label: CTR, CTCVR, даромад/сессия, нигоҳдорӣ, шикоятҳо/обуна (посбонҳо), таъхир/вақт.
Арзёбии сабабӣ: CUPED, таҷрибаҳои квази-таҷрибаҳо (Назорати Ди/синтетикӣ) ҳангоми тасодуфии маҳдуд.
Нишондиҳандаҳои болоӣ: Qini/AUUC, uplift @ k - барои тавсияҳо оид ба табобат.
6) Оғози хунук ва камаҳолӣ
Истифодабарандагони нав: маъмул @ segment, пурсиши мундариҷа, мундариҷа дар асоси клики аввал, бандит бо зеҳни васеъ.
Aytems нав: воридкунии метамаълумот/матн/тасвирҳо + якхела аз ҷониби студия/категория.
Соҳаҳои хурд: омӯзиши интиқол, бисёрҷониба (бурҷи муштарак), дистилятсияи домейн.
7) Диверсификатсия, навоварӣ, серендипитсия
Алгоритмҳо: MMR, x ҷарима барои якранг.
Квотаҳо: min/max аз рӯи категория/бренди/хавф.
Устувории рӯйхат: инерсияи мавқеъ, гистерезиси нав; баромадро "дурахш" накунед.
8) Инфраструктура ва MLO
Дӯкони хусусият: дорухатҳои PIT, TTL барои хусусиятҳои сессия, паритети онлайн/офлайнӣ.
Хидматҳои ANN: FAISS/ScaNN, sharding/кэш, нусхабардорӣ.
Ranker: хусусиятҳои вақти воқеӣ, калибрченкунӣ, имзои версия.
Сиёсат/Қабати такрорӣ: маҳдудиятҳо/квотаҳо/RG/басомадҳо/гуногунрангӣ.
SLA: ба охир мерасад p95 ≤ 100-300 мс; афтодани (маъмул-бехатар) ҳангоми таназзул.
Мушоҳидаҳо: пайҳои коррелятсияи _ id, фарқияти хусусият (PSI), ченакҳои сифатии онлайн, кран.
9) Амният, махфият, ахлоқ
Ҳадди ақали PII, RLS/CLS, ниқоб.
Филтрҳои RG/мутобиқат пеш аз намоиш, ҳадди басомад, соатҳои ором.
Ташхиси одилона аз рӯи сегмент; шарҳи сабабҳои намоиш; роҳи муроҷиат.
10) Рамзи псевдо: Ба хотир оред → Rank → Rank-rank гибрид
python
Recall cand_emb = ann.recall(user_embed, topk=500)
cand_rule = popular.by_segment(user.segment, k=200)
cands = dedup(cand_emb + cand_rule)
Rank features = featurize(user, cands, context) # user/item/context scores = ranker.predict(features) # p(click), value
Policy-aware re-rank final = rerank(
cands, scores,
constraints=dict(
diversity_min={'category': 3},
brand_quota={'A':0.3,'B':0.3},
rg_filter=True,
freq_caps=get_user_caps(user)
),
objective_weights=dict(ctr=0.6, value=0.3, novelty=0.1)
)
return final[:N]
Намунаи Томпсон барои эҷодкорон (эскиз)
python beta priors per creative: (α, β)
samples = {cr: np.random.beta(alpha[cr], beta[cr]) for cr in creatives}
chosen = max(samples, key=samples.get)
show(chosen)
update(alpha, beta, reward=click)
11) Псевдо-SQL: фикру мулоҳизаҳои манфӣ ва ҳадди басомад
sql
-- Последний показ и флаги «скрыть/жалоба» → баним на 7 дней
WITH last_impr AS (
SELECT user_id, item_id,
MAX(ts) AS last_ts,
BOOL_OR(feedback_hide) AS hidden,
BOOL_OR(feedback_report) AS reported
FROM impressions
GROUP BY 1,2
)
SELECT i.
FROM inventory i
LEFT JOIN last_impr l ON l.user_id=:uid AND l.item_id=i.item_id
WHERE COALESCE(l.hidden,false)=false
AND COALESCE(l.reported,false)=false
AND (l.last_ts IS NULL OR l.last_ts < NOW() - INTERVAL '7 day');
12) Ҷадвали қарор
13) Анти-намунаҳо
Оптимизатсияи "CTR хом" ба ҷои афзоиш ва арзиш.
Набудани қабати дубора дараҷабандӣ → монотонияи барзиёд, "нақби биниш".
Чеҳраҳо аз оянда; омехта TZ; таърифҳои сигнали ғайритабиӣ.
Не калибрченкунии эҳтимолият → ҳадди нодуруст/сиёсат.
RG/этика/адолатро нодида гиред → шикоятҳо/хатарҳо/ҷаримаҳо.
Хусусияти онлайн/офлайнии desynchronized ва ченакҳо - "кашиш" дар ғизо.
Набудани камбудӣ ва вентилятсияи таваққуф.
14) Рӯйхати санҷиши оғози тавсия
- Шиносномаи система - ҳадафҳо, маҳдудиятҳо, ченакҳо, соҳибон, версияҳо
- Ба хотир оред/рутба/рутбаи ҷудошуда; ANN гарм шуд, кэшҳо танзим карда шуданд
- Хусусиятҳои PIT, калибрченкунӣ, нишондиҳандаҳои офлайнӣ (NDCG/PR-AUC) гузаштанд
- Тарҳи A/B ва посбонҳо; гузориши омода оид ба қарор
- Маҳдудиятҳо: гуногунӣ/квотаҳо/RG/ҳадди басомад - татбиқ ва назорат карда мешаванд
- SLA p95, нишонаҳо, огоҳиҳо, боздоштани кран ва афтиши маъмул-бехатар
- Ҳуҷҷатгузорӣ, Runibooks, Нақшаи такмили афзоиш
Натиҷа
Системаи тавсияи қавӣ ин лӯлаи огоҳонаи сиёсат аст: гибридии Recall/Rank/Re-rank, ки арзиши афзоишро дар суръат, ахлоқ ва маҳдудиятҳои гуногунрангӣ оптимизатсия мекунад. Бо илова кардани бандитҳо/RL барои мутобиқсозии онлайн, интизоми MLOps ва арзёбии сабабҳои дуруст, шумо на "рӯйхатҳоро ба хотири рӯйхатҳо" мегиред, балки қарорҳои идорашавандае, ки қаноатмандии ROMI, LTV ва корбарро афзоиш медиҳанд - устувор ва бехатар.