Առաջարկական համակարգեր

Խորհրդատվական համակարգեր

Խորհրդատվական համակարգը ոչ միայն CTR մոդելն է։ Սա տվյալների փոխակրիչ է, ռուսական թեկնածուները հակադարձում են ռուսական քաղաքականությունը հակադարձ կապ, որը օպտիմիզացնում է իրական սահմանափակումների (արագություն, հաճախականության կաթիլներ, բազմազանություն, էթիկա/կոմպլենս)։

1) Տվյալներ, ազդանշաններ և ներկայացումներ

Իրադարձությունները 'դիտումներ/տեսահոլովակներ/ավելացումներ/գնումներ/ավանդներ, www.elll-time-time, www.ru։

Բովանդակություն/կատալոգ 'ատրիբուտներ (կատեգորիաներ/ժանրեր/ստուդիաներ/գինը/թարմ/ալատիլություն)։

Օգտագործողների պրոֆիլները ՝ RFM, նախընտրություններ, սարքեր/ալիքներ, թայմ արցունքներ։

Համատեքստ ՝ ժամ/օր/արձակուրդներ/խաղեր, ստալինյան/TZ, ցուցադրման տարածք։

Որակը 'point-in-time բաղադրատոմսեր, իրադարձությունների գաղափարախոսություն, dedup/antibot, PII դիմակավորում։

Empedings: user/item/ext ընդհանուր տարածքում (MF/Word2Vec2Rec/transformers), մուլտիմոդալ (տեքստ/պատկեր)։

2) Ճարտարապետություն: Recall www.Rank www.re Re-rank no Action

1. Candidate recall (200-5000 թեկնածուներ): ANN (FAISS/ScaNN), ժողովրդականություն/միտումներ, rule-based ֆիլտրեր։

2. Ranking (20-200): LTR (GBM/NN), Tower-ճարտարապետություն, երկուական/բազմաբնույթ targets (click, conversion, value)։

3. Policy-aensre-rank (5-30 վերջնական ցուցակում) 'ինդեքսավորում/նորություն/սերենդիպություն, բրենդների քվոտաներ/կատեգորիաներ, RG/կոմպլեքս, հաճախականության կաթիլներ, fairness։

4. Action: ցուցադրություն/2019/e-mail/անձնական վիտրինը կուլդաունամներով և «հանգիստ ժամերով»։

5. Feedback: log 'impression click www.value ", բացասական արձագանքը (skip, բողոք)։

3) Մոդելային պարադիգմներ

Content-based: Հարևանությունը item-ի և ալյումինի նշաններով։ կատարյալ է աիթեմների սառը մեկնարկի համար։

Համագործակցային ֆիլտրը 'user-user/item-item փոխազդեցության մատրիցով։

Ֆակտորիզացիա/սաղմեդինգներ ՝ MF/BPR/NeuMF, երկշաբաթյա MLP (user tower coritem tower)։

Learning-to-Rank: pairwise/listwise (Lambox MART, Rance Net), NDCG @ k օպտիմիզացիա։

Սեսսիոն/հետևողական ՝ GRU4Rec, SASRec, Transformers (T5-style) - կարգուկանոն/կոնտեքստը նստաշրջանում։

Կոնտեքստային ավազակները ՝ LinUCB/Thompson արագ առցանց հարմարեցման և ստեղծարարությունների համար։

RL: Slast Q/DQN/Policy Gradient բազմաշերտ մրցանակների համար (LTV)։

Կաուզալ/uplift մոտեցումները 'առաջարկություններ, որոնք հաշվի են առնում աճը, և ոչ թե «CTR պանիրը»։

4) Նպատակներ, սահմանափակումներ և խնդրի ձևակերպում

Նպատակները ՝ CTR/CTCVR, եկամուտ/մարջա/LTV, պահպանումը, բավարարվածությունը, արագությունը։

Սահմանափակումները, պրովայդերների քվոտաները/կատեգորիաները, հաճախականության կաթիլները, RG/complaens, fairness/էթիկան, SLA p95։

Policy-aerre-rank (սկալարիզացիայի օրինակ)

[
\textstyle Score = \alpha \cdot \hat p_{\text{click}} + \beta \cdot \text{Value}

\gamma \cdot \text{Fatigue} + \delta \cdot \text{Novelty} - \sum_j \lambda_j \cdot \text{Penalty}_j
]

Որտեղ Penalty-ը քվոտի/RG/հաճախականության/մեկ։

5) Մետրիկի և գնահատականի

Օֆլինը

Ռելեվանտացիա/ռենջացիա ՝ AUC/PR-AUC, Recall @ k, MAP, NDCG @ k։

Բիզնեսը ՝ eRPM/eCPM, proxy-LTV, սպասվող մարժա։

Տրամաբանությունը ՝ Brier, RF (կարևոր է/քաղաքական)։

Списки: coverage/diversity/novelty/serendipity.

Առցանց

A/B/բազմաչափ թեստեր ՝ CTR, CTCVR, եկամուտը/նստաշրջանը, պահելը, բողոքները/հուղարկավորությունները (guardrails), latency/timeout։

Կաուզալ գնահատական ՝ CUPED, քվասիզիեքսպերիմենտներ (DiD/սինթետիկ վերահսկողություն) սահմանափակ ռանդոմիզացիայի ժամանակ։

Uplift-metriks: Qini/AUUC, uplift @ k - treatom-aj-ի համար։

6) Սառը մեկնարկը և հաստությունը

Նոր օգտագործողները 'popular @ segram, բովանդակություն-հարցում, առաջին տեսահոլովակի բովանդակությունը, ավազակը լայն հետախուզությամբ։

Նոր այթեմներ ՝ մետատվյալներ/տեքստային սաղմեդդինգներ/նկարներ + look-alike ստուդիայում/կատեգորիայում։

Փոքր հատվածներ ՝ transfer learning, multi-task (shared tower), cross-domain distillation։

7) Ինտերֆեյսը, նորությունը, սերենդիպությունը

Ալգորիթմներ ՝ MMR, xQUAD, PM-2; տուգանքներ մեկ ձևի համար։

Քվոտաներ ՝ min/max կատեգորիաների/բրենդների/ռիսկի դասերի։

Ցուցակների իրականացումը 'դիրքերի իներցիա, հիստերեևիչ։ մի գաղթեք։

8) Ենթակառուցվածքը և MLOps-ը

Feature Store: PIT բաղադրատոմսեր, TTL նստաշրջանի ֆիչի համար, առցանց/offline հավասարություն։

ANN ծառայություններ ՝ FAISS/ScaNN, շարդինգ/քեշ, կրկնօրինակումը։

Ranker: real-time fichi, տրամաչափություն, տարբերակների ստորագրություններ։

Policy/Re-rank շերտը ՝ սահմանափակումներ/քվոտաներ/RG/հաճախականություններ/diversity։

SLA: end-to-end p95 ≤ 100–300 мс; fallback (popular-safe) քայքայման ժամանակ։

Դիտարկումը 'հետքեր' wwww.relation _ id ', fich-drift (PSI), որակի առցանց չափումներ, «stop-cran»։

9) Անվտանգություն, գաղտնիություն, էթիկա

PII, RSA/CLS, դիմակավորում։

RG/complaens ֆիլտրերը մինչև ցուցադրումը, հաճախականության կաթիլները, «հանգիստ ժամացույցը»։

Fairness-ախտորոշումը հատվածներով; բացահայտման պատճառների բացատրությունը. բողոքարկման ճանապարհը։

10) Կեղծ կոդը ՝ Recall Rank-Rank-ի հիբրիդ Rank-rank-rank-rank-rank

python
Recall cand_emb = ann. recall(user_embed, topk=500)
cand_rule = popular. by_segment(user. segment, k=200)
cands = dedup(cand_emb + cand_rule)

Rank features = featurize(user, cands, context)   # user/item/context scores = ranker. predict(features)        # p(click), value

Policy-aware re-rank final = rerank(
cands, scores,
constraints=dict(
diversity_min={'category': 3},
brand_quota={'A':0. 3,'B':0. 3},
rg_filter=True,
freq_caps=get_user_caps(user)
),
objective_weights=dict(ctr=0. 6, value=0. 3, novelty=0. 1)
)
return final[:N]

Thompson Sampling-ը ստեղծագործական արարածների համար (sketch)

python beta priors per creative: (α, β)
samples = {cr: np. random. beta(alpha[cr], beta[cr]) for cr in creatives}
chosen = max(samples, key=samples. get)
show(chosen)
update(alpha, beta, reward=click)

11) Կեղծ-SQL 'բացասական արձագանք և հաճախականության կաթիլներ։

sql
-- Last show and "hide/complain" flags → 7-day bans
WITH last_impr AS (
SELECT user_id, item_id,
MAX(ts) AS last_ts,
BOOL_OR(feedback_hide) AS hidden,
BOOL_OR(feedback_report) AS reported
FROM impressions
GROUP BY 1,2
)
SELECT i.
FROM inventory i
LEFT JOIN last_impr l ON l. user_id=:uid AND l. item_id=i. item_id
WHERE COALESCE(l. hidden,false)=false
AND COALESCE(l. reported,false)=false
AND (l. last_ts IS NULL OR l. last_ts < NOW() - INTERVAL '7 day');

12) Decision table (քաղաքականության ուրվագիծ)

Պայմանը	Համատեքստը	Գործողություն	Սահմանափակումներ	Մեկնաբանություն
`new_user & low_history`	onbording	popular@segment + content-seed	հաճախականության կաթիլներ, RG, RG	սառը սկիզբ
`session_len>3 & diversity_low`	նստաշրջան	MMR/xQuAD re-rank	min 3 կատեգորիայի	սերենդինպություն
`uplift_push≥τ`	offers	անձնական ֆուտբոլ	Do-Wint-Disturb, բողոքներ wwwX	Rement, ոչ CTR
`risk_RG≥τ`	ռիսկի բովանդակություն	RG/complaens	անվտանգություն

13) Anti-patterna

«Հում CTR» -ի օպտիմիզացումը երկարաժամկետ և արժեքների փոխարեն։

Re-rank շերտի բացակայությունը միանձնյա ավելցուկ է, «տեսողության թունել»։

Ապագայի աղվեսները. TZ խառնուրդ; ազդանշանների անփոխարինելի սահմանումները։

Հավանականության տրամաբանություն չկա։

RG/էթիկայի/fairness-ի անտեսումը բացատրում է բողոքները/ռիսկերը/տուգանքները։

Առցանց/offline rasinchron fich և metric - «արթնացում» երկարության մեջ։

Fallback-ի և «stop-kran» -ի բացակայությունը։

14) Առաջարկողի մեկնարկի չեկի ցուցակը

Համակարգի անձնագիր ՝ նպատակներ, սահմանափակումներ, չափումներ, տերեր, վարկածներ
Recall/Rank/Re-rank ուսումնասիրված; ANN մեղմություն, կեշի տրամադրություն
PIT-fichi, տրամաչափը, ofline-benchmarks (NDCG/PR-AUC) անցանելի են։
A/B դիզայն և guardrails; decision-ready (ազդեցություն/ռիսկեր)
Սահմանափակումներ ՝ diversity/քվոտաներ/RG/հաճախականության կաթիլներ, իրականացվում և վերահսկվում են։
SLA p95, հետքեր, ալերտներ, «stop-kran» և popular-safe fallback fallback
Մոսկվան, ռունիբուկները, ռեմենտալ բարելավման պլանը

Արդյունքը

Ուժեղ խորհրդատվական համակարգը policy-ault փոխակրիչ է 'ստացիոնար Recall/Rank/Re-rank, որը օպտիմիզացնում է այլընտրանքային արժեքը արագության, էթիկայի և բազմազանության սահմանափակումների համար։ Ավելացնելով ավազակախմբերը/RL առցանց հարմարեցման համար, MLOps-ի կարգապահությունը և ճիշտ կաուզական գնահատականը, դուք ստանում եք ոչ թե «ցուցակներ հանուն ցուցակների», այլ կառավարվող լուծումներ, որոնք բարձրացնում են ROMI, LTV և օգտագործողների բավարարումը կայուն և անվտանգ։

Առաջարկական համակարգեր

Խորհրդատվական համակարգեր

Առցանց

Thompson Sampling-ը ստեղծագործական արարածների համար (sketch)

Արդյունքը

Կապ հաստատեք մեզ հետ

Արագ կապ

Տեսանյութը շուտով կթարմացվի

Այս պահին մենք ծանրաբեռնված ենք նախագծերով