نظم التوصيات

نظام التوصيات ليس فقط "نموذج CTR. "إنه خط أنابيب من البيانات → المرشحين → → ترتيب السياسة → الإجراءات، → التعليقات التي تعمل على تحسين القيمة الإضافية في ظل قيود العالم الحقيقي (السرعة، وحدود التردد، والتنوع، والأخلاق/الامتثال).

1) البيانات والإشارات والتمثيلات

الأحداث: المشاهدات/النقرات/الإضافات/المشتريات/الودائع، وقت الإقامة، الإلغاء.
المحتوى/الكتالوج: السمات (الفئات/الأنواع/الاستوديوهات/السعر/النضارة/التقلب).
ملفات تعريف المستخدم: RFM، التفضيلات، الأجهزة/القنوات، المواعيد.
السياق: الساعة/اليوم/العطلات/المباريات، الموقع/TZ، موقع العرض.
الجودة: وصفات نقطة في الوقت المناسب، غباء الأحداث، الوفاة/الأحذية المضادة، إخفاء PII.
الدمج: المستخدم/العنصر/السياق في الفضاء المشترك (MF/Word2Vec2Rec/transformers)، متعدد الوسائط (نص/صور).

2) الهندسة المعمارية: استدعاء → رتبة → إعادة تصنيف → العمل

1. استدعاء المرشح (200-5000 مرشح): ANN (FAISS/ScaNN)، الشعبية/الاتجاهات، المرشحات القائمة على القواعد.
2. الترتيب (20-200): LTR (GBM/NN)، بنى البرج، أهداف ثنائية/متعددة الأهداف (انقر، تحويل، قيمة).
3. إعادة ترتيب السياسة العامة (5-30 في القائمة النهائية): التنويع/الجدة/الصدفة، حصص العلامة التجارية/الفئة، النمو الحقيقي/الامتثال، حدود التردد، الإنصاف.
4. العمل: عرض/دفع/بريد إلكتروني/عرض شخصي مع تهدئة و «ساعات هادئة».
5. ردود الفعل: سجل 'impression→click→action→value'، ردود الفعل السلبية (تخطي، شكوى).

3) النماذج النموذجية

قائم على المحتوى: القرب من ميزات تكنولوجيا المعلومات وموجزها ؛ مثالية لبداية باردة للعناصر.
الترشيح التعاوني: المستخدم/المستخدم/العنصر حسب مصفوفة التفاعل.
العوامل/التضمين: MF/BPR/NeuMF، MLP ذو البرجين (برج المستخدم × برج العنصر).
Learning-to-Rank: pairwise/listwise (LambdaMART، RankNet)، تحسين NDCG @ k.
الجلسة/التسلسل: GRU4Rec، SASRec، المحولات (T5-style) - الترتيب/السياق في الدورة.
قطاع الطرق السياقي: LinUCB/Thompson للتكيفات السريعة عبر الإنترنت والإبداعات.
RL: SlateQ/DQN/Policy Gradient للحصول على جائزة متعددة الخطوات (الاحتفاظ/LTV).
النُهُج السببية/الرفيعة: التوصيات التي تأخذ في الحسبان الزيادة، وليس «التقارير الأولية عن التجارة».

4) الأهداف والقيود وصياغة المهمة

الأهداف: CTR/CTCVR، الإيرادات/الهامش/LTV، الاحتفاظ، الرضا، السرعة.
القيود: التنويع، حصص مقدمي الخدمات/الفئات، الحدود القصوى للترددات، النمو الحقيقي/الامتثال، الإنصاف/الأخلاقيات، SLA p95.

إعادة ترتيب السياسة العامة (مثال على التوزيع القياسي):

[
\ textstyle Score =\alpha\cdot\hat p_{\text{click}} +\beta\cdot\text {Value}

\gamma\cdot\text {تعب} +\دلتا\cdot\نص {جديد} -\sum _ j\lambda _ j\cdot\text {عقوبة} _ j
]

حيث تكون العقوبة هي انتهاكات الحصص/النمو الحقيقي/التردد/الرتابة.

5) المقاييس والتسجيل

غير متصل

الصلة/الترتيب: AUC/PR-AUC, Recall @ k, MAP, NDCG @ k.
الأعمال: الهامش المتوقع eRPM/eCPM، proxy-LTV.
المعايرة: براير، اللجنة الاقتصادية لأوروبا (مهمة للعتبات/السياسات).
Списки: التغطية/التنوع/الحداثة/الصدفة.

عبر الإنترنت

اختبارات A/B/متعددة العلامات: CTR، CTCVR، الدخل/الجلسة، الاحتفاظ، الشكاوى/إلغاء الاشتراكات (حواجز الحماية)، زمن الوصول/المهلة.
التقييم السببي: CUPED، شبه التجارب (DiD/التحكم الاصطناعي) في عشوائية محدودة.
مقاييس الرفع: Qini/AUUC، uplift @ k - للتوصيات الواعية بالعلاج.

6) البداية الباردة والشرود

المستخدمون الجدد: شريحة @ الشهيرة، استطلاع المحتوى، المحتوى بناءً على النقرة الأولى، قطاع الطرق بذكاء واسع.
الأيتام الجديدة: البيانات الوصفية/تضمين النص/الصور + المظهر المتشابه حسب الاستوديو/الفئة.
المجالات الصغيرة: التعلم النقلي، المهام المتعددة (البرج المشترك)، التقطير عبر المجالات.

7) التنويع والجدة والصدفة

الخوارزميات: MMR, xQAD, PM-2; غرامات على الرتابة.
الحصص: الحد الأقصى/الحد الأقصى حسب الفئة/العلامة التجارية/فئة المخاطر.
استقرار القائمة: الجمود الموضعي، تحديث الهستيريا ؛ لا «تومض» الناتج.

8) البنية التحتية و MLOps

متجر الميزات: وصفات PIT، TTL لميزات الجلسة، التكافؤ عبر الإنترنت/غير متصل بالإنترنت.
خدمات ANN: FAISS/ScaNN، شحن/ذاكرة تخزين مؤقت، تكرار.
رانكر: ميزات في الوقت الفعلي، معايرة، توقيعات الإصدار.
السياسة/إعادة ترتيب الطبقة: الحدود/الحصص/النمو الحقيقي/الترددات/التنوع.
جيش تحرير السودان: من طرف إلى طرف p95 ≤ 100-300 мс ؛ الاحتياطي (الشائع الآمن) تحت التدهور.
إمكانية الملاحظة: آثار الارتباط _ الهوية، انحراف الميزات (PSI)، مقاييس الجودة عبر الإنترنت، توقف الرافعة.

9) الأمن والخصوصية والأخلاق

تقليل PII، RLS/CLS، القناع.
مرشحات RG/الامتثال قبل العرض، أغطية التردد، ساعات الهدوء.
تشخيص الإنصاف حسب القطاع ؛ وشرح أسباب العرض ؛ طريق الاستئناف.

10) الرمز الزائف: استدعاء → رتبة → إعادة تصنيف هجين

python
Recall cand_emb = ann. recall(user_embed, topk=500)
cand_rule = popular. by_segment(user. segment, k=200)
cands = dedup(cand_emb + cand_rule)

Rank features = featurize(user, cands, context)   # user/item/context scores = ranker. predict(features)        # p(click), value

Policy-aware re-rank final = rerank(
cands, scores,
constraints=dict(
diversity_min={'category': 3},
brand_quota={'A':0. 3,'B':0. 3},
rg_filter=True,
freq_caps=get_user_caps(user)
),
objective_weights=dict(ctr=0. 6, value=0. 3, novelty=0. 1)
)
return final[:N]

أخذ عينات طومسون للمبدعين (رسم تخطيطي)

python beta priors per creative: (α, β)
samples = {cr: np. random. beta(alpha[cr], beta[cr]) for cr in creatives}
chosen = max(samples, key=samples. get)
show(chosen)
update(alpha, beta, reward=click)

11) Seudo-SQL: ردود الفعل السلبية وأغطية التردد

sql
-- Last show and "hide/complain" flags → 7-day bans
WITH last_impr AS (
SELECT user_id, item_id,
MAX(ts) AS last_ts,
BOOL_OR(feedback_hide) AS hidden,
BOOL_OR(feedback_report) AS reported
FROM impressions
GROUP BY 1,2
)
SELECT i.
FROM inventory i
LEFT JOIN last_impr l ON l. user_id=:uid AND l. item_id=i. item_id
WHERE COALESCE(l. hidden,false)=false
AND COALESCE(l. reported,false)=false
AND (l. last_ts IS NULL OR l. last_ts < NOW() - INTERVAL '7 day');

12) جدول القرار

حالة	السياق	العمل	القيود	تعليق
'new _ user & low_history'	الصعود على متن الطائرة	special @ para + content-seed	أغطية التردد، RG	بداية باردة
'session _ len> 3 & diversity_low'	الدورة	إعادة ترتيب MMR/xQAD	3 فئات	الصدفة
'uplift_push≥τ'	عروض	دفع شخصي	لا تزعج، zhaloby≤Kh	الزيادة، وليس CTR
'risk_RG≥τ'	أي	حظر محتوى المخاطر	النمو الحقيقي/الامتثال	السلامة

13) الأنماط المضادة

تحسين «CTR الخام» بدلاً من الزيادة والقيمة.
عدم وجود طبقة إعادة الترتيب → الرتابة الزائدة، «نفق الرؤية».
وجوه من المستقبل ؛ وخلط TZ ؛ تعاريف الإشارة غير الواقعية.
لا توجد معايرة للاحتمالات → عتبات/سياسات غير صحيحة.
تجاهل النمو الحقيقي/الأخلاقيات/الإنصاف → الشكاوى/المخاطر/الغرامات.
ميزة ومقاييس غير متزامنة عبر الإنترنت/غير متصلة بالإنترنت - «سحب» في الطعام.
عدم وجود احتياطي وصمام إيقاف.

14) قائمة مرجعية لإطلاق التوصية

جواز سفر النظام - الأهداف والقيود والمقاييس والمالكين والإصدارات
الاستدعاء/الرتبة/إعادة الرتبة المطلقة ؛ تم تسخين ANN، وتكوين المخابئ
مرت ميزات PIT والمعايرة والمعايير غير المتصلة بالإنترنت (NDCG/PR-AUC)
تصميم A/B وحواجز الحماية ؛ تقرير جاهز لاتخاذ القرار
القيود: التنوع/الحصص/النمو الحقيقي/الحدود القصوى للترددات - المنفذة والمرصودة
SLA p95، الآثار والتنبيهات وإيقاف الرافعة والاحتياطي الآمن الشعبي
التوثيق، Runibooks، خطة التحسين التدريجي

المجموع

نظام التوصيات القوي هو خط الأنابيب الواعي بالسياسة: إعادة الاستدعاء/الرتبة/إعادة الترتيب الهجين الذي يحسن القيمة الإضافية في ظل السرعة والأخلاق وقيود التنوع. من خلال إضافة قطاع الطرق/RL للتكيف عبر الإنترنت، وانضباط MLOps والتقييم السببي الصحيح، لا تحصل على «قوائم من أجل القوائم»، ولكن الحلول المدارة التي تزيد من ROMI و LTV ورضا المستخدم - مستقرة وآمنة.

نظم التوصيات