نظم التوصيات
نظم التوصيات
نظام التوصيات ليس فقط "نموذج CTR. "إنه خط أنابيب من البيانات → المرشحين → → ترتيب السياسة → الإجراءات، → التعليقات التي تعمل على تحسين القيمة الإضافية في ظل قيود العالم الحقيقي (السرعة، وحدود التردد، والتنوع، والأخلاق/الامتثال).
1) البيانات والإشارات والتمثيلات
الأحداث: المشاهدات/النقرات/الإضافات/المشتريات/الودائع، وقت الإقامة، الإلغاء.
المحتوى/الكتالوج: السمات (الفئات/الأنواع/الاستوديوهات/السعر/النضارة/التقلب).
ملفات تعريف المستخدم: RFM، التفضيلات، الأجهزة/القنوات، المواعيد.
السياق: الساعة/اليوم/العطلات/المباريات، الموقع/TZ، موقع العرض.
الجودة: وصفات نقطة في الوقت المناسب، غباء الأحداث، الوفاة/الأحذية المضادة، إخفاء PII.
الدمج: المستخدم/العنصر/السياق في الفضاء المشترك (MF/Word2Vec2Rec/transformers)، متعدد الوسائط (نص/صور).
2) الهندسة المعمارية: استدعاء → رتبة → إعادة تصنيف → العمل
1. استدعاء المرشح (200-5000 مرشح): ANN (FAISS/ScaNN)، الشعبية/الاتجاهات، المرشحات القائمة على القواعد.
2. الترتيب (20-200): LTR (GBM/NN)، بنى البرج، أهداف ثنائية/متعددة الأهداف (انقر، تحويل، قيمة).
3. إعادة ترتيب السياسة العامة (5-30 في القائمة النهائية): التنويع/الجدة/الصدفة، حصص العلامة التجارية/الفئة، النمو الحقيقي/الامتثال، حدود التردد، الإنصاف.
4. العمل: عرض/دفع/بريد إلكتروني/عرض شخصي مع تهدئة و «ساعات هادئة».
5. ردود الفعل: سجل 'impression→click→action→value'، ردود الفعل السلبية (تخطي، شكوى).
3) النماذج النموذجية
قائم على المحتوى: القرب من ميزات تكنولوجيا المعلومات وموجزها ؛ مثالية لبداية باردة للعناصر.
الترشيح التعاوني: المستخدم/المستخدم/العنصر حسب مصفوفة التفاعل.
العوامل/التضمين: MF/BPR/NeuMF، MLP ذو البرجين (برج المستخدم × برج العنصر).
Learning-to-Rank: pairwise/listwise (LambdaMART، RankNet)، تحسين NDCG @ k.
الجلسة/التسلسل: GRU4Rec، SASRec، المحولات (T5-style) - الترتيب/السياق في الدورة.
قطاع الطرق السياقي: LinUCB/Thompson للتكيفات السريعة عبر الإنترنت والإبداعات.
RL: SlateQ/DQN/Policy Gradient للحصول على جائزة متعددة الخطوات (الاحتفاظ/LTV).
النُهُج السببية/الرفيعة: التوصيات التي تأخذ في الحسبان الزيادة، وليس «التقارير الأولية عن التجارة».
4) الأهداف والقيود وصياغة المهمة
الأهداف: CTR/CTCVR، الإيرادات/الهامش/LTV، الاحتفاظ، الرضا، السرعة.
القيود: التنويع، حصص مقدمي الخدمات/الفئات، الحدود القصوى للترددات، النمو الحقيقي/الامتثال، الإنصاف/الأخلاقيات، SLA p95.
[
\ textstyle Score =\alpha\cdot\hat p_{\text{click}} +\beta\cdot\text {Value}
\ gamma\cdot\text {إرهاق} +\دلتا\cdot\text {حداثة} -\sum _ j\lambda _ j\cdot\text {عقوبة} _ j
]
حيث تكون العقوبة هي انتهاكات الحصص/النمو الحقيقي/التردد/الرتابة.
5) المقاييس والتسجيل
غير متصل
الصلة/الترتيب: AUC/PR-AUC, Recall @ k, MAP, NDCG @ k.
الأعمال: الهامش المتوقع eRPM/eCPM، proxy-LTV.
المعايرة: براير، اللجنة الاقتصادية لأوروبا (مهمة للعتبات/السياسات).
Списки: التغطية/التنوع/الحداثة/الصدفة.
عبر الإنترنت
اختبارات A/B/متعددة العلامات: CTR، CTCVR، الدخل/الجلسة، الاحتفاظ، الشكاوى/إلغاء الاشتراكات (حواجز الحماية)، زمن الوصول/المهلة.
التقييم السببي: CUPED، شبه التجارب (DiD/التحكم الاصطناعي) في عشوائية محدودة.
مقاييس الرفع: Qini/AUUC، uplift @ k - للتوصيات الواعية بالعلاج.
6) البداية الباردة والشرود
المستخدمون الجدد: شريحة @ الشهيرة، استطلاع المحتوى، المحتوى بناءً على النقرة الأولى، قطاع الطرق بذكاء واسع.
الأيتام الجديدة: البيانات الوصفية/تضمين النص/الصور + المظهر المتشابه حسب الاستوديو/الفئة.
المجالات الصغيرة: التعلم النقلي، المهام المتعددة (البرج المشترك)، التقطير عبر المجالات.
7) التنويع والجدة والصدفة
الخوارزميات: MMR, xQAD, PM-2; غرامات على الرتابة.
الحصص: الحد الأقصى/الحد الأقصى حسب الفئة/العلامة التجارية/فئة المخاطر.
استقرار القائمة: الجمود الموضعي، تحديث الهستيريا ؛ لا «تومض» الناتج.
8) البنية التحتية و MLOps
متجر الميزات: وصفات PIT، TTL لميزات الجلسة، التكافؤ عبر الإنترنت/غير متصل بالإنترنت.
خدمات ANN: FAISS/ScaNN، شحن/ذاكرة تخزين مؤقت، تكرار.
رانكر: ميزات في الوقت الفعلي، معايرة، توقيعات الإصدار.
السياسة/إعادة ترتيب الطبقة: الحدود/الحصص/النمو الحقيقي/الترددات/التنوع.
جيش تحرير السودان: من طرف إلى طرف p95 ≤ 100-300 мс ؛ الاحتياطي (الشائع الآمن) تحت التدهور.
إمكانية الملاحظة: آثار الارتباط _ الهوية، انحراف الميزات (PSI)، مقاييس الجودة عبر الإنترنت، توقف الرافعة.
9) الأمن والخصوصية والأخلاق
تقليل PII، RLS/CLS، القناع.
مرشحات RG/الامتثال قبل العرض، أغطية التردد، ساعات الهدوء.
تشخيص الإنصاف حسب القطاع ؛ وشرح أسباب العرض ؛ طريق الاستئناف.
10) الرمز الزائف: استدعاء → رتبة → إعادة تصنيف هجين
python
Recall cand_emb = ann.recall(user_embed, topk=500)
cand_rule = popular.by_segment(user.segment, k=200)
cands = dedup(cand_emb + cand_rule)
Rank features = featurize(user, cands, context) # user/item/context scores = ranker.predict(features) # p(click), value
Policy-aware re-rank final = rerank(
cands, scores,
constraints=dict(
diversity_min={'category': 3},
brand_quota={'A':0.3,'B':0.3},
rg_filter=True,
freq_caps=get_user_caps(user)
),
objective_weights=dict(ctr=0.6, value=0.3, novelty=0.1)
)
return final[:N]
عينات طومسون للمبدعين (رسم تخطيطي)
python beta priors per creative: (α, β)
samples = {cr: np.random.beta(alpha[cr], beta[cr]) for cr in creatives}
chosen = max(samples, key=samples.get)
show(chosen)
update(alpha, beta, reward=click)
11) Seudo-SQL: ردود الفعل السلبية وأغطية التردد
sql
-- Последний показ и флаги «скрыть/жалоба» → баним на 7 дней
WITH last_impr AS (
SELECT user_id, item_id,
MAX(ts) AS last_ts,
BOOL_OR(feedback_hide) AS hidden,
BOOL_OR(feedback_report) AS reported
FROM impressions
GROUP BY 1,2
)
SELECT i.
FROM inventory i
LEFT JOIN last_impr l ON l.user_id=:uid AND l.item_id=i.item_id
WHERE COALESCE(l.hidden,false)=false
AND COALESCE(l.reported,false)=false
AND (l.last_ts IS NULL OR l.last_ts < NOW() - INTERVAL '7 day');
12) جدول القرار
13) الأنماط المضادة
تحسين «CTR الخام» بدلاً من الزيادة والقيمة.
عدم وجود طبقة إعادة الترتيب → الرتابة الزائدة، «نفق الرؤية».
وجوه من المستقبل ؛ وخلط TZ ؛ تعاريف الإشارة غير الواقعية.
لا توجد معايرة للاحتمالات → عتبات/سياسات غير صحيحة.
تجاهل النمو الحقيقي/الأخلاقيات/الإنصاف → الشكاوى/المخاطر/الغرامات.
ميزة ومقاييس غير متزامنة عبر الإنترنت/غير متصلة بالإنترنت - «سحب» في الطعام.
عدم وجود احتياطي وصمام إيقاف.
14) قائمة مرجعية لإطلاق التوصية
- جواز سفر النظام - الأهداف والقيود والمقاييس والمالكين والإصدارات
- الاستدعاء/الرتبة/إعادة الرتبة المطلقة ؛ تم تسخين ANN، وتكوين المخابئ
- مرت ميزات PIT والمعايرة والمعايير غير المتصلة بالإنترنت (NDCG/PR-AUC)
- تصميم A/B وحواجز الحماية ؛ تقرير جاهز لاتخاذ القرار
- القيود: التنوع/الحصص/النمو الحقيقي/الحدود القصوى للترددات - المنفذة والمرصودة
- SLA p95، الآثار والتنبيهات وإيقاف الرافعة والاحتياطي الآمن الشعبي
- التوثيق، Runibooks، خطة التحسين التدريجي
النتيجة
نظام التوصيات القوي هو خط الأنابيب الواعي بالسياسة: إعادة الاستدعاء/الرتبة/إعادة الترتيب الهجين الذي يحسن القيمة الإضافية في ظل السرعة والأخلاق وقيود التنوع. من خلال إضافة قطاع الطرق/RL للتكيف عبر الإنترنت، وانضباط MLOps والتقييم السببي الصحيح، لا تحصل على «قوائم من أجل القوائم»، ولكن الحلول المدارة التي تزيد من ROMI و LTV ورضا المستخدم - مستقرة وآمنة.