GH GambleHub

نماذج التخصيص

نماذج التخصيص

التخصيص هو نظام حيث → نماذج → البيانات عرض السياسة → العمل → التغذية المرتدة. والهدف هو زيادة القيمة الإضافية إلى أقصى حد (الدخل/الاستبقاء/الرضا) مع مواجهة القيود (الأخلاقيات/النمو الحقيقي، وحدود التردد، والتنوع، والنضارة، وجيش تحرير السودان).

1) البيانات والآراء

المواد الخام: الأحداث (المشاهدات/النقرات/الألعاب/المشتريات/الودائع)، كتالوج المحتوى (السمات)، ملامح المستخدمين، السياق (الوقت/الجهاز/القناة)، إشارات الجودة (الروبوت/الاحتيال).

فيتشي:
  • المستخدم: RFM، تفضيلات الفئة، حساسية السعر، الوقت من اليوم، الجهاز.
  • العنصر: النوع/الفئة، الاستوديو/المزود، اللغة، السعر/التقلب، «النضارة».
  • السياق: dow/hod، promo/events، session، login channel.
  • تضمين: المساحات التعاونية للمستخدم/العنصر (MF/Word2Vec2Rec/transformers)، متعدد الوسائط (نص/صور).
  • الجودة: نقطة زمنية (بدون وجوه)، وقت التوقيت العالمي المنسق، إفراط الأحداث، إخفاء PII.

2) النماذج الأساسية

1. القرب القائم على المحتوى - حسب خصائص العنوان وملف المستخدم.
2. الترشيح التعاوني (CF) - مستخدمون/أيتات متشابهة بناءً على إشارات التفاعل.
3. عوامل/تضمين المصفوفة - عوامل خفية، منتج نقطي/MLP للدرجة.
4. Learning-to-Rank (LTR) - تعزيز التدرج/الشبكات العصبية لقوائم الترتيب (زوجي/listwise).
5. إعادة ترتيب الطبقة - المعالجة اللاحقة، مع مراعاة التنويع/التجديد/القيود.
6. قطاع الطرق السياقيون - التعلم عبر الإنترنت مع الاستكشاف والاستغلال.
7. RL/seq-recommendations - تحسين المسار/الدورة (جائزة متعددة الخطوات).

3) خط أنابيب القرار

1. استدعاء (اختيار سريع للمرشح، 200-5 ك): ANN حسب التضمين، القاعدة/الفئة، الشعبية.
2. الترتيب (الدقيق، 20-200): LTR/MLP مع ميزات غنية.
3. إعادة ترتيب/سياسة (Fin. list, 5-30): التحسين المتعدد الأغراض + القيود والتنويع.
4. العمل: عرض/دفع/بريد إلكتروني/عرض شخصي مع حراس فم و «ساعة هادئة».
5. التغذية المرتدة: إشارات ضمنية/صريحة → إعادة التدريب/تحديث قطاع الطرق.

4) الأهداف والقيود متعددة الأغراض

الأهداف: CTR/CTCVR، الاحتفاظ، الإيرادات، الهامش، LTV، الرضا، السرعة.
القيود: تواتر الاتصال، النمو الحقيقي/الامتثال، مجموعة متنوعة من الفئات، حصص العلامة التجارية/المزود، الإنصاف.

الصياغة:
[
\ max\sum _ i w_i\cdot\text {Objective} _ i\quad
\ النص {ق. t. }\نص {قبعات، RG، التنوع، SLA}
]

الممارسة: إعادة ترتيب السياسات (انظر الفقرة 7)، حيث تقترن السرعة بالقواعد.

5) البداية الباردة والبيانات الصغيرة

المستخدمون الجدد: الشعبية حسب القطاع/القناة/الجغرافيا، على أساس المحتوى حسب الاستبيان/النقر الأول، قطاع الطرق مع ذكاء واسع.
الأيتيمات الجديدة: تضمين المحتوى (النص/العلامات)، البيانات الوصفية، «المظهر المتشابه» حسب المزود/النوع.
لقطات قليلة: تضمين النقل/البرج المشترك.

6) مقاييس التسجيل

غير متصل

التصنيف/الترتيب: AUC/PR-AUC, NDCG @ k, MAP, Recall @ k.
الأعمال: eCPM/eRPM، الإيرادات/الهامش المتوقع، وكيل LTV.
متعدد الأغراض: المقاييس المرجحة (على سبيل المثال NDCG مع ربح = قيمة).
المعايرة: براير، اللجنة الاقتصادية لأوروبا (للاحتمالات).
Списки: التغطية/التنوع/الحداثة/الصدفة.

عبر الإنترنت

اختبارات A/B وقطاع الطرق: CTR، CTCVR، الدخل/الدورة، الاحتفاظ D1/D7، الشكاوى/إلغاء الاشتراكات (حواجز الحماية)، زمن الوصول/جيش تحرير السودان.
الزيادة: رفع٪، CUPED/شبه التجارب في التوزيع العشوائي المعقد.

7) التنويع وإعادة ترتيب السياسات

MMR/PM-2/xQuAD: توازن «الصلة × الجدة».
الحصص: الحد الأقصى/الحد الأقصى حسب النوع/المزود/فئة المخاطر.
الإنصاف: الحد من الأسهم لتجنب الانحراف المنهجي.

مثال التسجيل:
[
\ textstyle\text {Score} =\alpha\cdot\hat {p} _ {\text {click}}} +\beta\cdot\text {gamma\cdot\text} +\delta\cdot\text {Novelty}
]

الهستيريا: لا ترمش القوائم ؛ تحديث العناصر مع القصور الذاتي.

8) قطاع الطرق السياقي و RLs

قطاع الطرق (LinUCB، Thompson): التعلم السريع عبر الإنترنت، والتحكم في الاستكشاف. جيد للمركز الأول/إبداعي/قناة.
قطاع الطرق المتتالي: تحسين أعلى k.
RL (DQN/Policy Gradient/SlateQ): تخصيص الجلسة، وتحسين المكافآت متعددة الخطوات (العائد/الإيرادات/الجلسة الطويلة).
السلامة: تقييم خارج السياسة (IPS/DR)، وأجهزة محاكاة، وأغطية للبحث، وآمنة RL.

9) التخصيص للتأثير السببي

نماذج رفع: من يجب لمسه (مقنع)، Qini/AUUC، uplift @ k.
الترتيب الواعي بالعلاج: قم بتضمين احتمالية الزيادة بدلاً من CTR الخام.
حواجز الحماية: شرائح عدم الإزعاج، قواعد RG، الإنصاف.

10) الهندسة المعمارية و MLOps

متجر الميزات: التكافؤ عبر الإنترنت/غير متصل بالإنترنت، نقطة في الوقت المناسب، TTL لميزات الجلسة.
خدمات المرشحين: ANN/FAISS/ScaNN، التخزين المؤقت/الشحن حسب القطاع.
رانكر: تعزيز التدرج/MLP/هندسة الأبراج، المعايرة.
السياسة/إعادة الترتيب: القواعد/القيود، التنويع، طبقة قطاع الطرق.
Corchestration: request idempotency, p95 latency ≤ 100-300 ms, DLQ/retray.
إمكانية الملاحظة: الارتباط _ تتبع معرف، PSI، مقاييس الجودة، stopcock.

11) الأمن والخصوصية والأخلاق

تقليل PII: الترميز، RLS/CLS، القناع.
إمكانية التفسير: أهم السمات/أسباب العرض ؛ طريق الاستئناف.
الأخلاقيات/النمو الحقيقي: حدود التردد، «ساعات الهدوء»، حظر العروض العدوانية من الفئات الضعيفة.
الامتثال: مراجعة القرارات/السجلات، ونسخ السياسات والمنشآت.

12) جوازات السفر وجداول القرارات

شهادة مرجعية (مثال)

ID/version: 'REC _ HYBRID _ RANK _ v5'

تذكر: ANN (تضمين المستخدم/العنصر)، أعلى 500

رانكر: LTR-GBM + MLP (الميزات: مستخدم RFM، عنصر ميتا، السياق)

إعادة الترتيب: PM-2 (التنوع)، حصص العلامة التجارية، مرشحات RG، أغطية التردد

الأهداف/المقاييس: NDCG @ 10, eRPM, zhaloby≤Kh, latency p95≤150 ms

A/B: 14 يومًا، CUPED ؛ حواجز الحماية - RG/قابلية التسليم

المالكون/قطع الأشجار/Runibook

جدول القرار

حالةالسياقالعملالقيودتعليق
«جديد _ مستخدم» و «تاريخ منخفض _»الصعود على متن الطائرةالبذور الشعبية @ المقطع + المحتوىأغطية التردد، RGبداية باردة
'session _ len> 3' & 'diversity _ low'الدورةإعادة تصنيف с MMR3 فئاتالصدفة
'uplift_push≥τ'عروضدفع شخصيلا تزعج، zhaloby≤Khالآثار، وليس CTR

13) رمز زائف (رسم تخطيطي)

ألف - الاستدعاء الهجين + الرتبة + إعادة الترتيب

python
Recall cands_emb = ann. recall(user_embed, topk=500)
cands_rule = rule_based. popular_by_segment(user, k=200)
cands = dedup(cands_emb + cands_rule)

Rank features = featurize(user, cands, context)  # user/item/context scores = ranker. predict(features)      # CTR/Value score

Re-rank (policy-aware)
final = rerank(
cands, scores,
constraints=dict(diversity_min={'category':3},
brand_quota={'A':0. 3,'B':0. 3},
rg_filter=True,
freq_caps=per_user_caps(user)),
objective_weights=dict(ctr=0. 6, value=0. 3, novelty=0. 1)
)
return final[:N]

أخذ عينات من B. Thompson للمبدعين

python beta priors per creative: (α, β)
for creative in creatives:
p_hat = np. random. beta(alpha[creative], beta[creative])
chosen = argmax(p_hat)
show(chosen)
update(alpha, beta, reward=click)

14) التشخيص والرصد

الجودة: NDCG/Recall @ k، eRPM، التغطية/التنوع، المعايرة.
على الإنترنت: CTR/CTCVR، الدخل/الجلسة، الاحتفاظ، الشكاوى/إلغاء الاشتراكات، زمن الوصول/المهلة.
الانجراف: PSI/KL حسب الميزات الرئيسية، oflayn↔onlayn انخفاض الارتباط.
القيود: الوفاء بالحصص/التنوع، والتأثيرات على مرشحات النمو الحقيقي، وحدود التردد.
Runibooks: تدهور الاستدعاء (انخفاض ANN)، وزيادة الشكاوى، وزيادة المهلات، والطوارئ (الشائع الآمن).

15) الأخطاء المتكررة

تحسين «CTR الخام» بدلاً من الزيادة/القيمة.
لا توجد طبقة إعادة ترتيب → تنوع ضئيل، «نفق الرؤية».
وجوه من المستقبل، مزج TZ، تعريفات إشارة غير متسقة.
نقص المعايرة والعتبات → الميزانية وسقف التردد «يتدهور».
تجاهل النمو الحقيقي/الأخلاق والإنصاف → الشكاوى والمخاطر والقضايا التنظيمية.
ميزة غير مزامنة عبر الإنترنت/غير متصلة بالإنترنت → فشل في المبيعات.

16) قائمة التحقق من التخصيص قبل الإصدار

  • جواز سفر نموذجي (أهداف، قيود، مقاييس، مالكون، إصدارات)
  • الاستدعاء/الرتبة/إعادة الرتبة ؛ تم تسخين ANN والمخابئ
  • مرت ميزات ومعايرة PIT، معايير غير متصلة بالإنترنت (NDCG/PR-AUC)
  • تصميم A/B وحواجز الحماية ؛ تقرير جاهز لاتخاذ القرار
  • قيود النمو الحقيقي/التردد/التنوع/الحصص - نفذت ورصدت
  • قابلية الملاحظة، التنبيهات، رافعة التوقف، folbacks (شعبية آمنة)
  • التوثيق والرونيبوك، خطة التحسين التدريجي

المجموع

لا تكون نماذج التخصيص فعالة إلا كنظام واع للسياسات: البيانات الغنية والمضمنة → A Recall/Rank/Rank Hrank → قطاع الطرق المختلط/RL للتكيف عبر الإنترنت → الأهداف متعددة الأغراض للقيود والأخلاق الصارمة → MLOps المنضبطة والرصد. لا تقدم مثل هذه الدائرة «توصيات» فحسب، بل تقدم حلولًا يمكن التحكم فيها تزيد من ROMI و LTV والرضا - بأمان وشفافية وتكرار.

Contact

اتصل بنا

تواصل معنا لأي أسئلة أو دعم.نحن دائمًا جاهزون لمساعدتكم!

Telegram
@Gamble_GC
بدء التكامل

البريد الإلكتروني — إلزامي. تيليغرام أو واتساب — اختياري.

اسمك اختياري
البريد الإلكتروني اختياري
الموضوع اختياري
الرسالة اختياري
Telegram اختياري
@
إذا ذكرت تيليغرام — سنرد عليك هناك أيضًا بالإضافة إلى البريد الإلكتروني.
WhatsApp اختياري
الصيغة: رمز الدولة + الرقم (مثال: +971XXXXXXXXX).

بالنقر على الزر، فإنك توافق على معالجة بياناتك.