GH GambleHub

التدريس مع مدرس وبدونه

1) لماذا ومتى

تحت الإشراف: هناك ملصق → نتوقع الاحتمال/الفئة/القيمة. نستخدمه عندما تكون «الإجابة الصحيحة» واضحة وهناك قصة: اضطراب، إيداع 7 أيام، مخاطر RG/AML، احتمال الاستجابة لعرض، توقعات LTV.
غير خاضع للإشراف: لا توجد علامات → نجد الهياكل/المجموعات/الشذوذ/العوامل الكامنة: تقسيم اللاعبين، حلقات الاحتيال، الملفات الشخصية للألعاب، اكتشاف إخفاقات المزود، ضغط العلامات.

قاعدة الاختيار: إذا كان قرار العمل يعتمد على توقعات احتمالية محددة → تحت الإشراف ؛ إذا كان الهدف هو فتح أنماط/إشارات غير معروفة أو تقليل بعد البيانات → دون إشراف. من الناحية العملية، يتم الجمع بينها.

2) حالات iGaming النموذجية

تحت الإشراف

Churn/reactivation: binary classification (go/not go), uplift models for impact.

الميل إلى الإيداع/الشراء: احتمال وقوع حدث في الأفق

RG/AML: معدل الخطر، احتمالية الهيكلة، جلسة مشبوهة.
المكافأة ضد الإساءة: احتمال الاستخدام الاحتيالي للترويج.
التوصيات (الترتيب): احتمال النقر/الرهان على اللعبة (listwise/pointwise).

غير خاضع للإشراف

تجزئة اللاعب: k-mean، GMM، HDBSCAN بواسطة RFM/السلوك/النوع.
الشذوذ: Isolation Forest، LOF، AutoEncoder على المدفوعات/أنماط الألعاب.
تحليل الرسم البياني: التجميع في عمود «player-device-card-IP».
تقليص الحجم: PCA/UMAP للتصور وهندسة الميزات.
النماذج المواضيعية: NMF/LDL لأوصاف الألعاب/محادثات الدعم.

3) البيانات والميزات

اتصالات نقطة في الوقت لاستبعاد تسرب البيانات.
النوافذ المميزة: 10 دقيقة/1 ساعة/يوم واحد/7 أيام/30 يومًا (الحداثة، التردد، النقد).
السياق: السوق/الولاية القضائية/DST/العطلات، المزود/النوع، الجهاز/ASN.
ميزات الرسم البياني: عدد البطاقات الفريدة/بروتوكول الإنترنت/الأجهزة، المركزية.
تطبيع العملة/المنطقة الزمنية، SCD II للمستخدمين/الألعاب/مقدمي الخدمات.

4) الخوارزميات والمقاييس

مع المعلم

الخوارزميات: LogReg، XGBoost/LightGBM/CatBoost، TabNet ؛ للترتيب - LambdaMART/GBDT ؛ سلسلة زمنية - Prophet/ETS/Gradient Boosted TS.
المقاييس: ROC-AUC/PR-AUC, F1 @ operational chargeld, KS (risk), NDCG/MAP @ K (recommendations), MAPE/WAPE.

بدون معلم

التجميع: k-mean/GMM (عدد المجموعات - المرفق/الصورة الظلية)، HDBSCAN (الكثافة).
الشذوذ: Isolation Forest/LOF/AutoEncoder ؛ metrics - precision @ k on expert markup, AUCPR on synthetic anomalies.
البعد: PCA/UMAP لتصميم الميزات والتصورات.

5) النهج المشتركة

شبه مشرف: فقاعات زائفة لجزء من البيانات غير المخصصة (التدريب الذاتي)، تنظيم الاتساق.
الإشراف الذاتي: المهام المتناقضة/المقنعة (تضمين الجلسة/اللعبة) → استخدام المصب في الإشراف.
التعلم النشط: يوفر النظام وضع علامات على المرشحين (أقصى قدر من عدم اليقين/التنوع) → يحفظ عمل خبراء مكافحة غسل الأموال/النمو الحقيقي.
الإشراف الضعيف: الاستدلال/القواعد/الترميز البعيد شكل ملصقات «ضعيفة»، ثم المعايرة.

6) العملية: من ركوب الأمواج دون اتصال بالإنترنت إلى ركوب الأمواج عبر الإنترنت

1. غير متصل بالإنترنت: جمع/إعداد → مقسمة حسب الوقت/الأسواق → التدريب/التحقق → العودة.
2. دلالات المقاييس: صيغ موحدة (على سبيل المثال، churn_30d) ونوافذ زمنية ثابتة.
3. متجر الميزات: صيغ ميزة موحدة عبر الإنترنت/غير متصل بالإنترنت ؛ اختبارات الامتثال.
4. ركوب الأمواج عبر الإنترنت: gRPC/REST نقاط النهاية، SLA حسب زمن الوصول، AB التوجيه/إصدارات الكناري.
5. الرصد: انحراف البيانات/التنبؤ (PSI/KL)، الكمون p95، خطأ مقاييس الأعمال، التنبيهات.

7) الخصوصية والامتثال

تقليل PII: الاسم المستعار، عزل الخرائط، CLS/RLS.
الإقامة: خطوط الأنابيب الفردية/مفاتيح التشفير حسب المنطقة (EEA/UK/BR).
DSAR/RTBF: حذف/تحرير الخصائص والسجلات ؛ الاحتفاظ بالأسس القانونية للاستثناءات.
تعليق قانوني: تجميد التحف الاستقصائية/الإبلاغ.
الإنصاف: ميزة وكيل التدقيق، تقارير التأثير (SHAP)، سياسة تدخل النمو الحقيقي.

8) الاقتصاد والإنتاجية

تكلفة حساب الخاصية (التكلفة/الخاصية) والاستدلال (التكلفة/الطلب).
تجسيد المجاميع غير المتصلة بالإنترنت ؛ عبر الإنترنت - نوافذ مهمة فقط.
مخبأ الأذونات/نتائج التسجيل لـ TTL القصيرة، والبحث غير المتزامن مع المهلات.
'1' الحصص والميزانيات الخاصة بعمليات الإعادة/الدراسات الخلفية ؛ رد المسؤولية بالأمر/النموذج.

9) أمثلة (شظايا)

9. 1 اختيار نقطة في الوقت المحدد churn_30d

sql
WITH base AS (
SELECT user_pseudo_id, DATE(event_time) AS asof
FROM silver. fact_events
GROUP BY user_pseudo_id, DATE(event_time)
),
feat AS (
SELECT b. user_pseudo_id, b. asof,
SUM(CASE WHEN e. type='deposit' AND e. event_time>=b. asof - INTERVAL '30' DAY
AND e. event_time<b. asof THEN amount_base ELSE 0 END) AS dep_30d,
COUNT(CASE WHEN e. type='bet' AND e. event_time>=b. asof - INTERVAL '7' DAY
AND e. event_time<b. asof THEN 1 END) AS bets_7d
FROM base b
JOIN silver. fact_events e USING (user_pseudo_id)
GROUP BY b. user_pseudo_id, b. asof
),
label AS (
SELECT f. user_pseudo_id, f. asof,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events x
WHERE x.user_pseudo_id=f. user_pseudo_id
AND x.event_time>f. asof AND x.event_time<=f. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS churn_30d
FROM feat f
)
SELECT FROM feat JOIN label USING (user_pseudo_id, asof);

9. 2 شذوذ الدفع (cseudocode، Isolation Forest)

python
X = build_features (payments_last_7d) # sum/frequency/novelty/BIN/ASN/time model = IsolationForest (contamination = 0. 01). fit(X_train)
scores = -model. decision_function(X_test)
alerts = where (scores> THRESHOLD) # AML case candidates

9. 3 تجزئة k-mean (أنواع RFM +)

python
X = scale(np. c_[R, F, M, share_slots, share_live, share_sports])
km = KMeans(n_clusters=8, n_init=20, random_state=42). fit(X)
segments = km. labels_

9. 4 عتبة تكلفة النموذج الثنائي

python threshold = pick_by_expected_cost(scores, labels, cost_fp=5. 0, cost_fn=50. 0)

10) التقييم والتصديق والتجارب

غير متصل بالإنترنت: الانقسام الزمني (القطار/val/الاختبار حسب الوقت/الأسواق)، الاختبار الخلفي، ثقة bootstrap.
عبر الإنترنت: A/B/n، اختبارات متسلسلة، CUPED/diff-in-diff.
خارج السياسة: IPS/DR لسياسات التخصيص.
المعايرة: بلات/متساوي التوتر للاحتمالات الصحيحة.
مكافحة التدهور: تنبيهات بواسطة مقاييس الأعمال التجارية و PR-AUC/KS.

11) RACI

R (مسؤول): علوم البيانات (نماذج/تجارب)، MLOps (منصة/خدمة)، Data Eng (ميزات/خطوط أنابيب).
ألف (مسؤول): رئيس قسم البيانات/المدير التنفيذي.
جيم (استشاري): الامتثال/إدارة الشؤون السياسية (PII/RG/AML)، الأمن (KMS/secrets)، SRE (SLO/value)، المالية (ROI).
I (معلومات): المنتج/التسويق/العمليات/الدعم.

12) خارطة طريق التنفيذ

أفضل لاعب (4-6 أسابيع):

1. فهرس الأهداف/الملصقات والإشارات (churn_30d، propensity_7d، risk_rg).

2. ميزة المتجر v1 (5-10 ميزات)، طرازات XGBoost الأساسية، لوحات تحكم المقاييس غير المتصلة بالإنترنت.

3. تجزئة الوسيلة k (8 مجموعات) + وصف الأجزاء ؛ غابة العزل للمدفوعات.

4. ركوب الأمواج عبر الإنترنت باستخدام ذاكرة التخزين المؤقت، p95 <150 ms ؛ A/B لـ 10-20٪ من حركة المرور.

المرحلة 2 (6-12 أسبوعاً):
  • نشط/شبه مشرف على ندرة الملصقات (AML/RG)، لعبة/جلسة مشرف عليها ذاتيًا.
  • إطلاق الكناري، مراقبة الانجراف، إعادة التدريب التلقائي.
  • طبقة دلالية واحدة من المقاييس وميزة المطابقة عبر الإنترنت/غير متصلة بالإنترنت.
المرحلة 3 (12-20 أسبوعاً):
  • إشارات الرسم البياني وحلقات الاحتيال ؛ نماذج المكافآت الراقية.
  • الخدمات المتعددة الأقاليم، الحصص/رد التكاليف ؛ أرشيف WORM للإصدارات.
  • تدقيق الإنصاف، اختبارات الإجهاد، حوادث الدفاتر.

13) قائمة مرجعية قبل البيع

  • أخذ العينات في الوقت المحدد واختبارات منع التسرب.
  • معايرة الاحتمالات ؛ حدد عتبة التكلفة المتوقعة.
  • بطاقات نموذجية (المالك، البيانات، المقاييس، المخاطر، الإنصاف).
  • متجر الميزات عبر الإنترنت/اختبار الامتثال غير المتصل بالإنترنت.
  • مراقبة الانجراف/الكمون/الخطأ والتنبيهات والتراجع التلقائي.
  • PII/DSAR/RTBF/Legal Hold policies ؛ قطع الأشجار غير شخصي.
  • الخطة ألف/باء والقدرة الإحصائية المحسوبة ؛ دفتر التراجع جاهز.

14) الأنماط المضادة

مزج الأحداث الجديدة في الملصقات (التسرب) وغياب نقطة زمنية.
«نموذج واحد للجميع» بدلاً من تحلل المجال.
بعض الاحتمالات المكتبية → عتبات عمل غير صحيحة.
الرحلة العمياء: لا توجد مراقبة للانجراف/الجودة عبر الإنترنت.
الإفراط في التعقيد عبر الإنترنت (انضمام خارجي ثقيل بدون مخبأ ومهلة).
قطاعات بدون تفسير تجاري ومالك.

15) خلاصة القول

يوفر التعلم الخاضع للإشراف توقعات قابلة للقياس وإدارة المخاطر/الدخل ؛ بدون معلم - هيكل وإشارات حيث لا توجد علامات. مزيجهم (شبه/إشراف ذاتي، تعلم نشط) في انضباط البيانات (نقطة في الوقت المناسب، متجر الميزات)، والامتثال و MLOps يمنح منصة iGaming زيادة مطردة في صافي الإيرادات، وانخفاض في الاحتيال وتدخلات RG في الوقت المناسب - مع قابلية التكاثر والتحكم في التكلفة والاستعداد للتدقيق.

Contact

اتصل بنا

تواصل معنا لأي أسئلة أو دعم.نحن دائمًا جاهزون لمساعدتكم!

بدء التكامل

البريد الإلكتروني — إلزامي. تيليغرام أو واتساب — اختياري.

اسمك اختياري
البريد الإلكتروني اختياري
الموضوع اختياري
الرسالة اختياري
Telegram اختياري
@
إذا ذكرت تيليغرام — سنرد عليك هناك أيضًا بالإضافة إلى البريد الإلكتروني.
WhatsApp اختياري
الصيغة: رمز الدولة + الرقم (مثال: +971XXXXXXXXX).

بالنقر على الزر، فإنك توافق على معالجة بياناتك.