آموزش با و بدون معلم

1) چرا و چه زمانی

تحت نظارت: یک برچسب وجود دارد → ما پیش بینی احتمال/کلاس/ارزش. ما از آن استفاده می کنیم زمانی که «پاسخ صحیح» روشن است و یک داستان وجود دارد: ریزش، سپرده 7 روز، خطر RG/AML، احتمال پاسخ به پیشنهاد، پیش بینی LTV.
بدون نظارت: هیچ علامتی وجود ندارد → ما ساختارها/خوشه ها/ناهنجاری ها/عوامل پنهان را پیدا می کنیم: تقسیم بندی بازیکنان، حلقه های تقلب، پروفایل های موضوعی بازی ها، تشخیص خرابی های ارائه دهنده، فشرده سازی علائم.

قانون انتخاب: اگر تصمیم کسب و کار بستگی به یک پیش بینی احتمالی خاص دارد ؛ اگر هدف باز کردن الگوها/سیگنال های ناشناخته یا کاهش ابعاد داده ها → بدون نظارت باشد. در واقع با هم ترکیب می شوند.

2) موارد iGaming معمولی

تحت نظارت

Churn/reactivation: طبقه بندی باینری (برو/نه برو)، مدل های بالا بردن برای تاثیر.
تمایل به سپرده/خرید: احتمال رویداد در افق T.
RG/AML: میزان ریسک، احتمال ساختار، جلسه مشکوک.
پاداش ضد سوء استفاده: احتمال استفاده جعلی از تبلیغی.
توصیه ها (رتبه بندی): احتمال کلیک/شرط بندی در بازی (listwise/pointwise).

بدون نظارت

تقسیم بندی بازیکن: k-means، GMM، HDBSCAN توسط RFM/رفتار/ژانر.
ناهنجاری ها: جنگل جداسازی، LOF، AutoEncoder در پرداخت/الگوهای بازی.
تجزیه و تحلیل نمودار: خوشه بندی در ستون «بازیکن-دستگاه-کارت-IP».
کاهش: PCA/UMAP برای تجسم و مهندسی ویژگی.
مدل های موضوعی: NMF/LDL برای توصیف بازی/پشتیبانی از چت.

3) داده ها و ویژگی ها

اتصالات نقطه در زمان برای حذف نشت داده ها.
پنجره های مشخصه: 10 دقیقه/1 ساعت/1 روز/7 روز/30 روز (اعتبار، فرکانس، پولی).
زمینه: بازار/صلاحیت/DST/تعطیلات، ارائه دهنده/ژانر، دستگاه/ASN.
ویژگی های نمودار: تعداد کارت های منحصر به فرد/IP/دستگاه ها، مرکزیت.
عادی سازی ارز/منطقه زمانی، SCD II برای کاربران/بازی ها/ارائه دهندگان.

4) الگوریتم ها و معیارها

با استاد

الگوریتم ها: LogReg، XGBoost/LightGBM/CatBoost، TabNet ؛ برای رتبه بندی - LambdaMART/GBDT ؛ سری زمان - پیامبر/ETS/شیب TS افزایش یافته است.
معیارها: ROC-AUC/PR-AUC، F1 @ آستانه عملیاتی، KS (خطر)، NDCG/MAP @ K (توصیه ها)، MAPE/WAPE (پیش بینی ها)، هزینه مورد انتظار با وزن FP/FN.

💡 بدون معلم

خوشه بندی: k-means/GMM (تعداد خوشه ها - آرنج/شبح)، HDBSCAN (تراکم).
ناهنجاری ها: جداسازی جنگل/LOF/AutoEncoder ؛ metrics - precision @ k در نشانه گذاری متخصص، AUCPR در ناهنجاری های مصنوعی.
ابعاد: PCA/UMAP برای طراحی و تجسم ویژگی.

5) رویکردهای ترکیبی

نیمه نظارت: شبه حباب برای بخشی از داده های تخصیص نیافته (خود آموزش)، تنظیم سازگاری.
خود نظارت: وظایف متضاد/ماسک (جلسه/تعبیه بازی) → استفاده از پایین دست در نظارت.
یادگیری فعال: سیستم ارائه می دهد نامزدهای مارک (حداکثر عدم اطمینان/تنوع) → موجب صرفه جویی در کار کارشناسان AML/RG.
نظارت ضعیف: اکتشافی/قوانین/نشانه گذاری از راه دور برچسب های «ضعیف» را تشکیل می دهند، سپس کالیبراسیون کنید.

6) فرآیند: از آفلاین به گشت و گذار آنلاین

1. آفلاین: جمع آوری/آماده سازی → تقسیم بر زمان/بازار → آموزش/اعتبار → backtest.
2. معانی متریک: فرمول های یکنواخت (به عنوان مثال، churn_30d) و پنجره های زمان ثابت.

3. فروشگاه ویژگی: فرمول ویژگی های یکنواخت آنلاین/آفلاین ؛ تست های انطباق

4. گشت و گذار آنلاین: نقاط پایانی gRPC/REST، SLA با تاخیر، مسیریابی AB/انتشار قناری.
5. مانیتورینگ: رانش داده/پیش بینی (PSI/KL)، تأخیر p95، خطای معیارهای تجاری، هشدارها.

7) حفظ حریم خصوصی و انطباق

حداقل PII: pseudonymization، جداسازی نقشه، CLS/RLS.
اقامت: خطوط لوله فردی/کلیدهای رمزگذاری بر اساس منطقه (EEA/UK/BR).
DSAR/RTBF: حذف/ویرایش ویژگی ها و سیاهههای مربوط ؛ دلایل قانونی برای استثنائات را حفظ کنید.
نگهداری قانونی: انجماد مصنوعات تحقیق/گزارش.
عدالت: ویژگی پروکسی حسابرسی، گزارش های تاثیر (SHAP)، سیاست مداخله RG.

8) اقتصاد و بهره وری

هزینه محاسبه ویژگی (هزینه/ویژگی) و استنتاج (هزینه/درخواست).
تحقق تجمعات آفلاین ؛ آنلاین - فقط پنجره های بحرانی.
کش از مجوز/نتایج به ثمر رساند برای TTL کوتاه, lookups ناهمزمان با وقفه.
سهمیه و بودجه برای تکرار/backtests ؛ شارژ با دستور/مدل.

9) نمونه ها (قطعات)

9. 1 انتخاب نقطه در زمان برای churn_30d

sql
WITH base AS (
SELECT user_pseudo_id, DATE(event_time) AS asof
FROM silver. fact_events
GROUP BY user_pseudo_id, DATE(event_time)
),
feat AS (
SELECT b. user_pseudo_id, b. asof,
SUM(CASE WHEN e. type='deposit' AND e. event_time>=b. asof - INTERVAL '30' DAY
AND e. event_time<b. asof THEN amount_base ELSE 0 END) AS dep_30d,
COUNT(CASE WHEN e. type='bet' AND e. event_time>=b. asof - INTERVAL '7' DAY
AND e. event_time<b. asof THEN 1 END) AS bets_7d
FROM base b
JOIN silver. fact_events e USING (user_pseudo_id)
GROUP BY b. user_pseudo_id, b. asof
),
label AS (
SELECT f. user_pseudo_id, f. asof,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events x
WHERE x.user_pseudo_id=f. user_pseudo_id
AND x.event_time>f. asof AND x.event_time<=f. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS churn_30d
FROM feat f
)
SELECT FROM feat JOIN label USING (user_pseudo_id, asof);

9. 2 ناهنجاری های پرداخت (شبه کد، جنگل جداسازی)

python
X = build_features (payments_last_7d) # sum/frequency/novelty/BIN/ASN/time model = IsolationForest (contamination = 0. 01). fit(X_train)
scores = -model. decision_function(X_test)
alerts = where (scores> THRESHOLD) # AML case candidates

9. 3 تقسیم بندی k-means (ژانرهای RFM +)

python
X = scale(np. c_[R, F, M, share_slots, share_live, share_sports])
km = KMeans(n_clusters=8, n_init=20, random_state=42). fit(X)
segments = km. labels_

9. 4 آستانه هزینه برای مدل باینری

python threshold = pick_by_expected_cost(scores, labels, cost_fp=5. 0, cost_fn=50. 0)

10) ارزیابی، اعتبار و آزمایش

آفلاین: تقسیم زمانی (قطار/وال/تست توسط زمان/بازار)، backtesting، اعتماد بوت استرپ.
آنلاین: A/B/n، آزمایشات متوالی، CUPED/diff-in-diff.
خارج از سیاست: IPS/DR برای سیاست های شخصی سازی.
کالیبراسیون: پلات/ایزوتونیک برای احتمالات صحیح.
کنترل تخریب: هشدار توسط معیارهای کسب و کار و PR-AUC/KS.

11) RACI

R (مسئول): علوم داده (مدل/آزمایش)، MLOps (پلت فرم/خدمت)، داده ها (ویژگی ها/خطوط لوله).
A (پاسخگو): رئیس داده/CDO.
C (مشورت): انطباق/DPO (PII/RG/AML)، امنیت (KMS/اسرار)، SRE (SLO/ارزش)، امور مالی (ROI).
I (مطلع): محصول/بازاریابی/عملیات/پشتیبانی.

12) نقشه راه پیاده سازی

MVP (4-6 هفته):

1. کاتالوگ اهداف/برچسب ها و سیگنال ها (churn_30d، propensity_7d، risk_rg).

2. ویژگی فروشگاه v1 (5-10 ویژگی)، مدل های اصلی XGBoost، داشبورد معیارهای آفلاین.

3. تقسیم بندی k-means (8 خوشه) + شرح بخش ها ؛ جداسازی جنگل برای پرداخت.

4. گشت و گذار آنلاین با کش، p95 <150 ms ؛ A/B برای 10 تا 20 درصد ترافیک

مرحله 2 (6-12 هفته):

فعال/نیمه نظارت برای کمبود برچسب (AML/RG)، تعبیه بازی/جلسه خود نظارت.
انتشار قناری، نظارت بر رانش، آموزش مجدد خودکار.
یک لایه معنایی واحد از معیارها و ویژگی تطبیق آنلاین/آفلاین.

مرحله 3 (12-20 هفته):

نشانه های نمودار و حلقه های تقلب ؛ مدل های پاداش بالا بردن.
خدمت چند منطقه ای، سهمیه/بازپرداخت ؛ بایگانی نسخه های WORM.
حسابرسی انصاف، تست استرس، حوادث کتاب اجرا.

13) چک لیست پیش فروش

نمونه برداری در زمان و آزمایش ضد نشت.
کالیبراسیون احتمال ؛ محدوده هزینه مورد انتظار را انتخاب کنید.
کارت های مدل (مالک، داده ها، معیارها، خطرات، انصاف).
ویژگی فروشگاه آنلاین/آفلاین تست انطباق.
رانش/تاخیر/خطا نظارت، هشدار و بازگشت خودکار.
PII/DSAR/RTBF/سیاست های حقوقی نگه دارید ؛ ثبت نام غیر شخصی است.
طرح A/B و قدرت آماری محاسبه; چرخ دنده عقب آماده است.

14) ضد الگوهای

مخلوط کردن رویدادهای جدید به برچسب (نشت) و عدم وجود نقطه در زمان.
«یک مدل برای همه» به جای تجزیه دامنه.
برخی از احتمالات محدود → آستانه کسب و کار نادرست است.
پرواز کور: بدون نظارت بر رانش/کیفیت آنلاین.
overcomplication آنلاین (سنگین خارجی می پیوندد بدون کش و وقفه).
بخش ها بدون تفسیر کسب و کار و مالک.

15) خط پایین

یادگیری تحت نظارت پیش بینی قابل اندازه گیری و مدیریت ریسک/درآمد را فراهم می کند ؛ بدون معلم - ساختار و سیگنال هایی که هیچ علامتی وجود ندارد. ترکیب آنها (نیمه/خود نظارت، یادگیری فعال) در نظم و انضباط داده ها (نقطه در زمان، فروشگاه ویژگی)، انطباق و MLOps می دهد پلت فرم iGaming افزایش مداوم در درآمد خالص، کاهش تقلب و مداخلات RG به موقع - با تکرارپذیری، کنترل هزینه و آمادگی برای ممیزی.

آموزش با و بدون معلم

بدون نظارت

با ما در تماس باشید

ارتباط سریع

ویدئو به‌زودی به‌روزرسانی می‌شود

ما در حال حاضر بسیار درگیر پروژه‌ها هستیم