GH GambleHub

למידת מכונה באיימינג

1) מקרים עסקיים וערכם

מוצר/הכנסות: תחזית LTV, Curn (outflow), יכולות הפקדה/רכישה, משימות דינמיות/מסעות, הבא-הפעולה-הטובה/הצעה.
שיווק/CRM: כפיל, קטגמנטציה, טריגרים בזמן אמת, אופטימיזציה של בונוס (ABO - Abble-Assance Bonus Optimization).
סיכון/ציות: אנטי-הונאה/AML (מהירות, מבנה, מאפייני גרף), הימורים אחראיים (RG) - שיעור סיכון, הפעלות התערבות.
מבצעים/SRE: תחזית אירוע, קיבולת/תחזית תנועה, אנומליות ספק.
פיננסים: תחזית GGR/NGR, רגישות Fx, מניפולציה מקבילה.

קווים מנחים אפקטים: + 3-7% להכנסות נטו עקב התאמה אישית, 20-40% להונאה-הפסד, 10-25% להונאה, SLA תגובה RG <5 s כאשר אונליין.

2) הנדסת תכונה

מקורות: משחק, תשלומים/PSP, אימות, התקנים/ASN/Geo, RG/KYC/KYB, שיווק UTM, יומנים ספקים, תמיכה/טקסטים.

תכונות בסיסיות:
  • חלונות התנהגותיים: N קצב/פיקדונות וסכומים לכל 10 min/שעה/יום, recency/frequency/monitary.
  • רצפים: שרשראות של משחקים, זמן עם הפעילות האחרונה, מאפייני הפעלה.
  • Geo/התקן: country/market, ASN, מכשיר/דפדפן.
  • גרף: חיבורי קלף-התקן-IP, רכיבים/מרכזים (טבעות הונאה).
  • זמן של יום/יום בשבוע/חגים בשוק, הספק/ז 'אנר/תנודתיות משחק.
  • RG/AML: גבולות, בלעדיות עצמית, סינון דגלים, PEP/סנקציות (באמצעות מטמון/אסינכרון).
המלצות:
  • נרמול מטבעות וזמן (UTC + market locale).
  • היסטוריוז ממדים (SCD II).
  • מסכים על טרנספורמציה מקוונת/לא מקוונת (קוד חנות תכונה יחיד).

3) ארכיטקטורה: ↔ לא מקוון

3. לולאה לא מקוונת 1

Lakehouse: Bronze # Silver (נורמליזציה/העשרה) # Gold (נתונים).
חנות תכונה (offline): רשמת נוסחאות, הצטרפות נקודתית בזמן, התממשות של סט אימונים.
אימון: מיכלים עם תלות קבועה; ניסויי מעקב (מטריצות/חפצים/נתונים).
אימות: קיפול קיי/פיצול זמני, בדיקה לאחור, הערכה מחוץ למדיניות.

3. 2 מעגל מקוון

Inneglath # Stream Processing: Flink/Spark/Beam עם חלונות/סימני מים, idempotency.
חנות תכונה (אונליין): מטמון פטנט נמוך (רדיס/סילה) + יציקות לא מקוונות.
הגשה: REST/gRPC endpoints, גרף ניקוד, ניתוב AB, שחרור קנרי.
חנויות בזמן אמת: ClickHouse/Pinot לפאנלים/כללים.

4) מודל מודלים וגישות

סיווג/ניקוד: Churn/Deposit/Hong/RG (LogReg, XGBoost/LightGBM, TabNet, CatBoost).
דירוג/המלצות: דירוג/דירוג רשימה (LambdAMART), Seq2rec (RNN/רובוטריקים), שודדים קונטקסטואליים.
חריגות: יער בידוד, SVM ברמה אחת, AutoEncoder, Prophet/TSPresh לסדרת זמן.
גרף: Node2Vec/GraphSAGE/GNN על טבעות הונאה.
סיבתיות: מודלים מרוממים, T-learner/X-learner, DoWhy/CausalML.
כרטיסים/צ 'אטים, סיווג תלונות, רגש, נושאים.

5) מדדים איכותיים

סיווג: ROC-AUC/PR-AUC, F1 בסף תפעולי, עלות צפויה (FP/FN), KS לניקוד סיכונים.
המלצות: NDCG @ K, MAP @ K, סיקור/גיוון, CTR/CVR מקוון.
TS/תחזית: MAPE/SMAPE, WAPE, שגיאה P50/P90, כיסוי PI.
RG/AML: דיוק/החזרה ב-SLA, פירושו זמן להפסקה.

כלכלה: עלייה בהכנסות נטו, הונאה חסכה, קמפיינים של ROI,

6) הערכה וניסויים

לא מקוון: פיצול זמני, מבחן אחורי בשבוע/שוק/דייר.
מקוון: A/B/N, CUPED/diff-in-diff, בדיקות רצף.
מחוץ למדיניות: IPS/DR למדיניות התאמה אישית.
מדינה. כוח: חישוב גודל המדגם בהתחשב בשונות ו MDE.

דוגמה לחישוב סף הערך (פסאודו קוד):
python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)

7) פרטיות, אתיקה, ציות

מזעור PII: כינויים, מיפוי בידוד, CLS/RLS.
תושבות: הפרדה בין קווי EEA/UK/BR; בלי מצטרפים אזוריים ללא בסיס.
DSAR/RTBF: מחיקה/עריכה בתכונות ובלוגים; מעצר משפטי לתיקים/דיווח.
הגינות/הטיה: ביקורת תכונות, השפעה שונה, שליטה על משתני פרוקסי.
הסברים: SHAP/feather experience, model cards (בעלים, תאריך, נתונים, מדדים, סיכונים).
אבטחה: KMS/CMK, סודות מחוץ ליומנים, ארכיון תולעת של שחרור.

8) מלופס: אופן חיים

1. מאפייני נתונים: סכמות/חוזים, כללי DQ (שלמות/ייחודיות/טווח/זמן), שושלות.
2. אימונים: מכולות, אוטומטי, ניסויי מעקב.
3. אימות: מבחני תאימות מעגלית, הטיה/הגינות, מבחני ביצועים.
4. שחרור (CI/CD/CT): גלאי קנרית/שלבים, דגלי תכונה, ”השקה אפלה”.
5. הגשה: הגשה אוטומטית, מטמון, GRPC/REST, פסקי זמן/מגשים מחדש.
6. ניטור: סחיפת נתונים/חיזוי (PSI/KL), latency p95, שגיאות קצב, כיסוי, ”מדדים שקטים”.
7. רכבת מחדש: לוח זמנים/מעורר על סחיפה/הידרדרות של מדדים.
8. תקריות: runbook, model rollback, fallback (כלל/מודל פשוט).

9) חנות מאפיינים (גרעין עקבי)

חישוב נקודה בזמן, אנטי-דליפה, תכונת נוסחה.
מקוון: Latency נמוך (10-30 ms), TTL, עקביות לא מקוונת.
חוזים: שמות/תיאור, בעלים, SLA, נוסחה, בדיקות ציות מקוונות/לא מקוונות.

דוגמה למפרט תכונה (YAML):
yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5

10) ניקוד מקוון וכללים

Hybrid ML + Rules: model + speed + servents; חוקים - קשה שמירה/אתיקה/חוק.
תפירה: תבניות CEP (מבנה/מהירות/מתג התקן) + ניקוד ML.
SLA: p95 מקצה לקצה 50-150ms עבור התאמה אישית, רישום 2-5S עבור התראות RG/AML.

ניתוב פסאודו קוד:
python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))

11) נתוני אימון: דוגמאות ותוויות

חלונות אירוע: t0 - התייחסות, t0 + TenName - תווית (הפקדה/הונאה בשחור).
דליפה-שליטה: הצטרפות נקודה בזמן, הדרה של אירועים עתידיים.
איזון: סטריטיפיקציה/משקל כיתתי, אובדן מוקד לשיעורים נדירים.
אתיקה: לשלול תכונות רגישות/פרוקסי, השפעה שליטה.

12) כלכלה ופרודוקטיביות

תכונות עלות: ספירת עלות/תכונה ועלות/בקשה, הימנעו מהצטרפות כבדה לרשת.
מזומן: מאפיינים חמים ב ־ RAM, קר - עצלן.
התממשות: צבירה לא מקוונת; מקוון רק קריטי.
מכסות: מגבלות על שידור חוזר, מסעות אחוריים על חלונות זמן; רכיבה על ידי צוות.

13) דוגמאות קוד SQL/פסאודו

דגימת נקודה בזמן עבור נזיפה (30 ימים של שתיקה):
sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;
חלון הפקדה מקוון (Flink SQL, 10 דקות):
sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);

14) מימוש מפת דרכים

MVP (4-6 שבועות):

1. קטלוג אותות וחנות תכונה v1 (5-10 תכונות לתשלומים/משחק).

2. מודל בסיסי של נזיפה/הפקדה (XGBoost) + A/B עבור 10-20% מהתנועה.

3. גלישה מקוונת עם מטמון (p95 <150 ms) ושחרור כנרית.

4. סחיפה/ניטור איכות, כרטיס מודל, רולינג-בוק.

שלב 2 (שבועות 6-12):
  • ניקוד RG/AML, תכונות גרף, טריגרים בזמן אמת.
  • מודלים מרוממים לבונוסים, שודדים קונטקסטואליים, הערכה מחוץ למדיניות.
  • רכבת אוטומטית על ידי סחיפה/לוח שנה, אוטומציה תיעוד.
שלב 3 (שבועות 12-20):
  • התאמה אישית של קטלוג המשחקים (seq2rec), אופטימיזציה רב-אובייקטיבית (הכנסה/אחריות).
  • גלישה רב-אזורית, SLAs/מכסות, צ 'רגבק על תכונות/הסקה.
  • ביקורת הגינות ובדיקות לחץ, תרגילי ד "ר ומאגרי שחרור תולעת.

15) ראסי

R (אחראי): MLops (פלטפורמה/הגשה), Data Science (מודלים/ניסויים), Data Eng (תכונות/צינורות).
א '(אחראי): ראש הנתונים/CDO.
C (ייעוץ): ציות/DPO (PII/RG/AML/DSAR), אבטחה (KMS/סודות), SRE (SLO/ערך), פיננסים (אפקט/ROI), משפטיים.
אני (מושכל): מוצר/שיווק/מבצעים/תמיכה.

16) רשימת בדיקות לפני המכירה

[ תכונות ] מוסכמות באינטרנט/מחובר, בדיקות מעבר עברו.
[ כרטיס מודל ] (בעלים, נתונים, מדדים, סיכונים, הגינות) מלא.
[ ] Canary לשחרר/fichflag; התראות SLA ו Latency/שגיאה/drift.
[ ] מדיניות PII/DSAR/RTBF/Legal Hold נאכפה; היומנים לא אישיים.
[ ] תקרית/רולינג-בוק; אסטרטגיית גיבוי.
[ ניסויי ] פורמליים (היפותזות, מדדים, משך, MDE).
[ ] עלות המסקנות והמאפיינים נכללים בתקציב; מכסות וגבולות כלולים.

17) אנטי דפוסים

אי התאמה מקוונת/לא מקוונת.
אפליקציה חיצונית סינכרונית ב ”שביל החם” ללא מטמון ופסקי זמן.
נוסחאות מטריות אטומות/אין כרטיסי מודל.
אימון/סחיפה מחדש ללא ניטור ואימון יתר.
PII באנליטיקה ואימונים ללא CLS/RLS/מזעור.
”מודל אחד גדול לכל דבר” ללא פירוק תחום.

18) השורה התחתונה

ML ב-iGaming אינה קבוצה של מודלים ”קסומים”, אלא דיסציפלינה: נתונים ומאפיינים עקביים, אימון לא מקוון, גלישה מקוונת אמינה, MLOPs קפדניים, מדדים שקופים ואתיקה/ציות. אם תנהג על ־ פי מדריך זה, תבנה מערכת שתגדיל באופן עקבי את ההכנסות ואת השמירה, תפחית את הסיכון ותתאים לדרישות הרגולטוריות - בקנה מידה, במהירות ובצפוי. ‏

Contact

צרו קשר

פנו אלינו בכל שאלה או צורך בתמיכה.אנחנו תמיד כאן כדי לעזור.

התחלת אינטגרציה

Email הוא חובה. Telegram או WhatsApp — אופציונליים.

השם שלכם לא חובה
Email לא חובה
נושא לא חובה
הודעה לא חובה
Telegram לא חובה
@
אם תציינו Telegram — נענה גם שם, בנוסף ל-Email.
WhatsApp לא חובה
פורמט: קידומת מדינה ומספר (לדוגמה, +972XXXXXXXXX).

בלחיצה על הכפתור אתם מסכימים לעיבוד הנתונים שלכם.