GH GambleHub

נתיב מקורות ונתונים

1) מהי שושלת נתונים

שושלת נתונים (באנגלית: Data Lineage) היא ”סיפור חיים” של נתונים: ממקום לידה (מקור), דרך טרנספורמציות והעברות לחנויות, דוחות ומודלים. השושלת עונה על שאלות:
  • מאיפה המספרים בדו "ח הגיעו?
  • אילו טבלאות/שדות יושפעו מהשינוי בתרשים?
  • למה החלפת קיי-פי-איי אתמול בשעה 9?
  • איזה מידע נכנס לדגם מסוים וגרסת אם-אל?

עבור iGaming, הדבר קריטי בשל רגולציה, דיווח פיננסי (GGR/NET), אנטי-הונאה, KYC/AML, משחק אחראי ומהירות גבוהה של שינויי מוצר.

2) רמות שושלת וגרנולריות

1. שושלת עסקית - קישור בין מדדים ומונחים עסקיים (מן הגלוסרי) לתצוגות/נוסחאות.
2. קו טכני (טבולרי) - יחסים בין טבלאות/עבודות/חבילות טרנספורמציה.
3. רמת שדה/עמודה - איזה עמוד מקור מהווה את עמודת היעד, עם כללים.
4. ריצה (runtime-lineage) - ריצות בפועל: זמנים, כרכים, גרסאות קוד/סכימה, חפצי חשיש.
5. נתיב מקצה לקצה ממספק/PSP/CRM לדיווח/לוח מחוונים/מודל.
6. קשרים בין מוצרי מידע בתחום תחת חוזים.

3) ערך מפתח

אמון וביקורת: הסברים של דיווחים ומודלים, חקירה מהירה של אירועים.
ניתוח השפעה: שינויים בטוחים בתוכניות/לוגיקה, חיזוי של שחרור.
אנליסטים ומהנדסים חדשים מבינים את הנוף מהר יותר.
ציות: איתור PII, Hold משפטי, דיווח לרגולטורים.
אופטימיזציה עלויות: זיהוי של צינורות מתים וחנויות כפולות.

4) חפצים וחפצים

ישויות גרף: Source (ספק משחקים, PSP, CRM), Topic/Stream, Raw/Staging, Bronze/Silver/Gold, DWH, ML, מודל BI, Dashboard.
מערכות יחסים: טרנספורמציות (SQL/ELT), ג 'בס (Airflow/DBT/...), מודלים (גרסה), חוזים (Avro/Proto/JSON Schema).
תכונות: בעלים, דומיין, סיווג, סכימה, בקרת איכות, רעננות, SLO/SLI.

5) מקורות אמת לשושלת

סטטי: פירוק SQL/configs (dbt, ETL) # לבנות תלויות.
Dynamic/Runtime - לאסוף metadata בזמן ריצה (הצהרה בתזמור, רישומי שאילתות).
אירוע: אירועי שושלת בעת פרסום/קריאת הודעות באוטובוס (קפקא/פולסר), אימות של חוזים.
מדריך (מינימום) - מתאר לוגיקה עסקית מורכבת שאינו מוחזר באופן אוטומטי.

6) שושלת וחוזי נתונים

החוזה מתקן את התוכנית, הסמנטיקה וה-SLA.
סימון תאימות (semver) ואידמפוטנטיות נדרשים.
Linige שומר קישור לחוזה/גרסה והעובדה של העברת הצ 'ק (CI/CD + runtime).

7) שושלת ב ־ iGaming: דוגמאות דומיין

Game Events # RTP aggregates, תנודתיות, שימור, תצוגת זהב ביצועי משחק.
תשלומים/יציאות/צ 'רג' בקס * דו "חות GGR/NET, אותות נגד הונאה.
KYC/AML # statuses, checkes, מתריעים על תיקי ציות ודיווח.
Gaming Gaming Problems/self-Industry Progress.
שיווק/CRM # מסעות פרסום, בונוסים, הימור על השפעת LTV/ARPU.

8) הדמיית גרף

המלצות:
  • שני מצבים הם ”מפת נוף” (מאקרו) ו ”דרך מסלול” (מיקרו) משדה לשדה.
  • מסננים: לפי תחום, בעלים, סיווג (PII), סביבה (prod/stage), זמן.
  • כיסויים: רעננות, כרכים, שגיאות DQ, גרסאות סכימה.
  • צעדים מהירים: ”הצג תלויים”, ”מי אוכל את הטור הזה? ”, ”נתיב ללוח המחוונים של KPI”.

9) ניתוח השפעה וניהול שינויים

לפני שינוי התוכנית/לוגיקה, הפעל מה-אם: אילו דקירות/תצוגות/לוחות מחוונים/מודלים יושפעו.
אוטוגנרציה של כרטיסים לבעלים של חפצים תלויים.
דפוס דו-כתיבה/כחול-ירוק לחנויות: v2 מלא במקביל, השוואה מטרית, מיתוג.
חוברות משחק: איך ואיך לטעון נתונים היסטוריים, איך לבדוק עקביות.

10) שושלת ואיכות נתונים (DQ)

כללי DQ משותפים עם צומתי גרף/שדות: תוקף, ייחודיות, עקביות, זמן.
במקרה של הפרות, להציג ”קטעים אדומים” על הפסים ולהעלות התראות לבעלים.
שמור היסטוריה של תקריות DQ והשפעתם על KPIs.

11) שושלת ל ־ ML/AI

Traceability - dataset ac features _ training code ac model (גירסה).
תיקון מתחייב, פרמטרי אימון, גרסאות מסגרת, נתוני אימות.
שושלת היוחסין עוזרת לחקור סחף, רגרסיה מטרית, ולשכפל תוצאות.

12) שושלת ופרטיות/ציות

לייבל PII/שדות פיננסיים, מדינות, חוק (GDPR/local), בסיס עיבוד.
סמן את הצמתים שבהם מיישמים מיסוך/זהות/אנונימיות.
עבור DSAR/Right להישכח, עקוב אחר חלונות/גיבוי הנבדק.

13) Metrics (SLO/SLI) עבור Lineage

כיסוי:% של טבלאות/שדות עם linejet עמודה.
פרופורציה של צמתים שמתאימים לעדכון SLA.
DQ לעבור קצב: הפרופורציה של בדיקות מוצלחות על ידי נתיבים קריטיים.
MTTD/MTTR לתקריות מידע.
שינוי זמן עופרת: הזמן הממוצע לנהל משא ומתן ולשחרר בבטחה סכימה.
נכסים מתים: פרופורציה של חנויות ללא דורש/עבודה.

14) כלים (קטגוריות)

קטלוג/גלוסרי/לינאז ': גרף metadata יחיד, יבוא מ ־ SQL/תזמורות/אוטובוס.
תזמור: איסוף metadata זמן ריצה, סטטוסים משימה, SLAs.
סכימה רישום/חוזים - בדיקות תאימות, מדיניות גירסה.
DQ/Observability: חוקים, חריגות, רעננות, כרכים.
סק/גישה: תוויות PII, RBAC/ABAC, ביקורת.
ML Registry: גרסה של דגמים, חפצים ומידע.

15) תבניות (מוכנות לשימוש)

15. דרכון יחידת ליניה 1

שם/דומיין/סביבה: בעלים/סטיוארד:
  • סיווג: ציבורי/פנימי/סודי/מוגבל (PII)
  • מקור/כניסות: טבלאות/נושאים + גרסאות חוזה
  • שינוי צורה: SQL/עבודה/ריפו + להתחייב
  • יציאות/צרכנים: הצג ארגזים/לוחות מחוונים/מודלים
DQ-Rules/SLO:
  • אותות תצפית: רעננות, נפח, חריגות
תלויות נתיב קריטיות עבור KPIs:
  • היסטוריית אירוע: קישורים לכרטיסים/לאחר המוות

15. כרטיס תקשורת 2 (רמת עמודה)

מהשדה: סכימה. שולחן. col (סוג, נול)

בשטח: סכימה. שולחן. col (סוג, נול)

כלל שינוי צורה: ביטוי/פונקציה/מילון

הקשר איכותי: צ 'קים, טווחים, אזכורים

15. 3 ספר משחקים לחקירת תקריות

1. זהה KPI מושפע/לוח מחוונים * 2) במעלה הזרם אל המקור *

2. בדוק רעננות/כרכים/DQ בכל קודקוד # 4) מצא את שינוי הקוד/סכימה האחרונה

3. השווה ייצור/שלב/אתמול = 6) הקצה קיבעון ומילוי = 7) פוסט-מורטם וחוק לעתיד.

16) תהליכים ואינטגרציות

על שינוי: כל מיזוג לתוך repo שמשנה את סכימה/SQL מעורר בנייה מחדש של השושלת וניתוח ההשפעה.
במנוסה: כל עבודה מוצלחת/כושלת כותבת metadata זמן ריצה לגרף.
בקשות גישה מראות את הדרך למח "ש ולבעלים האחראים.
טקסי ממשל: סקירה שבועית של מסלולים קריטיים, דו "ח חודשי על SLO.

17) מימוש מפת דרכים

0-30 ימים (MVP)

1. מזהים לוחות מחוונים קריטיים ומסלולים מקצה לקצה.
2. חבר בין ניתוחי SQL/עבודות לשושלת טבעית.
3. הכנס את הדרכון/תקשורת ואת מדדי הטריות המינימליים.
4. תאר את תגי ה ־ PII במסלולי המפתח (KYC, תשלומים).

60-90 ימים

1. עבור לרמת עמודה לתיבות התצוגה העליונות.
2. Integrator runtime metadata (זמן, נפח, סטטוסים).
3. כללי DQ עמיתים עם גרף, כולל התראות.
4. הדמיה: מסננים לפי תחום/בעלים/PII, כיסוי של רעננות.

3-6 חודשים

1. חוזים ורשימות של תוכניות על אוטובוס האירוע (הזנות משחק/תשלום).
2. full track ML-lineage (dannyye = fichi # model # inferens).
3. ניתוח השפעה ב CI * כרטיסים אוטומטיים לבעלי תלות.
4. כיסוי ברמת עמודה של 70% מהמחסנים הפעילים; דיווח SLO.

18) דפוסים ואנטי דפוסים

תבניות:
  • גרף-ראשון: גרף מטא-דטה יחיד כ ”מצפן” של שינויים.
  • שושלת מודעת חוזה: התאגדות עם סכימה גרסאות ותוצאות אימות.
  • כיסוי תצפית: רעננות/כרכים/DQ חלקי גרף.
  • חשיבה-מוצר: בעלי דומיין מפרסמים ”מוצרי נתונים” מוסמכים.
אנטי-דפוסים:
  • ”תמונה למען התמונה” ללא איסוף ותמיכה אוטומטיים.
  • מפות מוח ידניות במקום ניתוחים ואמת בזמן ריצה.
  • חוסר עמודה המפרטת בנתיבי קיי-פי-איי קריטיים.
  • לינאז 'ללא קשירה עם גישה/PII ותהליכי DSAR/Ligal Hold.

19) רשימות בדיקה מעשיות

לפני שחרור שינויי נתונים

[ ] חוזה מעודכן, התאמה עברה
[ ] ניתוח השפעת התלות הושלם
[ ] v2-תצוגה שהורכבה במקביל, השוואה של מדדים
[ ] Backfill ותוכנית rollback מתועד

סקירה שבועית

[ ] שבילים קריטיים ירוקים בטריות
[ ] אין עבודה יתומה/מחסנים
[ ] תקריות DQ נסגרו ותועדו
[ ] רמת גיס> סיקור סף היעד

תוצאות

השושלת הופכת זרמי מידע כאוטי למפה ניתנת לשליטה של האזור: אתם יכולים לראות מאיפה מה בא, מי אחראי, אילו סיכונים וכיצד להשתנות בבטחה. עבור iGaming, זהו בסיס של אמון ב KPI, מהירות של ניסויים ותאימות בוגרת.

Contact

צרו קשר

פנו אלינו בכל שאלה או צורך בתמיכה.אנחנו תמיד כאן כדי לעזור.

התחלת אינטגרציה

Email הוא חובה. Telegram או WhatsApp — אופציונליים.

השם שלכם לא חובה
Email לא חובה
נושא לא חובה
הודעה לא חובה
Telegram לא חובה
@
אם תציינו Telegram — נענה גם שם, בנוסף ל-Email.
WhatsApp לא חובה
פורמט: קידומת מדינה ומספר (לדוגמה, +972XXXXXXXXX).

בלחיצה על הכפתור אתם מסכימים לעיבוד הנתונים שלכם.