GH GambleHub

תוכניות נתונים והאבולוציה שלהם

1) מדוע זוהי פלטפורמת iGaming

אמינות - שינויים בנתונים אינם שוברים דוחות, API או מודלים.
מהירות תכונה: הוספת שדות בבטחה (KYC/RG/PSP) ללא עצירת זרמים.
רגולציה: איתור ויכולת רבייה (ביקורת ביקורת/שושלות, DSAR, Ligal Hold).
עלות: למזער ”עודף” והשבתה של מילוי גב.

2) סוגי מזימות והיכן הן חיות

אירועים (זרמים): "תשלומים. deposit_accepted', המשחק. round_finished'.
OLTP/DDL: שולחנות מנורמלים (KYC, חשבונות, גבולות).
DWH/Storfronts (זהב): אגרגטים מושחתים תחת BI/ML.
חנות תכונה: תכונה מקוונת/לא מקוונת קובעת עם ערבויות עקביות.
חוזי שותפים חיצוניים: PSP, ספקי משחקים, מקורות שיווק.

סימונים: Avro/Protobuf (זרמים), JSON Schema (אינטגרציות), SQL DDL (DWH), schema Parquet (אגם).

3) תאימות (ליבת האבולוציה)

התאמה לאחור: יצרנים חדשים * צרכנים ישנים (נוספה ברירת מחדל C/nullable).
צרכנים חדשים (קורא חדש מתעלם מיותר).
התאמה מלאה: שניהם (מטרה רצויה לאירועים).
שינוי שם/מחיקת שדה, שינוי סוג/סמנטיקה, שינוי מקש/מחיצה.

כלל 1: אירועים מתפתחים באמצעות חיבור, לא באמצעות שינוי.
חוק 2: למחוק - רק בגרסת המייג 'ור של התרשים לאחר תקופת הפחת.

4) גרסאות ומדיניות סמנטיות

מייג 'ור. מינורי. PATCH 'עבור כל מערך תצוגה/תכונה.

מייג 'ור - אי-התאמה (נושא/שולחן/מאפיין חדש ערוך, דו-ריצה).
מינור - תואם (שדות חדשים/ברירת מחדל, ערכי אנום חדשים).
תיקון - עריכת תיאורים/גבולות/הערות.

מחזור חיים שדה: ”experiental _ active = producted ac הוסר” (עם תאריכים ובעלים).

5) רישום מזימות וחוזי נתונים

סכימה רישום: מאגר גרסאות, תאימות, אבולוציה ובעלים.
חוזה נתונים: מתקן את התכונה + SLO איכות + פרטיות (ראה סעיף ”אימות נתונים”).

דוגמה (אברו, תשלומים. deposit_accepted v1. 7. 0):
json
{
"type":"record","name":"deposit_accepted","namespace":"payments",
"fields":[
{"name":"event_id","type":"string"},
{"name":"occurred_at","type":{"type":"long","logicalType":"timestamp-micros"}},
{"name":"user_id","type":"string"},
{"name":"brand","type":"string"},
{"name":"country","type":"string"},
{"name":"psp","type":"string"},
{"name":"method","type":"string"},
{"name":"amount","type":{"type":"bytes","logicalType":"decimal","precision":18,"scale":2}},
{"name":"currency","type":{"type":"enum","name":"Currency","symbols":["EUR","USD","TRY","BRL"]}},
{"name":"risk_score","type":["null","int"],"default":null},       // MINOR+
{"name":"kyc_level","type":["null",{"type":"enum","name":"Kyc","symbols":["L0","L1","L2","L3"]}],"default":null}
],
"compatibility":"FULL","owner":"team-payments"
}

6) דפוסי נדידה

6. 1 אירועים (זרמים)

תוסף בלבד: הוסף שדות עם ברירת מחדל/nullable; צרכנים ישנים לא נשברים.
תווים חדשים נחשבים ל-MINOR, הצרכנים נדרשים להחזיק בסניף ”אחר/לא ידוע”.
הגירה גדולה: התשלומים של הנושא החדש. deposit_accepted. v2 ', דו-כתיבה, קריאת צללים, ואז החלפת צרכנים.

6. 2 DWH/storfronts

שולחנות כחולים-ירוקים: "זהב. revenue_v2' ליד 'v1'; להתממש, לאמת, לעבור BI.
הילוך אחורי: שידור חוזר של תמונות + מיזוג אידמפוטנטים (על ידי מפתחות/גרסאות).
SCD: סוג 2 לשינוי תכונות באיטיות (גבולות, KYC, VIP statuses).

6. 3 חנות מאפיינים

הגשה כפולה: הסט הישן מוגש במקביל לחדש; הדגם מופעל באמצעות נתב.
עקביות נקודתית: האבולוציה לא צריכה לשבור את השמחות של PITA (חותמת זמן/גרנולריות לא משתנות בMINOR).

7) טקסונומיה של שינויים (רשימה)

בטוח (מינורי):
  • הוספת שדה/ברירת מחדל;
  • סיומת אנום (עם סניף ”לא ידוע” אצל הצרכן);
  • הוספת אינדקס/תגובה/תיאור שאינו מפתח.
בטחון מותנה:
  • שינוי קנה מידה/יחידה (לדוגמה, סכום של סנט = מטבע בסיס) - מז "ן בלבד
  • העברה/התייחסות - דרך שכבת המצגת.
שבירה (מייג 'ור):
  • שינוי שם/מחיקת שדה
  • שינוי סוג/פורמט/מפתח/מחיצה
  • שינוי הסמנטיקה (לדוגמה, 'בונוס _ כמות' מ ”הצטבר” = ”נכתבה”).

8) מקשרי מעגל ומבחני תאימות

סכימה מוך: סגנון שם (”snake _ case”), תוויות דרושות (”בעלים”, ”doc”, ”pii”), תבנית תאריך/מטבע.
בדיקות קומבט: בדיקת הגרסה החדשה כנגד הרישום (אחורה/קדימה/מלא).
בדיקות חוזה-צרכן: כל שירות מספק ”מטען דגימה” וציפייה; לרוץ על מודיע בעת שינוי המזימה.
Golden-datasets: קבוצה של דוגמאות אמיתיות ו ”רעות” (enum חדש, שדות ריקים/מאוחרים, ערכי גבול של סכומים).

9) ספריות, חוקן ולוקליזציה

Reference-Data (מדינות/מטבעות/PSP/ספקים): גרסאות בודדות ועדכוני SLA; לא לתפור לתוך קוד האירוע.
אזורי Locale/time: לאחסן UTC באירועים + מיקום מפורש להצגה.
כללי שיפוט: דגלי גיל, הגבלות פרומו - בצורה של ספריות עם תאריכי פעולה.

10) Multi-Brand/Multi-שיפוט ו-PII

בידוד דייר: ”מותג”, ”מדינה”, ”רישיון” - שדות חובה עם enum; ניתוב עליהם.
מדיניות PII ברמת סכימה: לסמן את השדות ”pii = אמת”, ליישם מסכות/טוקניזציה; באירועים, רק אסימונים.
DSAR: נוכחות של 'source _ id/trace _ id' or מחיקה/החזרה; אחיזה משפטית בנדידת מייג 'ור.

11) DDL ו ־ Lake Versioning

נדידת DDL: הגירה הצהרתית (Liquibase/Flyway/dbt), אחסון ב-VCS, סקירה על ידי בעל התחום.
פורמטים באגם: Avro/Parquet - רשמו את התפתחות השדות; בסרן - שולחן חדש/שביל ”.../v2/”.
מחיצה: החלפת חלקים (לדוגמה, ”תאריך” ”תאריך, מותג”) - רק דרך מייג 'ור וכניסה כפולה.

12) דוגמאות של iGaming

12. 1 PSP שיטות מורחבות

שיטה נוספת = ”MEFETE” ל-enum.
שחרור מינורי של v1 המקובל. 8. 0`; צרכנים שאינם מכירים את MEFETE שולחים סניף ל ”שיטה _ לא ידועה”.

12. 2 ספקי משחקים נוספו

וי 'גיים. round_finished' הוסיף 'jackpot _ id' (nullable).
זהב של תצוגה. game_rounds_v3' מקבל מינור; דוחות ישנים עובדים, חדשים סופרים זכיינים.

12. 3 תכונות RG

מעבר מ-Boolean 'self _ nulded' ל-status 'rg _ state _ non, הגבלה, התקררות, self_excluded}' - MAJOR, נושא חדש + dual-write + הגירה של תצוגות ומודלים.

13) תהליך אבולוציה (מרעיון להחלפה)

1. הצעה (ADR): מדוע שינוי, סוג של תאימות, הערכת סיכונים והשפעה על הצרכנים.
2. עיצוב וחוזה: תוכנית לרישום, סמבר, מדיניות תאימות.
3. בדיקות: לינטרים, קומבט, חוזים צרכניים, שידור חוזר על זהב-סט.
4. פריסה: כתיבה כפולה/כחול ירוק/קריאות צללים; התראות.
5. פיוס: Business מאזן/invariants (ראה אימות נתונים).
6. החלפה: לעבור צרכנים/BI/תכונות.
7. להקפיא סכמות ישנות, תקופת חסד, למחוק וארכיון.

14) Metrics ו ־ SLOs של אבולוציה

אחוזי הצלחה בנדידה, זמן ריצה כפול, שיתוף באירועי פורמט חדשים, נפח גיבוי, פיגור/רעננות.
תקריות תאימות (P1/P2), איכות החלון לאחר ההחלפה.
עלות: $/TB עודף, $/שעה דו-כתיבה, עומס אשכול.
ציות: 0 דליפות PII, SLA DSAR/Legal Hold נפגש.

15) כלים וחפצים

15. 1 מדיניות תאימות (רישום)

yaml schema: payments. deposit_accepted compatibility: FULL default_nulls: true enums:
currency: {allow_new_symbols: true, require_consumer_unknown_branch: true}
pii: false owners: ["team-payments"]
reviewers: ["data-governance","security-dpo"]

15. 2 דרכון נדידה (תבנית)

yaml change_id: MIG-2025-041 scope: game. round_finished -> v3 type: MAJOR plan:
dual_write: true shadow_reads: consumers: ["gold-rounds","rg-models"]
backfill: {from: "2025-01-01", mode: "idempotent-merge"}
validation:
invariants: ["sum_bets = sum_wins + margin + bonuses"]
freshness_delta_p95_max: "PT5M"
switch_criteria:
error_rate_max: 0. 1%
kpi_diff_pp_max: 0. 5 deprecate_after: "2025-12-31"

15. 3 לינטר של שמות וסוגים (כללים)

'sake _ case', UTC timestamps, עשרוני (18. 2) עבור סכומים, 'מדינה' עבור אלפא-2 ISO-3166-1, 'מטבע' עבור ISO-4217.
No 'free _ text' for enum fields; ספרי עיון - חיצוניים.

16) מימוש מפת דרכים

0-30 ימים (MVP)

1. אפשר סכימת מדיניות תאימות עבור אירועי מפתח (תשלומים, game_rounds, משתמש).
2. מבחני לינטרס/קומבט במצ "ח; ספריית בעלים וביקורות SLA.
3. תבניות ADR ודרכון הגירה; רשימת בדיקות גדולה.

30-90 ימים

1. Blue-Green for Gold Storfronts; כתיבה כפולה לנושאים ביקורתיים.
2. בדיקות צרכניות לשירותים בסיסיים; נתונים מוזהבים.
3. אוטומטי diff-פיוס והתראות בעת החלפה; דוחות עלות.

3-6 חודשים

1. תהליך הפחתה/הסרה יחיד עם תקופת החן; אחיזה ארכיונית ומשפטית.
2. תוכניות הצפנה ומפתחות ספציפיים לגיאו/דייר; וריאציות DP לשווקים רגישים.
3. מילון נתונים ותרשימי שושלת חיים.

17) ראסי

ממשל נתונים (A/R): סטנדרטים, רישום, ביקורת הגירה, דה-פרסום.
בעלי דומיין (R): משמעות של שדות, ספרי עיון, אינווריאנטים עסקיים.
פלטפורמת נתונים (R): כלי רישום, בדיקות קומבט, דו-ריצה/מילואים.
אבטחה/DPO (A/R): מדיניות PII, גיאו/דייר, DSAR/Legal Hold.
SRE/Observability (C): התראות, אבולוציה SLO, קיבולת.
מוצר/פיננסים (C): אימות של KPIs, החלפת חלונות.

18) אנטי דפוסים

”ערוך את השדה בזבוב” ללא גרסאות ודו-ריצה.
שינוי שם במקום להוסיף שדה חדש * התמוטטות מסיבית.
קשיחות ללא ענף ”לא יודע” טיפה בערכים חדשים.
ספרייה אחת ”בקוד” לכל תחומי השיפוט.
חזרה ללא אידמפוטנט מיזוג ולבדוק מאזנים.
יומנים עם PII וללא trace_id לחיפוש/DSAR.

19) חלקים קשורים

אימות נתונים, מקור נתונים ונתיב, פרקטיקות DataOps, Analytics ו-Metrics API, ביקורת, אבטחת נתונים והצפנה, בקרת גישה, MLOps: ניצול מודל.

סך הכל

התפתחות מזימות היא תהליך, לא נדידה חד פעמית: רישום, גרסאות ואינטרפרטציה; דו-ריצה וכחול-ירוק במקום ”מתגים בחצות”; מבחני תאימות ועסקים במקום מזל. אז הנתונים נשארים יציבים, המודלים צפויים, הדוחות נכונים, והרגולטורים רגועים.

Contact

צרו קשר

פנו אלינו בכל שאלה או צורך בתמיכה.אנחנו תמיד כאן כדי לעזור.

התחלת אינטגרציה

Email הוא חובה. Telegram או WhatsApp — אופציונליים.

השם שלכם לא חובה
Email לא חובה
נושא לא חובה
הודעה לא חובה
Telegram לא חובה
@
אם תציינו Telegram — נענה גם שם, בנוסף ל-Email.
WhatsApp לא חובה
פורמט: קידומת מדינה ומספר (לדוגמה, +972XXXXXXXXX).

בלחיצה על הכפתור אתם מסכימים לעיבוד הנתונים שלכם.