GH GambleHub

ארכיטקטורת מדדים

Metrics Architecture

ארכיטקטורת מטריקס (באנגלית: Metrics architecture) היא מערכת של כללים, חפצים ושירותים המספקים הגדרות חד משמעיות, חישוב מחדש, גישה שקופה ותפעול אמין של אינדיקטורים ברחבי הארגון. המטרה היא ש ”MAU”, ”Returation D30” או ”ARPU” ייחשבו זהים בכל לוחות המחוונים, הניסויים והדיווחים.

1) עקרונות

1. מקור אמת יחיד לנוסחאות וספרי עיון.
2. הפרדת הסמנטיקה מהיישום: ההגדרה העסקית חיה בשכבה סמנטית, לא בכל SQL/מחשב נייד.
3. סכימות, תרשימים ונוסחאות (v1 # v2) עם הגירה היסטורית מנוהלת.
4. רבייה ובדיקות: החישובים דטרמיניסטיים, מכוסים בבדיקות.
5. יכולת תצפית: רעננות, מלאות, עקביות וסחף - עם סלואים והתראות.
6. אבטחה ופרטיות: מזעור מח "ש, רילס/CLS, ביקורת חשבונות.
7. מערכת הפעלה כקוד: הגדרות, טרנספורמציות, מדיניות במאגר עם CI/CD.

2) שכבות ארכיטקטורה

נתוני מקור: אירועים/עסקאות, ספרי עיון, רישומי מודל/אינפרה.
אינטגרציה וניקיון: CDC/incremental טעינה, dedup, איחוד אזורי זמן.
מודל נתונים (DWH): כוכב/פתית שלג, לאט לאט משתנה מדידות (SCD), מפתחות פונדקאות.
שכבה סמנטית של מדדים: הגדרות אחידות, צבירה, מסננים, גרגר זמן, לוגיקה מתגלגלת.
שכבת עיצוב: אצווה/מיקרו-באץ '/זרם; חלונות, סימני מים, מפתחות.
קטלוג ומילון: ”מדדי דרכונים”, שושלת יוחסין, בעלים, זכויות.
גישה וצריכה: לוחות BI/Dashboard, מדדי API, העלאות, ניסויים/AB.

3) חוזי נתונים ומטרים

חוזה מקור (אירועים/טבלאות)

סכמה: שדות, סוגים, עירום, מפתח עיקרי.
SLA: רעננות (לדוגמה, ”פיגור של 10 דקות”), תדירות, איחור מרבי בהגעה.
איכות: ייחודיות מפתח, תחומים בעלי ערך תקף, אזור זמן, אידמפוטנטיות.
שינויים: מדיניות אבולוציה ערכית (אחורה/קדימה), תוכנית סטייה.

חוזה מטרי

שם/ID: "RET _ D30 _ v2&poss

דומיין/בעלים: ניתוח מוצרים

הגדרה (בשפה אנושית)

נוסחה: SQL/פסאודוקודה + מחסניות קלט/אובייקטים סמנטיים

היגיון גרנולרי/זמני: יום/שבוע; כללים נקודתיים בזמן, אזור זמן

קטעי ברירת מחדל/מסננים

יחידות ומטבעות (שיעור המרה/תאריך)

רעננות/X, דיוק/Y, זמינות/Z

גרסה/שינוי היסטוריה/תאריך אפקטיבי

מעקות בטיחות: טווחים תקפים, כללי ווינזוריזציה p1/p99

4) שכבה סמנטית של מדדים

המשימה של השכבה היא לאחסן הגדרות מרכזיות וכללי צבירה:
  • יסודות: ממדים (תאריך, מדינה, פלטפורמה), עובדות (אירועים, הכנסות), מדדים (ARPU, Retitation D30), שדות מחושבים, לוח שנה (עבודה/סוף שבוע, חגים).
  • התנהגות בזמן: טבלאות לוח שנה, לשונות, קוהורטות, חלונות ”מחליקים” (7/30/90).
  • Rollup ועקביות: כמות ביום = חודש, תוך איסור ספירה כפולה (משתמשים שונים).
  • התאמת מיקס: נורמליזציה לתערובת קבועה של ערוצים/מדינות עבור YoY ישר.
  • Multicurency/timezones: מותאם למטבע בסיס בתאריך העסקה; פרוסות UTC מקומיות ו ”קאנוניות”.

5) חישוב: אצווה, מיקרו באץ ', זרם

אצווה: עבודות לילה/שעות, חישובים מחדש מלא/אינקרמנטלי, שליטה אידמפוטנטיות.
חלונות 1-15 דקות ללוחות מחוונים מבצעיים.
זרם: אירועים דרך הצמיג; חלונות (Tumbling/Slading/Session), סימני מים (late data), סמנטיקה (declock + offset store).

דפוסי חלונות:
  • הופ 5 מ ', חלון 1' עבור קיי-פי-איי מבצעיים;
  • 'Tumble 1' עבור מדדים יומיים;
  • פגישה של 30 מטר לפגישות.

6) איכות ואימות

מבחני נתונים: סכמות, דומיין (רכסים), קישורים התייחסותיים.
מבחנים של מדדים: אינווריאנטים (DAU), מקטעים לא ריקים, ציפיות של מונוטוניות (מצטבר).
פיוס: בין שכבה סמנטית ודו "חות התייחסות/חשבונאות.
בריאות נתונים: רעננות, שלמות, שכפולים, שבר NULL, קפיצות חריגות.
מטרי סחיפה: PSI/KL/JS על תכונות מפתח, במיוחד עבור מטרי ML.

7) ורסינינג ונדידה

הנוסחה היא METRIC _ NAME _ vN. אסור ”בשקט” לשנות את ההגדרה מבלי לשנות את הגרסה.

אסטרטגיות הגירה:
  • זה לצד זה: V1 ו-V2 נספרים במקביל; פיוס והכשרה של משתמשים מבוצעים.
  • Cut-over: עובר צרכנים V2 בחלון העומס הנמוך; ארכיון v1.
  • חישוב מחדש של ההיסטוריה: סגירה לאחור לפי נתונים היסטוריים; פרוטוקול הבדל (דו "ח diff).
  • תקשורת: changelog, תאריך כניסה, מי יושפע, הוראות.

8) מודל נתונים למדדים

עובדות: תבואה (event_id, transaction_id, user_day), זמן אירוע, סכום/ערכים.
ממדים: משתמש, התקן, גאוגרפיה, ערוץ, מוצר, לוח שנה; סוג SCD להיסטוריה.
מפתחות: זיהוי פונדקאית, מפתחות עסקיים יציבים, מיפוי שולחנות.
אנטי-כפילויות: כללי זהות (מיזוג משתמש), הפעלה ”הדבקת” חלונות.

9) יחידות, מטבעות, עונתיות

יחידות/תבנית: יחידות מפורשות, עיגול, קשקשים (לוג/ליניארי).
רב-צורניות: המרה בשער החליפין בתאריך העסקה; לאחסן גם ”גלם” וגם כמות מנורמלת.
עונתיות: YoY ומדדים עונתיים; אפקטים נפרדים של ”חג”.

10) ביטחון וגישה

רו-רמה אבטחה (RLS): גישה למדדים על ידי מדינה/מותג/שותף.
אבטחה ברמה של עמודה (CLS) - מסכת שדות פיל/פיננסיים.
ביקורת: מי ביקש את המטרי, אשר מסנן, אשר ייצא נתונים.
הבדל API: ”מצטבר לפי תפקיד” נגד ”העלאות מפורטות”.

11) יכולת תצפית ו ־ SLO

רעננות SLO: לדוגמה, ”זמן תפעולי KPI-Lag 15 דקות, יום יום - עד 06:00 זמן מקומי”.
זמינות SLO: 99. 9% עבור שכבת API/סמנטית.
התראות: SLO עבריינות, קפיצות מטריות, NULL/שכפול צמיחה, שונות v1 vv2> X%.
ספרי ראנבוקס: מה לעשות כאשר מדרגות RCA מושפלות, נפילה לאחור (לדוגמה, החלפה ל ”מטריק הצילום” התקין האחרון).

12) ניסויים ומדדים

מדדי מעקה בטיחות: איחור, עמידות, FPR/FNR לניקוד.
הגדרות אחידות עבור A/B: המרות, שימור, NSM - דרך אותה שכבה סמנטית.
אפקט הבחנה מינימלי (MDE), ניתוח כוח: לאחסן פרמטרים בכרטיס המדדים.
ייחוס סיבתי: מדיניות על ידי התאמת מיקס וקבוצות בקרה.

13) מדדים וצריכה של API

”GET/metrics/{ name?” מ = 2025-09-01 & to = 2025-10-01 & dims = ארץ, פלטפורמה ופילטרים = ערוץ: בתשלום.
מדיניות: גבולות, מטמון, עבודת אלילים, ”יצוא” אידיוטי.
גרסאות: 'X-Metric-V2' header, אזהרות ירידה.

14) דפוסים וחפצים

דרכון מטרי (דוגמה)

קוד/גרסה: "ARPU _ v3&pos

הגדרה: הכנסות ממוצעות למשתמש משלם עבור התקופה

סכום (revenue_net )/ count_distinct (user_id איפה paying_flag=1)'

גרנולריות: יום; רול: שבוע/חודש = סכום מונה/מכנה

מקורות: "עובדה _ תשלומים _ v2", "dim _ users _ scd&pos

יחידות: מטבע ”base _ ccy”; המרה בשער החליפין נכון ל

מסנני ברירת מחדל: שווקים פעילים, לא כולל עסקאות בדיקה

רעננות 1 שעה; API/99 זמינות. 9%

מעקה בטיחות: ARPU [ 0; 10 000]; וינזוריזציה p1/p99

בעלים: Monetization Analytics; תאריך עדכון: 2025-10-01

לבדוק-רשימה שחרור מטרי

[ ] הגדרה ונוסחה הסכימו, מכוסה במבחנים
[ ] האובייקט הסמנטי שנוצר; שושלת מתועדת
[ ] Backfill והפניות הושלמו
[ ] SLO/התראות מוגדרות; ריצות מוכנות
[ הגדרות זכויות ] ו ־ RLS; PII מוסתר
[ ] גרסאות ישנות הוחלפו בלוחות מחוונים/ניסויים
[ ] Changelog/communication נשלח

point-in-time SQL פסאודו קוד (לדוגמה Restitution D30)

sql
WITH cohort AS (
SELECT user_id, MIN(event_date) AS signup_date
FROM fact_events
WHERE event_type = 'signup'
GROUP BY 1
),
activity AS (
SELECT user_id, event_date
FROM fact_events
WHERE event_type = 'app_open'
),
ret AS (
SELECT c. signup_date,
COUNT(DISTINCT CASE WHEN a. event_date = c. signup_date + INTERVAL '30 day' THEN a. user_id END) AS returned,
COUNT(DISTINCT c. user_id) AS cohort_size
FROM cohort c
LEFT JOIN activity a
ON a. user_id = c. user_id
AND a. event_date BETWEEN c. signup_date AND c. signup_date + INTERVAL '30 day'
GROUP BY 1
)
SELECT signup_date, returned / cohort_size AS retention_d30
FROM ret;

15) טעויות תכופות וכיצד להימנע מהן

עריכת נוסחה שקטה: תמיד דרך גירסה וצ 'אנגלוג.
”שונה בכל מחשב נייד” מדדים: כוח על שכבה סמנטית/API.
אזורי זמן/מטבעות לא עקביים: לוח שנה מרוכז ושולחן FX.
חשבון משתמש כפול: גלגול כללים ומפתחות ייחודיים.
רעננות אטומה: הצג בבירור את שעת הפיגור/עדכון.
תלות במהנדס אחד: הכל הוא כמו קוד, עם סקירה ואונקול.

סך הכל

ארכיטקטורת המטרים היא מילון + שכבה סמנטית + חישוב חזק + מינהל ו-SLO. על ידי ציות לעקרונות המתוארים (חוזים, מבחנים, גרסאות, תצפיות, בטיחות), אתה הופך מדדים מ ”סכסוכי מספרים” למוצר בר קיימא ומנגנון ניהול עסקי.

Contact

צרו קשר

פנו אלינו בכל שאלה או צורך בתמיכה.אנחנו תמיד כאן כדי לעזור.

התחלת אינטגרציה

Email הוא חובה. Telegram או WhatsApp — אופציונליים.

השם שלכם לא חובה
Email לא חובה
נושא לא חובה
הודעה לא חובה
Telegram לא חובה
@
אם תציינו Telegram — נענה גם שם, בנוסף ל-Email.
WhatsApp לא חובה
פורמט: קידומת מדינה ומספר (לדוגמה, +972XXXXXXXXX).

בלחיצה על הכפתור אתם מסכימים לעיבוד הנתונים שלכם.