צבירה ודיווחים מאוחדים
צבירה ודיווח מאוחד
צבירה (באנגלית: Aggregation) היא טרנספורמציה של רשומות מפורטות למדדים מסכמים עבור הסעיפים והתקופות הנדרשים. איחוד - שילוב צבירים ממקורות שונים/ישויות משפטיות/מוצרים לתוך דו "ח יחיד עם התאמות (מטבע, מדיניות חשבונאות, אלימינציה). להלן גישה שיטתית: החל בעיצוב חלונות ראווה וכלה בדיווח הפעלה.
1) משימות וסוגי גיבוש
הפעלה/מוצר: DAU/WAU/MAU, המרות, הכנסות על ידי מדינה/ערוץ/פלטפורמה.
פיננסים (ex. and regulatory): P&L, Cash Flow, Balance Geep, GGR/Net Gaming Emotions, מסים, דו "חות ישות משפטית.
סיכון/ציות: אנטי-הונאה, מדדי RG, SLA/זמינות, מסחף נתונים/מודל.
אסטרטגית: KPI מאוחד על ידי החזקה, תיק מותג, אזורים.
2) ארכיטקטורה של שכבת הצבירה
שכבות נתונים: ”Raw” ”au” staging ”” # ”core” (עובדות/ממדים) # ”marts” (אגרגטים לדיווחים).
שכבה סמנטית: הגדרות מטריות, לוח שנה, מטבעות, כללי גלגול.
דגנים וגרגרי זמן: 'אירוע', 'משתמש _ יום', 'txn',' bund _ country _ day '.
זהויות: מפתחות יציבים (user/brand/legal_entity), טבלאות מיפוי).
3) גלגיליות והיררכיות
היררכיות המימד הן Game # Category # Second, Channel # Creative # Creative # Country # Cluster.
כללי סיכום: תוסף (sum), תוסף למחצה (snapshot - ממוצע/אחרון לתקופה), לא תוסף (מקדמים/אחוזים).
שכפול - משתמשים ייחודיים ואירועי תבואה; הימנעו מספירה כפולה כאשר מקורות מיזוג.
4) רב כרזות, אזורי זמן, לוח שנה
זמן: ”אירוע _ time _ utc” ופרוסות מקומיות; לוח שנה של ימי חגים/עבודה.
מטבע: שמור את הסכום ”גולמי” + ”base _ ccasy” בשער החליפין של מועד העסקה (או שער החליפין הממוצע של התקופה עם caveat).
נורמליזציה: הצג יחידות מפורשות/תאריך שער מטבע/חליפין.
sql
WITH fx AS (
SELECT date, from_ccy, to_ccy, rate
FROM dim_fx_rates
WHERE to_ccy = 'EUR'
),
tx AS (
SELECT t. txn_id, t. amount, t. ccy, t. brand, t. country, t. event_date
FROM fact_tx
)
SELECT brand, country, DATE_TRUNC('month', event_date) AS month,
SUM(amount COALESCE(fx. rate, 1)) AS revenue_eur
FROM tx
LEFT JOIN fx
ON fx. date = tx. event_date AND fx. from_ccy = tx. ccy
GROUP BY 1,2,3;
5) איחוד על ידי מקור/ישות משפטית
מיפוי תרשימים של חשבונות: CoA יחיד (תרשים חשבונות) + מיפוי מתוך תוכניות מקומיות.
מדיניות חשבונאית: IFRS/GAAP/Transformation layer (לדוגמה, הכנסות ברוטו/נטו, הכרה בבונוסים/עמלות).
ביטול תחלופה פנימית-קבוצתית: הדרת עסקאות בין הישויות המשפטיות של ההחזקה.
שיטות איחוד: מלא, פרופורציונלי, שיטת הון עצמי.
בעלי מניות מיעוט: הקצאת אינטרס ללא שליטה (NCI).
sql
WITH interco AS (
SELECT a. txn_id
FROM fact_tx a
JOIN dim_counterparty b ON a. counterparty_id = b. id
WHERE a. legal_entity IN (SELECT id FROM dim_legal WHERE group_id = 1)
AND b. legal_entity IN (SELECT id FROM dim_legal WHERE group_id = 1)
)
SELECT
FROM agg_pl_month
WHERE txn_id NOT IN (SELECT txn_id FROM interco);
6) איכות ופיוס
פיוס מקור: כמות אחר מקור = כמות בהצגה (עם סובלנות שער/זמן).
אינווריאנטים: 'DAU MAU', סכום על פני ימים = סך חודשי (עבור מדדים תוספים).
שליטה מוחלטת: נתח של NULL, נתח של שכפולים, פיגור בטריות.
דו "ח אי התאמה רשימת אי התאמות וצעדי תיקון.
7) ביצועים ו ־ SLO
טריות SLO: יחידות מבצעיות - lag 15 דקות; שעות היום - עד 06:00 זמן מקומי; עד T + 1/T + 3.
אופטימיזציה: קדם-צבירה, חישובים אקספרמנטליים, חלוקה (לפי תאריך/מותג/מדינה), מטמון לפרוסות פופולריות.
מגבלות UI: 12 קטגוריות לכל לוח זמנים; סגידה לשולחנות; עומס עצלנים.
8) ניהול הגדרות וגרסאות
מילון מדדים: קוד, הגדרה, נוסחה, מקור, יחידות, בעלים, מעקות בטיחות.
Versioning: ”METRIC _ vN”; כל עורכת גרסה חדשה + הילוך אחורי וצ 'אנגלוג.
שכבה סמנטית: מקור אמת אחד עבור BI/ניסויים/משלוחים.
9) ביטחון וגישה
RLS/CLS: גישה לפי תפקיד (מדינה/מותג/ישות משפטית), מיסוך PII.
ביקורת: מי העלה איזה דו "ח; בקרת ייצוא (מועדים, אסימונים).
מזעור: הנפקת אגרגטים ולא נתוני מח "ש גולמיים.
10) אגרגטים טיפוסיים וחיזוי
מוצר: משפכים (סורגים), קוהורטות (מפת חום), שימור D7/D30, ARPU/ARPU, GGR/Net.
פיננסים: P&L לפי היררכיה, מפל מים (גשר), מבנה הכנסות לפי אזור, דינמיקת G&A.
מבצעים/ML: SLA, Latency p95/p99, PR- AUC/Recall @ FPR, x%, PSI-heatmap נסחף.
11) דרכון הדו "ח המאוחד (תבנית)
קוד/גרסה: "CONSOL _ PNL _ v3&pos
מטרה: ניהול P&L על ידי קבוצת מותג, מטבע בסיסי רב-תחומי EUR
כיסוי: כל הישויות החוקיות של הקבוצה; שיטה - גיבוש מלא; NCI - מודגש
מקור/שכבה: ”mart _ fin _ pnl _ v3” (מבוסס על ”עובדה _ tx _ v2”, ”dim _ legal”, ”dim _ fx _ rates”)
גרנולריות: חודש (התגלגלות מהיום)
פסילות: ”חברה = אמת” - תחלופה בתוך קבוצה לא נכללה
SLO: מנעול T + 06:00; זמינות 99. 9%
פיוס - דו "ח חשבונאות" BK _ PNL _ T + 1 ", שוני בין 0. 3%
בעלים: Finance Analytics, Data Platform
מעקות בטיחות: שולחן FX לא ישן מ-24 שעות; סיקור עסקאות 99. 5%
12) טעויות תכופות וכיצד להימנע מהן
שינויי נוסחה שקטים: תמיד דרך גרסאות וצ 'אנגלוג.
ספירה כפולה: שכפול קפיצים/ג "וינס - מפתחות שליטה ותבואה.
ערבוב אזורי זמן: לוח שנה מרכזי ואחסון UTC.
אחוז שגוי: מונה צבירה/מכנה, לא ”ממוצע ממוצעים”.
שיעורי ”גולמי”: מפורש FX תאריך/מקור, מדיניות עיגול עקבית.
אין פסילות: Inter-חברה מתהפכת דוחות.
רעננות אטומה: תמיד להראות ”מעודכן לפני N דקות”.
13) פסאודו ־ SQL: Incremental Monthly Agregate
sql
-- Recalculate only affected days/months
WITH changed_days AS (
SELECT DISTINCT DATE(event_time_utc) AS d
FROM fact_tx_delta -- new/modified per day
),
daily AS (
SELECT
DATE(event_time_utc) AS d,
brand, country,
SUM(net_revenue_eur) AS net_eur
FROM fact_tx
WHERE DATE(event_time_utc) IN (SELECT d FROM changed_days)
GROUP BY 1,2,3
)
MERGE INTO agg_month_brand_country m
USING (
SELECT DATE_TRUNC('month', d) AS month, brand, country, SUM(net_eur) AS net_eur
FROM daily
GROUP BY 1,2,3
) s
ON (m. month = s. month AND m. brand = s. brand AND m. country = s. country)
WHEN MATCHED THEN UPDATE SET m. net_eur = s. net_eur, m. updated_at = NOW()
WHEN NOT MATCHED THEN INSERT (month, brand, country, net_eur, updated_at)
VALUES (s. month, s. brand, s. country, s. net_eur, NOW());
14) תהליכים ותפעול
1. עיצוב: מטרות/קהל, מדדים, היררכיות, מטבע/אזורי זמן.
2. נתונים: חוזי מקור, תוכניות, בדיקות איכות.
3. בניין חלונות: חפצים סמנטיים, גלגול חוקים, חיסול.
4. פיוס: דיווחים על שונות אוטומטית, דו "חות תיקון.
5. שחרור: גרסה, תיעוד, אימון משתמש.
6. ניטור: רעננות, שלמות, שכפולים, זמן תגובה, תקריות.
7. עדכון: אימות רבעוני של הגדרות, מפיות, מדיניות FX.
15) רשימת הצהרות מאוחדות מראש
[ ] הגדרות מטריות והיררכיות המתועדות בשכבה סמנטית
[ ] נוצרות המרת מטבע ואזורי זמן; מראה את היחידות והתאריך של הקורס
[ ] מהפכות תוך-קבוצתיות/חיסול NCI מיושמות (אם ניתן ליישם)
[ ] אינווריאנטים ופיוס עם מקורות ייחוס מבוצעים בסובלנות
[ ] חישובים חוזרים ומחלקים מאופשרים
[ ] טריות/זמינות מוגדרות; סטטוסים עדכניים מוצגים
[ ] RLS/CLS ו-PII מסווגים; לייצא ביקורת חשבונות מאופשרת
[ ] צוין גרסה/צ 'אנג-לוג ובעלים; יש תקריות רנטגן
סך הכל
צבירה וגיבוש הם לא רק ”GROUP BY”, אלא מערכת הוליסטית: הגדרות עקביות, גלגולים נכונים, ריבוי מטבעות ולוח שנה, אלימינציות ופיוס, תצפיות ו-SLO. על ידי מעקב אחר הארכיטקטורה המתוארת, אתה הופך נתונים הטרוגניים לכספות אמינות עבור מוצר, פיננסי וניהול סיכונים.