GH GambleHub

Αρχιτεκτονική μέτρησης

Αρχιτεκτονική μετρικών

Η αρχιτεκτονική των μετρικών είναι ένα σύστημα κανόνων, αντικειμένων και υπηρεσιών που παρέχουν σαφείς ορισμούς, αναπαραγώγιμο υπολογισμό, διαφανή πρόσβαση και αξιόπιστη λειτουργία των δεικτών σε όλο τον οργανισμό. Ο στόχος είναι το «MAU», το «Retention D30» ή το «ARPPU» να θεωρούνται το ίδιο σε όλα τα ταμπλό, τα πειράματα και τις αναφορές.

1) Αρχές

1. Ενιαία πηγή αλήθειας για τύπους και βιβλία αναφοράς.
2. Διαχωρισμός της σημασιολογίας από την εφαρμογή: ο ορισμός της επιχείρησης ζει σε ένα σημασιολογικό στρώμα, όχι σε κάθε SQL/laptop.
3. Μετρήσεις εκδόσεων, σχήματα και τύποι (v1→v2) με διαχειριζόμενη μετανάστευση ιστορικού.
4. Αναπαραγωγιμότητα και δυνατότητα δοκιμής: οι υπολογισμοί είναι καθοριστικοί και καλύπτονται από δοκιμές.
5. Παρατηρησιμότητα: φρεσκάδα, πληρότητα, συνέπεια και μετατόπιση - με SLO και συναγερμούς.
6. Ασφάλεια και προστασία της ιδιωτικής ζωής: ελαχιστοποίηση PII, RLS/CLS, έλεγχος.
7. Λειτουργικό σύστημα ως κωδικός: ορισμοί, μετασχηματισμοί, πολιτικές - στο αποθετήριο με CI/CD.

2) Στρώματα αρχιτεκτονικής

Στοιχεία πηγής: γεγονότα/συναλλαγές, βιβλία αναφοράς, αρχεία καταγραφής υποδειγμάτων/infra.
Ολοκλήρωση και καθαρισμός: CDC/επαυξητική φόρτωση, αποσύνθεση, ενοποίηση των ζωνών ώρας.
Μοντέλο δεδομένων (DWH): άστρο/νιφάδα χιονιού, αργή αλλαγή μετρήσεων (SCD), υποκατάστατα κλειδιά.
Σημασιολογικό στρώμα μετρήσεων: ομοιόμορφοι ορισμοί, συγκεντρώσεις, φίλτρα, κόκκοι χρόνου, λογική ανατροπής.
Στρώμα σχεδιασμού: παρτίδα/μικροεπεξεργαστή/ροή· παράθυρα, σημάδια νερού, κλειδιά.
Κατάλογος και λεξικό: «μετρήσεις διαβατηρίων», καταγωγή, ιδιοκτήτες, δικαιώματα.
Πρόσβαση και κατανάλωση: BI/ταμπλό, μετρήσεις API, uploads, πειράματα/AB.

3) Συμβάσεις δεδομένων και μετρήσεων

Σύμβαση πηγής (γεγονότα/πίνακες)

Σχήμα: πεδία, τύποι, ακυρότητα, κύριο κλειδί.
SLA: φρεσκάδα (για παράδειγμα, «≤10 λεπτά καθυστέρηση»), συχνότητα, μέγιστη καθυστερημένη άφιξη.
Ποιότητα: βασική μοναδικότητα, έγκυροι τομείς αξίας, χρονική ζώνη, ταυτότητα.
Αλλαγές: πολιτική εξέλιξης του συστήματος (οπισθοδρόμηση/πρόοδος), σχέδιο απόκλισης.

Μετρικό συμβόλαιο

Όνομα/ταυτότητα: 'RET _ D30 _ v2'

Domaine/Ιδιοκτήτης: Product Analytics

Ορισμός (στην ανθρώπινη γλώσσα)

Τύπος: SQL/ψευδοκώδικας + καταστήματα εισόδου/σημασιολογικά αντικείμενα

Κοκκιότητα/χρονική λογική: ημέρα/εβδομάδα; point-in-time κανόνες, timezone

Προκαθορισμένα τμήματα/φίλτρα

Μονάδες και νομίσματα (ισοτιμία/ημερομηνία μετατροπής)

SLO: φρεσκάδα ≤ X, ακρίβεια ≥ Y, διαθεσιμότητα ≥ Z

Έκδοση/Αλλαγή ιστορικού/Ημερομηνία έναρξης ισχύος

Guardrails: έγκυρες σειρές, κανόνες Winzorization p1/p99

4) Σημασιολογικό στρώμα μετρήσεων

Καθήκον του θεματικού επιπέδου είναι η κεντρική αποθήκευση των ορισμών και των κανόνων συγκέντρωσης:
  • Στοιχεία: διαστάσεις (ημερομηνία, χώρα, πλατφόρμα), γεγονότα (γεγονότα, έσοδα), μετρήσεις (ARPU, διατήρηση D30), υπολογιζόμενα πεδία, ημερολόγιο (εργασία/Σαββατοκύριακο, διακοπές).
  • Χρονική συμπεριφορά: ημερολογιακοί πίνακες, υστερήσεις, ομάδες, «συρόμενα» παράθυρα (7/30/90).
  • Rollup και συνέπεια: ποσό ανά ημέρα = μήνα, χωρίς διπλή μέτρηση (διαφορετικοί χρήστες).
  • Μίξη-προσαρμογή: ομαλοποίηση σε ένα σταθερό μίγμα καναλιών/χωρών για έντιμη YoY.
  • Multicurrency/timezones: προσαρμοσμένο στη βάση του νομίσματος κατά την ημερομηνία συναλλαγής· τοπικές και «κανονικές» φέτες UTC.

5) Υπολογισμός: παρτίδα, μικροσκόπιο, ρεύμα

Παρτίδα: νυχτερινές/ωριαίες θέσεις εργασίας, πλήρεις/επαυξητικοί επανυπολογισμοί, έλεγχος ιδεατότητας.
Μικροβιογράφημα: παράθυρα 1-15 λεπτά για λειτουργικά ταμπλό.
Ροή: γεγονότα μέσω του ελαστικού. παράθυρα (κατάδυση/ολίσθηση/συνεδρία), σημάδια νερού (καθυστερημένα δεδομένα), σημασιολογία ακριβώς μία φορά (αδιέξοδο + αποθήκευση όφσετ).

Μοτίβα παραθύρων:
  • "HOP 5m, WINDOW 1h 'for operational KPIs,
  • ημερήσιες μετρήσεις «TUMBLE 1 for»,
  • 'SESSION 30 for sessions.

6) Ποιότητα και δυνατότητα επαλήθευσης

Δοκιμές δεδομένων: σχηματικός, τομέας (εύρος), σύνδεσμοι αναφοράς.
Δοκιμές μετρήσεων: αναλλοίωτα (DAU≤MAU), μη κενά τμήματα, προσδοκίες μονοτονίας (σωρευτικά).
Συμφιλίωση: μεταξύ σημασιολογικών εκθέσεων και εκθέσεων αναφοράς/λογιστικής.
Υγεία δεδομένων: φρεσκάδα, πληρότητα, αντίγραφα, κλάσμα NULL, μη φυσιολογικά άλματα.
Παρασυρόμενες μετρήσεις: PSI/KL/JS σε βασικά χαρακτηριστικά, ειδικά για μετρήσεις ML.

7) Εκδόσεις και μεταναστεύσεις

Η έκδοση τύπου είναι 'METRIC _ NAME _ vN'. Απαγορεύεται η «αθόρυβη» αλλαγή του ορισμού χωρίς αλλαγή της έκδοσης.

Στρατηγικές μετανάστευσης:
  • Side-by-side: Τα v1 και v2 υπολογίζονται παράλληλα. γίνεται συνδυασμός και κατάρτιση των χρηστών.
  • Cut-over: μετάβαση των καταναλωτών σε v2 στο παράθυρο χαμηλού φορτίου· αρχείο v1.
  • Επανυπολογισμός του ιστορικού: οπισθοπλήρωση σύμφωνα με ιστορικά δεδομένα. πρωτόκολλο διαφορών (έκθεση diff).
  • Ανακοινώσεις: changelog, ημερομηνία εισόδου, ποιος θα επηρεαστεί, οδηγίες.

8) Μοντέλο δεδομένων για τις μετρήσεις

Στοιχεία: σιτηρά (event_id, transaction_id, user_day), χρόνος εκδήλωσης, άθροισμα/τιμές.
Διαστάσεις: χρήστης, συσκευή, γεωγραφία, δίαυλος, προϊόν, ημερολόγιο. Τύπος SCD για την ιστορικότητα.
Κλειδιά: υποκατάστατες ταυτότητες, σταθερά επιχειρηματικά κλειδιά, πίνακες χαρτογράφησης.
Αντίγραφα: κανόνες ταυτότητας (συγχώνευση χρήστη), παράθυρα «κόλλησης» συνεδρίας.

9) Μονάδες, νομίσματα, εποχικότητα

Μονάδες/μορφότυπος: ρητές μονάδες, στρογγυλοποίηση, κλίμακες (log/γραμμική).
Πολλαπλά νομίσματα: μετατροπή με τη συναλλαγματική ισοτιμία κατά την ημερομηνία συναλλαγής. αποθηκεύει τόσο «ακατέργαστη» όσο και κανονικοποιημένη ποσότητα.
Εποχικότητα: YoY και εποχιακοί δείκτες. ξεχωριστά εφέ «διακοπών».

10) Ασφάλεια και πρόσβαση

Ασφάλεια επιπέδου γραμμής (RLS): πρόσβαση σε μετρήσεις ανά χώρα/εμπορικό σήμα/εταίρο.
Στήλη - Ασφάλεια επιπέδου (CLS) -Τροπολογία PII/χρηματοοικονομικά πεδία.
Έλεγχος: ποιος ζήτησε τη μέτρηση, ποια φίλτρα, που εξήγαγε δεδομένα.
Διαφοροποίηση API: «συγκεντρωτικά μεγέθη ανά ρόλο» ή «λεπτομερή φορτία».

11) Παρατηρησιμότητα και SLO

Φρεσκάδα SLO: για παράδειγμα, «λειτουργικός KPI - lag ≤ 15 λεπτά, ημερησίως - έως τις 06:00 τοπική ώρα».
Διαθεσιμότητα SLO: ≥ 99. 9% για API/σημασιολογικό στρώμα.
Καταχωρίσεις: εγκληματικότητα SLO, μετρικά άλματα, NULL/διπλή ανάπτυξη, διακύμανση vs 2> X%.
Runbooks: τι να κάνετε όταν υποβαθμιστεί - βαθμίδες RCA, οπισθοδρόμηση (για παράδειγμα, μετάβαση στην τελευταία έγκυρη «μέτρηση στιγμιότυπου»).

12) Πειράματα και μετρήσεις

Μετρήσεις Guardrail: καθυστέρηση, ανθεκτικότητα, FPR/FNR για βαθμολόγηση.
Ομοιόμορφοι ορισμοί για A/B: μετατροπές, κατακράτηση, NSM - μέσω του ίδιου σημασιολογικού στρώματος.
Ελάχιστο διακριτό αποτέλεσμα (MDE), ανάλυση ισχύος: αποθήκευση παραμέτρων στην κάρτα μέτρησης.
Αιτιώδης απόδοση: πολιτικές ανά ομάδα προσαρμογής και μάρτυρα.

13) Μετρήσεις και κατανάλωση API

: 'GET/metrics/{ name}? από = 2025-09-01 & to = 2025-10-01 & dims = χώρα, πλατφόρμα & φίλτρα = κανάλι: πληρωμένο'.
Πολιτικές: όρια, κρυφή μνήμη, ειδοποίηση, ευφυείς «εξαγωγές».
Εκδόσεις: κεφαλίδα 'X-Metric-Version: v2', προειδοποιήσεις υποτίμησης.

14) Πρότυπα και τεχνουργήματα

Μετρικό διαβατήριο (παράδειγμα)

Κωδικός/έκδοση: 'ARPPU _ v3'

Ορισμός: μέσα έσοδα ανά χρήστη πληρωμής για την περίοδο

«άθροισμα ( )/ ( όπου )»

Κοκκία: ημέρα. rollup: εβδομάδα/μήνας = άθροισμα αριθμητή/παρονομαστή

Πηγές: 'fact _ payments _ v2', 'dim _ users _ scd'

Μονάδες: νόμισμα 'base _ ccy', μετατροπή με συναλλαγματική ισοτιμία

Προεπιλεγμένα φίλτρα: ενεργές αγορές, εξαιρουμένων των δοκιμαστικών συναλλαγών

SLO: φρεσκάδα ≤ 1 ώρα· Διαθεσιμότητα API ≥ 99. 9%

Φρουρά: ARPPU ∈ [0; 10 000]; βινζορίωση p1/p99

Ιδιοκτήτες: Monetization Analytics Ημερομηνία αναθεώρησης: 2025-10-01

Check-list metric release

  • Ορισμός και τύπος που έχει συμφωνηθεί και καλύπτεται από τις δοκιμές
  • Δημιουργήθηκε σημασιολογικό αντικείμενο. Καταγεγραμμένη γενεαλογία
  • Συμπληρώνεται η οπισθοπλήρωση και τα στοιχεία αναφοράς
  • Οι καταχωρίσεις SLO/SLO είναι διαμορφωμένες. έτοιμο εγχειρίδιο
  • Διάρθρωση δικαιωμάτων και RLS. Κρυμμένο PII
  • Παλαιές εκδόσεις που αντικαταστάθηκαν σε ταμπλό/πειράματα
  • Αποστολή Changelog/επικοινωνίας

point-in-time SQL ψευδο-κωδικός (παράδειγμα D30 διατήρησης)

sql
WITH cohort AS (
SELECT user_id, MIN(event_date) AS signup_date
FROM fact_events
WHERE event_type = 'signup'
GROUP BY 1
),
activity AS (
SELECT user_id, event_date
FROM fact_events
WHERE event_type = 'app_open'
),
ret AS (
SELECT c. signup_date,
COUNT(DISTINCT CASE WHEN a. event_date = c. signup_date + INTERVAL '30 day' THEN a. user_id END) AS returned,
COUNT(DISTINCT c. user_id) AS cohort_size
FROM cohort c
LEFT JOIN activity a
ON a. user_id = c. user_id
AND a. event_date BETWEEN c. signup_date AND c. signup_date + INTERVAL '30 day'
GROUP BY 1
)
SELECT signup_date, returned / cohort_size AS retention_d30
FROM ret;

15) Συχνά λάθη και τρόπος αποφυγής τους

Ήσυχη επεξεργασία φόρμουλα: πάντα μέσω έκδοσης και changelog.
«Διαφορετικές σε κάθε φορητό υπολογιστή» μετρήσεις: Δύναμη σε σημασιολογικό στρώμα/API.
Ασυνεπείς χρονικές ζώνες/νομίσματα: συγκεντρωτικός πίνακας ημερολογίου και FX.
Διπλή λογιστική καταγραφή χρήστη: κανόνες ανατροπής και μοναδικά κλειδιά.
Αδιαφανής φρεσκάδα: Εμφανίστε σαφώς το χρόνο καθυστέρησης/ενημέρωσης.
Εξάρτηση από έναν μηχανικό: όλα είναι σαν έναν κώδικα, με μια αναθεώρηση και ένα oncall.

Σύνολο

Η αρχιτεκτονική μετρήσεων είναι το λεξικό + σημασιολογικό στρώμα + ισχυρός υπολογισμός + διακυβέρνηση και SLO. Ακολουθώντας τις αρχές που περιγράφονται (συμβάσεις, δοκιμές, εκδόσεις, παρατηρησιμότητα, ασφάλεια), μετατρέπετε τις μετρήσεις από «διαφορές αριθμού» σε έναν βιώσιμο μηχανισμό διαχείρισης προϊόντων και επιχειρήσεων.

Contact

Επικοινωνήστε μαζί μας

Επικοινωνήστε για οποιαδήποτε βοήθεια ή πληροφορία.Είμαστε πάντα στη διάθεσή σας.

Έναρξη ολοκλήρωσης

Το Email είναι υποχρεωτικό. Telegram ή WhatsApp — προαιρετικά.

Το όνομά σας προαιρετικό
Email προαιρετικό
Θέμα προαιρετικό
Μήνυμα προαιρετικό
Telegram προαιρετικό
@
Αν εισαγάγετε Telegram — θα απαντήσουμε και εκεί.
WhatsApp προαιρετικό
Μορφή: κωδικός χώρας + αριθμός (π.χ. +30XXXXXXXXX).

Πατώντας «Αποστολή» συμφωνείτε με την επεξεργασία δεδομένων.