집계 및 통합 보고서
집계 및보고
집계는 상세 레코드를 필요한 섹션 및 기간에 대한 요약 표시기로 변환하는 것입니다. 통합 - 다양한 소스/법인/제품의 집계를 조정과 함께 단일 보고서 (통화, 회계 정책, 제거) 로 결합합니다. 아래는 상점 창 설계에서 운영보고에 이르기까지 체계적인 접근 방식입니다.
1) 작업 및 유형의 통합
운영/제품: DAU/WAU/MAU, 전환, 국가/채널/플랫폼 별 수익.
재무 (예: 규제): P&L, Cash Flow, Balance Sheet, GGR/Net Gaming Revenue, 세금, 법인 보고서.
위험/준수: 사기 방지, RG 지표, SLA/가용성, 데이터/모델 드리프트.
전략: KPI를 보유, 브랜드 포트폴리오, 지역별로 통합했습니다.
2) 집계 계층의 구조
데이터 계층: '원시' → '준비' → '핵심' (사실/치수) → '마트' (보고서 집계).
시맨틱 계층: 메트릭 정의, 캘린더, 통화, 롤업 규칙.
곡물 및 타임 그레인: '이벤트', 'user _ day', 'txn', 'brand _ country _ day' → 추가 주/월/분기 롤업.
식별: 안정적인 키 (사용자/브랜드/법인), 매핑 테이블).
3) 롤업 및 계층
차원 계층은 게임 → 카테고리 → 공급자, 채널 → 캠페인 → 크리에이티브, 도시 → 지역 → 국가 → 클러스터입니다.
요약 규칙: 첨가제 (합), 반 첨가제 (스냅 샷-기간 동안 평균/마지막), 비 첨가제 (계수/백분율).
중복 제거 - 고유 한 사용자 및 곡물 이벤트; 소스를 병합 할 때 이중 계산을 피하십시오.
4) 다원성, 우주선, 달력
시간: '이벤트 _ time _ utc' 및 로컬 슬라이스를 저장하십시오. 공휴일/근무일 달력.
통화: 거래일 (또는 경고가있는 기간의 평균 환율) 의 환율로 "원시" 금액 + '기본 _ ccy' 를 유지하십시오.
정규화: 명시 적 단위/통화/환율 날짜 표시.
sql
WITH fx AS (
SELECT date, from_ccy, to_ccy, rate
FROM dim_fx_rates
WHERE to_ccy = 'EUR'
),
tx AS (
SELECT t. txn_id, t. amount, t. ccy, t. brand, t. country, t. event_date
FROM fact_tx
)
SELECT brand, country, DATE_TRUNC('month', event_date) AS month,
SUM(amount COALESCE(fx. rate, 1)) AS revenue_eur
FROM tx
LEFT JOIN fx
ON fx. date = tx. event_date AND fx. from_ccy = tx. ccy
GROUP BY 1,2,3;
5) 소스/법인별 통합
계정 매핑 차트: 단일 CoA (차트 차트) + 로컬 요금제에서 매핑.
회계 정책: IFRS/GAAP/세금 규칙 → 변환 계층 (예: 총/순 수익, 보너스/수수료 인식).
그룹 내 이직률 제거: 보유 법인 간의 거래 제외.
통합 방법: 전체, 비례, 지분 방법.
소수 주주: 비 지배 지분 (NCI) 할당.
sql
WITH interco AS (
SELECT a. txn_id
FROM fact_tx a
JOIN dim_counterparty b ON a. counterparty_id = b. id
WHERE a. legal_entity IN (SELECT id FROM dim_legal WHERE group_id = 1)
AND b. legal_entity IN (SELECT id FROM dim_legal WHERE group_id = 1)
)
SELECT
FROM agg_pl_month
WHERE txn_id NOT IN (SELECT txn_id FROM interco);
6) 품질과 화해
소스 조정: 쇼케이스에서 소스 별 금액 = 금액 (환율/시간 허용 오차 포함).
불변량: 'DAU 지정 MAU', 일 = 월 총합 (부가 지표).
완벽한 제어: 양의 공유, 중복의 공유, 신선도의 지연.
불일치 보고서-불일치 및 치료 단계 목록.
7) 성능 및 SLO
신선도 SLO: 작동 장치-지연 15 분; 주간-현지 시간으로 06: 00까지; 매월-최대 T + 1/T + 3.
최적화: 사전 집계, 증분 재 계산, 분할 (날짜/브랜드/국가 별), 인기있는 슬라이스 캐시.
UI 제한: 일정 당 몇 개의 카테고리; 테이블의 페이지 매김; 게으른 짐입니다.
8) 정의 및 버전 관리
메트릭 사전: 코드, 정의, 공식, 소스, 단위, 소유자, 가드 레일.
동의: 'METRIC _ vN'; 모든 편집 → 새 버전 + 백필 및 변경 로그.
시맨틱 레이어: BI/실험/선적을위한 진실의 원천 중 하나.
9) 보안 및 액세스
RLS/CLS: 역할 별 액세스 (국가/브랜드/법인), PII 마스킹.
감사: 누가 어떤 보고서를 업로드했는지; 내보내기 제어 (마감일, 토큰).
최소화: 원시 PII 데이터가 아닌 집계를 발행하십시오.
10) 전형적인 집계 및 시각화
제품: 깔때기 (스텝 바), 코호트 (히트 맵), D7/D30 보존, ARPU/ARPPU, GGR/Net.
금융: 계층 구조 별 P&L, 폭포 (교량) 요인, 지역 별 수익 구조, G&A 역학.
작업/ML: SLA, 대기 시간 p95/p99, PR- AUC/Recall @ FPR
11) 통합 보고서의 여권 (템플릿)
코드/버전: 'CONSOL _ PNL _ v3'
목적: 브랜드 그룹 별 관리 P&L, multicurrency → 기본 통화 EUR
적용 범위: 그룹의 모든 법인; 방법 - 완전한 통합; NCI-하이라이트
소스/레이어: 'mart _ fin _ png _ v3' ('fact _ tx _ v2', 'dom _ legal', 'dom _ fx _ rates' 기반)
세분성: 월 (낮부터 롤업)
제거: '회사 간 = 참' -그룹 내 매출 제외
SLO: T + 1 06:00 잠금; 가용성은 99 이상입니 9%
조정-회계 보고서 'BK _ PNL _ T + 1', 분산 3%
소유자: 재무 분석, 데이터 플랫폼
가드 레일: 24 시간 이하의 FX 테이블; 적용 범위 거래는 99 이상입 5%
12) 빈번한 실수와 피하는 방법
조용한 공식 변경: 항상 버전과 변경 로그를 통해.
이중 계산: 중복 스프링/조인-제어 키 및 그레인.
믹싱 시간 영역: 중앙 일정 및 UTC 스토리지.
잘못된 백분율: "평균의 평균" 이 아닌 분자/분모를 집계하십시오.
"Raw" 요율: 명시적인 FX 날짜/소스, 일관된 반올림 정책.
제거 없음: 회사 간 회전율 왜곡 보고서.
Opaque 신선도: 항상 "N 분 전에 업데이트 됨" 을 표시하십시오.
13) 의사-SQL: 증분 월간 집계
sql
-- Recalculate only affected days/months
WITH changed_days AS (
SELECT DISTINCT DATE(event_time_utc) AS d
FROM fact_tx_delta -- new/modified per day
),
daily AS (
SELECT
DATE(event_time_utc) AS d,
brand, country,
SUM(net_revenue_eur) AS net_eur
FROM fact_tx
WHERE DATE(event_time_utc) IN (SELECT d FROM changed_days)
GROUP BY 1,2,3
)
MERGE INTO agg_month_brand_country m
USING (
SELECT DATE_TRUNC('month', d) AS month, brand, country, SUM(net_eur) AS net_eur
FROM daily
GROUP BY 1,2,3
) s
ON (m. month = s. month AND m. brand = s. brand AND m. country = s. country)
WHEN MATCHED THEN UPDATE SET m. net_eur = s. net_eur, m. updated_at = NOW()
WHEN NOT MATCHED THEN INSERT (month, brand, country, net_eur, updated_at)
VALUES (s. month, s. brand, s. country, s. net_eur, NOW());
14) 프로세스 및 작동
1. 디자인: 목표/청중, 지표, 계층, 통화/가속.
2. 데이터: 소스 계약, 체계, 품질 테스트.
3. 창 구축: 의미 론적 객체, 롤업 규칙, 제거.
4. 조정: 자동 분산 보고서, 수정 티켓.
5. 릴리스: 버전, 문서, 사용자 교육.
6. 모니터링: 신선도, 완전성, 중복, 응답 시간, 사건.
7. 개정: 정의, 매핑, FX 정책의 분기 별 검증.
15) 사전 통합 진술 점검표
- 시맨틱 레이어에 문서화 된 미터법 및 계층 구조 정의
- 통화 변환 및 가로막이 설정됩니다. 코스의 단위와 날짜를 보여줍니다
- 그룹 내 회전/NCI 제거 구현 (해당되는 경우)
- 참조 소스와의 불변량 및 조정은 공차에서 수행됩니다
- 증분 재 계산 및 분할 가능
- 신선도/가용성 SLO가 설정됩니다. 업데이트 상태가 표시됩니다
- RLS/CLS 및 PII 마스킹이 구성됩니다. 수출 감사 활성화
- 버전/변경 및 소유자 지정; 런북 사건
합계
통합 및 통합은 'GROUP Ł' 뿐만 아니라 일관된 정의, 올바른 롤업, 다중 통화 및 일정, 제거 및 조정, 관찰 가능성 및 SLO와 같은 전체 시스템입니다. 설명 된 아키텍처를 따라 이기종 데이터를 제품, 재무 및 위험 관리를위한 신뢰할 수있는 볼트로 전환합니다.