GH GambleHub

هماهنگ سازی داده های تحلیلی

1) چرا اکوسیستم نیاز به هماهنگ سازی تجزیه و تحلیل دارد

این شبکه اپراتورها، استودیوها/RGS، ارائه دهندگان PSP/APM، KYC/AML و رسانه ها را گرد هم می آورد. برای دیدن یک تصویر واحد (قیف CR → FTD → ARPU/LTV، RG/انطباق، SLO حمل و نقل، امور مالی/RevShare)، اکوسیستم نیاز به هماهنگ سازی داده های متعارف، به موقع و قابل اثبات بین زنجیره ها و فروشگاه ها - بدون «دو حقیقت»، با سابقه صریح تغییر و کنترل هزینه.


2) هستی شناسی و قراردادهای داده

Сущности: 'eventId', 'traceId', 'participantId', 'role' (اپراتور/استودیو/وابسته/psp/kyc/stream), 'صلاحیت', 'brandId', 'campaignId', 'apmRouteId', 'gameId', 'tableId', 'currency', 'schemaVersion', 'فرمول ".

رویدادهای متعارف (حداقل):
  • 'click', 'session _ start', 'registration', 'kyc _ status', 'deposit', 'ftd', 'bet/spin', 'reward _ granted', 'withdrawal', 'postback _ sent/received', 'rg _ guardrail _ hit', 'stream _ sli'.
قراردادهای داده:
  • طرحوارهها در رجیستری طرحواره (semver، سازگاری فیلد)
  • صاحبان، پنجره های جمع آوری، SLA های تازه و کامل ؛
  • خط مشی خطا (nullable/stubs)، دایرکتوری ها (ارزها، مناطق، پروفایل های RTP).

فروشگاه متریک: نسخه فرمول (GGR/NetRev/CR/ARPU/LTV، K-عوامل)، صاحبان آنها و تاریخ ورود - فرمول همیشه در گزارش لگد.


3) معانی زمانی و پنجره ها

Event Time vs Processing Time (زمان رویداد در مقابل زمان پردازش): Aggregations باید بر اساس زمان رویداد باشد، نه زمان پردازش.
علامت های سفید: برای نظارت بر رویدادهای «اواخر» ؛ سیاست پذیرش (به عنوان مثال، T + 24h).
ویندوز: کشویی/تقویم، با محاسبه مجدد در طول اضافه بار.
تاخیر به عنوان متریک: 'ingest _ lag' و 'publish _ lag' برای هر ویترین منتشر می شود.


4) حالت حمل و نقل و هماهنگ سازی

1. CDC/جریان (زمان واقعی):

اتوبوس رویداد (EDA)، مشارکت توسط 'traceId/participantId' ؛

«دقیقا یک بار در معنی» از طریق idemotency مصرف کننده و هش بدن ؛

موضوعات سرپرستی: رویدادهای خام، نرمال، aggregates/oracles.

2. دسته/میکروبچ:

آپلود افزایشی با صفحه بندی مکان نما (موقت/نشانگر ورود به سیستم);

فرمت ها: پارکت/آورو با طرح ؛ بیانیه های حزب

3. API/وب سایت ها:

'/vN/events 'با نشانگرها و' Idempotency-Key '؛

وب سایت امضا شده (JWS/HMAC)، رجیستری پخش، عقب نشینی + jitter.

4. دارایی نزول:

دایرکتوری ها/مکان ها/کاتالوگ بازی ها به عنوان بسته های نسخه ای (هش، TTL).


5) idempotence، dedup و رویدادهای اواخر

Idempotency-کلید و هش بدن در مسیرهای بحرانی (پرداخت/postbacks).
Deduplication: پنجره ± 5 دقیقه/علامت ؛ ذخیره سازی هش های «دیده شده».

رویدادهای اواخر: سیاست upsert/backcount ؛ فروشگاه های changelog

دقیقا یک بار در مفهوم کسب و کار: ما نیازی به «سحر و جادو کارگزار» نداریم، ما نیاز به idemotence مصرف کننده و جبرگرایی طرح ها داریم.


6) اصلاح اسناد و فرمول ها

Attribution: آخرین قانون لمس اختیاری با پنجره ها توسط کانال ها/حوزه های قضایی، دستگاه متقابل - فقط از طریق نشانه ها (بدون PD خام).
فرمول متریک: هر ورودی مرجع 'formulaVersion' ؛ تغییرات عمده به صورت «data _ formula _ change» events منتشر می شوند.
Backfill با توجه به قوانین: هنگام تغییر فرمول، انتشار دو (قدیمی/جدید) در دوره انتقال (دوره یخ زده) مجاز است.


7) کیفیت داده ها: SLI/SLO و تست انطباق

SLI کیفیت داده:
  • تازگی (publish_lag p95)،
  • کامل بودن (نسبت وقایع در مقابل مرجع)،
  • منحصر به فرد (نسبت تکراری)،
  • ثبات (ارز/محلی/شناسه)،
  • دقت (چک سام/اوراکل)،
  • خطی بودن زمان (رویدادهای دیرهنگام در راهرو).
SLO (نشانه ها):
  • publish_lag p95 ≤ 1-5 ثانیه (پانل های عملیاتی)، ≤ 15 دقیقه (باله. واحدها) ؛
  • کامل ≥ 99 5٪ در T + 15 دقیقه، ≥ 99. 9٪ در T + 24 ساعت ؛
  • ≤ تکراری 0 1‰; اختلاف اوراکل ≤ 0. 1–0. 3%.

تست انطباق: طرح ها، زمینه های اجباری، دایرکتوری ها، امضاهای وب، آپلود مکان نما بدون شکاف.


8) خط، حسابرسی و اوراکل

Lineage: از نمای فروشگاه/داشبورد به مجموعه های اولیه (طرح/نسخه/صاحبان).
حسابرسی WORM: تغییر ناپذیر طرح/فرمول/کلید/استثنا سیاهههای مربوط.
Oracles (summaries signed): GGR/NetRev/SLO/RG با «formulaVersion»، «هش (ورودی)»، «بچه»، «traceId» - منبع حقیقت برای فاکتورها و تجدید نظر.
بسته های ردیابی آزمایشی: SLA 60-90 s برای حوادث P1/P2.


9) حفظ حریم خصوصی، محلی سازی و امنیت

PII-minimization: نشانه گذاری «playerId»، ممنوعیت اطلاعات شخصی در سیاهههای مربوط/ویترین، detokenization تنها در مناطق امن.
محلی سازی: نقشه های حوزه های قضایی (جایی که کلاس های داده را ذخیره/پردازش می کنیم).
اعتماد صفر: mTLS، نشانه های کوتاه مدت، لیست خروج مجاز، چرخش کلید/JWKS.
ABAC/ReBAC/SoD: دسترسی «دیدن آنها و موافقت» ؛ «اندازه گیری ≠ نفوذ ≠ تغییر».


10) آشتی مالی و حل و فصل

درآمد خالص کانن (ساده شده):
[
NetRev = GGR - BonusCost - برنده تمام پولها/PoolShare - پرداخت هزینه - بازپرداخت - مالیات/مالیات - FraudLoss
]
آشتی کردن:
  • آپلود مکان نما، «ors» (aggregates امضا شده)، checksums ؛
  • وضعیت صورتحساب، اعمال اختلاف و تجزیه SLA ها ؛
  • قوانین FX، NET7/14/30، نگه می دارد و klau-backs.

11) مدیریت هزینه هماهنگ سازی

سیاست های کاردینالیتی: ممنوعیت «شناسه کاربر »/URL خام در برچسب ها ؛ 'routeId/campaignId' allowed.
Downsampling/رول یو پی اس: 1с→1м→5м ؛ داده های RAW کوتاه عمر می کنند، دانه ها طولانی تر می شوند.
نمونه برداری تطبیقی از آثار: درصد پایه + اولویت برای خطاها/مسیرهای آهسته/نسخه های جدید.
SLO اول: جمع آوری تنها آنچه پشتیبانی از راه حل (SLO/امور مالی/RG).


12) داشبورد هماهنگ سازی

بررسی اجمالی همگام سازی داده ها: publish_lag، کامل بودن، تکراری، نسبت دیرکرد، رانش طرح، خطاهای سازگاری.
سلامت اسناد: به موقع بودن پس زمینه، پنجره های dedup، موارد بحث برانگیز.
امور مالی/اوراکل: اختلاف بین aggregates و اوراکل، وضعیت فاکتور.
نقشه صلاحیت: محل/PD جریان، انطباق DPA/DPIA.


13) عملیات، حوادث، RCA

هشدارها: میزان سوختگی در طراوت/کامل بودن، رانش طرح ها، افزایش موارد تکراری.

اتاق جنگ: کتاب های آماده برای لاستیک/webhooks/CDC/storefronts ؛ دکمه های توقف برای جمع آوری/فرمول

RCA «بدون جستجو گناه»: faktgipotezaexperimentvyvoddeystviye; SLO پس از مرگ


14) ضد الگوهای

«دو حقیقت» توسط معیارها/فرمول ها و تاریخ های الحاق.
صفحه بندی افست تاریخ تحت بار (فقط نشانگر).
اطلاعات شخصی خام در سیاهههای مربوط/ویترین ؛ بدون نشانه گذاری.
باغ وحش Postback بدون امضا و idemotency → دو برابر/سوراخ.
مخلوط کردن رویداد/پردازش زمان در تجمع.
بدون علامت و بدون سیاست رویدادهای اواخر.
آشتی دستی (اکسل/آپلود دستی) به جای اوراکل.
جداول بزرگ تنها با کاردینالیتی نامحدود از برچسب.


15) چک لیست

طراحی سایت

  • هستی شناسی، ثبت طرح، صاحبان، کتاب های مرجع.
  • فروشگاه متریک с 'formulaVersion' и دوره یخ زده для MAJOR.
  • معناشناسی زمان (زمان رویداد، علامت)، سیاست رویداد اواخر.
  • حمل و نقل: EDA/CDC، API/امضا webhooks، نشانگر، idempotency.
  • SLI/SLO کیفیت داده، تست انطباق، هشدار.
  • حریم خصوصی/محلی سازی (DPIA/DPA)، اعتماد صفر، ABAC/ReBAC/SoD.
  • قوانین و مقررات.

شروع به کار

  • Sandbox و Load/Chaos-Bus اجرا می شود/نمایش موارد.
  • هماهنگ سازی قناری 1٪ → 5٪ → 25٪ → 50٪ → 100٪ با گاردریل.
  • داشبورد publish_lag/completeness/duplicates/drift.
  • مستند سازی فرمول ها و تاریخ های موثر ؛ یادداشتهای انتشار 'data _ formula _ change'.

عملیات اجرایی

  • گزارش هفتگی DQ ؛ SLO/guardrails تجدید نظر.
  • تغییرات ماهانه طرح ها/فرمول ها/دسترسی ها.
  • DR/xaoc به طور منظم برای کارگزار/ingestors/storefronts.

16) نقشه راه بلوغ

v1 (بنیاد): طرح های یکپارچه، CDC/batch اساسی، نمایشگرها، DQ-SLI، آشتی دستی.
v2 (ادغام): علامت های سفید و سیاست رویداد اواخر، اوراکل، داشبورد هماهنگ سازی، retrays خودکار با jitter.
v3 (اتوماسیون): نظارت بر طراوت/کامل بودن پیش بینی، آشتی هوشمند، نمایه سازی خودکار، نمونه برداری تطبیقی.
v4 (حاکمیت شبکه ای): تبادل بین زنجیره ای اوراکل/سیگنال های کیفیت، قوانین DAO فرمول ها و خزانه های شفاف.


17) معیارهای موفقیت

کیفیت داده ها: publish_lag p95، کامل بودن٪، ‰ تکراری، اواخر٪، نرخ رانش طرح.
یکنواختی: نسبت گزارش ها با یک فرمول ثابت، تعداد MAJEهای بدون حادثه.
امور مالی: اختلاف با اوراکل، سهم آشتی خودکار، اختلاف <X٪.
عملیات: MTTD/MTTR حوادث هماهنگ سازی، سهم خودکار توقف/برگشت.
انطباق: 0 نشت PD، بررسی موفقیت آمیز DPIA/DPA، 100٪ در دسترس بودن گزارش های WORM.
اقتصاد مشاهده پذیری: هزینه برای همگام سازی در هر rps/رویداد، انطباق کاردینالیتی.


خلاصه ای کوتاه

هماهنگ سازی داده های تحلیلی کپی کردن جداول نیست، بلکه یک پروتکل اعتماد و زمان است: کانون طرح ها و فرمول ها، زمان رویداد با علامت ها، نشانگر ها و idempotency، رویدادهای dedup و اواخر، DQ-SLO و oracles، حریم خصوصی و محلی سازی. با پیروی از این چارچوب، اکوسیستم تجزیه و تحلیل یکپارچه، تازه و قابل اثبات را دریافت می کند - پایه ای برای راه حل های سریع، محاسبات صادقانه و رشد شبکه مقیاس پذیر.

Contact

با ما در تماس باشید

برای هرگونه سؤال یا نیاز به پشتیبانی با ما ارتباط بگیرید.ما همیشه آماده کمک هستیم!

شروع یکپارچه‌سازی

ایمیل — اجباری است. تلگرام یا واتساپ — اختیاری.

نام شما اختیاری
ایمیل اختیاری
موضوع اختیاری
پیام اختیاری
Telegram اختیاری
@
اگر تلگرام را وارد کنید — علاوه بر ایمیل، در تلگرام هم پاسخ می‌دهیم.
WhatsApp اختیاری
فرمت: کد کشور و شماره (برای مثال، +98XXXXXXXXXX).

با فشردن این دکمه، با پردازش داده‌های خود موافقت می‌کنید.