GH GambleHub

مستودعات البيانات

1) غرض ودور DWH في iGaming

DWH هي الطبقة المركزية لتوحيد البيانات وتقديمها للإبلاغ والتحليلات والامتثال و ML. وينص على ما يلي:
  • التعاريف المترية المشتركة (GGR/NGR، ARPPU، Retention، Churn).
  • تقارير قابلة للتكرار للجهات التنظيمية وأصحاب المصلحة الداخليين.
  • واجهات المتاجر السريعة لألواح BI/التشغيل ومصادر النماذج.
  • مراقبة الجودة والنسب والسلامة على مستوى المنصة.

2) الخيارات المعمارية

2. 1 كلاسيك DWH

ETL → DWH → BI.
الإيجابيات: نماذج يمكن التحكم فيها، تناسق قوي.
السلبيات: التنزيلات باهظة الثمن، والملء المعقد، والمرونة المحدودة.

2. 2 Lakehouse DWH

برونز/فضة/ذهب على طاولات ACID (دلتا/Iceberg/Hudi) + محرك SQL/MPP.
الإيجابيات: تخزين موحد، سفر عبر الزمن، إعادة معالجة بسيطة.
السلبيات: يتطلب انضباط الطبقات و DQ، التنسيق الناضج.

2. 3 هجين

Lakehouse باعتباره «مصدر الحقيقة» (البرونز/الفضة)، DWH-March في MPP (ClickHouse/Pinot/Druid/Cloud DWH) للقراءة عالية السرعة.
الإيجابيات: توازن التكلفة والأداء، واجهات المتاجر المرنة.
السلبيات: الدعم المزدوج للدوائر والتزلج، هناك حاجة إلى التزامن.

توصية: لـ iGaming - Lakehouse + DWH-March (هجين). البرونز/الفضة - توحيد، الماركات الذهبية/الفعلية - تقدم أحمال القراءة.

3) نمذجة البيانات

3. 1 نجمة وثلج

جداول الحقائق: ضيقة مدفوعة بالحدث: «حقيقة _ رهانات»، «حقيقة _ مدفوعات»، «حقيقة _ مدفوعات».
الأبعاد: "dim _ users' (SCD)،" dim _ games "،" dim _ providers'، "dim _ markets'.
ندفة الثلج مناسبة في الفضة (التطبيع)، النجمة - بالذهب (القراءة).

3. 2 Data Vault 2. 0 (التكامل الأساسي)

Hubs (business keys), Links (relations), Satellites (context/history).
تقدم في Silver لتكامل المزود/PSP طويل العمر.

3. 3 SCD I/II/III

SCD II لـ RG/KYC/القنوات وسمات اللعبة (RTP/التقلب).
تنضم الفترات الصارمة «صالحة _ من/صالحة _ إلى»، بشكل صحيح في الوقت المناسب.

4) الحمل: ETL/ELT، CDC والزيادات

نهج ELT: التحميل في تحويل → الفضية في DWH.
CDC: Debezium/log replication from OLTP; ميرزي خفية.
الزيادات: حسب الوقت الماء ('محدث _ على> max_loaded_ts') و/أو هاش دلتا.
الردم/إعادة المعالجة: السفر عبر الزمن، النطاقات، الحصص، المقارنات الجافة.

دمج (مثال):
sql
MERGE INTO silver. payments s
USING stage. payments_delta d
ON s. transaction_id = d. transaction_id
WHEN MATCHED THEN UPDATE SET
WHEN NOT MATCHED THEN INSERT;

5) الطبقة الدلالية والمقاييس

متجر المقاييس/الطبقة الدلالية: صيغ موحدة GGR/NGR/Conversion/LTV.
مقاييس النسخ والحساب «af-of» للتكرار.
الاتفاقيات هي الأسماء المترية والوحدات والعملة (base EUR) و «fx _ source».

6) واجهات المحلات والتقديم

معارض ذهبية: معطلة، SLA جاهزة (على سبيل المثال، حتى 06:00 قفل.) .
المارتس التشغيلي: ClickHouse/Pinot/Druid للوحات من 1 إلى 5 دقائق.
التصدير: CSV/JSON/PDF + hash ؛ الحزم الثابتة (WORM) للمنظمين.

مثال GGR Daily:
sql
CREATE OR REPLACE VIEW gold. ggr_daily AS
SELECT
DATE(b. event_time) AS event_date,
b. market,
g. provider_id,
SUM(b. stake_base) AS stakes_eur,
SUM(p. amount_base) AS payouts_eur,
SUM(b. stake_base) - SUM(p. amount_base) AS ggr_eur
FROM silver. fact_bets b
LEFT JOIN silver. fact_payouts p
ON p. user_pseudo_id = b. user_pseudo_id
AND p. game_id = b. game_id
AND DATE(p. event_time) = DATE(b. event_time)
JOIN dim. games g ON g. game_id = b. game_id
GROUP BY 1,2,3;

7) جودة البيانات (DQ) والعقود

المخطط أولاً: سجل JSON/Avro + اختبارات التوافق (يحركها المستهلك).
DQ- как - код: الاكتمال/الصلاحية/التفرد/FK/النطاق/الزمني.
سياسات رد الفعل: تفشل → الحرجة + DLQ ؛ البطاقة → الرئيسية/الثانوية والإبلاغ.
إمكانية رصد DQ: لوحات تحكم نضرة/اكتمال/صلاحية، قمع السجلات المفقودة.

8) الأمن والخصوصية والإقامة

التقليل من PII: المستخدمون عبر الهوية الزائفة ؛ بشكل منفصل.
RLS/CLS: الوصول إلى خط/سطر/ما بعد الجدول حسب الدور والولاية القضائية.
التشفير: TLS أثناء العبور ؛ في الراحة - KMS/CMK مع التناوب.
إقامة البيانات: أدلة ومفاتيح منفصلة للمنطقة الاقتصادية الأوروبية/المملكة المتحدة/BR ؛ حظر الانضمام عبر الأقاليم دون سبب.
DSAR/RTBF: الإسقاطات القابلة للحساب والتحريرات الانتقائية ؛ عقد قانوني على الإبلاغ عن القطع الأثرية.

9) الأداء والتكلفة (هندسة التكاليف)

التقسيم: حسب التاريخ/السوق/المستأجر ؛ التجميع/الطلب Z حسب «السوق»، «المزود _ المعرف»، «اللعبة _ المعرف»، «المستخدم _ الزائف _ المعرف».
الأشكال: Parquet + الإحصاء والضغط ؛ تحسين/فراغ في الموعد المحدد.
التجسيد: تجميعات ثابتة وجداول موجزة ؛ تجنب انضمام «الدهون» بسرعة.
الحصص/رد التكاليف: ميزانيات الطلبات/الإعادة الثقيلة ؛ التكلفة/الاستفسار، التكلفة/البنزين.
التخزين المتدرج: ساخن/دافئ/بارد ؛ اتجاهات الإنعاش الواضحة.

10) إمكانية الرصد والإدارة

مقاييس خط الأنابيب: المدة، الأحجام، إعادة التدوير، التأخير، تحمل الخطأ.
مقاييس DWH: وقت الاستجابة/القدرة التنافسية/ضربات ذاكرة التخزين المؤقت/القيمة.
النسب: الرسم البياني من المصادر إلى التقارير ؛ وتحليل أثر التغييرات.
SLO: Freshness Silver p95 ≤ 15 мин; الذهب يوميًا - جاهز حتى الساعة 6:00 ؛ صلاحية ≥ 99. 9%; الاكتمال ≥ 99. 5%; ≥ 99. 9%.

11) تعدد الإيجارات وعزلة المجال

التقسيم حسب المخطط/قاعدة البيانات/الكتالوج إلى مستأجر/سوق.
الحصص ومجموعات الموارد ؛ الحد من «الجيران الصاخبين».
سياسات التصدير/الاستيراد بين المستأجرين والعقود الموحدة.

12) سجل البيانات والوثائق

كتالوج البيانات: المالك، SLA، المخطط، الأمثلة، قواعد DQ، النسب.
المقاييس/لوحات القيادة: بطاقات مع صيغ ومسؤولة.
سجل التغيير: نسخ المنطق، الهجرات، التأثير.

13) العمليات و RACI

R (مسؤول): Data Engineering (models Silver/Gold, DAG 'i), Data Platform (infra, registry, DQ).
ألف (مسؤول): رئيس قسم البيانات/المدير التنفيذي.
جيم (استشاري): الامتثال/القانوني/إدارة الشؤون السياسية، المالية (FX/GGR)، المخاطر (RG/AML)، SRE (SLO/стоимость).
I (مطلع): BI، المنتج، التسويق، العمليات.

14) خارطة طريق التنفيذ

أفضل لاعب (4-6 أسابيع):

1. Lakehouse Bronze/Silver (جداول ACID)، CDC/الزيادات للمدفوعات/طريقة اللعب.

2. عروض الذهب الأولى (GGR Daily، تحويل)، SLAs حتى 06:00.

3. DQ-like-code (10-15 rules) + لوحات القيادة Freshness/Compleness.

4. كتالوج البيانات والطبقة الدلالية الأساسية من المقاييس.

المرحلة 2 (6-12 أسبوعاً):
  • SCD II для المستخدمين/الألعاب/مقدمي الخدمات ؛ توسيع النطاق.
  • عبر الإنترنت مارس (ClickHouse/Pinot) للوحات في الوقت الفعلي/شبه الفعلي.
  • تحليل النسب/الأثر، إجراءات DSAR/RTBF، الهيكلة الإقليمية (EEA/UK).
المرحلة 3 (12 + أسبوعًا):
  • المحاكاة التلقائية للتغيرات (التشغيل الجاف) وإعادة التشغيل ومقارنة المقاييس.
  • رد التكاليف/الحصص، لوحات متابعة التكاليف ؛ تمارين DR واسترداد السفر عبر الزمن.
  • التوليد التلقائي لوثائق العرض وبطاقات المقاييس.

15) أمثلة على نماذج SQL

المعدلات الفعلية (الفضة، 3NF):
sql
CREATE TABLE silver. fact_bets (
bet_id STRING PRIMARY KEY,
user_pseudo_id STRING NOT NULL,
game_id STRING NOT NULL,
stake_ccy DECIMAL(18,2) NOT NULL,
currency CHAR(3) NOT NULL,
stake_base DECIMAL(18,2) NOT NULL,
market CHAR(2) NOT NULL,
event_time TIMESTAMP NOT NULL
);
الاتصال بـ SCD II (احصل على حالة RG في وقت الرهان):
sql
SELECT b. bet_id, u. rg_status
FROM silver. fact_bets b
JOIN dim. users_scd u
ON u. user_pseudo_id = b. user_pseudo_id
AND b. event_time >= u. valid_from
AND (u. valid_to IS NULL OR b. event_time < u. valid_to);
التحكم في الاكتمال حسب السوق:
sql
SELECT market, DATE(event_time) d, COUNT() n
FROM silver. fact_bets
GROUP BY market, DATE(event_time)
HAVING n = 0;

16) قائمة مرجعية قبل البيع

  • المخططات والعقود في السجل، اختبارات التوافق خضراء.
  • إجراءات CDC/الزيادات و MERGE خفية.
  • تحتوي معارض الذهب على اتفاقيات SLAs، وصيغ مترية ثابتة.
  • قواعد DQ نشطة (→ الحرجة تفشل + DLQ)، لوحات تحكم النضارة/الاكتمال.
  • RBAC/ABAC، التشفير، الإقامة حسب المنطقة، سجلات الوصول.
  • تمكين النسب/الأثر ؛ تم التحقق من السفر عبر الزمن/النسخ الاحتياطي/DR.
  • التكاليف الخاضعة للسيطرة: الأطراف، والتجميع، والتجسيد، والحصص.

17) الأنماط والمخاطر المضادة

«DWH واحد دهني بدون طبقات»: مزيج من البيانات الخام والمبلغ عنها → الفوضى والإصلاحات باهظة الثمن.
إعادة التحميل الكامل يوميًا بلا داع: استخدام الزيادات/مراكز السيطرة على الأمراض والوقاية منها.
الذهب بدون مالك وصيغ: عدم وجود نسخة واحدة من الحقيقة → الخلافات والتراجع.
PII في طبقات تحليلية: إبقاء الخرائط منفصلة، CLS/RLS.
لا يوجد DQ/النسب: لا يوجد دليل على المنظمين/التدقيق.
التكلفة غير القابلة للإدارة: لا توجد دفعات/تحسينات/حصص.

18) مسرد (موجز)

DWH هو مستودع بيانات للتوحيد والتحليلات.
Lakehouse - بحيرة بيانات + جداول ACID ومحرك SQL.
مركز السيطرة على الأمراض - التقاط التغييرات من OLTP.
SCD - القياسات المتغيرة ببطء (I/II/III).
عرض ذهبي - ورقة/عرض تقرير جاهز للاستهلاك.
الطبقة الدلالية - تعريفات موحدة للمقاييس والسمات.

19) خلاصة القول

DWH الحديث لـ iGaming ليس «طاولة كبيرة»، ولكنه منصة يمكن التحكم فيها: الطبقات البرونزية/الفضية/الذهبية، والعقود الصارمة و DQ، والمقاييس الموحدة والنسب، والخصوصية والإقامة، والأداء والكفاءة. من خلال بناء Lakehouse + DWH-March الهجين، سيكون لديك قرار سريع ويمكن التحقق منه جاهز للتدقيق والنطاق والأسواق الجديدة.

Contact

اتصل بنا

تواصل معنا لأي أسئلة أو دعم.نحن دائمًا جاهزون لمساعدتكم!

Telegram
@Gamble_GC
بدء التكامل

البريد الإلكتروني — إلزامي. تيليغرام أو واتساب — اختياري.

اسمك اختياري
البريد الإلكتروني اختياري
الموضوع اختياري
الرسالة اختياري
Telegram اختياري
@
إذا ذكرت تيليغرام — سنرد عليك هناك أيضًا بالإضافة إلى البريد الإلكتروني.
WhatsApp اختياري
الصيغة: رمز الدولة + الرقم (مثال: +971XXXXXXXXX).

بالنقر على الزر، فإنك توافق على معالجة بياناتك.