データメッシュ:フェデレーションデータモデル
(セクション: 技術とインフラ)
概要
Data Meshは、データがドメインチームの製品として扱われる組織的および技術的モデルであり、プラットフォームの中心的な役割は、セルフサービス、標準、およびコンプライアンスを提供することです。iGamingの場合、決済チームは"Deposit Events"と"Net Deposits Mart"を所有し、リスクチームは"Fraud Signals'を所有し、ゲームは"Bet Events"と"Leaderboards"を所有し、中央プラットフォームはカタログ、契約スキーム、アクセス、品質監視、finops、 ツール/ELT。
1)データメッシュの原則
1.ドメイン責任:各ドメイン(支払い、リスク、ゲーム、KYC/コンプライアンス、 CRM、アフィリエイト)は、そのデータセットとそのライフサイクルを所有しています。
2.製品としてのデータ:各セットには所有者、説明、SLO、アクセスSLA、ドキュメント、バージョン、フィードバック、ロードマップがあります。
3.セルフサービスプラットフォーム:標準パイプラインは、/transform/serve,テンプレート、デフォルトセキュリティ、ディレクトリおよびオブザビリティを取り込みます。
4.フェデレーション管理:スキーム、メトリクス、PII/ローカライズ、品質の共通基準-センター;実装と進化-ドメインで。
2)操作モデルおよび役割
ドメインデータ製品オーナー(DPO):優先順位付け、SLO、データ製品の改善のバックログ。
ドメインデータエンジニア/アナリティクスエンジニア:回路図、パイプライン、DQテスト、バージョン管理。
Domain Steward:フィールドセマンティクス、メトリクス辞書とPII分類への対応。
プラットフォームチーム:カタログ、IAM/RBAC、 Policy-as-Code、テーブルフォーマット(Delta/Iceberg/Hudi)、オーケストレーション、observability、 finops。
Federated Governance Board:標準(スキーム、メトリクス、セキュリティ)を承認し、クロスドメイン紛争を解決します。
3)「データ製品」-パスポートとアーティファクト
最小データ製品構成:- 契約(スキーム、タイプ、進化、互換性)。
- アクセスAPI (SQL/table、 topic/stream、 file/share)。
- SLA/SLO(新鮮さ、可用性、品質)。
- DQテスト(一意性、範囲、参照整合性)。
- ドキュメント(フィールドの説明、リクエストの例、所有者、連絡先)。
- バージョン管理(セマンティックバージョニングスキーム、非推奨ポリシー)。
- ポリシー(PII、ローカリゼーション、保持/TTL、権利)。
パスポートテンプレート(YAML、例)
yaml name: bets. events. v1 domain: games owner: games-data@company interface:
sql: lakehouse. silver. bets_events stream: kafka://bets. events. v1 share: read-only (EU only)
schema_version: 1. 3. 0 slo:
freshness: "<= 5 min (p95)"
availability: ">= 99. 9%"
dq:
- unique: bet_id
- valid_values: currency in [EUR, USD, TRY, BRL]
- non_negative: [stake, payout]
security:
pii: false region: EU retention: 365d lineage:
sources: [game_engine. outbox, payments. psp. webhooks]
consumers: [crm. triggers, risk. realtime, dwh. fact_bets]
versioning:
compat: backward deprecation_policy: "60 days"
4)相互運用性および標準
スキーム/契約:Avro/Protobuf/JSONスキーマ+スキーマレジストリ;バックコンパットポリシー、新しいメジャーバージョンなしで変更を破ることはありません。
セマンティックレイヤー:GGR、 NGR、 Net Deposits、 LTV、 cohortsの統一された定義-コードとして(dbt metrics/semantic layer)。
識別子:グローバル'player_id'、 'tenant_id'、 'bet_id'、 unified country/currency/providerディレクトリ。
メタデータ:必須カラム'ingest_ts'、 'schema_version'、 'trace_id'、 'source'、 'region'。
アクセス:SQL (lakehouse/OLAP)、ストリーム(Kafka/Pulsar)、テーブル/スナップショット共有;交換形式はParquet/Delta/Icebergです。
5)プロセス参照の標準(ベンダーへの不可知性)
Ingest: Outbox/CDC\\OLTP→Kafka→Lakehouse(ブロンズ)。
トランスフォーム:ELT/DBT-シルバー/ゴールド;インクリメンタル'MERGE'、 SCD、マテリアルディスプレイケース。
サーブ:OLAP (ClickHouse/BigQuery/Snowflake)、 RT- движки (Pinot/Druid)は、ほぼリアルタイムです。
Catalog/Lineage:単一のカタログ、自動ドキュメント、依存関係グラフ。
観測性:鮮度/SLO指標、DQ-assert、ストリームラグ、コスト。
ポリシー:IAM/RBAC/ABAC、暗号化、ローカライズ(ゾーンデータルーティング)。
6)データ製品のSLO/SLA
ターゲットSLOの例:- 新鮮さ:ベットイベント(P95) ≤ 5ミリアンペア;詐欺信号≤ 30秒;ネット預金マート≤ 15分。
- 空室状況:≥ 99。読まれたインターフェイスのための9%。
- 品質:重複≤ 0。01%、空の必須フィールドのシェア≤ 0。1%、通貨の一貫性100%。
- コストSLO:ウィンドウスキャンのコスト≤ N$/日、小さなファイル比<10%。
7)安全性、PIIおよびローカリゼーション
分類:PII/機密財務/運用。
技術的な対策:暗号化at-rest/in-transit;PIIトークン化;マスキングコラム;'tenant_id'による行レベルのフィルタ。
ローカライズ:ドメイン製品は認可地域(EU/TR/LATAM)で公開されています。クロスボーダー共有-PIIのないユニットのみ。
監査:誰が公開/読み取り;スキーマバージョンの権利エスカレーション要求-承認を通じて。
8) FinOpsとバリューマネジメント
ドメインごとの予算:制限を計算し、アラートを超過します。
ストレージ:ストレージクラス+TTL(ブロンズショート、シルバーミディアム、ゴールドロング/アグリゲート)。
クエリの最適化:パーティション/クラスタリング、実体化ビュー、BI結果キャッシュ。
小さいファイル:compaction/OPTIMIZEポリシー;ターゲットファイルサイズは128-1024 MBです。
9)ライフサイクルと進化
バージョン管理:'ドメイン。プロダクト。v {major}';マイナーフィールド-バックコンパット。
非推奨:消費者通知、「2レール」期間、古いバージョンへの自動アラート。
スキーマの変更:契約リポジトリへのプルリクエスト;CI互換性テスト;カタログへのAutoPublish。
フィードバック:製品チャネル(issue tracker)、消費者NPS、インシデント応答時間。
10) iGamingの具体化-ドメインと製品マップ
お支払い方法
'支払い。psp。webhooks。v1'(ストリーム)
'mart_net_deposits_daily。v1 '(SQL)-SLOの鮮度≤ 15分;PIIフリー
ゲーム
'ベット。イベント。v1 '(ストリーム/SQL)-p95 ≤ 5分
'mart_ggr_daily。v1 '(SQL/MV)-国/ゲーム別の集計
リスク/不正防止
'リスク。シグナルです。v1'(ストリーム)-p95 ≤ 30秒
「リスク」 。 。v1 '(SQL)-SCD2 Investigation History
CRM/パーソナライゼーション
'crm。トリガーだ。v1'(ストリーム)-セグメントトリガー
'profile。特徴。オンラインで。v1 '(KV/SQL)-オンライン機能(TTL)
KYC/コンプライアンス
'kyc。ステータス。v1 '(SQL)-PIIで保護された行レベルのポリシー
'responsible_gaming。イベント。v1'(ストリーム)-制限/信号
11)プラットフォームプロセスとアーティファクト
ディレクトリ:ドメイン/フィールド/PIIラベル、図のプレビュー、例で検索します。
テンプレートジェネレータ:新製品(パスポート、CI、 DQテスト、SLOダッシュボード)のcookiecutter。
Policy-as-Code:輸出規則、PII、地域間の共有。
観測性:既製ダッシュボード:新鮮さ、DQエラー、コスト、リネージ、ストリームラグ。
Runbooks: 鮮度/DQ/スキームのインシデント、緊急時の非推奨、バージョンのロールバック。
12)データメッシュへの移行(ロードマップ)
1.現在のデータセットのインベントリ→ドメイン別のグループ化。
2.パイロット2-3ドメイン(支払い、ゲーム、リスク)-パスポート付きの製品としての問題。
3.カタログと標準:回路図、メトリック、PII/ローカライズ、 DQ。
4.セルフサーブ:パイプラインテンプレート、CI/CD、 SLO監視。
5.高炉へのモノリシックショーケースの切断;古いインターフェイスのための「2柵」サポート。
6.連邦評議会-定期セッション、契約変更のレビュー。
7.CRM/アフィリエイト/マーケティングに拡張し、パートナーシェア。
13)実装チェックリスト
定義されたドメイン;所有者と通信チャネルが割り当てられます。
ディレクトリが開始されました。各商品のパスポートが発行されます。
スキーマ-コントラクト・リポジトリ内;CIテスト互換性/DQ。
宣言されたSLO/SLA;鮮度/DQ/コストダッシュボードが利用可能です。
PII/ローカリゼーションポリシー-コード;監査が有効になっています。
FinOps:予算、アラート、ドメインレポートによるコスト。
バージョン管理/入金プロセス-文書化および自動化。
インシデントのランブック-利用可能で訓練された(ゲームデー)。
14) Antipatterns
「データメッシュの名前を変更しましたが、すべて中央のデータコマンドを介して」-狭い首は排除されません。
メトリックの単一の辞書の欠如→GGR/NGRはドメインによって異なります。
契約と互換性テストのないスキーム→「breaking」リリース。
セルフサーブ→各テーブルが手動で作成され、データに時間がかかりません。
地域横断共有におけるPII/ローカリゼーションを無視します。
所有者/SLOなしのマイクロプロダクト-「放棄された」データ。
15)データメッシュ成功KPI
Time-to-Data:アイデアから利用可能なデータプロダクトまで(中央値)。
再利用:製品あたりの消費者ドメイン数。
品質:成功したDQチェックのシェア、100万件あたりの欠陥。
信頼性:新鮮さ/可用性のSLO準拠。
コスト:$/request/user、小さなファイルの共有、処理を計算します。
変更率:1週間あたりの回路/店頭リリース。
概要
Data Meshはテクノロジーだけでなく、データが所有者、SLO、契約、品質指標を持つ製品であるマネージドドメインフェデレーションでもあります。iGamingでは、このアプローチは狭いネックを除去し、統合(不正防止、支払い、CRM)を高速化し、メトリクス(GGR/NGR/LTV)の透明性を向上させ、コストを制御します。強力なセルフサービスプラットフォームを構築し、品質、スピード、コンプライアンスを損なうことなく、統合された標準とデータ・アズ・ア・プロダクトの文化、および分析エコシステムの拡張をビジネスとともに実現します。