GH GambleHub

データ監査とバージョン管理

1)なぜそれを必要とします

監査とバージョン管理によって再現性が生まれます。任意の図を説明し、計算を繰り返し、モデル/ショーケースを安全に開発できます。iGamingでは、これは金融(GGR/NET)、支払い、KYC/AML、責任あるゲームおよび規制報告にとって重要です。

目的:
  • トレース:データ/スキーマ/ロジックとその理由を変更したユーザー。
  • 再現性:レポートを生成したデータ/コード/モデルのバージョン。
  • リリースセキュリティ:変更のロールバックと予測可能性。
  • コンプライアンス:規制当局および内部監査のための実証可能なログ。

2)コンセプトとバージョンレベル

1.スキーマバージョン-フィールド/タイプ/セマンティック進化(SEMVER)。
2.データセットVersion-Snapshot/slice at a time 「true」 for report/training。
3.データ製品バージョン:数式、フィルタ、集計。
4.MLフィーチャー/モデルバージョン:date/code/hyperparameters/feature/data (end-to-end)。
5.パイプラインバージョン:変換コード、configs、依存関係。
6.データ契約バージョン:生産者/消費者要件(スキーム、SLA、品質)。


3)監査: 何をログに記録するか

対象者:サブジェクト(ユーザー/サービス)、役割/属性(RBAC/ABAC)。
What:テーブル/ショーケース/モデル/スキーム/契約。
時:正確な時間、tz、相関id。
理由:タスク/チケット/リリースノートへのリンク、理由。
より:コード/モデルバージョン、コミットハッシュ、コンテナイメージ。
変更方法:before/after (diff)、 row volume (rows affected)、 integrity control (hash/signature)。
コンテキスト:環境(prod/stage)、ドメイン、データ感度(class)。

監査ログは、append-only/WORM、 signed、およびSIEMで利用可能です。


4)バージョン管理方針(推奨事項)

SEMVER: 'MAJOR。マイナー。PATCH(パッチ)

MAJOR-互換性のないスキーマ/セマンティクスの変更。
MINOR-可逆的に互換性のある追加(nullableの新しいフィールド/列、新しいvNextショーケース)。
PATCH-契約を変更せずに修正(quality-fix、 backfill)。
Deviation-procedure:陳腐化ウィンドウ、/CIディレクトリ内の警告、切断日。
リリースノート:リリースごとに1ページ:何、なぜ、リスク、ロールバック計画。


5)貯蔵および流れの技術

タイムトラベル/スナップショット: テーブルバージョンの保存;「そのまま」クエリを実行する機能T-0.

SCD(ゆっくりと変化する寸法):寸法(ゲーム、プロバイダー、プレーヤー)のタイプ1/2/3。
CDC/CDF (Change Data/Capture&Feed):ファクトの増分変更(レート、支払い、KYC)。
Audit Fact-A別のファクトテーブルで、イベントを編集/追加/削除します。
整合性制御:バッチ/ファイルハッシュ、パッケージ署名、集約和解。


6)回路とデータ契約の進化

コードとしての契約:スキーマ、タイプ、必須フィールド、許可された値、SLAフレッシュネス、DQルール。
互換性:追加→MINORフィールド;migrationとdual-writeでtype/semantics→MAJORを変更しました。
CIゲート:互換性が壊れているか、リリースノートがない場合、PR変更スキームがブロックされます。
ディレクトリ/レジストリ:アクティブ/古いバージョンと所有者を格納します。


7) BIとメトリックのバージョン管理

認定「ゴールド」ショーケース:固定KPIセマンティクス(GGR、 ARPPU、保持)。
デュアルラン:ショーケースの新しいバージョンは、メトリック(公差バンド)の比較、並列(v2)で構築されています。
Commit Reports-各エクスポート/ダッシュボードは'dataset_version'と'definition_version'を参照します。
カレンダーセクション:「dey-kat」、 「month-to-date」-データバージョンで固定されています。


8) ML/MLOpsのバージョン管理

モデルレジストリ:モデル、日付、品質指標、トレーニングデータ(dataset_version)、フィーチャーバージョン(feature_set_version)。
フィーチャーストア:バージョン管理されたフィーチャーグループ;明示的なバージョンのない「ホット」フィールドの禁止。
Repro set: training code(コミット)、environment (Docker/conda lock)、 sid。
Champion-Challenger:販売、品質、公平性、プライバシーに関するレポートの並行バージョン。
ロールバック:前の安定したモデルおよび特徴セットへの速いロールバック。


9)ロールバック、バックフィルおよび修正

ロールバックプラン:各MAJOR/MINORバージョン-明確なリターンステップ。
Backfill Playbook:真実のソース、日付範囲、再計算の順序、チェックサム、ラベル「recomputed=true」。
可視性を編集:v2は比較後にのみv1を置き換えます。すべての「履歴」レポートは、バージョンを参照し続けます。


10)監査における安全性とコンプライアンス

イベント/パッケージ署名:生産者のサイン、消費者の検証。
PII衛生:監査は生のPIIではないトークンを保存します。
法的保留:調査期間中のバージョン/ログの削除はありません。
DSAR:バージョンはトークン別に件名レコードを検索してアップロードします。歴史的なスナップショットが考慮されます。


11)メトリックとSLO

Repro Rateは、データバージョン/コードからターゲットスレッショルド≥再生されたレポートの割合です。

カバレッジ: タイムトラベル/監査ログが有効なテーブルの%

スキーマ互換性パス:CIでの互換性チェックの成功率。
デュアルランデルタ:許容範囲内の分散v1/v2。
ロールバックMTTR:平均バージョンのロールバック時間。
監査整合性-署名され検証されたイベントの割合。
Backfill Success:再計算のパーセンテージが正しく完了しました。


12) iGamingパターン(ケース)

GGRの修正を遡って:サプライヤーはRTPを再計算しました-私たちはその期間の事実のバックフィルを作り、'recomputed_at'を修正し、リリースノートを公開し、v1/v2を比較します。過去数ヶ月のレポートは書き換えませんが「、修正されたバージョンが利用可能です」とマークしてください。
不正防止ルール:MAJOR、デュアルランモデル、ショーケースなどの機能のセマンティクスを変更し、後退時にチャンピオンにロールバックします。
KYC/AML:新しいプロバイダのステータスを追加しました。契約に互換性テストを含める。
RG信号:「一連の損失」の論理を明確にしました-MINOR+リリースノートとインパクトモニタリング。


13)ツールとアーティファクト(カテゴリ)

カタログ/ライン/レジストリ:/回路図/店頭バージョン、所有者、接続、契約を設定します。
Orchestrator&CI/CD:互換性ゲート、デュアルラン、リリースノートのパブリッシング。
タイムトラベルのストレージ:スナップショット/ログのストレージ。
署名とチェックサム:バッチ署名、バッチチェックサム。
モデル/フィーチャーレジストリ:フィーチャー/モデルバージョン、チャンピオンチャレンジャーレポート。


14)テンプレート(使用可能)

14.1リリースノート

バージョン: 'payments_gold v2。1.0`

タイプ: MINOR(新しいフィールド'psp_country'、 'method_group')

理由: PSP/カントリーレポート統一

リスク: ディスプレイケース'risk_signals'への影響'

検証: デュアルラン14日、デルタ≤ 0。2% GGR

ロールバック: 'v2に切り替えます。0.3'オーケストレータフラグ経由

日付/所有者/チケットの展開

14.2キット版パスポート

データセット: 'game_rounds_silver'

バージョン: '2025-11-01T00: 00: 00Z'(スナップショットID)

スキーマ: 'schema@1。7.0'(コントラクト参照)

出典: Provider Feeds A/B(コミット……)

整合性チェックサム署名マニフェスト

DQ: 完全性99。9%、鮮度≤ 15分

用途: 'games_perf_gold v3。x'、'rg_signals v1。[x]

14.3監査報告書の変更

イベント: 更新スキーマ'kyc_status'→'kyc_status、 v2'

ユーザー/サービス、'Data-Engineer'ロール

いつ: '2025-11-01 09:32:10+02'

理由: チケット#3421(新しいプロバイダのステータス)

差分: +'status_reason' (nullable)、 enum extended

チェック: CI semver pass、 MINOR contract

キャプション: 'sig=……'、hash diff: 'sha256='……

14.4バージョン管理ポリシー(フラグメント)

MAJOR:互換性を破る;デュアル書き込み≥ 30日;必須のロールバック計画。
マイナー:可逆的に互換性があります。ディレクトリの警告A/Bストアフロント7-14日。
PATCH:品質修正/再計算;リリースノートが必要です。
アーカイブ:規制のスナップショットをNヶ月≥保存します。監査のためのWORM。


15)プロセス(エンドツーエンド)

1.イニシアチブ:チケット+リネッジのインパクトスコアを変更します。
2.エンジニアリング契約/スキーマアップデート+リリースノート。
3.検証:CI互換性チェック、DQテスト、デュアルラン。
4.展開:フラグ、カナリア;カタログにバージョンを公開します。
5.モニタリング:デルタv 1/v2、 KPI、苦情。
6.Backfill:回帰プレイブック。
7.死後:インシデントが発生した場合、ポリシー/テストを更新します。


16) RACI(例)

政策と基準:CDO (A)、データガバナンス評議会(R/A)、 DPO/Sec (C)。
契約/スキーム:ドメインオーナー(A)、データスチュワード(R)、 プラットフォーム/Eng (C)。
オーケストレーション/ストレージ:プラットフォーム/Eng (R)、 SRE (C)。
BI/メトリクス: Analytics Lead (R)、 Product/Finance (C)。
MLバージョン:MLリード(A)、 DS (R)、プラットフォーム(C)。
監査/ログ:SecOps (R)、内部監査(C)。


17)実装ロードマップ

0-30日(MVP)

重要なテーブル(支払い、game_rounds、 kyc)のタイムトラベル/スナップショットを有効にします。
不変の監査ログとingestionパッケージの署名を実行します。
SEMVERポリシーとリリースノートテンプレートを受け入れます。
カタログ:トップショーケースに'owner'、 'schema_version'、 'dataset_version'を追加します。

30-90日

すべてのMINOR/MAJORのデュアルランを入力します。v1/v2の自動比較。
コントラクトを互換性とDQ CIゲートに関連付けます。
バックフィル/ロールバックの規則;チームを訓練してくれ。
dannyye→fichi→model→inferensリンクのフルセットのモデル/フィーチャーレジストリ。

3〜6ヶ月

完全な監査ログのカバレッジ、WORMストレージ、規制当局のレポート。
diff+lineageからの自動リリースノート。
ダッシュボードのRepro Rate/Schema互換性/Rollback MTTRレポート。
KPIバージョンの四半期ごとのレビューと定義の「凍結」。


18)アンチパターン

新しいバージョン/リリースノートなしでKPIセマンティクスを変更する。
バックフィル計画と「再計算」マークなしで「静かに」再計算します。
監査ログにraw PIIを保存します。
デュアルランとインスタントウィンドウの交換が不足しています。
バージョンとソースを指定せずに「永遠」モデル/ショーケース。


19)関連セクション

データ管理、データ起源とパス、アクセス制御、トークン化、セキュリティと暗号化、モデル監視、倫理とDSAR、連結学習、機密ML。


[結果]

監査とバージョン管理は、データとモデルを信頼できる製品に変換します。それぞれの変更は透明で再現性があり、可逆的です。iGamingにとって、これはKPIへの信頼、コンプライアンスの持続可能性、安全なリリースのスピードの基礎です。

Contact

お問い合わせ

ご質問やサポートが必要な場合はお気軽にご連絡ください。いつでもお手伝いします!

統合を開始

Email は 必須。Telegram または WhatsApp は 任意

お名前 任意
Email 任意
件名 任意
メッセージ 任意
Telegram 任意
@
Telegram を入力いただいた場合、Email に加えてそちらにもご連絡します。
WhatsApp 任意
形式:+国番号と電話番号(例:+81XXXXXXXXX)。

ボタンを押すことで、データ処理に同意したものとみなされます。