iGamingでの機械学習
1)ビジネスケースと価値
製品/収益:LTV予測、チャーン(アウトフロー)、入金/購入の提案、ダイナミックミッション/クエスト、次のベストアクション/オファー。
マーケティング/CRM:似ている、セグメンテーション、リアルタイムトリガー、ボーナス最適化(ABO-乱用耐性ボーナス最適化)。
リスク/コンプライアンス:不正防止/AML(速度、構造化、グラフ特性)、責任あるゲーム(RG)-リスク率、介入トリガー。
オペレーション/SRE:インシデント予測、容量/トラフィック予測、プロバイダ異常。
財務:GGR/NGR予測、Fx感度、カウンターパーティ操作検出。
効果ガイドライン:パーソナライゼーションによる純収益への+3-7%、詐欺損失への− 20-40%、解約への− 10-25%、オンライン時のSLA応答RG <5 s。
2)フィーチャーエンジニアリング
ソース:ゲームプレイ、支払い/PSP、認証、デバイス/ASN/地理、 RG/KYC/KYB、マーケティングUTM、プロバイダログ、サポート/テキスト。
基本的な機能:- 行動ウィンドウ:Nレート/預金と10 min/hour/day、 recency/frequency/monetaryあたりの金額。
- シーケンス:ゲームのチェーン、最後のアクティビティとの時間、セッション特性。
- 地理/デバイス:国/市場、ASN、デバイス/ブラウザの種類。
- グラフ:player-card-device-IP接続、コンポーネント/セントラリティ(詐欺リング)。
- コンテキスト:曜日/曜日/祝日、プロバイダ/ジャンル/ゲームのボラティリティの時間。
- RG/AML:制限、自己除外、スクリーニングフラグ、PEP/制裁(キャッシュ/非同期)。
- 通貨と時間(UTC+マーケットロケール)を正規化します。
- 寸法の履歴(SCD II)。
- オンライン/オフライン変換(単一のFeatureストアコード)に同意します。
3)アーキテクチャ: オフライン↔オンライン
3.1オフラインループ
レイクハウス: ブロンズ→シルバー(正規化/濃縮)→ゴールド(データセット)
Feature Store(オフライン):数式レジスタ、ポイント・イン・タイム・ジョイン、トレーニングセットの具現化。
トレーニング:固定依存性を持つコンテナ。追跡実験(メトリック/アーティファクト/データ)。
検証:k-fold/temporal split、 backtest、 off-policy評価。
3.2オンライン回路
Ingest→Stream Processing: Flink/Spark/Beam with windows/watermarks、 idempotency。
Feature Store(オンライン):低特許キャッシュ(Redis/Scylla)+オフラインキャスト。
サービング:REST/gRPCエンドポイント、スコアグラフ、ABルーティング、カナリアリリース。
リアルタイムストアフロント:パネル/ルールのClickHouse/Pinot。
4)モデルとアプローチ
分類/スコアリング:チャーン/デポジット/詐欺/RG (LogReg、 XGBoost/LightGBM、 TabNet、 CatBoost)。
Ranking/Recommendations: factorization/list-ranking (LambdaMART)、 seq2rec (RNN/Transformers)、 contextual bandits。
異常:Isolation Forest、ワンクラスSVM、 AutoEncoder、 Prophet/TSfresh for time series。
グラフ:詐欺リングのNode2Vec/GraphSAGE/GNN。
因果関係:アップリフトモデル、T-learner/X-learner、 DoWhy/CausalML。
NLP/ASR:チケット/チャット、苦情の分類、感情、トピック。
5)品質指標
分類:ROC-AUC/PR-AUC、運用しきい値のF1、予想コスト(重み付けFP/FN)、リスクスコアリングのKS。
推奨事項:NDCG@K、 MAP@K、カバレッジ/多様性、CTR/CVRオンライン。
TS/Forecast: MAPE/SMAPE、 WAPE、 P50/P90エラー、PIカバレッジ。
RG/AML: SLAでの精度/リコール、平均時間間隔。
エコノミー:純収入のアップリフト、詐欺の保存、ROIキャンペーン、%ボーナスの乱用。
6)評価と実験
オフライン:時間の割れ目、週/市場/テナントによってバックテスト。
オンライン:A/B/n、 CUPED/diff-in-diff、シーケンシャルテスト。
オフポリシー:パーソナライゼーションポリシーのIPS/DR。
Stat。 power:分散とMDEを考慮したサンプルサイズの計算。
python cost_fp = 5. 0 # false alarm cost_fn = 50. 0 # missed fraud threshold = pick_by_expected_cost (scores, labels, cost_fp, cost_fn)
7)プライバシー、倫理、コンプライアンス
PII最小化:エイリアス、マッピング分離、CLS/RLS。
居住:EEA/UK/BRの輪郭を分けて下さい;基礎なしで十字地域の結合なしで。
DSAR/RTBF:機能とログの削除/編集;ケース/報告のための法的保持。
公平性/バイアス:機能の監査、異なる影響、プロキシ変数の制御。
説明:SHAP/機能の重要性、モデルカード(所有者、日付、データ、メトリクス、リスク)。
セキュリティ:KMS/CMK、ログ外の秘密、リリースのWORMアーカイブ。
8) MLOps: ライフサイクル
1.データと機能:スキーム/コントラクト、DQルール(完全性/一意性/範囲/時間)、系統。
2.トレーニング:コンテナ、オートチューニング、トラッキング実験。
3.検証:回路互換性テスト、バイアス/公平性、パフォーマンステスト。
4.リリース(CI/CD/CT):カナリア/フェーズドロールアウト、フィーチャーフラグ、「ダークローンチ」。
5.サービング:オートスケーリング、キャッシュ、gRPC/REST、タイムアウト/リトレイ。
6.モニタリング:データ/予測ドリフト(PSI/KL)、レイテンシp95、エラーレート、カバレッジ、「サイレントメトリクス」。
7.再トレーニング:メトリクスのドリフト/劣化のスケジュール/トリガ。
8.インシデント:runbook、モデルのロールバック、フォールバック(ルール/シンプルモデル)。
9) Feature Store(整合性カーネル)
オフライン:ポイントインタイム計算、アンチリーク、数式バージョン機能。
オンライン:低遅延(≤ 10-30ミリ秒)、TTL、オフラインとの整合性。
契約:名前/説明、所有者、SLA、数式、オンライン/オフラインのコンプライアンステスト。
yaml name: deposits_sum_10m owner: ml-risk slo: {latency_ms_p95: 20, availability: 0. 999}
offline:
source: silver. payments transform: "SUM(amount_base) OVER 10m BY user_pseudo_id"
online:
compute: "streaming_window: 10m"
tests:
- compare_online_offline_max_abs_diff: 0. 5
10)オンライン得点とルール
ハイブリッドML+ルール:モデル→速度+説明;ルール-ハードガード/倫理/法律。
ステッチ:CEPパターン(構造化/速度/デバイススイッチ)+MLスコアリング。
SLA:パーソナライゼーションのためのp95エンドツーエンド50-150ms、 RG/AMLアラートの≤ 2-5s。
python features = feature_store. fetch(user_id)
score = model. predict(features)
if score > T_RG:
trigger_intervention(user_id, reason="RG_HIGH_RISK", score=score)
elif score > T_BONUS:
send_personal_offer(user_id, offer=choose_offer(score, seg))
11)訓練データ: サンプルおよびラベル
イベントウィンドウ:t0-リファレンス、t0+Δ-ラベル(デポジット/ブラック/詐欺)。
リークコントロール:ポイント・イン・タイムの参加、将来のイベントの除外。
バランスをとること:層別化/クラス重量、まれなクラスのための焦点損失。
倫理:敏感な属性/プロキシ、コントロールの影響を除外します。
12)経済と生産性
コスト機能:コスト/機能とコスト/要求をカウントし、重いオンライン接続を避けます。
現金:RAMのホット機能、冷たい-怠惰。
マテリアライゼーション:オフライン集計;オンラインでのみ重要です。
クォータ:リプレイの制限、タイムウィンドウのバックテスト;チームによるチャージバック。
13) SQL/擬似コードの例
チャーン(沈黙の30日)のためのポイント・イン・タイムのサンプル:sql
WITH base AS (
SELECT user_pseudo_id, MIN(event_time) AS first_seen
FROM silver. fact_bets
GROUP BY user_pseudo_id
),
agg AS (
SELECT user_pseudo_id,
DATE(t. event_time) AS asof,
SUM(amount_base) FILTER (WHERE type='deposit' AND event_time >= t. event_time - INTERVAL '30' DAY AND event_time < t. event_time) AS dep_30d,
COUNT() FILTER (WHERE type='bet' AND event_time >= t. event_time - INTERVAL '7' DAY) AS bets_7d
FROM silver. fact_events t
GROUP BY user_pseudo_id, DATE(t. event_time)
)
SELECT a. user_pseudo_id, a. asof, a. dep_30d, a. bets_7d,
CASE WHEN NOT EXISTS (
SELECT 1 FROM silver. fact_events e
WHERE e. user_pseudo_id=a. user_pseudo_id AND e. event_time > a. asof AND e. event_time <= a. asof + INTERVAL '30' DAY
) THEN 1 ELSE 0 END AS label_churn_30d
FROM agg a;
オンライン預金ウィンドウ(Flink SQL、 10分):
sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);
14)実装ロードマップ
MVP (4-6週):1.シグナルのカタログとFeature Store v1(支払い/ゲームプレイのための5-10機能)。
2.基本的なチャーン/デポジットモデル(XGBoost)+トラフィックの10-20%のA/B。
3.キャッシュ(p95 <150ミリ秒)とカナリアリリースでオンラインサーフィン。
4.ドリフト/品質モニタリング、モデルカード、ロールバックランブック。
フェーズ2(6-12週間):- RG/AMLスコアリング、グラフ機能、リアルタイムトリガー。
- ボーナス、コンテキストバンディット、オフポリシー評価のためのアップリフトモデル。
- ドリフト/カレンダー、ドキュメントオートメーションによる自動再トレーニング。
- ゲームのカタログ(seq2rec)のパーソナライズ、多目的最適化(収入/責任)。
- マルチリージョナルサーフィン、SLA/クォータ、機能/推論のチャージバック。
- 公平性監査とストレステスト、DRドリルとWORMリリースリポジトリ。
15) RACI
R(責任ある):MLOps(プラットフォーム/サービング)、データサイエンス(モデル/実験)、Data Eng(特徴/パイプライン)。
A(説明責任):データ/CDOの責任者。
C(コンサルティング):コンプライアンス/DPO (PII/RG/AML/DSAR)、セキュリティ(KMS/シークレット)、 SRE (SLO/value)、ファイナンス(effect/ROI)、 Legal。
I (Informed):製品/マーケティング/オペレーション/サポート。
16)売り上げ前のチェックリスト
- オンライン/オフラインで合意された機能、通過したトランジットテスト。
- モデルカード(所有者、データ、指標、リスク、公平性)が記入されています。
- カナリアリリース/fichflag;SLAおよびレイテンシ/エラー/ドリフトアラート。
- PII/DSAR/RTBF/法的保持ポリシーが施行されました。ログは非人格的です。
- Incident/rollback runbook;フォールバック・ストラテジー。
- 実験は形式化されている(仮説、メトリック、期間、MDE)。
- 推論および特徴の費用は予算に含まれています;クォータと制限が含まれています。
17)アンチパターン
オンライン/オフライン機能の不一致→アクセス不能。
キャッシュとタイムアウトのない「ホットパス」内の同期外部API。
不透明なメトリック式/モデルカードなし。
モニタリングとオーバートレーニングなしで再訓練/ドリフト。
CLS/RLS/minimizationのない分析および訓練のPII。
ドメイン分解なしの「すべてのビッグモデル」
18)ボトムライン
iGamingのMLは「魔法」モデルのセットではなく、規律です。一貫したデータと機能、再現可能なオフライントレーニング、信頼性の高いオンラインサーフィン、厳格なMLOps、透明な指標と倫理/コンプライアンス。このガイドに従うことで、収益と保持を一貫して増加させ、リスクを削減し、規制要件(規模、迅速、予測可能)に準拠するシステムを構築します。