Аналітика екосистеми
1) Роль аналітики в мережевій екосистемі
Аналітика екосистеми - це наскрізна здатність збирати, нормалізувати та інтерпретувати сигнали від усіх учасників (оператори, студії/RGS, PSP/APM, KYC/AML, афіліати/медіа, стримери, SRE, безпека), перетворюючи їх на рішення маршрутизація платежів, рекомендації контенту, guardrails RG, ліміти, фіча-прапори, крос-кампанії, планування ємності і DR.
Мета - єдина правда про дані (single source of truth), передбачувані SLO/KPI і швидкий цикл поліпшень.
2) Джерела, події та онтологія
2. 1 Подієва модель (мінімальний домен)
`click`, `session_start/stop`, `bet/spin`, `round_start/result`, `deposit/withdrawal`, `psp_auth`, `kyc_status`, `fraud_signal`, `reward_granted`, `leaderboard_update`, `stream_interaction`.
2. 2 Ідентифікатори та зв'язність
`playerId` (псевдоним), `operatorId`, `providerId`, `contentId`, `campaignId`, `paymentRouteId`, `tableId`, `traceId`.
Всі ID токенізуються, PII зберігається в сейф-зонах.
2. 3 Онтологія та контракти даних
Schema Registry і словники доменів.
Data Contracts: власник, призначення, SLA свіжості/повноти, формули метрик, допустимі значення.
Версіонування: semver для схем і формул.
3) Архітектура аналітики
3. 1 Потоки і сховища
Streaming (≤1–5 с): шина подій → матеріалізовані уявлення (операційні дашборди, SRE, real-time рішення).
Batch (5-15 хв/добові): CDC/ETL → DWH/Lakehouse (фінанси, звіти, комплаєнс).
Hot/Warm/Cold шари, S3-сумісне архівування, вакуум/ретеншн.
3. 2 Шари даних
Raw (незмінно, шифр, lineage).
Staging (очищення/нормалізація).
Semantic (зірки/локшини, хуртовини, метрики).
Feature Store (онлайн/оффлайн ознаки).
Knowledge Graph (граф сутностей/зв'язків для рекомендацій і антифроду).
3. 3 Доступ і безпека
RBAC + ABAC + ReBAC, mTLS/JWS, токенізація, юрисдикційні фільтри, SoD (поділ обов'язків), WORM-аудит.
4) Каталог метрик (каноніка)
4. 1 Продукт і зростання
CR воронки: логін → KYC → депозит → активна гра.
Retention D1/D7/D30, ARPU/ARPPU, LTV (кумулятивний/модельний).
Engagement: сесії/DAU/WAU/MAU, середня тривалість, місії/турніри.
4. 2 Платежі/PSP/APM
Conversion Rate (АРМ × регіон × пристрій), p95 авторизації, чарджбек-ризик, відмовостійкість маршруту, cut-over час.
4. 3 KYC/AML
Pass-rate і SLA етапів, FP/FN, вплив на CR депозиту, черга manual review.
4. 4 Контент/студії
Сесії/залучення/утримання по грі, RTP/волатильність, лайв-SLI (e2e-затримка, packet loss).
4. 5 Інфра/SRE
p95/p99 API, лаг брокера, uptime інтеграцій, headroom, DR-фліпи, бюджет помилок.
4. 6 Фінанси
GGR/Net Revenue, rake/fee, Cost-to-Serve (per rps/txn/stream/event), кредити/пенальті (SLO-пов'язані).
5) Атрибуція та експериментування
5. 1 Атрибуція
Правило: «last eligible touch» з вікнами по юрисдикції, анти-дублі постбеків, cross-device стітчинг за узгодженими токенами.
Перевірки: sanity-тести, узгодження з фінансами/юридикою.
5. 2 Експерименти
A/B/C, стратифікація (юрисдикція, сегменти ризику, пристрій), guardrails (SLO, RG, комплаєнс).
Єдина платформа підрахунку: ефекти, довірчі інтервали, CUPED/CPP для зниження дисперсії.
Feature-flags/Progressive delivery з авто-роллбеком по бюджету помилок.
6) Feature Store и Knowledge Graph
6. 1 Feature Store
Онлайн ознаки (реакція ≤ 20-50 мс): propensity, risk, платіжні рутини, контент-смаки.
Оффлайн ознаки (батч/тренінг).
SLA свіжості/consistency, контроль дрейфу, тести на витоки ПДн.
6. 2 Knowledge Graph
Вузли: гравець, сегмент, гра, провайдер, APM/PSP, регіон, кампанія, ризик-подія.
Ребра: «зіграв», «депозит через APM», «верифікований», «учасник кампанії», «спрацював антифрод-патерн».
Use-cases: рекомендації, look-alike, колюзії, неявні залежності в платежах і маршрутах.
7) Федеративна аналітика, приватність і комплаєнс
Federated Learning (FL): навчання моделей на даних партнерів без передачі ПДн; secure aggregation і диференціальна приватність (DP).
DPA/DPIA: цілі, терміни зберігання, транскордонні потоки.
PII-мінімізація: токенізація, маскування, роздільні сейф-зони.
Аудит: запити та обчислення з WORM-логами і traceId.
8) MLOps і BIOps (аналітика як продукт)
8. 1 MLOps
Картки моделей (мета, дані, метрики, ризики), автоматичний тренінг/деплою, моніторинг drift/latency, Canary/Shadow.
Метрики: AUC/PR, lift, KS, fairness, latency інференса, частота перенавчань.
8. 2 BIOps (панелі/вітрини)
Версіонування формул/віджетів, чейнджлоги, пісочниці та демо-дані, conformance-тести панелей.
SLO панелей: свіжість даних, p95 рендера, доступність, частка кеш-хітів.
9) Економіка аналітики: Cost-to-Serve и ROI
Cost per rps/txn/stream/event, вартість інференсу/1000 запитів, зберігання фіч і stream-агрегацій.
Value Map: внесок моделей/правил в CR депозитів, ARPU/LTV, зниження чарджбеков і інцидентів.
ROI експериментів: uplift, час окупності, вплив на SLO/штрафи/кредити.
Оптимізація: кешування гарячих зрізів, партіонування, прунінг колонок, адаптивні вікна.
10) Спостережуваність даних і якості
Data-SLO: completeness, freshness, uniqueness, consistency.
Schema-violations/Lineage: алерти при роз'їзді схем, візуальний шлях походження.
Reconciliation: звірка агрегатів (фінанси, атрибуція), контроль дублів/втрат.
Trace-кореляція: 'traceId'від події до панелей і дій.
11) Управління змінами та версії
Семантичні версії схем і формул, міграції «add-only», адаптери між версіями.
Change-windows, auto-rollback, «прапорці» сумісності, deprecation-план з паралельними вікнами.
12) Анти-патерни
Багато «істин»: різні формули однієї метрики в різних командах.
Сирі ПДн в BI: відсутність токенізації/маскування.
Події без Schema Registry: роз'їзди вітрин і моделей.
Експерименти без guardrails: зростання інцидентів/штрафів.
Ретраї без ідемпотентності в пайплайнах: дублі/зміщення.
SLO «на папері»: немає алертів/стоп-кнопок.
Відсутність lineage: спірну цифру неможливо довести.
SPOF-шлюз на вході даних, немає N + 1.
13) Чек-листи впровадження
13. 1 Дані та схеми
- Онтологія і словники затверджені.
- Schema Registry + Data Contracts (власник, SLA, версія).
- Токенізація/маскування ПДн, DPIA оформлена.
13. 2 Пайплайни і якість
- Stream + Batch конвеєри, SLAs свіжості/повноти.
- Data-tests (в т.ч. атрибуція/фінанси), reconciliation джоби.
- Алерти на drift/violations/лаг шини.
13. 3 Метрики та панелі
- Каталог метрик з формулами і власниками.
- Версії віджетів, пісочниця, conformance-набір.
- SLO панелей (свіжість, рендер, доступність).
13. 4 Моделі та рішення
- Картки моделей, моніторинг, canary/shadow.
- Feature Store (online/offline), контроль дрейфу.
- Guardrails RG/комплаєнс, стоп-кнопки.
13. 5 Економіка
- Cost-to-Serve карта (per rps/txn/event/stream).
- Value Map і процес ROI-оцінки.
- Co-funding/кредити/пенальті прив'язані до метриків.
14) Дорожня карта зрілості
v1 (Foundation): події/онтологія, Schema Registry, базові панелі і батч-звіти, data-tests.
v2 (Integration): stream-вітрини, каталог метрик, A/B-платформа, Feature Store, scorecards партнерів.
v3 (Automation): предиктивні моделі SRE/платежів/контенту, авто-дозування по SLI, BIOps, авто-аллерти і auto-rollback.
v4 (Networked Intelligence): федеративні моделі (FL/DP), knowledge graph як ядро рекомендацій і антифроду, міжпартнерські вітрини і спільні рішення.
15) Коротке резюме
Аналітика екосистеми - це семантика + потоки + рішення. Стандартизуйте події та формули, забезпечте якісні stream/batch-пайплайни, ведіть каталог метрик, використовуйте Feature Store і граф знань, захищайте приватність (DP/FL), керуйте версіями і SLO. Зв'яжіть все з економікою (Cost-to-Serve і ROI) - і ваша мережа учасників буде вчитися кожен день і приймати рішення швидше ринку.