GH GambleHub

Нақты уақыттағы талдау

1) Мақсаты және бизнес-құндылығы

Нақты уақыттағы талдау (RTA) реакцияларды сағат сайын емес, секундпен қамтамасыз етеді:
  • AML/Антифрод: депозиттерді құрылымдау, velocity-шабуылдар, тәуекел-транзакциялар.
  • Responsible Gaming (RG): лимиттерден асып кету, тәуекел үлгілері, өзін-өзі жою.
  • SRE/Операциялар: SLA деградацияларын, қате жарылыстарын, кластерлердің қызып кетуін ерте анықтау.
  • Өнім және маркетинг: дербестендіру триггерлері, миссиялар/квесттер, real-time сегментациясы.
  • Операциялық есептілік: near-real-time GGR/NGR, залдардың/провайдерлердің дашбордтары.

Нысаналы бағдарлар: p95 end-to-end 0. 5–5 с, completeness ≥ 99. 5%, қол жетімділік ≥ 99. 9%.

2) Эталондық сәулет

1. Ingest/Edge — `/events/batch` (HTTP/2/3), gRPC, OTel Collector; схемаларды валидациялау, анти-дубли, гео-маршруттау.
2. Оқиғалар шинасы - Kafka/Redpanda ('user _ id/tenant/market', DLQ, ретеншн 3-7 күн бойынша партиялануы).
3. Stream-өңдеу - Flink/Spark Structured Streaming/Beam: stateful-операторлар, CEP, watermarks, allowed lateness, дедуп.
4. Online-байыту - Redis/Scylla/ClickHouse lookups (RG-лимиттер, KYC, BIN → MCC, IP → Geo/ASN), таймауттар мен fallback бар асинхронды қоңыраулар.
5. Сервинг - ClickHouse/Pinot/Druid (жедел сөрелер 1-5 минут), Feature Store (онлайн белгілері), webhooks/тикетинг/SOAR.
6. Lakehouse - ұзақ мерзімді біріктіру, реплея және салыстыру үшін Bronze/Silver/Gold.
7. Байқалуы - пайплайндардың метрикасы, трейсинг (OTel), логи, lineage және cost-дашбордтар.

3) Сигналдар мен таксономия

Төлемдер: 'payment. deposit/withdraw/chargeback`.
Ойын: 'game. bet/payout ', сессиялар.
Аутентификация және мінез-құлық: 'auth. login/failure`, device-switch, velocity.
Операциялық бөлмелер: latency, error-rate, тұғырларды қайта қосу, saturation.
Комплаенс: санкциялық скрининг, RG-жалаулар, DSAR-оқиғалар.

Әрбір түрі иесі (domain owner), сұлбасы, SLO жаңалық және late data саясаты бар.

4) Терезелер, watermarks және late data

Терезелер: tumbling (фикс.) , hopping (жабу), session (белсенділігі бойынша).
Watermark: «уақыт бойынша білім» шегі (әдетте 2-5 мин).
Кешігу оқиғалары: түзетулердің қосымша эмиссиялары, қатты кешігу кезінде 'late = true', DLQ жалаушасы.

Flink SQL мысалы (10-минут velocity депозиттер):
sql
SELECT user_id,
TUMBLE_START(event_time, INTERVAL '10' MINUTE) AS win_start,
COUNT() AS deposits_10m,
SUM(amount_base) AS sum_10m
FROM stream. payments
GROUP BY user_id, TUMBLE(event_time, INTERVAL '10' MINUTE);

5) CEP және stateful-агрегациялар

Кілт: 'user _ id', 'device _ id', 'payment. account_id`.
Жай-күйі: жылжымалы есептегіштер/сомалар, дедуп үшін bloom-сүзгілер, TTL.
CEP-паттерндер: structuring (<табалдырық, ≥ N рет, T терезесі үшін), device-switch, RG-fatigue.

CEP жалған құжаты:
python if cnt_deposits(last=10MIN) >= 3 and sum_deposits(last=10MIN) > THRESH and all(d. amount < REPORTING_THRESHOLD):
emit_alert("AML_STRUCTURING", user_id, snapshot())

6) Exactly-Once, тәртіп және іспеттілік

At-least-once шинада жеткізу + дедуп бойынша 'event _ id' өңдеуде (TTL 24-72 сағ).
Тәртiп: кiлттер бойынша партияландыру (жергiлiктi тәртiп кепiлдендiрiлген).
Sink: транзакциялық коммиттер (2-phase) немесе idempotent upsert/merge.
Outbox/Inbox: OLTP домендік оқиғаларын транзакциялық жариялау.

7) Online-байыту және Feature Store

Lookup: RG-лимиттері, KYC-мәртебелері, BIN → MCC, IP → Geo/ASN, нарықтар/салықтар, оқиға сәтіндегі FX.
Асинхронды шақырулар: санкциялық/РЕР АРI таймауттары бар; қате болса - 'unknown' + ретрай/кэш.
Feature Store: online/offline келісу; бір кодтық трансформация базасы.

8) Real-time витриналар және сервинг

ClickHouse/Pinot/Druid: секундтық/минуттық агрегаттар, materialized views, SLA кідірісі 1-5 минут.
API/GraphQL: дашбордтар/виджеттер үшін төменгі жасырындылық.
Алерталар: байытылған контекспен/Jira/SOAR (trace_id, last events).

Мысал ClickHouse (минутына GGR):
sql
CREATE MATERIALIZED VIEW mv_ggr_1m
ENGINE = AggregatingMergeTree()
PARTITION BY toDate(event_time)
ORDER BY (toStartOfMinute(event_time), market, provider_id) AS
SELECT toStartOfMinute(event_time) AS ts_min,
market,
provider_id,
sumState(stake_base) AS s_stake,
sumState(payout_base) AS s_payout
FROM stream. game_events
GROUP BY ts_min, market, provider_id;

9) Метриктер, SLI/SLO және дашбордтар

Ұсынылатын SLI/SLO:
  • p95 ingest → alert ≤ 2 с (сыни ережелер), ≤ 5 с (басқалар).
  • Completeness терезесі T ≥ 99. 5%; Schema validity ≥ 99. 9%; Trace coverage ≥ 98%.
  • Стрим-сервистің қолжетімділігі ≥ 99. 9%; late-ratio ≤ 1%.
Дашбордтар (минимум):
  • Партиялар/топиктер бойынша лаг; операторлардың busy time; күйінің өлшемі.
  • «оқиға → ереже → кейс», домендер бойынша precision/recall.
  • Жылу картасы late/completeness; «ыстық» кілттердің картасы.

10) DQ ағыны (сапа)

Ingest-валидация: schema/enums/size-limits, анти-дубли.
Ағында: completeness/dup-rate/late-ratio, терезелердің дұрыстығы (екі еселеусіз).
Реакция саясаты: critical → DLQ + pager; major/minor → тегтеу + есеп.

YAML мысалы:
yaml stream: payments rules:
- name: schema_valid type: schema severity: critical
- name: currency_whitelist type: in_set column: currency set: [EUR,USD,GBP,TRY,BRL]
- name: dedup_window type: unique keys: [event_id]
window_minutes: 1440

11) Жекешелiк, қауiпсiздiк және резиденттiк

PII-минимизация: ID бүркемелеу, сезімтал өрістерді бүркемелеу, PAN/IBAN токенизациясы.
Data residency: өңірлік конвейерлер (EEA/UK/BR), жекелеген KMS-кілттер.
DSAR/RTBF: downstream сөрелерінде селективті редакциялау; Кейстер/есептер үшін Legal Hold.
Аудит: рұқсаттардың/ережелерді өзгертудің өзгермейтін логтары, релиздерді журналдау.

12) Экономика және өнімділік

Шардинг/кілттер: «ыстық» кілттерден (salting/composite), партия теңгерімінен аулақ болыңыз.
Күйі: TTL, compact snapshots, тюнинг RocksDB/state backend.
Шулы тақырыптар үшін бастапқы кезеңде reduce.
Sampling: тек критикалық емес метриктер үшін (транзакция/комплаенс емес).
Chargeback: тақырыптарға арналған бюджеттер/джобтар, репликаларға арналған квоталар және ауыр сұрау салулар.

13) Процестер және RACI

R: Streaming Platform (инфра/релиздер), Domain Analytics (ережелер/фичтер), MLOps (скоринг/Feature Store).
А: Head of Data/Risk/Compliance домендері бойынша.
C: DPO/Legal (PII/retention), SRE (SLO/инциденттер), Сәулет.
I: Өнім, Қолдау, Маркетинг, Қаржы.

14) Енгізу жол картасы

MVP (2-4 апта):

1. Kafka/Redpanda + 2 сыни топика (мысалы, 'payments', 'auth').

2. Flink-джоба watermark, дедуп және 1 CEP-ережесімен (AML немесе RG).

3. Жедел витрина ClickHouse/Pinot (1-5 мин), дашбордтар lag/completeness.

4. Инцидент-арна (вебхактар/Jira), базалық SLO және алерталар.

2-фаза (4-8 апта):
  • Online-байыту (Redis/Scylla), Feature Store, асинхронды lookups.
  • Ережелерді код, canary/A-B, DQ ағыны ретінде басқару.
  • Конвейерлерді аймақтандыру, DSAR/RTBF процедуралары, кейстер үшін Legal Hold.
3-фаза (8-12 апта):
  • active-active көп аймағы, «replay & what-if» симуляторы, табалдырықтарды автоматты калибрлеу.
  • Gold-stream витриналары (GGR/RG/AML), near-real-time есептілігі.
  • Cost-дашбордтар, chargeback, DR-жаттығулар.

15) Мысалдар (фрагменттер)

Flink CEP — device-switch:
sql
MATCH_RECOGNIZE (
PARTITION BY user_id
ORDER BY event_time
MEASURES
FIRST(A. device_id) AS d1,
LAST(B. device_id) AS d2,
COUNT()      AS cnt
PATTERN (A B+)
DEFINE
B AS B.device_id <> PREV(device_id) AND B.ip_asn <> PREV(ip_asn)
) MR
Kafka Streams - демпотенттік сүзгі:
java if (seenStore. putIfAbsent(eventId, now()) == null) {
context. forward(event);
}

16) Азық-түлік алдындағы чек-парағы

  • Registry-дегі схемалар/келісімшарттар, back-compat тестілері жасыл.
  • watermark/allowed lateness, дедуп және DLQ қосылған.
  • SLO және алерталар (lag/late/dup/state size) теңшелген.
  • Кэштермен және таймауттармен байыту; fallback «unknown».
  • RBAC/dual-control ережелеріне/модельдеріне; өзгерістер журналы қосылған.
  • Ережелер/витриналар құжаттамасы; runbook 'және реплика/қайтару.

17) Жиі қателер және оларды болдырмау

Ignor event-time: watermarks метрикасыз «жүзеді».
Дедуп жоқ: жалған алерт, қосарлы есеп.
Ыстық кілттер: партия қисаюы → salting/resharding.
Ыстық жолдағы синхронды сыртқы API: тек async + кэш.
Басқарылмайтын құн: алдын ала тіркеу, TTL жай-күйі, квоталар, cost-мониторинг.
Симулятордың жоқтығы: «replay» → регрессиясыз шығулар.

18) Қорытынды

Нақты уақыттағы талдау - бұл «жылдам BI» емес, келісімшарттар, stateful-логика, CEP, watermarks, online-байыту және қатаң SLO-мен басқарылатын контур. Осы практикаларға сүйене отырып, платформа бақыланатын құн кезінде комплаенс, азық-түлік сценарийлерін және операциялық орнықтылықты ұстап, секундтар шегінде нақты сигналдар мен шешімдер алады.

Contact

Бізбен байланысыңыз

Кез келген сұрақ немесе қолдау қажет болса, бізге жазыңыз.Біз әрдайым көмектесуге дайынбыз!

Telegram
@Gamble_GC
Интеграцияны бастау

Email — міндетті. Telegram немесе WhatsApp — қосымша.

Сіздің атыңыз міндетті емес
Email міндетті емес
Тақырып міндетті емес
Хабарлама міндетті емес
Telegram міндетті емес
@
Егер Telegram-ды көрсетсеңіз — Email-ге қоса, сол жерге де жауап береміз.
WhatsApp міндетті емес
Пішім: +ел коды және номер (мысалы, +7XXXXXXXXXX).

Батырманы басу арқылы деректерді өңдеуге келісім бересіз.