Veri akışlarından uyarılar
1) Neden ve nerede kullanılır
IGaming'de kritik olaylar gerçek zamanlı olarak gerçekleşir: depozitolar ertelenir, oyun sağlayıcısı düşer, kohortun RG riski artar ve ters ibraz oranı artar. Akış uyarıları, para, UX ve uyumluluk etkilenmeden önce anormallikleri yakalar.
Hedefler:- Veri/ödeme/oyun olaylarının erken tespiti.
- Otomatik reaksiyonlar (rota değişikliği, bozulma, özellik bayrakları).
- Akıllı eşikler ve konsolidasyon yoluyla MTTR'yi azaltın ve yorgunluğu uyarın.
2) Mimari (referans)
Etkinlik Veri Yolu/Günlük: Kafka/Pulsar/Kinesis - orijinal akışlar (ödemeler, oyun turları, ETL lojistiği, RG sinyalleri).
Akış İşleme: Flink/Spark/Faust - pencereler, agregalar, korelasyonlar, CEP (Karmaşık Olay İşleme).
Kurallar ve Modeller: Kurallar Motoru (DSL/YAML), Statopores ve Çevrimiçi Anomali Modelleri.
Alert Router: normalleştirme ve yönlendirme (PagerDuty/Slack/Email/Webhook), kopyaların bastırılması.
Olay Mgmt: biletler, tırmanmalar, runbooks, SOAR playbooks.
Gözlemlenebilirlik ve Depolama: uyarı metrikleri, geçmiş, etiketler, denetim WORM günlüğü.
3) Akış pencereleri ve agregalar
Yuvarlanma (sabit aralıklar: 1, 5, 15 dakika) - istikrarlı iş metrikleri.
Kayar - Erken trend tespiti.
Oturum pencereleri - oyuncu davranışı durumları.
Filigranlar - geç olaylar; Pencereyi sonlandırmadan önce bir gecikmeye izin verin (örneğin, 120s).
Idempotence - benzersiz olay kimliği, veri tekilleştirme, tam olarak bir kez semantik, geç verilerle "yeniden kalibrasyon".
4) Uyarı türleri
1. Eşik: p95 gecikme PSP> 2000 ms, başarı oranı <99. 5%.
2. Trend değişimi (CUSUM/ADWIN): GGR/dak'da keskin değişim, mevduat dönüşümünde anormallikler.
3. Korelasyon/CEP: KYC başarısız - para yatırma - ters ibraz olay dizisi.
4. Kompozit: "düşük tazelik + dönüşüm hatalarının büyümesi".
5. Etik/RG: Segmentte yüksek risk payındaki büyüme> 10 dakikada yüzde X puan.
6. Veri/kalite: şema kayması, tamlıkta keskin düşüş, null spike/duplicates.
7. Gizlilik/güvenlik: Günlüklerde PII, yetkisiz detokenizasyon.
5) Gürültü azaltma (SNR)
Histerezis ve kalıcı rahatsızlık (Y pencerelerinden X), zirvelerde sarsılmamak için.
Dinamik eşikler: taban çizgisi + σ veya sürgülü bir pencerede nicelik.
Uyarıların örneklenmesi: Bir 'etiket' kümesi için T dakika cinsinden N'den fazla değil.
Olayı gruplama: Yüzlerce oyun uyarısı yerine "oyun sağlayıcı hatası" için bir bilet.
Mevsimsellik: Gece/asal ve promosyonlar/turnuvalar için ayrı eşikler.
SLO farkında kurallar: yalnızca ihlal özel SLO'yu etkiliyorsa tetikleyin.
6) Önceliklendirme ve tırmandırma
P1: para/düzenleme engelleme (ödemeler, RG ihlalleri, büyük ölçekli aşağı).
P2: belirgin bozulma (gecikme/hatalar/tazelik), KPI regresyon riski.
P3: Dikkat gerektiren bozulma (DQ, model sürüklenmesi).
Eskalasyon: alan adı sahibi - SRE/DS görev görevlisi - ürün yöneticisi - kriz merkezi.
7) Gizlilik ve uyumluluk
Uyarı yükünde sıfır PII: yalnızca belirteçler/toplamlar/vaka referansları.
RG/AML modları: tek tek kanallar ve erişim listeleri, metin redaksiyonu.
Düzenleyiciler ve post-mortlar için denetim değişmezi (WORM).
Coğrafi/kiracı izolasyonu: marka/ülkeye göre yönlendirme; farklı anahtarlar/konular.
8) SLO ve uyarı kalitesi metrikleri
MTTD (algılama zamanı) и MTTA/MTTR (ack/recover).
Hassas/Hatırlama uyarıları (olay-gerçeği ile).
Yanlış Alarm Oranı ve Bastırma Oranı (kaç ses kesildi).
Kapsam: Uyarılar altındaki kritik yolların %'si (ödemeler, game_rounds, KYC, RG).
Sürüklenme Algılama Gecikmesi: Sürüklenme gerçeğinden uyarıya kadar geçen süre.
On-call Load: uyarı/vardiya ve "gece alarm saatleri".
9) iGaming durumları (kural örnekleri)
Ödemeler/PSP: 'success _ rate _ deposits _ 5m <99. 5 % 'Ve' psp = XYZ 'Ve' ülke içinde [EE, LT, LV] '- P1, SOAR: geçiş rotası, yükseltme retrays.
Oyun sağlayıcıları: 'game _ rounds _ per _ min drop> 40 % vs baseline_28d' on the cluster of games' provider = A '> P1, sağlayıcıya bildir, lobi döşemelerini gizle.
RG: 'High _ risk _ share _ 10m ↑> 3 p.p.' In 'brand = B'> P2, yumuşak sınırları etkinleştir, RG komutunu bildir.
Dolandırıcılık: 'Chargeback _ rate _ 60m> μ + 3 σ' Ve 'new _ device _ share ↑' - P1, anti-dolandırıcılık sertleşmesini sağlar.
Данные/DQ: 'tazelik _ ödemeler _ altın> 15m' И 'ingest _ errors> 0. P2, raporları dondur, durum başlığını etkinleştir.
10) Kural Şablonları (DSL/YAML)
10. 1 Eşik + histerezis
yaml rule_id: psp_success_drop severity: P1 source: stream:payments. metrics_1m when:
metric: success_rate filter: {psp: ["XYZ"], country: ["EE","LT","LV"]}
window: {type: sliding, size: PT5M, slide: PT1M}
threshold:
op: lt value: 0. 995 sustain: {breaches_required: 3, within: PT5M}
actions:
- route: pagerduty:payments
- runbook: url://runbooks/payments_psp_drop
- soars: [{name: "switch_route", params: {psp_backup: "XYZ2"}}]
privacy: {pii_in_payload: false}
10. 2 Anomali vs taban çizgisi
yaml rule_id: provider_volume_anomaly severity: P1 source: stream:games. rounds_1m baseline: {type: rolling_quantile, period: P28D, quantile: 0. 1}
anomaly:
op: lt_ratio value: 0. 6 # drop below 60% of baseline labels: {provider: "$ provider"}
suppress: {per: provider, max: 1, within: PT10M}
actions:
- route: slack:#games-ops
- feature_flag: {hide_provider_tiles: true}
10. 3 CEP ile kompozit
yaml rule_id: kyc_deposit_chargeback severity: P2 pattern:
- event: kyc_result where: {status: "fail"}
- within: PT24H
- event: payment where: {type: "deposit"}
- within: PT14D
- event: chargeback actions:
- route: antifraud_queue
- create_case: {type: "investigation", ttl: P30D}
11) Entegrasyonlar ve otomatik reaksiyonlar
SOAR: PSP/endpoint switching, retray increase, feature flag activation, geçici API degradasyonu.
Özellik Bayrakları: Sorunlu oyunları/widget'ları devre dışı bırakma, RG için "zihinsel korkuluk".
Durum Sayfası: dahili/ortak paneller için otomatik afişler.
Biletleme: Alanların sahibi, etki alanı, runbook, doldurulması. "trace_id"
12) Operasyonlar ve Süreçler
RACI: kural sahipleri - alan adı ekipleri; Platform - motor, SLO, ölçek.
Sürüm oluşturma: Git'teki kurallar, 'MAJOR/MINOR/PATCH', kanarya modu.
Testler: Akış simülasyonları, tekrarları, bilinen olaylarda geriye dönük kontroller.
Post-mortemler: her P1/P2 - dersler, eşiklerin/histerezisin güncellenmesi, CEP kısıtlamalarının eklenmesi.
13) Uygulama Yol Haritası
0-30 gün (MVP)
1. Kritik yolları örtün: ödemeler, game_rounds, tazeliği yutun.
2. Kurallar, Git depolama ve sahip dizini için DSL/YAML girin.
3. Histereziyi ve çift bastırmayı etkinleştirin; Slack/PagerDuty kanalları.
4. 3 runbook oluşturun: "ödemeler", "oyunlar", "DQ/tazelik".
5. Metrikler: MTTD/MTTR, Manuel işaretleme ile Hassas/Hatırlama.
30-90 gün
1. Temel anormal dedektörler (temel/nicelikler), CEP şablonları.
2. SOAR otomasyonu (PSP anahtarlama, özellik bayrakları, durum sayfaları).
3. SLO'ya duyarlı kurallar ve olay gruplaması.
4. Kural "regresyon" testleri için hikaye tekrarları.
5. Düzenleme ve erişim kısıtlamaları olan RG/AML kanalları.
3-6 ay
1. Anomali kuralları ve modelleri için Champion-Challenger.
2. Efekt kataloğu (aslında MTTR/kaybı azaltan uyarılar).
3. AIOps eşik ipuçları ve histerezis otomatik ayarlama.
4. İmzalı webhooklarla harici entegrasyonlar (oyun sağlayıcıları/PSP'ler).
5. Üç aylık hijyen oturumları: "Ölü" kuralların kaldırılması, yinelenen kuralların birleştirilmesi.
14) Başarı metrikleri (örnek)
MTTD/MTTR: Olay türüne göre medyan ve p90.
Alert Precision/Recall - Hedef eşiklerini ≥.
Noise↓: − X %4xx/false P3; "Geceleri alarm" ≤ Y/hafta.
Kapsam: Etkin kurallara sahip kritik yolların %95'ini ≥.
SOAR etkisi: manuel müdahaleden önce zaman tasarrufu.
İş etkisi: tutulan mevduat/ödemeler, kayıp turların azaltılması.
15) Anti-desenler
Taban çizgisi ve histerezisi olmayan gözle eşik.
SLO/iş riskine bağlı olmayan uyarılar.
Uyarı organlarında PII, ortak kanallarda veri içeren ekran görüntüleri.
Bastırma/gruplama eksikliği - bildirimlerin fırtınası.
Tekrar yok - kurallar her zirvede kırılıyor.
İnceleme ve sahibi olmadan "ebedi" kurallar.
16) İlgili bölümler
DataOps Uygulamaları, Analitik ve Metrik API'leri, Denetim ve Sürüm Oluşturma, Erişim Kontrolü, Güvenlik ve Şifreleme, Depolama Politikaları, MLOps: Model Sömürü, Sorumlu Oyun, Anti-dolandırıcılık/Ödemeler.
Toplam
Akış uyarıları, veri işleyen bir sinir sistemidir: Zaman içinde sorunların akışını durdurmak için olayları, bağlamı ve otomatik eylemleri birleştirirler. Doğru mimari, eşik hijyeni ve gizliliğe saygı ile uyarılar MTTR'yi azaltır, geliri korur ve oyuncuların ve düzenleyicilerin güvenini korur.