Dolandırıcılık tespiti
Dolandırıcılık Tespiti
Antifraud sadece bir "risk modeli" değildir. "Bu devre: standartlaştırılmış olaylar - özellikler ve grafikler - kurallar/modeller - karar ve eylem - açıklama ve itirazlar - etki ölçümü ve sürüklenme kontrolü. Aşağıda ödeme ve oyun platformları, pazar yerleri ve fintech hizmetleri için geçerli bir sistem talimatı bulunmaktadır.
1) Tehdit haritası (koruduğumuz şey)
Ödeme planları: çalıntı kartlar, kart testi, ters ibrazlar, dostça dolandırıcılık.
Hesap riskleri: hack/interception, çoklu hesap, bonus kötüye kullanımı, cihaz çiftlikleri.
KYC/AML: sahte belgeler, mankenler, nakit çıkışı, yaptırımlar/PEP riskleri.
Davranışsal: botlar, komut dosyaları, anormal oran/işlem kalıpları.
Bağlı kuruluş: Trafik/yönlendirme sahtekarlığı, düşük kaliteli mevduatların uyarılması.
2) Sinyaller ve hammaddeler
Cihaz/ağ: cihaz parmak izi, kanvas/wag, emülatörler, IP/ASN/proxy/VPN, geovelositi.
Ödeme: BIN/MCC/kart ülkesi, 3DS/ECI, AVS/CVV sonuçları, hız (kart/hesap/cihaz ile), limit sapmaları.
Davranış: formların hızı, fare/dokunma yörüngeleri, bekleme süresi, eylem sırası.
Sosyal/grafik: Telefonların/e-postaların/haritaların/adreslerin/cihazların çakışması, "kötü" düğümlerle ortak özellikler.
CUS/Belgeler: OCR kalitesi/selfie eşleşmesi/canlılık (canlılık), tarih/kaynak, kara listeler/yaptırımlar.
3) Özellik deposu (zaman içinde nokta)
Zaman pencereleri: Hız özelliği için 5m/1h/24h/7d; Expon. yumuşatma.
Kimliğe göre birimler: user_id, telefon, e-posta, harita, cihaz, IP/ASN.
Coğrafi/Zaman: Ülke/Bölge/Saat Dilimi/Yerel Tatil Profilleri
Özellik grafiği: derece/üçgen sayısı/PageRank, kötü olanlarla bağlantıların oranı, bileşen.
KYC kalitesi: güven OCR, isimlerin/adreslerin düzenleme mesafesi, IBAN/TIN doğrulaması.
Anti-yüzler: kesinlikle zaman içinde nokta, gelecek işaretleri yok; Çevrimiçi/çevrimdışı parite.
4) İşaretleme ve hedef değişkenler
Hedefler: Ters ibraz = 1, confirmed_fraud=1, bonus_abuse=1.
Ertelenmiş gerçeğin pencereleri: etiketler T'den sonra gelir (ters ibrazlar), öğrenirken dönemin "frizini" kullanın.
Dağılım: güçlü dengesizlik (0. 1-1 % "birimler") - dikkatlice tartma/örnekleme.
Vekil etiketler: manuel onaylar ve itirazlar - emin olun.
5) Modeller ve yaklaşımlar
Kurallar (policy-as-code): beyaz listeler/kara listeler, hız eşikleri, coğrafi boşluklar, uyumsuz nitelikler. Hızlı, anlaşılabilir, arıza güvenliği için temel.
Denetim: gradyan artırma/orman, lojistik regresyon, maliyete duyarlı kayıplı tablo NN'leri.
Anomaliler: İzolasyon Ormanı, LOF, sağlam z-skoru/mevsimsel-dekomp, otoenkoderler.
Grafik yaklaşımları: bağlantı tahmini, GNN/DeepWalk gömmeleri, genel aygıt/harita kuralları.
Melezler: kaskad (kurallar - ML - grafik), FP/FN için farklı para cezaları ile topluluklar.
Kalibrasyon: Olasılıklar için Platt/İzotonik; hataların maliyetinden kaynaklanan eşikler.
6) Kalite metrikleri (nadir sınıflara odaklanma)
PR-AUC birincil olarak; ROC-AUC, dengesizlikte ikincildir.
% Recall@FPR≤x, Precision @ k, Maliyete duyarlı yardımcı program.
Üretim puanlaması için Kapsama ve Gecikme p95.
Adalet/Zararlar: Ülkeye/Cihaza/Ödeme Yöntemi Segmentine Göre Hatalar.
7) Eşik politikası ve histerezis
Çözüm bölgelerini ayırın:- 'score ≥ τ_block' - autoblock;
- 'τ _ review ≤ puanı <τ_block'> manuel inceleme;
- 'skor <τ_review'> atlama.
"Yanıp sönmeyi" önlemek için histerezis (giriş/çıkış eşiği farklıdır) ve soğuma (minimum yeniden deneme aralıkları) ekleyin.
Karar tablosu örneği
8) Çevrimiçi devre: puanlama ve orkestrasyon
Akış: Otobüs ile Olaylar; Online özellik mağazasından özellikler; 'event _ id' aracılığıyla idempotency.
Gecikme: hedef p95 (örneğin, istek başına ≤ 100-300 ms).
Orkestratör: garantili teslimat, retrai/backoff, DLQ, kanallar arasında hız sınırı.
Eylem kanalları: 3DS/step-up, hold/limit, block, request for documents, case manager bileti, kullanıcıya bildirim.
Denetim: Uçtan uca 'correlation _ id' "sinyali, resteniye, deystviye, iskhod".
9) Döngüdeki insan ve vaka yönetimi
Vakalar: Toplu olaylar/kanıtlar, bir açıklama gösterin (üst özellikler/kurallar, grafik-komşular).
İzinler: Ek ACC/kapatma için otomatik blok/kısmi limit/istek.
Eğitim: Analistlerin düzenlemeleri verilere geri dönüyor (yeniden etiketleme), sınırda varlık-lening.
SLA: P1/P2 öncelik, yanıt süreleri, kuyruklar, yük paylaşımı.
10) Uygulamada grafik analizi
: "Kullanıcı cihaz kartı telefon e-posta IP".
Desenler: Kart testinin "yıldızları", bonus kötüye kullanımının "bileşenleri", genel proxy'ler/VPN'ler.
Puanlama düğümleri/kenarları: ağırlıklı PageRank, kötü komşuların oranına göre şüphecilik.
Önleyici: "Enfekte" bileşene dahil edilmişlerse yeni düğümleri karantinaya alın.
11) KYC/AML/yaptırımlar ve uyum
Maç: yaptırımlar listeleri/POP/adres medya; Bulanık arama, isim normalleştirme/transliterasyon.
Belgeler: canlılık/anti-spoofing, MRZ/görsel işaretler kontrolü, coğrafi tutarlılık.
İşlemsel izleme: miktarlar/eşikler/transfer zincirleri ile ilgili kurallar, senaryolar sıfırlandı.
Yönetişim: RLS/CLS, PII maskeleme, karar günlüğü, açıklanabilirlik ve temyiz yolu.
12) Etki tahmini (sadece "doğruluk'değil)
Çözüm ekonomisi:[
EV =\text {Önceki. Hasar} -\text {Yanlış blokların maliyeti} -\text {İşlem maliyetleri}
]
Politikalar/testler: Eşikler ve kurallar için A/B/yarı-deneyler (DiD); Bir adım adım yöntemi seçmek için haydutlar.
Korkuluklar: şikayetler/itirazlar, NPS, "yanlış kilitler" (FPR) oranı, gecikme.
13) İzleme, sürüklenme ve SLO
Kalite: PR-AUC/Kayar pencere aracılığıyla @ FPR'yi geri çağırma; olasılık kalibrasyonu.
Sürüklenme: Temel özelliklere göre PSI/KL, "bilinmeyen" BIN/ASN'nin paylaşımı, yeni cihaz kümeleri.
İşlemler: p95 gecikme, zaman aşımı payı, manuel yükselmelerin %'si, backlog incelemesi.
SLO: kullanılabilirlik> 99. %9, Karar - Eylem p95 ≤ 2-5 c; Veri kalitesinin düşmesi durumunda "stopcock".
Runibooks: Kart testlerinde artış, 3DS'de düşüş, kesinti sağlayıcısı, günlüklerin fırtınası.
14) Veri ve kod mimarisi
Olaylar: kanonik şema (UTC, sürüm, kaynak), idempotent anahtarlar.
Feature Store: online/offline parity, point-in-time uçuşlar, sürüm dönüşümleri.
Modeller: versiyonların kaydı, tekrarlanabilir boru hatları, üretimde sertifikasyon, gölge başlatma.
Rules-as-Code: git deposu, inceleme/kontrol listeleri, regresyon testleri.
Açıklanabilirlik: SHAP/kural ağırlıkları günlüğü, destek eğitimi için vaka örnekleri.
15) Güvenlik, gizlilik, etik
PII minimizasyonu: tokenization/hashing of identifiers; Ayrı "güvenli" mağazalar.
Erişim: RLS/CLS ve denetim okumaları/yüklemeleri; İhracat - belirteçler ve son tarihler ile.
Adalet: Bölgeye/yönteme göre test hatası farklılaştırması, geçersiz nitelikleri ortadan kaldırın.
Şeffaflık: Kararların nedenleri ve kullanıcıya anlaşılır itiraz.
16) Sözde-SQL ve tarifler
Idempotent İşlem Günlüğü
sql
MERGE INTO fact_payments t
USING staging_payments s
ON t. txn_id = s. txn_id
WHEN MATCHED AND s. updated_at > t. updated_at THEN
UPDATE SET status=s. status, amount=s. amount, updated_at=s. updated_at
WHEN NOT MATCHED THEN
INSERT (txn_id,user_id,card_hash,amount,currency,event_time,created_at)
VALUES (s. txn_id,s. user_id,s. card_hash,s. amount,s. currency,s. event_time,NOW());
Hız özellikleri (24 saat pencere)
sql
SELECT user_id,
COUNT() AS tx_24h,
SUM(amount) AS sum_24h,
COUNT(DISTINCT card_hash) AS uniq_cards_24h,
COUNT(DISTINCT device_hash) AS uniq_devices_24h,
MIN(event_time) AS first_tx_24h,
MAX(event_time) AS last_tx_24h
FROM fact_payments
WHERE event_time >= NOW() - INTERVAL '24 hour'
GROUP BY user_id;
17) Dolandırıcılıkla mücadele başlatma kontrol listesi
- Sinyaller ve devre standardize, idempotency etkin
- Zamanında, çevrimiçi/çevrimdışı eşlik ile Özellik Mağazası
- Etiketler yüzsüz olarak oluşturulur, ertelenmiş gerçek pencereleri dikkate alınır
- Histerezis ve step-up ile eşik politikası, SLA ve korkuluklar set
- Vaka yönetimi ve döngüdeki insan kuruldu, açıklanabilirlik mevcut
- Metrikler: PR-AUC, Geri Çağırma @ FPR, Maliyet yardımcı programı; Adalet-teşhis
- Sürüklenme/Hata İzleme, Uyarılar, Olay Runibooks
- Yönetişim: model/kural sürümleri, incelemeler, çözüm denetimleri, KYC/AML uyumluluğu
- Eşikler/politikalar için A/B/DiD planı; Kurallarda güvenli geri dönüş
Toplam
Güçlü anti-dolandırıcılık, kontrollü bir döngüde kuralların, modellerin ve grafiklerin bir melezidir: yüksek kaliteli sinyaller ve özellikler - histerezis ile eşik politikası - hızlı çevrimiçi puanlama ve eylemlerin düzenlenmesi - döngüde insan ve şeffaf itirazlar - etki metrikleri ve sürüklenme kontrolü. Bu şemayı izleyerek, kayıpları azaltır, yanlış kilitlerden kaynaklanan zararları sınırlar ve kullanıcıların ve düzenleyicilerin güvenini korursunuz.