Խարդախության բացահայտում
Խարդախության հայտնաբերումը
Հակաֆրոդը միայն ռիսկի մոդել չէ։ Սա բացատրում է, որ ստանդարտացված իրադարձությունները ցույց են տալիս կանոնների/մոդելի նշանները և գրաֆիկները որոշումն ու գործողությունը բացատրվում են էֆեկտի չափման և դրեյֆի վերահսկման միջոցով։ Ներքևում համակարգային հրահանգն է, կիրառելով ստացիոնար և խաղային պլատֆորմներին, մարքեթլեյսներին և ֆինանսական ծառայություններին։
1) Սպառնալիքների քարտեզը (որ մենք պաշտպանում ենք)
Հիբրիդային սխեմաները 'գողացված քարտեզներ, քարտերի փորձարկումներ, աղյուսակներ, friendly fraud։
Հաշիվ ռիսկերը 'պայթյուն/ընդհատում, մուլտիկաունտինգ, բոնուս-աբյուզ, սարքերի ագարակներ։
KYC/AML 'կեղծ փաստաթղթեր, կեղծ դեմքեր, գրկախառնություններ, սանկցիոն/RER ռիսկեր։
Վարքագծային 'բոտեր, ջութակներ, աննորմալ արտոնագրեր, գործարքներ։
Գործընկերներ ՝ ֆրոդ/ռեֆերալներ, անորակ դեպոզիտների խթանում։
2) Ազդանշաններ և հումք
Սարքը/ցանցը 'device fingerprint, canvas/wag, էմուլյատորներ, IP/ASN/NPN, գեովելոսիտներ։
Հիբրիդային ՝ BIN/MCC/քարտեզի երկիրը, 3DS/ECI, AVS/CVV արդյունքները, velocity (քարտեզով/հաշիվով/սարքով), սահմանների շեղումը։
Վարքագիծը 'ձևերի արագությունը, մկնիկի հետքերը, www.ell-time-ը, գործողությունների հաջորդականությունը։
Սոցիալական/գրաֆիկական 'հեռախոսների/e-mail/քարտերի/հասցեների/սարքերի համընկնումները, ընդհանուր ֆիչերը «վատ» հանգույցների հետ։
KUS/Փաստաթղթերը ՝ OCR/սելֆի խաղային/կենդանի (liveness), ամսաթիվը/աղբյուրը, blacklis.ru/սանկցիաները։
3) Նշանների ճարտարագիտություն (feature store, point-in-time)
Ժամանակավոր պատուհանները ՝ 5m/1h/24h/7d velocity-fich; էքսպոն։ հարթեցում։
Նույնականության ագրեգատները ՝ user _ id, հեռախոսը, e-mail, քարտեզ, սարք, IP/ASN։
Գեո/ժամանակը 'երկիրը/տարածաշրջանը/թայմզոնը/տեղական արձակուրդային պրոֆիլները։
Գրաֆի ֆիչին 'degree/triangle count/PoftRank, կապերի մասը վատ, դիմադրության հետ։
KYC որակը ՝ edidence OCR, edit distae անուններ/հասցեներ, IBAN/INN-ի վալիդացիա։
Anti-lics: խստորեն point-in-time, առանց ապագա նշանների։ online/offline parity.
4) Նշումներ և տարբերություններ։
Targets: chargeback = 1, www.irmed _ fraud = 1, bonus _ abuse = 1։
Հետաձգված ճշմարտության պատուհանները 'ռուսական գալիս են T (charjbeki), օգտագործեք «ֆրիզը» ուսուցման ընթացքում։
Դիստրիբյուտիվ 'ուժեղ անհավասարակշռություն (0. 1-1 տոկոսը «միավորներ») նշանակում է կշռել/սեմպլինգ զգույշ։
Սուրրոգատ չափանիշները ՝ ձեռքով ապացույցներ և բողոքարկումներ, վստահություն պահեք։
5) Մոդելներ և մոտեցումներ
Կանոնները (policy-as-code) 'սպիտակ/սև ցուցակներ, velocity, geovelosity, անհամատեղելի ատրիբուտներ։ Արագ, բացատրված, fail-safe հիմքը։
Սուպերվիզիա 'գրադիենտ բուստինգ/անտառ, լոգիստիկ ռեգրեսիա, NN պլանշետ cost-sultitive loss։
Անոմալիաներ ՝ Isolation Forest, LOF, robust z-score/seasonal-decomp, ավտոմեքենաների կոդեր։
Գրաֆիկ մոտեցումներ ՝ link prodiction, GNN/DeepWalk-embedings, «ընդհանուր dewis/քարտ» կանոնները։
Հիբրիդները ՝ cascade (ML-ի կանոններ), անսամբլի տարբեր տուգանքներով FP/FN-ի համար։
Տրամաչափություն ՝ Platt/Isotonic հավանականության համար։ հակումներ սխալների արժեքից։
6) Որակի մետրերը (կենտրոնանում ենք հազվագյուտ դասարանների վրա)
PR-AUC-ն որպես հիմնական; ROC-AUC-ն տեղադրված է անհավասարակշռության ժամանակ։
Recall@FPR≤x%, Precision@k, Cost-sensitive utility.
Coverage-ը և Latency p95-ը պրոդ սկորինգի համար։
Fairness/Harts: սխալներ երկրների/սարքերի/վճարման մեթոդների հատվածների վրա։
7) Շեմի քաղաքականությունը և հիստերեևիչը
Կիսեք լուծման գոտիները
'score windows _ block' 112 ավտոբուս;
"Բանաձև _ review wwww.score <բանաձև _ block 'international ստուգում;
«score <բանաձև _ review '2019»։
Ավելացրեք հիստերեմիա (մուտքի/ելքի շեմը տարբերվում է) և cool-down (կրկնվող գործողությունների նվազագույն ընդմիջումները), որպեսզի բացառեն «միգրացիան»։
Օրինակ decision table
8) Առցանց ֆորումը 'կարեկցանքը և նվագախումբը։
Սթրիմինգ 'իրադարձություններ անվադողերի միջոցով։ phics online feature store; «event _ id» -ի միջոցով։
Latency: 24p95 (օրինակ, 100-300 մզ հարցման համար)։
Նվագարկիչ 'երաշխավորված առաքում, ռետորիա/backoff, DLQ, rate-limit։
Գործողությունների ալիքները ՝ 3DS/step-up, hold/limit, բլոկը, փաստաթղթերի հարցումը, քեյս մենեջերի հյուսետը, օգտագործողի ծանուցումը։
Աուդիտ '"www.relation _ id" -ի միջոցով ազդանշանը բացատրում է վերջնական արդյունքը "։
9) Human-in-the-loop և Cas-կառավարման
Քեյսա 'համախմբեք միջադեպերը/ապացույցները, ցույց տվեք բացատրությունը (top features/կանոնները, կոմս հարևանությունը)։
Թույլտվություն 'ավտոմեքենաների փոխանակում/մասնակի սահմանը/հարցումը KUS/2019։
Ուսուցում. Վերլուծաբանների ղեկավարները վերադառնում են տվյալներին (relabel), սահմանին 108-րդ։
SLA 'P1/P2 գերակայությունը, ժամանակավոր արձագանքը, հերթերը, բեռի բաշխումը։
10) Գրաֆային վերլուծություն գործնականում
Связи: `user ↔ device ↔ card ↔ phone ↔ email ↔ IP`.
Patterns: Քարտեզային թեստավորման աստղեր, բոնուս աբյուզի «բաղադրիչներ», ընդհանուր կոդեր/SNN։
Քորինգը/կողոսկրը 'կշռված Pox Rank, suspiciousness-ը վատ հարևանների մասնաբաժնի վրա։
Լոկոմոտիվ 'նոր հանգույցների կարանտինը, եթե դրանք մտնում են «վարակված» բաղադրիչի մեջ։
11) KYC/AML/սանկցիաներ և համադրություններ
Մաթչինգը 'սանկցիոն ցուցակներ/RER/adverz-մեդիա; fuzzy-որոնում, անունների նորմալացում/թարգմանություն։
Փաստաթղթերը 'կենդանի/անտի-սպուֆինգ, MRZ/տեսողական նշաններ, գեո-համաձայնություն։
Գործարքային համակարգը 'սումամների/շեմերի/թարգմանությունների շղթաների կանոնները, սցենարները։
Գովերնանսը ՝ RFC/CLS, PII դիմակավորում, որոշումների լոգ, բացատրություն և բողոքարկման ճանապարհ։
12) Ազդեցության գնահատումը (ոչ միայն «ճշգրտությունը»)
Լուծման տնտեսությունը
[
EV = proft.com վնասը '0,028
]
Քաղաքական/թեստեր ՝ A/B/quaziexperiment (DiD) շեմերի և կանոնների համար։ bandits-ը step-up մեթոդի ընտրության համար։
Guardrails: բողոքներ/բողոքներ, NPS, «սխալ բլոկների» (FPR), latency։
13) Մոսկվա, դրեյֆ և SLO
Որակը ՝ PR-AUC/Recall @ FPR սայթաքուն պատուհանի վրա։ հավանականության տրամաչափություն։
Դրեյֆը ՝ PSI/KL հիմնական փուլերով, «անհայտ» BIN/ASN-ի մասը, սարքերի նոր կլաստերներ։
Վիրահատություններ ՝ p95 latency, թայմաուտների մասը, ձեռքի շարժասանդուղքների տոկոսը, backlog-ը։
SLO 'հասանելիություն> 99։ 9%, Decision→Action p95 ≤ 2–5 c; «Stop-cran» -ը տվյալների որակի քայքայման ժամանակ։
Runibuks: Քարտային թեստերի աճը, 3DS-ի անկումը, պրովայդերի ալգորիթմը, լոգարանների փոթորիկը։
14) Տվյալների և կոդի ճարտարապետությունը
Իրադարձությունները 'կանոնական սխեմա (UTC, version, source), idempotent բանալիներ։
Feature Store: Առցանց/offline paritet, point-in-time գրառումներ, փոխակերպումների տարբերակումը։
Մոդելներ ՝ այլընտրանքային տարբերակներ, որոնք վերարտադրում են դաշտերը, սերտիֆիկացումը, shadow-արձակումը։
Rules-as-Code: git-reposororia, revew/chek-lists, ռեգրեսիայի թեստեր։
Intainability: SHAP/log կանոնների կշիռներ, Casport-ի սերմեր։
15) Անվտանգություն, գաղտնիություն, էթիկա
PII-ի նվազեցումը 'տոկենիզացիա/hashizators; առանձին «սեյֆը»։
Հասանելիություն ՝ RFC/CLS և ընթերցանության/բեռնման աուդիտ; արտահանումը հոսանքներով և ժամկետներով։
Արդարություն. Փորձարկեք սխալների տարբերությունը տարածաշրջանների/տարածքների վրա, բացառեք անթույլատրելի ատրիբուտները։
Թափանցիկություն 'որոշումների պատճառները և օգտագործողի հասկանալի միգրացիան։
16) Կեղծ-SQL և բաղադրատոմսեր
Գործարքների idempotent ամսագիրը
sql
MERGE INTO fact_payments t
USING staging_payments s
ON t. txn_id = s. txn_id
WHEN MATCHED AND s. updated_at > t. updated_at THEN
UPDATE SET status=s. status, amount=s. amount, updated_at=s. updated_at
WHEN NOT MATCHED THEN
INSERT (txn_id,user_id,card_hash,amount,currency,event_time,created_at)
VALUES (s. txn_id,s. user_id,s. card_hash,s. amount,s. currency,s. event_time,NOW());
Velocity-fici (www.ch պատուհան)
sql
SELECT user_id,
COUNT() AS tx_24h,
SUM(amount) AS sum_24h,
COUNT(DISTINCT card_hash) AS uniq_cards_24h,
COUNT(DISTINCT device_hash) AS uniq_devices_24h,
MIN(event_time) AS first_tx_24h,
MAX(event_time) AS last_tx_24h
FROM fact_payments
WHERE event_time >= NOW() - INTERVAL '24 hour'
GROUP BY user_id;
17) Հակաֆրոդի գործարկման թուղթը
- Ազդանշանները և սխեմաները ստանդարտացված են, կուռքը միացված է։
- Feature Store point-in-time, on.ru/wwww.ru-paritet
- Մոսկվան ձևավորվում է առանց դեմքերի, հետաձգված ճշմարտության պատուհանները հաշվի են առնվում
- Հիստերեզիայի և step-up, SLA և guardrails-ի շեմի քաղաքականությունը տեղադրված է
- Քեյս կառավարումը և human-in-the-loop-ը տրամադրված են, բացատրությունը հասանելի է։
- Metriki: PR-AUC, Recall @ FPR, Cost-utility; fairness ախտորոշում
- Deldreefa/սխալներ, alerts, runibucks/
- Governans: մոդելների/կանոնների, խանդի, որոշումների աուդիտի, KYC/AML/AML/AML-ի համադրման տարբերակները։
- Պլանը A/B/DiD շեմերի համար/քաղաքական; ապահով ֆոլբեքը կանոնների համար
Արդյունքը
Ուժեղ հակաֆրոդը կառավարվող բովանդակության մեջ կանոնների, մոդելների և գրաֆիկների հիբրիդ է 'բարձրորակ ազդանշաններ և ֆիտներ, որոնք պարունակում են հիստերեզիայի շեմի քաղաքականություն, արագ առցանց սկորինգ և նվագախումբ, որոնք գործում են wwww.human-in-the-loop-ում և թափանցիկ բողոքարկումներ: և dreaf վերահսկողություն։ Հետևելով այս սխեմային ՝ դուք նվազեցնում եք կորուստները, սահմանափակում եք վնասը կեղծ արգելափակումներից և պահպանում եք օգտագործողների և կարգավորողների վստահությունը։