Maʼlumotlarni belgilash va modellar sifati

1) Vazifasi va prinsiplari

Maqsad: leykedjsiz va komplayensni hisobga olgan holda takrorlanadigan yorliqlar va o’lchanadigan modellar sifatini olish.

Prinsiplar:

Schema-first: rasmiy ontologiyalar, sinf lug’atlari va mezonlari.
Point-in-time: yorliqlar hal qilish vaqtida mavjud bo’lgan ma’lumotlardan iborat.
Quality-as-code: ko’rsatmalar, testlar, chek varaqalari va tanlanmalar - omborxonada.
Privacy-by-design: PII, DSAR/RTBF minimallashtirish, rezidentlik.
Cost-aware: belgilash va xato echimlar (expected cost) qiymatini hisoblaymiz.

2) Ontologiya va yorliqlar sxemasi

Belgilash obʼekti, sinflar, istisnolar va haqiqat manbalarini aniqlang: Misol (AML/Antifrod):

Obyekt: tranzaksiya/sessiya.
Классы: `legit`, `fraud_suspected`, `fraud_confirmed`, `unknown`.
Istisnolar: dalilsiz chargeback →’unknown’.
Manbalar: keys-menejment, chargeback-reyestrlar, provayderlar/bank.

YAML sxemasi:

yaml task: aml_classification object: "payment_transaction"
labels:
- legit
- fraud_suspected
- fraud_confirmed
- unknown guidelines_version: "1. 3. 0"
positive_class: "fraud_confirmed"
exclusions:
- "dispute opened but no evidence -> unknown"
sources_of_truth:
- "case_system. resolution"
- "issuer. chargeback_code"

3) Annotatsiya yo’riqnomalari (guidelines)

Tuzilishi:

1. Vazifa va biznes kontekstining tavsifi.

2. Ijobiy/salbiy misollar va chegara keyslari bo’lgan sinflarni aniqlash.

3. Manbalar ustuvorligi qoidalari (haqiqat> evristika> fikr).

4. ’unknown’ va eskalatsiya mezonlari.

5. Maxfiylik siyosati (yashirish, ID o’rniga tokenlar).

6. FAQ va chizgichning chek-varaqasi.

Yo’riqnoma parchasi (frod):

’fraud _ confirmed’: isbotlangan chargeback/yopiq keys FRAUD tag.
’fraud _ suspected’: ≥ 3 ta depozit <10 daqiqada REPORT_LIMIT + IP bog’lamasi/halqali karta.
’legit’: 60 kun oynasida bayroqlar va tasdiqlangan keyslar yoʻq.
’unknown’: qarama-qarshi belgilar yoki maʼlumot yetarli emas.

4) Yorliqlar manbalari va point-in-time qoidalari

Avto-yorliqlar: qoidalar/keyslar, chargeback, o’z-o’zini istisno qilish (RG), outcome stavkalari.
Graund-trut: tekshirish/tartibga solish natijalari.
Point-in-time: Hal qilingandan keyin hodisalardan foydalanish taqiqlanadi (t0).
Kechikishlar: masalan, chargeback 45-90 kundan keyin paydo bo’ladi → yorliq «pishib yetadi».

Kelajaksiz SQL namunasi:

sql
SELECT e. id, e. event_time AS asof,
CASE WHEN EXISTS (
SELECT 1 FROM cases c
WHERE c. tx_id = e. id
AND c. decision_time <= e. event_time + INTERVAL '90' DAY
AND c. result = 'FRAUD_CONFIRMED'
) THEN 'fraud_confirmed'
ELSE 'legit'
END AS label
FROM silver. payments e;

5) Tanlanmalar: stratifikatsiya va balans

Noyob hodisalar: use stratified sampling bozorlar/provayderlar/sanalar bo’yicha; oversampling nodir sinflar yoki focal loss.
Validatsiya qatlamlari: haftalar/bozorlar/tenantlar bo’yicha holdout saqlang.
Sanksiyalar/PII: To’g’ridan-to’g’ri identifikatorli maydonlarni o’quv to’plamlaridan chiqarib tashlang.

Tanlov siljishini nazorat qilish:

sql
-- Verification of class shares by market
SELECT market, label, COUNT() FROM dataset GROUP BY market, label;

6) Belgilovchilarning muvofiqligi (IRR)

Cohen’s κ (2 ta annotator )/Krippendorff’s α (N annotator, turli xil shkala).

Koʻrsatkichlar:

κ < 0. 4 - zaif muvofiqlik → yo’riqnoma/misollarni qayta ko’rib chiqish.

0. 4–0. 6 - murakkab vazifalar uchun maqbuldir;> 0. 6 - yaxshi;> 0. 8 - a’lo darajada.

Belgilash sifati kartochkasi:

Qoplash (qancha belgilanganligi), sinflar va slayslar bo’yicha κ/ α,’unknown’ulushi, o’rtacha vaqt, top xatolar.

7) QA-kontur va oltin etalonlar

Golden set: 1-5% belgilangan - ikki marta tekshiriladigan etalon.
Honey-pot vazifalari: vazifalar oqimida yashirin maʼlum keyslar.
Ikkinchi qarash: bahsli misollarda eskalatsiya/arbitraj.
Regression belgilash testlari: gidlar yangilangandan keyin qayta validatsiya qilish.

8) Faol, zaif va yarim nazorat qilinadigan ta’lim

Active Learning: «noaniq» misollarni tanlash (maksimal entropiya/xilma-xillik).
Weak Supervision: evristika/distant supervision + yorliqlar uchun shovqin modeli.
Semi-Supervised: harorat chegarasi bo’lgan va keyinchalik tekshiriladigan psevdoleybllar.

Pipeline (eskiz):

python
U = unlabeled_pool()
scores, conf = model. predict(U)
C = pick_top_k_by_uncertainty(U, conf, k=500)
labels = annotate (C) # person train (model, L ∪ labels) # additional training

9) Anti-leykedj va vaqt nazorati

Point-in-time join fich va yorliqlar uchun.
Kelajakdagi yorliqlarni taqiqlash (’asof’dan keyin).
Transformatsiyalarning ekvivalentlik testiga ega bo’lgan onlayn/offline alohida payplaynlar.
Datasetlar va mantiqni versiya qilish (’logic _ version’,’data _ version’,’asof _ date’).

10) Modellar sifati metrikasi

Xatolarning biznes qiymati uchun metriklarni tanlang:

Tasniflash: PR-AUC/ROC-AUC, F1 @k, Recall @k, expected cost (FP/FN og’irliklari).
Xavf skoringi: KS/ROC-AUC, Brier, kalibrlash (ECE), dreyf uchun PSI/CSI.
Tavsiyalar: NDCG/MAP @K, coverage/diversity, yangilik.
Anomaliyalar: Precision @k, AUCPR sintetik/oltin to’plamda.

Expected-Cost (psevdokod):

python best_thr = argmin_thr(cost_fpFPR(thr) + cost_fnFNR(thr))

11) Slays-tahlil va fairness

Slayslar: bozor, provayder, devays/ASN, hisobvaraq yoshi, depozit miqdori, sutka vaqti.
Fairness: disparate impact (ratio), equalized odds (разница FPR/TPR).
Harakatlar: fichni qayta tanlash, slayslar bo’yicha kalibrlash, ostonalarni qayta ko’rib chiqish, o’rgatuvchi vazn.

12) Production-sifat monitoringi

Maʼlumot/bashorat dreyfi: PSI/KL fich/skorlar boʻyicha.
Kalibrlash: ECE, reliability-diagrammalar.
Chegaraning barqarorligi: alert, agar expected cost ↑> X% yoki PR-AUC ↓.
Sxemalar/kontraktlar: breaking changes (schema registry) ni ushlash.
Feedback loop: hodisalar bo’yicha tezkor qo’l yorliqlari (case-yopish, RG-natijalar).

13) Maxfiylik, xavfsizlik, komplayens

PII-minimallashtirish: taxalluslar, alohida himoyalangan mapping.
Rezidentlik: alohida payplaynlar/kalitlar (EEA/UK/BR); asossiz kross-mintaqaviy join’onlarni taqiqlash.
DSAR/RTBF: hisoblab chiqiladigan proyeksiyalar va selektiv tahrirlash.
Legal Hold: WORM - keyslar va hisobot paketlari uchun arxivlar.
Jurnallar: foydalanishning/eksportning o’zgarmas auditi.

14) Belgilash jarayonini tashkil etish

Asboblar: task-treker, misollar navbati, kontekstni oldindan koʻrish, PII niqoblash, issiq tugmalar.
Tezlik va sifat nazorati: KPI annotator (tezlik, aniqlik golden), o’qitish va attestatsiya.
Version:’guidelines _ version’,’annotator _ id’,’reviewer _ id’, taymstemplar.
Hujjatlar: to’plam kartochkasi (owner, manba, derazalar, qoidalar, metriklar).

15) Namunalar

Dataset kartochkasi (YAML):

yaml name: aml_tx_2025q1_pt owner: ml-risk asof_range: ["2024-10-01", "2024-12-31"]
positive_label: fraud_confirmed guidelines_version: "1. 3. 0"
feature_window: "[-30d, 0d)"
holdout: ["2024-12-15", "2024-12-31"]
pii_policy: "tokenized_user_ids; masked_pan; no_raw_ip"

Belgilash qoidalari:

yaml qa:
min_kappa: 0. 6 golden_accuracy_min: 0. 9 max_unknown_share: 0. 15 reannotation_on_disagreement: true

Confusion matrix (SQL gʻoyasi):

sql
SELECT pred, label, COUNT() n
FROM eval_predictions
GROUP BY pred, label;

16) Joriy etish yo’l xaritasi

MVP (2-4 hafta):

1. Ontologiya va yo’riqnomalar v1, oltin to’plam (domenga 1000 misoldan ≥).

2. PII niqobli annotatsion oqim, har hafta uchun κ-metrika.

3. Asosiy model + offline-baholash (PR-AUC, expected cost), point-in-time tanlash.

4. Fich/tezkor dreyf monitoringi; datasetlar va gidlar versiyalari registri.

2-bosqich (4-8 hafta):

Active/weak-supervision konveyer, auto-triage’unknown’.
Slays-tahlil va fairness-hisobotlar, ehtimollarni kalibrlash.
Belgilangan toʻplamlar uchun DSAR/RTBF protseduralari, keyslar uchun Legal Hold.

3-faza (8-12 hafta):

To’liq avtomatlashtirish QA (golden/honey-pots), regression belgilash testlari.
Datasetlar katalogi va «model sifati» kartochkalari; expected-cost ostonalarini orkestrlash.
Belgilash/inferens qiymati bo’yicha Chargeback, yorliqlarni yangilash bo’yicha SLA.

17) RACI

R (Responsible): Data Science (ontologiya, metrika), Label Ops (jarayon/QA), Data Eng (namunalar/PII/saqlash).
A (Accountable): Head of Data / CDO.
C (Consulted): Compliance/DPO (PII/residency/DSAR), Risk/AML/RG (qoidalar), Security (KMS/audit).
I (Informed): Mahsulot/Marketing/Operatsiyalar/Qo’llab-quvvatlash.

18) Sotishdan oldingi chek-varaq

Ontologiya va gaydalar tasdiqlangan, versiya qayd etilgan.
Sifat namunasi: stratifikatsiya, vaqt/bozor bo’yicha holdout.
κ/ α ≥ maqsadli chegara; golden-accuracy kuzatildi.
Point-in-time fich va yorliqlarni to’plash; leykedj yo’qligi bo’yicha test o’tkazildi.
Metriklar expected cost tomonidan tanlangan, slays-tahlil va fairness bajarilgan.
Dreyf/kalibrlash monitoringi kiritilgan; Alertlar sozlangan.
PII/DSAR/RTBF va Legal Hold siyosatiga rioya qilingan; audit kiritilgan.

19) Anti-patternlar va xavflar

Aniq mezonlarsiz belgilash → past κ, shovqinli yorliqlar.
Kelajakdagi leykedj (post-faktum belgilari/yorliqlari).
Balanssiz tanlov, qiymatni hisobga olmagan holda ROC-AUC metrikasi.
Golden/QA va regression belgilash testlarining yo’qligi.
PII rezidentlik va niqobsiz datasetlarda.
Slays tahlili yoʻq → hududlarda/provayderlarda yashirin tanazzul.

20) Jami

Modellar sifati yorliqlar sifatidan boshlanadi. Xatolar qiymatini hisobga oluvchi qat’iy ontologiya, namunali yo’riqnomalar, point-in-time intizomi, QA-konturlari va metrikalari - iGaming’da takrorlanadigan MLning asosi. Ushbu amaliyotlarni ma’lumotlar konveyeri va MLOps-ga qo’shib, siz kutilmagan biznes natijalarini yaxshilaydigan barqaror, axloqiy va komplayent modellarni olasiz.

Maʼlumotlarni belgilash va modellar sifati

Biz bilan bog‘laning

Tez aloqa

Video tez orada yangilanadi

Hozir loyihalar bilan juda bandmiz