AI algoritmleriniň barlagy
1) AI auditi näme we näme üçin zerur?
AI algoritmleriniň barlagy - AI-iň ygtybarly, adalatly, ygtybarly we kanuny işleýändigini we töwekgelçilikleriň dolandyrylýandygyny subut edýän maglumatlaryň, modelleriň, prosesleriň we gözegçilikleriň yzygiderli barlagy.
Maksatlar:- Ynamy artdyrmak (stakeholders, müşderiler, düzgünleşdiriji).
- Amal/abraýly/hukuk töwekgelçiliklerini azaltmak.
- Ömrüň gaýtalanmagyny we dolandyrylmagyny üpjün etmek (ML/LLM Ops).
- Iş çözgütlerini hiliň we töwekgelçiligiň ölçeg ölçegleri bilen goldamak.
2) Auditiň meýdany we çäkleri
Maglumatlaryň derejesi: ýygnamak/razylyk, hil, süýşmeler, gizlinlik, gelip çykyş çyzyklary.
Modeliň derejesi: usulyýet, tassyklama, düşündiriş, gaýduwsyzlyk, gowşaklyk.
Önümiň derejesi: UX-töwekgelçilikler, adam-kontur, seslenme we güýçlenme.
Amallaryň derejesi: gözegçilik, SLO, hadysalar, yza gaýdyp gelmek, wersiýalary dolandyrmak.
Hukuk we etika: maglumat subýektleriniň hukuklary, gadaganlyklar/çäklendirmeler, resminamalar.
Üpjün edijiler we 3rd-party: daşarky modeller, API, maglumatlar, ygtyýarnamalar, şertnama kepillikleri.
3) Töwekgelçilige gönükdirilen usulyýet (skelet)
1. Ulanmagyň kritikligi: maliýe/saglyk/hukuklara täsiri (pes/orta/ýokary).
2. Töwekgelçilikleri kesgitlemek: maglumatlar, adalat, howpsuzlyk, gizlinlik, galýusinasiýa, hyýanatçylykly peýdalanmak.
3. Gözegçilikler we subutnamalar: haýsy mehanizmler töwekgelçiligi peseldýär we haýsy artefaktlar tassyklaýar.
4. Baha bermek we skoring: domenler boýunça bal şkalalary (0-3/0-5), "go/no-go" bosagalary.
5. Remdiasiýa we gowulaşmalar meýilnamasy: SLA düzedişler, eýeler, möhletler.
6. Dowamlylygy: gaýtalanýan auditleriň ýygylygy, meýilleşdirilmedik barlagyň triggerleri.
4) Resminamalar we artefaktlar (evidence)
Data Sheet: çeşmeler, shemalar, hukuklar we ylalaşyklar, arassalamak, göçürmek, retenşn.
Model Card: maksady, okuw maglumatlary, metrikler, çäklendirmeler, howpsuz ulanmagyň şertleri.
"Eval Report": awtonom baha beriş usuly, bölünişikler, bootstrap/CI, stres ýagdaýlary.
Risk Register: ähtimallygy/täsiri bolan töwekgelçilikleriň sanawy, remediasiýa ýagdaýy.
Change Log: Maglumat/kod/model/prompp wersiýalary, goýberilen senesi.
Playbooks: runbooks, eskalasiýa, DSAR/maglumatlary aýyrmak, hadysalara jogap.
Üpjün ediji Dossier: üpjün edijileriň şertleri (LLM API, modeller), çäklendirmeler we kepillikler.
5) Maglumatlaryň barlagy
Kanunylyk we ylalaşyklar: hukuk esaslary, gaýtadan işlemegiň maksatlary, serhetaşa geçirimler.
Hil/ynam: täzelik, dolulyk, özboluşlylyk, paýlanyşyň süýşmegi.
Çalyşmalar (bias): synplaryň deňsizligi, wekilçilik, proxy-alamatlar.
Gizlinlik: lakamlaşdyrma/tokenizasiýa, differensial gizlinlik (ulanylsa), giriş žurnallary.
Linij: çeşmeden penjirelere we şekilli platformalara çenli ýol; datasetleriň köpeldilmegi.
Ygtyýarnamalar we IP: emele gelýänleri öwrenmek/ýaýratmak hukugy.
Kiçi barlag sanawy: Metrik/meýdan sözlügi, shema şertnamalary, DQ synaglary, razylyk magazineurnaly, DSAR-proseduralary barmy?
6) Nusgawy ML modelleriniň barlagy
Walidasiýa we gaýtadan taýýarlamak: dogry bölünmeler, leakage-barlaglar, wagtlaýyn kesişlerde durnuklylyk.
Batyrgaýlyk: stres synaglary (ses, zyňyndylar, geçişler), akylly domenlerde adversarial sample's.
Adalat: disparate impact, equal opportunity, calibration parity; segmentler boýunça seljerme.
Düşündiriş ukyby: ýerli/global SHAP/ICE, ähmiýetleriň durnuklylygy.
Ulanyş çäklendirmeleri: näbellilik zolaklary, fallback-logika, human-in-the-loop.
Hil ykdysadyýeti: cost curves, ýalňyşlyk profilleri, guardrail-metrikler.
7) LLM/generatiw ulgamlaryň barlagy (goşmaça)
Galýusinasiýalar we ygtybarlylyk: çeşmeler bilen jogaplaryň paýy, faktologiki evals.
Mazmun howpsuzlygy: zyýanly/gadagan edilen süzgüç, jailbreak/prompt-injection-dan gorag.
Kontekst we syzdyrmalar: RAG-daky çäklendirmeler (PII/syrlar), çeşmelerden sitata bermek syýasaty.
Gurallar we funksiýalar: funksiýalary çagyranyňyzda howpsuz çäkler (no DDL/DML, çäkler).
Özüňi alyp barşyň regressiýasy: Prompt toplumlary boýunça A/B, ulgamlaýyn görkezmeleriň "gatylaşmagy", prompt wersiýasy.
Juzability we etika: töwekgelçilik ýagdaýlarynda ýüz öwürmek/ugrukdyrmak, dogry diskleýmerler, hyýanatçylykly hereketleri awtomatlaşdyrmakdan goramak.
8) Howpsuzlyk we ekspluatasiýa töwekgelçilikleri
Model howpsuzlygy: okuw maglumatlaryny çykarmak, membership inference, model stealing - synaglar we gargalar.
Supply-chain ML: artefaktlaryň bitewiligi (modeller, agramlar, embeddingler), gollar, endiklere gözegçilik.
Infrastruktura: gurşawyň izolýasiýasy, gizlin dolandyryş, egress gözegçiligi, kwotalar.
Syn edilişi: logi/metrika/treýsing, drift we hil aladalary, haýyşlaryň/eksportyň barlagy.
Wakalar: "AI-hadysanyň", RACI kesgitlemesi, habarnamalaryň möhletleri, post-mortemalar.
9) Metrikler we eval-amallar
Wezipe boýunça hili: accuracy/AUC/MAE/F1; для LLM — pass@k, faithfulness, groundedness.
Adalat: segmentler boýunça boşluklar, equalized odds/TPR-gap, unfairness-score.
Berklik: ses/üýtgeşiklik wagtynda metrikleriň ýykylmagy; worst-case segmentleri boýunça.
Howpsuzlyk: jailbreak-rate, toxicity/abuse rate, data exfil success rate.
Ykdysadyýet: cost-to-serve, latency p95/p99, cache hit-rate, ýalňyşlyklar/1000 haýyş.
Ynam we tejribe: şikaýatlar, şikaýatlar, el bilen overradlaryň paýy, reaksiýanyň wagty.
10) Onlaýn gözegçilik we töwekgelçiligi dolandyrmak
Drift detektorlary: ilat bilen deňeşdirmeler; alertler we awto-zaýalanma.
Guardrails: diapazonlar, ynam bosagalary, blok sahypalary/allow sahypalary.
Human-in-the-loop: möhüm ýagdaýlarda - hökmany barlag, seslenme boýunça okuw.
A/B we syn edilýän täsirler: model metrikleriniň KPI iş metrleri we guardrail bilen baglanyşygy.
Yza gaýdyp gelmek we goýberiş kontury: canary/blue-green, modelleriň/prompptlaryň/maglumatlaryň wersiýasy.
11) Kadalara we içerki syýasata laýyklyk
Subýektleriň gizlinligi we hukuklary: elýeterlilik/aýyrmak/düşündiriş, retenşn, lokalizasiýa hukugy.
Aç-açanlyga bildirilýän talaplar: maksady, şikaýatlar, çäklendirmeler üçin aragatnaşyk.
AI töwekgelçiliklerini dolandyrmak: ýokary töwekgelçilikli ulgamlary hasaba almak, täsirine baha bermek (AIA/PIA), döwürleýin synlar.
Wendorlar bilen şertnamalar we SLA: log eksporty, gaýtadan işlenilýän ýer, subprosessorlar, audit hukuklary.
12) Rollar we jogapkärçilik
AI/ML Owner: modeliň we hiliň eýesi.
Data Steward: Data & DQ/lineedge eýesi.
Töwekgelçilik & Compliance: syýasat, barlaglar, düzgünleşdiriji bilen özara gatnaşyk.
Howpsuzlyk/Gizlinlik: giriş gözegçiligi, hüjüm/syzmak synaglary.
Product/UX: töwekgelçilikli interfeýs we mazmun dizaýny.
Audit Lead (daşarky/içerki): garaşsyz baha bermek we hasabat.
13) Çözgütleriň gurallary we synplary
DQ/katalog/lineedge: hil synaglary, lineage, sözlükler, toplumlaryň pasportlary.
Evals we synag toplumlary: awtonom/onlaýn baha bermek, stres hadysalaryny döretmek, benchmark toplumlary.
LLM-howpsuzlyk: prompt-injection skanerleri, mazmun süzgüçleri, policy-checkers.
Gözegçilik: infeners telemetri, drift-detektorlar, hereketleriň/eksportyň barlagy.
Senagat böleklerini/modellerini dolandyrmak: reýestrler, wersiýalara gözegçilik etmek, köpeltmek.
Red Team platformalary: hüjümleriň kataloglary, ssenariler, awtomatiki synaglar.
14) Antipatternler
"Diňe accuracy": ignor fairness/robustness/privacy/security.
Hiç hili resminama ýok: Model Card, Data Sheet, change log ýok.
Çig PII, LLM-de/kontekstinde: syzdyrmalar we kanuny töwekgelçilikler.
Onlaýn gözegçiligiň ýoklugy: waka boldy - hiç kim duýmady.
Aç-açan däl UX: ulanyjy munuň AI-iň nämedigine we nädip garşy çykmalydygyna düşünmeýär.
Bir gezeklik audit: aýlawly we triggerli gözden geçirmezden.
15) Auditiň girizilmeginiň ýol kartasy
1. Foundation: AI syýasaty, rol modeli, Risk Register, Model Card/Data Sheet şablonlary.
2. Maglumatlara gözegçilik: şertnamalar, DQ-synaglar, gelip çykyş çyzyklary, ygtyýarnamalar we razylyk.
3. "Eval-çarçuwa": hil/adalat/howpsuzlyk metrikleri, stres hadysalarynyň toplumlary.
4. LLM-arassaçylyk: RAG-syýasatlar, süzgüçler, injection goragy, çeşmeler magazineurnaly.
5. Gözegçilik we hadysalar: telemetriýa, aladalar, yza gaýdyp gelmek, runbooks, işgärleri taýýarlamak.
6. Daşarky taýýarlyk: düzgünleşdiriji/müşderiler üçin hasabat, ýokary kritikligiň garaşsyz barlagy.
7. Yzygiderli gowulaşmak: retro siklleri, býudjet-guardlar, yzygiderli red team-sessiýalar.
16) AI modeli/funksiýasy işe başlamazdan ozal çek-sanawy
- Doldurylan Data Sheet we Model Card; hukuklary/ygtyýarnamalary tassyklandy.
- Amala aşyryldy: hil, segmentler boýunça adalatlylyk, berklik, howpsuzlyk.
- LLM üçin: galýusinasiýa/groundedness ölçegleri; prompt-injection/jailbreak.
- Gözegçilik we aladalar (hil, süýşmek, zäherlilik, latency/cost).
- Ynsan-in-loop we möhüm kararlar üçin şikaýat prosesi bar.
- DSAR/silmek/retenşn suratlandyryldy we steýjde barlandy.
- Modelleriň/prompptlaryň sanawy täzelendi; gaýdyşlar we canary taýýar.
- security-review we red teaming geçirildi; bloklaýjy findings ýok edildi.
17) Audit boýunça hasabatyň gurluşynyň mysaly (skelet)
1. Töwekgelçilikleri jemlemek we skoring (domenler boýunça tablisa).
2. Ulgamyň beýany (maksady, ulanyjylary, mazmuny).
3. Maglumatlar (çeşmeler, hukuklar, hil, süýşmeler, gelip çykyş çyzyklary).
4. Model/LLM (arhitektura, okuw, metrika, çäklendirmeler).
5. Howpsuzlyk/gizlinlik (gözegçilikler, hüjümleriň synaglary, giriş journalurnaly).
6. Eval-netijeler (hil, fairness, berklik, howpsuzlyk, UX).
7. Amallar (gözegçilik, SLO, hadysalar, yza gaýdyp gelmek).
8. Kadalara laýyklyk (syýasatlar, prosesler, artefaktlar).
9. Düzgün bozmalar/gap 'y we remediasiýa meýilnamasy (SLA, eýeler).
10. Programmalar: Model Card, Data Sheet, synag ýazgylary, wersiýalary.
18) Kiçi şablonlar (psevdo-YAML)
Model Card (gysgaça)
yaml model:
name: churn_xgb_v12 purpose: owners customer outflow forecast: [data_science@company]
data:
sources: [events_app, payments, support_tickets]
rights: consent:true; pii:tokenized evals:
metrics: {auc: 0. 86, f1: 0. 62}
fairness: {tpr_gap_gender: 0. 03}
limits:
do_not_use_for: credit decisions operations:
monitoring: {drift: enabled, latency_p95_ms: 120}
rollback: canary -> blue_green
LLM Guardrails
yaml llm:
blocked_content: [pii, sexual, violence, illegal_advice]
tools_allowlist: [sql_read_analytics, search_docs]
max_tokens: 1024 require_sources: true pii_redaction: on injection_scan: on
19) Jemleýji
AI algoritmleriniň barlagy bir gezek ulanylýan "bellik" däl-de, eýsem ähli maglumatlar we modeller zynjyry boýunça töwekgelçilikleri dolandyrmagyň üznüksiz prosesi: ylalaşyklardan we süýşmelerden başlap, galýusinasiýa we hadysalara çenli. Resminamalar, eval-çarçuwalar, operasiýa gözegçilikleri we aç-açan UX bilelikde işleýän mahaly, AI önümiň ygtybarly, barlanylýan we tygşytly düzüm bölegine öwrülýär.