PII-maglumatlary bellemek
PII-maglumatlary bellemek
1) Tokenizasiýa näme üçin we nämäni tokenleşdirýäris
Maksat: operasiýa konturynda we seljermede "çig" şahsy maglumatlara ýüz tutmagy aradan aýyrmak, syzmak howpuny azaltmak we talaplara laýyklygy ýönekeýleşdirmek.
PII-mysallar: doly ady, telefon, email, salgysy, pasport/ID, STIR, IP-salgylary, cookie-ID, töleg kesgitleýjileri, doglan senesi we ş.m.
- başlangyç manysyny aýan etmeýär;
- yzyna gaýtaryp boljak (goralýan detokenizasiýa hyzmaty arkaly) ýa-da yzyna gaýtaryp bolmajak bolup biler;
- determinirlenen (join/gözleg üçin) ýa-da determinirlenmedik (iň ýokary gizlinlik üçin) bolup biler.
2) Howplaryň nusgasy we gözegçiligiň maksatlary
Töwekgelçilikler: DB/log/bellikleriň syzmagy, içerki okalyşlar, gaýtalanýan gymmatlyklar boýunça baglanyşyk, rugsatsyz detokenizasiýa, sözlük/format boýunça hüjümler (email/telefon), syrlary gaýtadan ulanmak.
Maksatlar:1. Ynam zolaklaryny bölmek: programma bellikler bilen işleýär, çeşme - diňe bellik hyzmatynda.
2. Tokenleriň kriptografik çydamlylygyny we dolandyrylýan detokenizasiýany kepillendirmek.
3. KMS/HSM, aýlanyş we "kripto-sterilizasiýa" arkaly blast radiusy azaldyň.
4. Gözegçilik edilýän töwekgelçilikde/joynlary/analitikleri gözlemek üçin laýyklygy üpjün etmek.
3) Bellikleriň tipologiýasy
Maslahat berilýän profiller:- / Joýnlary gözlemek üçin PII: tersine determinirlenen, sebite baglanan (tenant/skope), KMS-de berkitme bilen.
- PII operatiw maskalanmak üçin (UI): gaýtadan ulanmagyň töwekgelçiligini azaltmak üçin ömri bilen yzyna gaýtarylyp bilinmez.
- "Çal zolakda" analitikler üçin: yzyna dolanyp bolmajak (esasy NMAS/duzly kesh) ýa-da DP-agregasiýalar.
4) Tokenizasiýa arhitekturasy
4. 1 Komponentler
Tokenization Service (TS): API "tokenize/detokenize/search", ýokary ynam zolagy.
Token Vault (TV): goralýan mapa 'token → asyl (+ meta-maglumatlar)'.
KMS/HSM: Kök açarlaryny saklamak (KEK), örtük/gol amallary.
Policy Engine: kim, nirede we näme üçin detokinasiýa edip biler; scope/TTL/rate-limits; mTLS/mTLS+mTLS.
Audit & Immutability: ähli tokenizasiýa/detokenizasiýa amallarynyň üýtgemeýän magazinesurnallary.
4. 2 Açarlar iýerarhiýasy
KMS/HSM-de Root/KEK (gurama/sebit/kärendeçi üçin).
DEK-PII maglumat domenine (email/phone/address) we/ýa-da dataset.
Aýlanyş: rewrap DEK ähli wolty täzeden ýazmazdan; "açary bozmak" meýilnamasy.
4. 3 Akymlar
1. Tokenize: müşderi → TS (mTLS + A&A) → kadalaşma → belgi hasaplamak → TV-e ýazmak → belgi bilen jogap bermek.
2. Detokenize: hukukly müşderi → TS → syýasaty/esaslary barlamak → çeşme bermek (ýa-da ret etmek).
3. Search/Match: determinirlenen tokenizasiýa token boýunça gözlemäge mümkinçilik berýär; email/telefon üçin - tokenizasiýa etmezden ozal formaty kadalaşdyrýarys.
5) Bellikleriň gurluşlary (kripto dizaýny)
5. 1 Yzyna gaýtaryp bolýar (iş meýilnamasy üçin maslahat berilýär)
AES-SIV/AEAD envelope: `cipher = AEAD_Encrypt(DEK, PII, AAD=scope|tenant|field)`; belgi = 'prefix' nonce 'cipher' tag '.
Format üçin FPE (FF1/FF3-1) (mysal üçin, ýurduň kody bolmadyk 10 belgili telefon). Seresaplylyk we dogry domen bilen ulanmak (elipbiý/uzynlyk).
5. 2 Yzyna gaýtaryp bolmajak (analitika/adynyň aýdylmazlygy bosagada)
Keyed HMAC/хэш: `token = HMAC(PII_normalized, key=K_scope)`; duz/pepper - aýratyn; kärendeçi ýa-da senesi boýunça.
Konfliktleriň töwekgelçiligini funksiýa (SHA-256/512) we domen saýlamak arkaly azaltmak.
5. 3 Determinizm we hereketleriň ugry
Join üçin AAD = '{tenant' purpose 'field} '\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\
Dürli hyzmatlarda anti-korrelasiýa üçin - dürli açarlar/ýerler.
5. 4 Sözlük boýunça hüjümleri azaltmak
Normalizasiýa (email/telefon kanonizasiýasy), KMS-de pepper, domen ululygynyň çäklendirilmegi (side kanaly hökmünde "ýazgy tapylmady"), rate-limit we jemgyýetçilik nokatlary üçin SARTSNA/proxy.
6) API dizaýny we shemasy
6. 1 REST/gRPC (wariant)
`POST /v1/tokenize { field, value, scope, tenant_id, purpose } -> { token, meta }`
`POST /v1/detokenize { token, purpose } -> { value }` (mTLS + OIDC + ABAC; "iň az" bermek)
'POST/v1/match {field, value} -> {token}' (gözlemek üçin kesgitlenen ýol)
6. 2 Saklamak shemasy (TV)
Таблица `tokens(field, scope, tenant_id, token, created_at, version, wrapped_key_id, hash_index)`
Indeksler: 'token', '(tenant_id, field, hash_index)' de-duplikasiýa/gözleg üçin.
Hash index (kadalaşdyrylan PII-den HMAC) detokenizasiýa etmezden gözlemäge mümkinçilik berýär.
6. 3 Kadalaşma konweýerleri
email: lowercasing, trim, canonical local-part (ähli domenler üçin nokatlary agressiw "iýmezden").
phone: E.164 (ýurt kody bilen), formatlaýjy nyşanlary aýyrmak.
address/name: transliterasiýa, trim, collapse spaces.
7) Köp kärende we izolýasiýa
Kireýine alyjy üçin açarlar we namespaces: KEK/DEK per tenant.
Detokenizasiýa syýasaty: rol + maksat + sebäp + waka-audit.
Kärendeçiniň maglumatlaryny kripto-aýyrmak - KEK-i yzyna almak we DEK → wolty ýok etmek peýdasyz bolýar (onuň ýazgylary üçin).
8) Integrasiýa
8. 1 Maglumat bazalary we nagt pullar
Diňe iş tablisalarynda bellikleri saklaň.
Seýrek ýagdaýlar üçin proxy/agent arkaly "uçuş" detokenizasiýasy zerurdyr.
Token nagt pullary - diňe TTL gysga ýatda, diske ýazylman.
8. 2 Analitika/BI/ML
DWH/kölde - bellikler ýa-da eşler. Join degişli skope-yň kesgitlenen bellikleri boýunça ýerine ýetirilýär.
ML üçin - lakamlaşdyrmak we agregatlar has gowudyr; adamlary dikeltmekden gaça duruň.
8. 3 Goldaw we antifrod hyzmatlary
UI maska ('+ 380') we esasly sebäplere görä epizodiki detokenizasiýa (reason code) + second factor.
9) Aýlanyş, wersiýalary we durmuş sikli
Bellik kesgitleýjisini we şifrlemek wersiýasyny bölüň (v1/v2).
Rewrap: Maglumatlary degirmezden KEK-i üýtgedýäris.
Wakalaryň meýilnamasy: açarlary birbada yzyna almak, detokenizasiýany gadagan etmek, "read-only" -e geçmek, rewrap başlamak.
TTL bellikleri: syýasat boýunça - hemişelik (kesgitleýjiler) ýa-da gysga (bir gezek ulanylýan baglanyşyklar/wagtlaýyn integrasiýa).
10) Öndürijilik we ygtybarlylyk
Enjamyň tizlenmegi (AES-NI/ARMv8), KMS-e birikdirilen howuzlar, DEK bilen örtülen nagt pul.
TS gorizontal masştaby; read/write ýollaryny bölmek.
Tor faplarynda tokenize gaýtalamak üçin idempotency-key.
DR/HA: köp zolakly, woltyň asinxron göçürmesi, yzygiderli dikeldiş synaglary.
SLO: p99 latentlik 'tokenize' ≤ 50-100 ms; 'detokenize' ≤ 50 ms; elýeterlilik ≥ 99. 9%.
11) Gözegçilik, audit, gabat gelmek
Metrikler: Usullar boýunça QPS, A&A ýalňyşlyklary, detokenizasiýalaryň paýy (rollar/maksatlar boýunça), keş hit-rate, KMS amallarynyň wagty.
Audit (üýtgemez): her bir detokenizasiýa 'who/what/why/where', heş soragy, netije.
Magazineurnal üçin saklamak we WORM syýasaty ("Audit we üýtgemeýän magazinesurnallara" serediň).
Laýyklyk: GDPR (minimallaşdyrmak, kripto-silmek arkaly aýyrmak hukugy), PCI DSS (PAN üçin - FPE/lakamlaşdyrmak), ISO/SOC hasabat.
12) Synag we howpsuzlyk
Kripto-birlik synaglary: kesgitlenen tokenleriň durnuklylygy, AAD barlagy we laýyk gelmeýän halatynda ret edilmegi.
Negatiw synaglar: sözlük hüjümleri, format boýunça tersi, rate-limit, CSRF (web panelleri üçin), SSRF-den bekendlere.
Chaos: KMS/wolt elýeterli däl, köne açar, bölekleýin köpeltmek.
Wagtal-wagtal Red-team sebäpsiz we gapdal kanallar arkaly detokenirlemek synanyşyklary.
13) Kiçi reseptler
Kesgitlenen yzyna gaýtarylýan belgi (AEAD SIV, psevdokod):
pii_norm = normalize(value)
aad = scope tenant field dek = kms. unwrap(kek_id, wrapped_dek_for_field)
token = aead_siv_encrypt (dek, pii_norm, aad) # deterministically store_vault (token, pii_norm, meta)
return token
Analitika üçin yzyna gaýtaryp bolmajak belgi (HMAC):
pii_norm = normalize(value)
pepper = kms. get_secret("pepper/"+tenant+"/"+field)
token = HMAC_SHA256 (pepper, pii_norm) # deterministically within scope return base64url (token)
Detokenizasiýa syýasaty (ideýa):
allow if role in {SupportL2, Risk, DPO} and purpose in {KYC, Chargeback, DSAR}
and mTLS and OIDC_claims match tenant and reason_code provided and ticket_id linked rate_limit per actor <= N/min
Kärendeçini kripto aýyrmak:
kms. disable_key(kek_tenant)
access to unwrap is blocked → detoxification is not possible schedule_destroy (kek_tenant, hold_days=7)
14) Ýygy-ýygydan ýalňyşlyklar we olardan nädip gaça durmaly
Loglarda bellikler. Bellikleri gizläň (esasanam tersine) duýgur maglumatlar.
Hemme zat üçin bir açar. Kärendeçiler/meýdanlar/maksatlar boýunça bölüň; AAD ulanyň.
"Mümkin boldugyça" kadalaşmak. Utgaşdyrylmadyk kanonizasiýa gözleg/joýnalary bozýar.
Sebäpsiz/çäklendirmesiz detokenizasiýa. Elmydama reason code, audit we rate-limit.
FPE panacea hökmünde. Diňe dogry domen/açarlar bilen formaty ulanmak.
Diskdäki uzak möhletli nagt pullar. Ýatda diňe TTL bar.
Rewrap prosesiniň ýoklugy. KEK-iň iş wagty bolmazdan aýlanmagy hökmanydyr.
15) Çek-listler
Önümden öň
- Saýlanan token profilleri per/maksat (tersine/determinizm/sebit).
- Açarlar iýerarhiýasy (KEK/DEK), KMS syýasaty, esasy amallaryň barlagy düzüldi.
- Girişleri kadalaşdyrmak, formatlary tassyklamak üçin konweýer amala aşyryldy.
- rate-limit, reason-codes, üýtgewsiz audit goşuldy.
- Söz hüjümleri/format/rola esaslanýan giriş synaglary geçdi.
- DR/wolt göçürmesi we açar barlagy.
Amal
- Detokenizasiýa boýunça aýlyk hasabat (kim/näme üçin/näçe).
- KEK/pepper, rewrap DEK.
- Rugsatsyz detokenizasiýa/gapdal kanallara Red-team.
- Täze formatlar/sebitler peýda bolanda kadalaşmagy täzeden gözden geçirmek.
16) FAQ
S: Tokenizasiýa = anonim?
A: Ýok. Tokenizasiýa - lakamlaşdyrma. Açarlar/wolt bar bolsa, gelip çykyşyny dikeldip (ýa-da deňeşdirip) bileris. GDPR sferasyndan çykmak üçin ygtybarly anonimleşdirme talap edilýär.
S: Detokenizasiýa etmezden e-poçta/telefon arkaly nädip gözlemeli?
O: Kanonizasiýa bilen deteminirlenen tokenizasiýa. Adresler/Doly ady üçin - hash indeksleri/gözleg açarlary we kömekçi tablisalar.
S: FPE haçan gerek?
O: Haçan-da daşarky şertnama/shema formaty talap edende (uzynlygy/elipbiýi). Beýleki ýagdaýlarda - adaty AEAD bellikleri has aňsat we ygtybarly.
S: Ähli maksatlar üçin bir belgi bolup bilermi?
O: Has gowy dürli ýerler (skope/purpose): şol bir PII dürli meseleler üçin dürli bellikleri berýär → baglanyşyk töwekgelçiligi azalýar.
S: "Aýyrmak hukugyny" nädip ýerine ýetirmeli?
O: Kripto-aýyrmak: degişli toplum üçin KEK/DEK-i yzyna alýarys we/ýa-da woltdaky ýazgyny aýyrýarys + meýdan/partiýa açarlaryny ýok edýäris; analitikada - TTL/agregasiýa/şahsylaşdyrma.
- "Syr dolandyryşy"
- "At Rest şifrlemek"
- "In Transit Şifrlemek"
- «Privacy by Design (GDPR)»
- "Audit we üýtgemeýän žurnallar"
- "Açarlary dolandyrmak we rotasiýa"