Zein da Datuak maskatzeko teknologia eta irtenbidea sareko pakete-brokeran?

1. Datuen maskararen kontzeptua

Datuen maskaratzea datuen maskarak ere ezagutzen da. Metodo teknikoa da, hala nola, telefono mugikorreko zenbakia, banku-txartelaren zenbakia eta bestelako informazioa bihurtzeko datu sentikorrak, aldatu edo estaltzeko. Teknika hau batez ere erabiltzen da datu sentikorrak ez direla zuzenean ingurune fidagarrietan erabiltzea ekiditeko.

Datuak maskatzeko printzipioa: Datuen maskarak jatorrizko datuen ezaugarriak, negozio arauak eta datuen garrantzia mantendu beharko lituzke, ondorengo garapenak, probak eta datuen analisiak ez direla maskarak eragingo. Datuen koherentzia eta baliozkotasuna maskaratu aurretik eta ondoren ziurtatzea.

2. Datuen maskararen sailkapena

Datuen maskarak datu estatikoen maskarak (SDM) eta datu dinamikoen maskarak (DDM) banatu daitezke.

Datu estatikoen maskara (SDM): Datu estatikoko maskarak produkzio ingurunetik isolatzeko produkzio ez-ingurune berriaren datu base berria ezartzea eskatzen du. Datu sentikorrak ekoizpen-datu-basetik ateratzen dira eta gero produkziorik gabeko datu basean gordetzen dira. Horrela, desensibilizatutako datuak ekoizpen ingurunetik isolatuta daude, negozio beharrak biltzen dituena eta produkzio datuen segurtasuna bermatzea.

Sdm

Datu dinamikoen maskara (DDM): Ekoizpen ingurunean erabiltzen da denbora errealean datu sentikorrak deszentsibilizatzeko. Batzuetan, maskarak maila desberdinak behar dira egoera desberdinetako datu sentikorrak irakurtzeko. Adibidez, rol eta baimen ezberdinek maskara-eskema desberdinak ezar ditzakete.

Ddm

Datuen berri emateko eta datuen produktuen maskara aplikazioa

Horrelako eszenatokiak batez ere datuen jarraipen produktuak edo karteldegia, kanpoko zerbitzuen datuen produktuak eta datuen analisian oinarritutako txostenak daude, hala nola negozio txostenak eta proiektuen berrikuspena.

Produktuen maskararen datuak

3. Datuak maskatzeko irtenbidea

Datu arruntak maskaratzeko eskemak hauek dira: baliogabetzea, ausazko balioa, datuen ordezkoa, enkriptazio simetrikoa, batez besteko balioa, desplazamendua eta biribiltzea, etab.

Baliogabetze: Baliogabeak datu sentikorrak enkriptatzea, enborra edo ezkutatzea aipatzen du. Erregimen honek normalean datu errealak ordezkatzen ditu sinbolo bereziekin (* adibidez). Eragiketa erraza da, baina erabiltzaileek ezin dute jatorrizko datuen formatua ezagutu, ondorengo datuen aplikazioei eragin diezaiekeena.

Ausazko balioa: Ausazko balioak datu sentikorren ausazko ordezkapenari egiten dio erreferentzia (zenbakiek digituak ordezkatzen dituzte, letrak ordezkatuz eta karaktereak karaktereak ordezkatzen dituzte). Makillaje metodo honek datu sentikorren formatua neurri batean ziurtatuko du eta ondorengo datuen aplikazioa erraztuko du. Maskaring hiztegiak behar dira hitz esanguratsuak, hala nola, pertsonen eta lekuen izenak.

Datuen ordezkapena: Datuen ordezkoa Balio nuluen eta ausazko balioen maskararen antzekoa da, izan ezik, karaktere bereziak edo ausazko balioak erabili beharrean, maskara datuak balio zehatz batekin ordezkatzen dira.

Zifratze simetrikoa: Zifratze simetrikoa maskara metodo itzulgarri berezia da. Datu sentikorrak enkriptatzen ditu zifratze teklak eta algoritmoen bidez. Zifratutako formatua koherentea da jatorrizko datuekin arau logikoetan.

Batezbesteko: Batez besteko eskema estatistika eszenatoki askotan erabiltzen da. Zenbakizko datuetarako, lehenik eta behin beren batez bestekoa kalkulatzen dugu, eta, ondoren, ausaz banatu batez bestekoaren inguruko balioak, horrela, datuen konstantearen batura mantenduz.

Offset eta biribiltzea: Metodo honek datu digitalak ausazko txandaren bidez aldatzen ditu. Konponketa borondateak barrutiaren gutxi gorabeherako benetakotasuna bermatzen du datuen segurtasuna mantentzen duen bitartean, aurreko eskemak baino datu errealetatik gertuago dagoena, eta garrantzi handia du datuen analisi handien agertokian.

Ml-npb-5660- 数据脱敏

Gomendio eredua "Ml-npb-5660"Datuak maskaratzeko

4. Normalean erabilitako datuak maskaratzeko teknikak

(1). Estatistika teknikak

Datuen laginketa eta datuen agregazioa

- Datuen laginketa: Ezarritako jatorrizko datuen azterketa eta ebaluazioa datu multzoen azpimultzo adierazgarri bat hautatuta, zehaztapen tekniken eraginkortasuna hobetzeko metodo garrantzitsua da.

- Datuen agregazioa: mikrodatuen atributuetan aplikatutako estatistika-tekniken bilduma gisa (hala nola, batuketa, zenbaketa, zenbaketa, zenbaketa, zenbaketa, zenbaketa, batezbestekoa eta minimoa.

(2). Kriptografia

Kriptografia desentsibilizazioaren eraginkortasuna desentsibilizatzeko edo hobetzeko metodo arrunta da. Zifratze algoritmo mota desberdinek desensibilizazio efektu desberdinak lor ditzakete.

- Zifratze determinista: ausazko enkriptazio simetrikoa ez da. Normalean ID datuak prozesatzen ditu eta zifra-testua jatorrizko IDra deszifratu eta leheneratu dezake behar denean, baina gakoa behar bezala babestu behar da.

- Zifratze itzulgarria: hash funtzioa datuak prozesatzeko erabiltzen da, normalean ID datuetarako erabiltzen dena. Ezin da zuzenean deszifratu eta mapen harremana gorde behar da. Gainera, Hash funtzioaren ezaugarria dela eta, datuen talka gerta daiteke.

- Zifratze homomorfoa: algoritmo homorfiko zifratua erabiltzen da. Bere ezaugarria da zifratutako operazioaren emaitza deszifratu ondoren testu-ebakuntzaren emaitza berdina dela. Hori dela eta, normalean zenbakizko eremuak prozesatzeko erabiltzen da, baina ez da oso erabilia errendimendu arrazoiengatik.

(3). Sistemaren teknologia

Ezabatzeko teknologiak pribatutasun-babesa betetzen ez duten datu elementuak ezabatzen edo ezkutatzen ditu, baina ez ditu argitaratzen.

- Maskaratzea: atributuaren balioa ezkutatzeko desensibilizazio metodo ohikoena aipatzen da, hala nola aurkarien zenbakia, NANa izartxo batekin markatuta dagoela edo helbidea ebakitzen da.

- Tokiko ezabapena: atributu balio espezifikoak (zutabeak) ezabatzeko prozesua aipatzen da, ezinbesteko datu-eremuak kenduz;

- Grabatu supresioa: erregistro zehatzak (errenkadak) ezabatzeko prozesua aipatzen da, ezinbesteko datuen erregistroak ezabatuz.

(4). Pseudonym teknologia

Pseudomanning defendatzeko teknika da, zuzeneko identifikatzaile (edo beste identifikatzaile sentikorreko beste identifikatzaile bat) ordezkatzeko. Pseudonym Techniques-ek identifikatzaile bakarrak sortzen ditu banakako informazioaren gai bakoitzerako, identifikatzaile zuzenak edo sentikorrak izan beharrean.

- Ausazko balioak modu independentean sor ditzake jatorrizko IDari dagokiona, mapatzeko taula gordetzeko eta mapak taularako sarbidea kontrolatu.

- Zifratzea ere erabil dezakezu pseudonimoak sortzeko, baina deszifratze gakoa behar bezala mantendu behar da;

Teknologia hau oso erabilia da datu independenteen erabiltzaile ugarien kasuan, hala nola OpenID plataforma irekiko agertokian, non garatzaile ezberdinek erabiltzaile berarentzako openidak desberdinak lortzen dituztenean.

(5). Orokortze teknikak

Orokortze teknikak datu-multzo batean hautatutako atributuen granularitatea murrizten duen identifikazio teknika aipatzen du eta datuen deskribapen orokorragoa eta abstraktua eskaintzen du. Generalizazio teknologia erraza da inplementatzeko eta erregistroaren datuen egiazkotasuna babestu dezake. Normalean datuen produktuetan edo datuen txostenetan erabiltzen da.

- Biribiltzea: hautatutako atributurako biribilketa oinarria hautatzea dakar, hala nola goranzko edo beheranzko auzitegiak, 100, 500, 1k eta 10K emaitzak emanez

- Goiko eta beheko kodetze teknikak: ordezkatu goiko (edo behean) atalasea goiko (edo beheko) maila adierazten duen atalasearekin, "X gainetik" edo "X azpitik" emaitza emanez.

(6). Ausazko teknikak

Identifikazio teknika moduko gisa, ausazko teknologiak atributu baten balioa ausazkoaren bidez aldatzea aipatzen du, beraz, ausazko balioa jatorrizko balio errealaren desberdina izan dadin. Prozesu honek erasotzaile baten gaitasuna datu-erregistro bereko beste atributu balioetatik ateratzeko duen balioa murrizten du, baina lortutako datuen egiazkotasunari eragiten dio, ekoizpen proben datuekin ohikoa dena.


Posta: 20122ko irailaren 27a