Zein da Data Masking Teknologia eta Soluzioa Network Packet Broker-en?

1. Datuen maskaratzearen kontzeptua

Datuen maskaratzea datuen maskaratze gisa ere ezagutzen da. Datu sentikorrak bihurtzeko, aldatzeko edo estaltzeko metodo teknikoa da, hala nola, telefono mugikorren zenbakia, banku-txartelaren zenbakia eta bestelako informazioa maskaratze-arauak eta politikak eman ditugunean. Teknika hau, batez ere, fidagarriak ez diren inguruneetan datu sentikorrak zuzenean erabiltzea saihesteko erabiltzen da.

Datuen maskaratzearen printzipioa: datuen maskaratzeak jatorrizko datuen ezaugarriak, negozio-arauak eta datuen garrantzia mantendu behar ditu, ondorengo garapenak, probak eta datuen analisiak maskaratzeak eragingo ez dituela ziurtatzeko. Ziurtatu datuen koherentzia eta baliozkotasuna maskaratu aurretik eta ondoren.

2. Datuen maskaratzearen sailkapena

Datuen maskaraketa datuen maskaratze estatikoetan (SDM) eta datuen maskaratze dinamikoetan (DDM) bana daiteke.

Datu estatikoen maskaratzea (SDM): Datu estatikoen maskaratzeak produkzioa ez den ingurunearen datu-base berri bat ezartzea eskatzen du, ekoizpen ingurunetik isolatzeko. Datu sentikorrak ekoizpen datu-basetik ateratzen dira eta, ondoren, ekoizpen ez den datu-basean gordetzen dira. Modu honetan, desentsibilizatutako datuak produkzio-ingurunetik isolatzen dira, negozioaren beharrak asetzen dituena eta ekoizpen-datuen segurtasuna bermatzen duena.

SDM

Datuen maskaratze dinamikoa (DDM): Oro har, ekoizpen-ingurunean erabiltzen da datu sentikorrak denbora errealean desentsibilizatzeko. Batzuetan, maskaratze maila desberdinak behar dira datu sentikor berdinak egoera ezberdinetan irakurtzeko. Adibidez, rol eta baimen ezberdinek maskaratze-eskema desberdinak ezar ditzakete.

DDM

Datuen berri emateko eta datu-produktuen maskaratze aplikazioa

Eszenatoki horiek, batez ere, barneko datuak monitorizatzeko produktuak edo karteldegiak, kanpoko zerbitzuen datuen produktuak eta datuen analisian oinarritutako txostenak dira, hala nola negozio-txostenak eta proiektuen berrikuspena.

datuen berri emateko produktuen maskaratzea

3. Datuen maskaratze irtenbidea

Datuen maskaratze-eskema arruntak honako hauek dira: baliogabetzea, ausazko balioa, datuak ordezkatzea, enkriptatzea simetrikoa, batez besteko balioa, desplazamendua eta biribiltzea, etab.

Baliogabetzea: baliogabetzeak datu sentikorrak enkriptatzeari, mozteari edo ezkutatzeari egiten dio erreferentzia. Eskema honek datu errealak ikur bereziekin ordezkatzen ditu normalean (* adibidez). Eragiketa erraza da, baina erabiltzaileek ezin dute jakin jatorrizko datuen formatua, eta horrek ondorengo datu-aplikazioetan eragina izan dezake.

Ausazko balioa: ausazko balioak datu sentikorren ausazko ordezkapenari egiten dio erreferentzia (zenbakiek digituak ordezkatzen dituzte, letrek letrak eta karaktereek karaktereak ordezkatzen dituzte). Maskaratze-metodo honek datu sentikorren formatua bermatuko du neurri batean eta ondorengo datuen aplikazioa erraztuko du. Baliteke hitz esanguratsu batzuetarako maskaratzeko hiztegiak behar izatea, esate baterako, pertsonen eta lekuen izenak.

Datuen ordezkapena: Datuen ordezkapena balio nuluen eta ausazkoen maskaratzearen antzekoa da, izan ezik, karaktere bereziak edo ausazko balioak erabili beharrean, maskaratze datuak balio zehatz batekin ordezkatzen dira.

Zifraketa simetrikoa: Enkriptatzea simetrikoa maskaratze-metodo itzulgarri berezi bat da. Datu sentikorrak zifratzen ditu enkriptazio-gako eta algoritmoen bidez. Zifratuaren formatua arau logikoetan jatorrizko datuekin bat dator.

Batez bestekoa: Batez besteko eskema agertoki estatistikoetan erabili ohi da. Zenbakizko datuetarako, lehenik haien batez bestekoa kalkulatzen dugu, eta, ondoren, ausaz banatuko ditugu dessensibilizatutako balioak batez bestekoaren inguruan, horrela datuen batura konstante mantenduz.

Desplazamendua eta biribilketa: Metodo honek datu digitalak ausazko aldaketaren bidez aldatzen ditu. Desplazamendu-biribilketak barrutiaren gutxi gorabeherako benetakotasuna bermatzen du datuen segurtasuna mantenduz, datu errealetatik hurbilago dagoena aurreko eskemak baino, eta garrantzi handia du big data analisiaren eszenatokian.

ML-NPB-5660-数据脱敏

Gomendatutako Eredua"ML-NPB-5660" Datu Maskingerako

4. Gehien erabiltzen diren datuak maskaratzeko teknikak

(1). Teknika Estatistikoak

Datuen laginketa eta datuen agregazioa

- Datuen laginketa: jatorrizko datu-multzoaren azterketa eta ebaluazioa datu-multzoaren azpimultzo adierazgarri bat hautatuz metodo garrantzitsua da desidentifikazio tekniken eraginkortasuna hobetzeko.

- Datuen agregazioa: mikrodatuetako atributuei aplikatzen zaizkien estatistika-tekniken bilduma gisa (adibidez, batuketa, zenbaketa, batez bestekoa, maximoa eta minimoa), emaitza jatorrizko datu multzoko erregistro guztien adierazgarria da.

(2). Kriptografia

Kriptografia desensibilizazioaren eraginkortasuna indartzeko edo dessensibilizatzeko ohiko metodo bat da. Enkriptazio-algoritmo mota ezberdinek desensibilizazio efektu desberdinak lor ditzakete.

- Enkriptatzea deterministikoa: ausazko zifraketa simetrikoa ez dena. Normalean ID datuak prozesatzen ditu eta zifratutako testua jatorrizko IDra deszifratu eta leheneratu dezake behar denean, baina gakoa behar bezala babestu behar da.

- Zifratze itzulezina: hash funtzioa datuak prozesatzeko erabiltzen da, normalean NAN datuetarako erabiltzen dena. Ezin da zuzenean deszifratu eta mapa-erlazioa gorde behar da. Horrez gain, hash funtzioaren ezaugarria dela eta, datu-talka gerta daiteke.

- Enkriptatzea homomorfikoa: testu zifratuaren algoritmo homomorfikoa erabiltzen da. Bere ezaugarria da testu zifratuaren eragiketaren emaitza deszifratu ondoren testu arruntaren eragiketaren berdina dela. Hori dela eta, zenbakizko eremuak prozesatzeko erabili ohi da, baina ez da asko erabiltzen errendimendu arrazoiengatik.

(3). Sistemaren Teknologia

Ezabatzeko teknologiak pribatutasunaren babesa betetzen ez duten datuak ezabatzen edo babesten ditu, baina ez ditu argitaratzen.

- Maskaratzea: desensibilizazio-metodo ohikoena aipatzen da atributuaren balioa ezkutatzeko, hala nola, aurkariaren zenbakia, NAN-a izartxo batekin markatzen da edo helbidea moztuta dago.

- Tokiko ezabaketa: atributu-balio zehatzak (zutabeak) ezabatzeko prozesuari egiten dio erreferentzia, funtsezkoak ez diren datu-eremuak kenduz;

- Erregistroak ezabatzea: erregistro zehatzak (errendak) ezabatzeko prozesuari egiten dio erreferentzia, funtsezkoak ez diren datuen erregistroak ezabatzeko.

(4). Teknologia pseudonimoa

Pseudomanning zuzeneko identifikatzaile bat (edo beste identifikatzaile sentikor bat) ordezkatzeko pseudonimo bat erabiltzen duen desidentifikazio-teknika bat da. Pseudonimo-teknikek identifikatzaile bakarrak sortzen dituzte informazio-gai bakoitzarentzat, identifikatzaile zuzen edo sentikorren ordez.

- Ausazko balioak sor ditzake modu independentean jatorrizko IDarekin bat etortzeko, mapa-taula gorde eta zorrozki kontrolatu mapa-taularako sarbidea.

- Enkriptatzea ere erabil dezakezu pseudonimoak sortzeko, baina deszifratze-gakoa behar bezala mantendu behar duzu;

Teknologia hau oso erabilia da datu-erabiltzaile independente askoren kasuan, hala nola OpenID plataforma irekiko eszenatokian, non garatzaile ezberdinek Openid desberdinak lortzen dituzten erabiltzaile berarentzat.

(5). Orokortze Teknikak

Orokortze-teknikak datu-multzo batean hautatutako atributuen granulartasuna murrizten duen eta datuen deskribapen orokorrago eta abstraktuagoa eskaintzen duen desidentifikazio-teknikari egiten dio erreferentzia. Orokortze teknologia ezartzeko erraza da eta erregistro-mailako datuen benetakotasuna babestu dezake. Datu-produktuetan edo datu-txostenetan erabili ohi da.

- Biribilketa: hautatutako atributurako biribilketa-oinarri bat hautatzea dakar, hala nola, goranzko edo beheranzko forentsea, 100, 500, 1K eta 10K emaitzak emanez.

- Goiko eta beheko kodetze-teknikak: ordezkatu atalasearen gaineko (edo beheko) balioak goiko (edo beheko) maila adierazten duen atalase batekin, "X gainetik" edo "X azpitik" emaitza lortuz.

(6). Ausazkoak antolatzeko teknikak

Desidentifikazio-teknika moduko bat denez, ausazkotasun-teknologiak aleatorizazioaren bidez atributu baten balioa aldatzeari egiten dio erreferentzia, beraz, aleatorizazioaren ondoren balioa jatorrizko balio errealaren desberdina izan dadin. Prozesu honek erasotzaile batek datu-erregistro bereko beste atributu-balio batzuetatik atributu-balio bat ateratzeko duen gaitasuna murrizten du, baina ondoriozko datuen benetakotasunari eragiten dio, ohikoa dena produkzio-probaren datuekin.


Argitalpenaren ordua: 2022-09-27