1. Tietojen peittämisen käsite
Tietojen peittäminen tunnetaan myös nimellä datan peittäminen. Se on tekninen menetelmä arkaluontoisten tietojen, kuten matkapuhelinnumeron, pankkikorttinumeron ja muiden tietojen muuntamiseksi, muokkaamiseksi tai peittämiseksi, kun olemme antaneet peittämäsääntöjä ja käytäntöjä. Tätä tekniikkaa käytetään ensisijaisesti arkaluontoisen tiedon estämiseksi suoraan epäluotettavissa ympäristöissä.
Tietojen peittämisperiaate: Tietojen peittämisen tulisi ylläpitää alkuperäisiä dataominaisuuksia, liiketoimintasääntöjä ja tietojen osuvuutta varmistaakseen, että maskinta ei vaikuta myöhempaan kehitykseen, testaamiseen ja tietoanalyysiin. Varmista tietojen johdonmukaisuus ja pätevyys ennen ja jälkeen peittämisen.
2. Tietojen peittämisluokitus
Tietojen peittäminen voidaan jakaa staattiseen tietojen peittämiseen (SDM) ja dynaamiseen datan peittämiseen (DDM).
Staattinen tietojen peittäminen (SDM): Staattinen tietojen peittäminen vaatii uuden ei-tuotantoympäristötietokannan perustamista tuotantoympäristöstä eristämistä varten. Arkaluontoiset tiedot poistetaan tuotantotietokannasta ja tallennetaan sitten ei-tuotantotietokantaan. Tällä tavoin herkistetty tieto on eristetty tuotantoympäristöstä, joka vastaa liiketoiminnan tarpeita ja varmistaa tuotantotietojen turvallisuuden.
Dynaaminen datan peittäminen (DDM): Sitä käytetään yleensä tuotantoympäristössä herkän tiedon herkistämiseen reaaliajassa. Joskus tarvitaan erilaisia peittämisasteita saman arkaluontoisen tiedon lukemiseksi eri tilanteissa. Esimerkiksi erilaiset roolit ja käyttöoikeudet voivat toteuttaa erilaisia peittämisjärjestelmiä.
Dataraportointi ja datatuotteiden peittämissovellus
Tällaiset skenaariot sisältävät pääasiassa sisäisiä tietojen seurantatuotteita tai mainostaulua, ulkoisia palvelutietotuotteita ja data -analyysiin perustuvia raportteja, kuten liiketoimintaraportteja ja projektikatsausta.
3. Tietojen peittämisratkaisu
Yleisiä tietojen peittämisjärjestelmiä ovat: mitätöinti, satunnainen arvo, tietojen korvaaminen, symmetrinen salaus, keskiarvo, siirto ja pyöristäminen jne.
Mitätöinti: Väittymä viittaa arkaluontoisten tietojen salaukseen, katkaisuun tai piiloon. Tämä kaavio korvaa yleensä todelliset tiedot erityisillä symboleilla (kuten *). Operaatio on yksinkertainen, mutta käyttäjät eivät voi tietää alkuperäisen datan muotoa, mikä voi vaikuttaa myöhempiin data -sovelluksiin.
Satunnaisarvo: Satunnaisarvo viittaa arkaluontoisten tietojen satunnaiseen korvaamiseen (numerot korvaavat numerot, kirjaimet korvaavat kirjaimet ja merkit korvaavat merkit). Tämä peittämismenetelmä varmistaa arkaluontoisten tietojen muodon tietyssä määrin ja helpottaa seuraavaa data -sovellusta. Joillekin merkityksellisille sanoille, kuten ihmisten nimille, ja paikkojen nimille voidaan tarvita peitettäviä sanakirjoja.
Tiedonsiirto: Tiedonkorvaus on samanlainen kuin nolla- ja satunnaisarvojen peittäminen, paitsi että erikoismerkkien tai satunnaisarvojen käytön sijasta peitetiedot korvataan tietyllä arvolla.
Symmetrinen salaus: Symmetrinen salaus on erityinen palautuva peittämismenetelmä. Se salaa arkaluontoisia tietoja salausavaimien ja algoritmien avulla. Salamerkki -muoto on yhdenmukainen alkuperäisten tietojen kanssa loogisissa säännöissä.
Keskimäärin: Keskimääräistä järjestelmää käytetään usein tilastollisissa skenaarioissa. Numeeristen tietojen osalta lasketaan ensin niiden keskiarvo ja jaamme sitten satunnaisesti desensibilisoidut arvot keskiarvon ympärille pitäen siten datavakion summan.
Ja pyöristäminen: Tämä menetelmä muuttaa digitaalista tietoa satunnaisvaihdosta. Offset -pyöristäminen varmistaa alueen likimääräisen aitouden säilyttäen samalla tietojen turvallisuutta, joka on lähempänä todellista tietoa kuin aiemmat järjestelmät, ja sillä on suuri merkitys isotietoanalyysin skenaariossa.
Suosittelen malli "ML-NPB-5660"Tietojen peittämistä varten
4. Yleisesti käytetyt tiedon peittämistekniikat
(1). Tilastot
Tietojen näytteenotto ja tietojen yhdistäminen
- Tietojen näytteenotto: Alkuperäisen tietojoukon analysointi ja arviointi valitsemalla tietojoukon edustava osajoukko on tärkeä menetelmä tunnistamistekniikoiden tehokkuuden parantamiseksi.
- Tietojen yhdistäminen: Tilastollisten tekniikoiden kokoelmana (kuten summaus, laskenta, keskiarvo, maksimi ja minimi), jota käytetään mikrotietojen määritteisiin, tulos edustaa kaikkia alkuperäisen tietojoukon tietueita.
(2). Sala
Salaus on yleinen menetelmä desensibilisaation tehokkuuden herkkimiseksi tai parantamiseksi. Erityyppiset salausalgoritmit voivat saavuttaa erilaisia herkistämisvaikutuksia.
- deterministinen salaus: ei-satunnainen symmetrinen salaus. Se käsittelee yleensä ID -tietoja ja voi purkaa ja palauttaa salauksen tekstin alkuperäiseen tunnukseen tarvittaessa, mutta avain on suojattava asianmukaisesti.
- Peruuttamaton salaus: Hash -toimintoa käytetään tietojen käsittelyyn, jota käytetään yleensä ID -tietoihin. Sitä ei voida suoraan purkaa ja kartoitussuhde on pelastettava. Lisäksi hash -toiminnon ominaisuuden vuoksi tiedon törmäys voi tapahtua.
- Homomorfinen salaus: Käytetään salausteksti homomorfista algoritmia. Sen ominaispiirteet ovat, että salaustekstitoiminnan tulos on sama kuin selkeän tekstin operaation salauksen jälkeen. Siksi sitä käytetään yleisesti numeeristen kenttien käsittelemiseen, mutta sitä ei käytetä laajasti suorituskyvyn syistä.
(3). Järjestelmätekniikka
Tukistusteknologia poistaa tai suojaa tietokohteita, jotka eivät täytä yksityisyyden suojaa, mutta eivät julkaise niitä.
- Masking: Se viittaa yleisimpaan desensibilisointimenetelmään, jolla voidaan peittää ominaisuusarvo, kuten vastustajan numero, ID -kortti on merkitty tähdellä tai osoite on katkaistu.
- Paikallinen tukahduttaminen: viittaa tiettyjen ominaisuusarvojen (sarakkeiden) poistamiseen, välttämättömien tietokenttien poistamiseen;
- Tallentaa tukahduttaminen: viittaa tiettyjen tietueiden (rivien) poistamiseen, ei-välttämättömien tietorekisterien poistamiseen.
(4). Salanimitekniikka
Pseudomanning on tunnistamistekniikka, joka käyttää salanimeä suoran tunnisteen (tai muun herkän tunnisteen) korvaamiseen. Salanimitekniikat luovat yksilöllisiä tunnisteita jokaiselle yksittäiselle tietolle suorien tai tiiviiden tunnisteiden sijasta.
- Se voi tuottaa satunnaisarvoja itsenäisesti vastaamaan alkuperäistä tunnusta, tallentaa kartoitustaulukko ja hallita tiukasti kartoitustaulukon pääsyä.
- Voit myös käyttää salausta salanimien tuottamiseen, mutta sinun on pidettävä salauksenpinta -avain oikein;
Tätä tekniikkaa käytetään laajasti suuressa määrässä riippumattomia tiedon käyttäjiä, kuten OpenID avoimen alustan skenaariossa, jossa eri kehittäjät saavat erilaisia OpenID -tuotteita samalla käyttäjälle.
(5). Yleistämistekniikat
Yleistymistekniikalla tarkoitetaan tunnistustekniikkaa, joka vähentää tietojoukossa valittujen ominaisuuksien rakeisuutta ja tarjoaa tietojen yleisemmän ja abstraktin kuvauksen. Yleistämistekniikka on helppo toteuttaa ja se voi suojata tietueiden tietojen aitoutta. Sitä käytetään yleisesti datatuotteissa tai dataraporteissa.
- Pyöristäminen: Sisältää valitun ominaisuuden pyöristämispohjan valitsemisen, kuten ylöspäin tai alaspäin ja alaspäin, saadaan tuloksia 100, 500, 1K ja 10k
- Ylä- ja alakoodaustekniikat: Korvaa arvot yläpuolella (tai alapuolella) kynnysarvo kynnyksellä, joka edustaa ylätasoa (tai alhaalta), mikä tuottaa tulosta "yläpuolella x" tai "alle x"
(6). Satunnaistamistekniikat
Eräänlaisena tunnistamistekniikkana satunnaistamistekniikka viittaa attribuutin arvon muuttamiseen satunnaistamisen kautta siten, että satunnaistamisen jälkeen oleva arvo eroaa alkuperäisestä todellisesta arvosta. Tämä prosessi vähentää hyökkääjän kykyä saada attribuuttiarvo muista attribuutin arvoista samassa tietorekisterissä, mutta vaikuttaa tuloksena olevan tiedon aitouteen, mikä on yleistä tuotantotestitietojen kanssa.
Viestin aika: SEP-27-2022