Wat is de technologie en oplossing voor gegevensmaskering in Network Packet Broker?

1. Het concept van gegevensmaskering

Gegevensmaskering wordt ook wel gegevensmaskering genoemd.Het is een technische methode om gevoelige gegevens zoals mobiel telefoonnummer, bankkaartnummer en andere informatie om te zetten, aan te passen of af te dekken wanneer we maskeringsregels en -beleid hebben gegeven.Deze techniek wordt vooral gebruikt om te voorkomen dat gevoelige gegevens direct in onbetrouwbare omgevingen worden gebruikt.

Principe van gegevensmaskering: gegevensmaskering moet de oorspronkelijke gegevenskenmerken, bedrijfsregels en gegevensrelevantie behouden om ervoor te zorgen dat de daaropvolgende ontwikkeling, testen en gegevensanalyse niet worden beïnvloed door maskering.Zorg voor gegevensconsistentie en validiteit voor en na maskering.

2. Classificatie van gegevensmaskering

Gegevensmaskering kan worden onderverdeeld in statische gegevensmaskering (SDM) en dynamische gegevensmaskering (DDM).

Statische gegevensmaskering (SDM): Statische gegevensmaskering vereist de oprichting van een nieuwe niet-productieomgevingdatabase voor isolatie van de productieomgeving.Gevoelige gegevens worden uit de productiedatabase gehaald en vervolgens opgeslagen in de niet-productiedatabase.Op deze manier worden de ongevoelig gemaakte gegevens geïsoleerd van de productieomgeving, wat voldoet aan de zakelijke behoeften en de veiligheid van productiegegevens garandeert.

SDM

Dynamische gegevensmaskering (DDM): Het wordt over het algemeen gebruikt in de productieomgeving om gevoelige gegevens in realtime ongevoelig te maken.Soms zijn verschillende niveaus van maskering vereist om dezelfde gevoelige gegevens in verschillende situaties te lezen.Verschillende rollen en machtigingen kunnen bijvoorbeeld verschillende maskeerschema's implementeren.

DDM

Applicatie voor gegevensrapportage en maskering van gegevensproducten

Dergelijke scenario's omvatten voornamelijk producten voor interne gegevensbewaking of billboard, gegevensproducten voor externe diensten en rapporten op basis van gegevensanalyse, zoals bedrijfsrapporten en projectevaluaties.

productmaskering voor gegevensrapportage

3. Oplossing voor gegevensmaskering

Veelgebruikte schema's voor het maskeren van gegevens zijn: ongeldigverklaring, willekeurige waarde, gegevensvervanging, symmetrische codering, gemiddelde waarde, offset en afronding, enz.

ongeldigverklaring: Invalidatie verwijst naar het versleutelen, inkorten of verbergen van gevoelige gegevens.Dit schema vervangt gewoonlijk echte gegevens door speciale symbolen (zoals *).De bediening is eenvoudig, maar gebruikers kunnen het formaat van de originele gegevens niet kennen, wat van invloed kan zijn op latere gegevenstoepassingen.

Willekeurige waarde: De willekeurige waarde verwijst naar de willekeurige vervanging van gevoelige gegevens (cijfers vervangen cijfers, letters vervangen letters en tekens vervangen tekens).Deze maskeermethode zal het formaat van gevoelige gegevens tot op zekere hoogte waarborgen en latere gegevenstoepassing vergemakkelijken.Het kan nodig zijn om woordenboeken te maskeren voor sommige betekenisvolle woorden, zoals namen van mensen en plaatsen.

Gegevensvervanging: Gegevensvervanging is vergelijkbaar met het maskeren van null en willekeurige waarden, behalve dat in plaats van speciale tekens of willekeurige waarden te gebruiken, de maskerende gegevens worden vervangen door een specifieke waarde.

Symmetrische versleuteling: Symmetrische codering is een speciale omkeerbare maskeringsmethode.Het versleutelt gevoelige gegevens door middel van coderingssleutels en algoritmen.Het cijfertekstformaat komt overeen met de oorspronkelijke gegevens in logische regels.

Gemiddeld: Het gemiddelde schema wordt vaak gebruikt in statistische scenario's.Voor numerieke gegevens berekenen we eerst hun gemiddelde en verdelen vervolgens de ongevoelige waarden willekeurig rond het gemiddelde, waardoor de som van de gegevens constant blijft.

Offset en afronding: Deze methode verandert de digitale gegevens door willekeurige verschuiving.De offset-afronding zorgt voor de geschatte authenticiteit van het bereik met behoud van de veiligheid van de gegevens, die dichter bij de echte gegevens ligt dan de vorige schema's, en is van groot belang in het scenario van big data-analyse.

ML-NPB-5660-apparaat

Het Aanbevelingsmodel "ML-NPB-5660" voor de gegevensmaskering

4. Veelgebruikte technieken voor het maskeren van gegevens

(1).Statistische technieken

Gegevensbemonstering en gegevensaggregatie

- Data sampling: De analyse en evaluatie van de originele dataset door een representatieve subset van de dataset te selecteren, is een belangrijke methode om de effectiviteit van de-identificatietechnieken te verbeteren.

- Data-aggregatie: als een verzameling van statistische technieken (zoals optellen, tellen, middelen, maximum en minimum) toegepast op attributen in microdata, is het resultaat representatief voor alle records in de originele dataset.

(2).Cryptografie

Cryptografie is een gebruikelijke methode om desensibilisatie te desensibiliseren of de effectiviteit ervan te vergroten.Verschillende soorten coderingsalgoritmen kunnen verschillende desensibilisatie-effecten bereiken.

- Deterministische codering: een niet-willekeurige symmetrische codering.Het verwerkt doorgaans ID-gegevens en kan indien nodig de cijfertekst decoderen en herstellen naar de oorspronkelijke ID, maar de sleutel moet goed worden beschermd.

- Onomkeerbare codering: de hash-functie wordt gebruikt om gegevens te verwerken, die meestal worden gebruikt voor ID-gegevens.Het kan niet direct worden ontsleuteld en de toewijzingsrelatie moet worden opgeslagen.Bovendien kan er vanwege de functie van de hash-functie een gegevensbotsing optreden.

- Homomorfe codering: het homomorfe algoritme voor gecodeerde tekst wordt gebruikt.Het kenmerk is dat het resultaat van de bewerking van gecodeerde tekst hetzelfde is als dat van de bewerking van platte tekst na decodering.Daarom wordt het vaak gebruikt om numerieke velden te verwerken, maar om prestatieredenen wordt het niet veel gebruikt.

(3).Systeem Technologie

De onderdrukkingstechnologie verwijdert of schermt data-items af die niet voldoen aan de privacybescherming, maar publiceert ze niet.

- Maskeren: het verwijst naar de meest gebruikelijke desensibilisatiemethode om de attribuutwaarde te maskeren, zoals het nummer van de tegenstander, ID-kaart is gemarkeerd met een asterisk of het adres is afgekapt.

- Lokale onderdrukking: verwijst naar het proces van het verwijderen van specifieke attribuutwaarden (kolommen), het verwijderen van niet-essentiële gegevensvelden;

- Recordonderdrukking: verwijst naar het proces van het verwijderen van specifieke records (rijen), het verwijderen van niet-essentiële gegevensrecords.

(4).Pseudonieme technologie

Pseudomanning is een de-identificatietechniek waarbij een pseudoniem wordt gebruikt om een ​​directe identificator (of andere gevoelige identificator) te vervangen.Pseudonieme technieken creëren unieke identifiers voor elk individueel informatiesubject, in plaats van directe of gevoelige identifiers.

- Het kan onafhankelijk willekeurige waarden genereren om overeen te komen met de oorspronkelijke ID, de toewijzingstabel opslaan en de toegang tot de toewijzingstabel strikt controleren.

- U kunt ook codering gebruiken om pseudoniemen te produceren, maar u moet de decoderingssleutel correct bewaren;

Deze technologie wordt veel gebruikt in het geval van een groot aantal onafhankelijke datagebruikers, zoals OpenID in het open platform-scenario, waarbij verschillende ontwikkelaars verschillende Openids verkrijgen voor dezelfde gebruiker.

(5).Generalisatie technieken

Generalisatietechniek verwijst naar een de-identificatietechniek die de granulariteit van geselecteerde attributen in een gegevensset vermindert en een meer algemene en abstracte beschrijving van de gegevens geeft.Generalisatietechnologie is eenvoudig te implementeren en kan de authenticiteit van gegevens op recordniveau beschermen.Het wordt vaak gebruikt in dataproducten of datarapporten.

- Afronding: omvat het selecteren van een afrondingsbasis voor het geselecteerde attribuut, zoals opwaarts of neerwaarts forensisch onderzoek, met als resultaat 100, 500, 1K en 10K

- Bovenste en onderste coderingstechnieken: vervang waarden boven (of onder) de drempel door een drempel die het hoogste (of onderste) niveau vertegenwoordigt, wat resulteert in "boven X" of "onder X"

(6).Randomisatie technieken

Als een soort de-identificatietechniek verwijst randomisatietechnologie naar het wijzigen van de waarde van een attribuut door middel van randomisatie, zodat de waarde na randomisatie afwijkt van de oorspronkelijke werkelijke waarde.Dit proces verkleint het vermogen van een aanvaller om een ​​attribuutwaarde af te leiden uit andere attribuutwaarden in dezelfde gegevensrecord, maar tast de authenticiteit van de resulterende gegevens aan, wat gebruikelijk is bij productietestgegevens.


Posttijd: 27 september 2022