【文件属性】:
文件名称:Data-Masking
文件大小:1.58MB
文件格式:ZIP
更新时间:2021-03-13 11:35:43
Python
数据脱敏
不同的数据脱敏算法根据专有保护类型可以分为数据失真技术,数据加密技术,限制公开技术。
数据失真
优势,差分优势
超越
早期技术的数据替代技术是基于线性变换的一种技术,不需要对分段进行复杂操作,通常具有较高的运行效率。
差分优势
数据集D和数据集D'有相同的数据结构,经过差分函数的变换,使D-> D'的查询有相似的结果。即通过对D'的查询来对D进行脱敏。
数据加密
置换
置换
处理数据时建立置换表,按照表中的规则进行映射,通过使用查询替换表来对数据进行加密。
限制公开
K-匿名,L-多样性
K-匿名
泛化处理数据表中的准标识符属性,以防止敌手使用准标识符属性把特定的个体与其他k-1个个体区分开来,其核心思想是保证数据集中有关准标识符的k条记录在同一个集合内,集合内记录为同一个等价类,从而降低某些特定个体被识别出的概率。
L-多样性
L-多样性模型通过减少相同等价类中的不同种类数量来