数据屏蔽是匿名化的同义词,还是匿名化数据的几种方法之一?我读了很多关于它的东西,但现在我有点困惑。也许是因为人们用它作为同义词,或者它确实是。

有帮助吗?

解决方案

数据屏蔽不是数据匿名化的同义词。

数据匿名化使数据无法唯一映射到给定实体。

这是相当困难的,因为即使大多数数据匿名化技术已应用于给定的数据集,如果数据中的某些元素之间的关系仍然存在,这些数据可以与其他非匿名数据集一起使用,即使原始数据集没有直接的实体关联手段,也可以将数据与给定的实体相关联。

数据屏蔽是一种用于尝试数据匿名化的技术,特别是数据扰动类型的尝试。

用于数据匿名化的其他技术包括

  • 数据聚合(从旧数据生成新的汇总数据,从而直接或通过数据关系导致实体关联精度损失
  • 数据缩减(从数据集中删除数据,以记录为基础或以变量为基础,或通过重新编码该变量或变量组合,以确保直接或通过数据关系丢失实体关联精度)
  • 数据扰动(修改数据集中的数据)
  • 合成微数据(根据旧数据集的一些统计属性生成一个完整的新数据集,但具有完全合成的数据)

其他参考资料可供参考 这里.

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top