Вопрос

Является ли маскирование данных синонимом анонимизации или одним из нескольких методов анонимизации данных?Я много читал об этом, но теперь немного запутался.Возможно, это потому, что люди используют это слово как синоним, или это действительно так.

Это было полезно?

Решение

Маскирование данных не является синонимом анонимизации данных.

Анонимизация данных делает данные такими, что их невозможно однозначно сопоставить с данным объектом.

Это довольно сложно, потому что даже после того, как большинство методов анонимизации данных были применены к данному набору данных, если связи между определенными элементами в данных сохраняются, их можно использовать в сочетании с другими неанонимизированными наборами данных для связи данных с данным объектом, даже когда исходный набор данных не имеет прямых средств для ассоциации объектов.

Маскирование данных — это метод, используемый для попытки анонимизации данных, в частности, попытки типа искажения данных.

Другие методы, используемые при анонимизации данных, включают:

  • Агрегация данных (создание новых сводных данных из старых данных, что приводит к потере точности связи объектов как напрямую, так и через связи данных).
  • Сокращение данных (удаление данных из набора данных либо на основе записей, либо на основе переменных, либо путем перекодирования этой переменной или комбинации переменных, чтобы гарантировать потерю точности ассоциации объектов как напрямую, так и через связи данных)
  • Возмущение данных (изменение данных в наборе данных)
  • Синтетические микроданные (генерация совершенно нового набора данных на основе некоторых статистических свойств старого набора данных, но с полностью синтетическими данными)

Доступны дополнительные ссылки здесь.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top