数据隐私保护

数据隐私保护确保个人数据不被滥用或泄露,是AI数据处理的核心要求。

数据脱敏

脱敏方法

数据脱敏通过变换原始数据保护隐私:

  • 掩码:部分隐藏敏感信息
  • 替换:用虚构数据替换真实数据
  • 泛化:降低数据精度(如年龄区间)
  • 令牌化:用令牌替代敏感数据

再识别风险

脱敏数据可能通过关联分析被再识别,需要评估风险。

差分隐私

差分隐私原理

差分隐私通过向查询结果添加噪声,确保单个数据记录的存在与否不会显著影响输出,从而保护隐私。

实现方式

  • 全局差分隐私:在数据发布时添加噪声
  • 本地差分隐私:在数据收集时添加噪声
  • 隐私预算:控制隐私损失的累积

联邦学习

联邦学习原理

数据不出本地,仅传输模型参数,保护数据隐私。

应用场景

医疗、金融等对数据隐私要求高的领域。

----