数据隐私保护
数据隐私保护确保个人数据不被滥用或泄露,是AI数据处理的核心要求。
数据脱敏
脱敏方法
数据脱敏通过变换原始数据保护隐私:
- 掩码:部分隐藏敏感信息
- 替换:用虚构数据替换真实数据
- 泛化:降低数据精度(如年龄区间)
- 令牌化:用令牌替代敏感数据
再识别风险
脱敏数据可能通过关联分析被再识别,需要评估风险。
差分隐私
差分隐私原理
差分隐私通过向查询结果添加噪声,确保单个数据记录的存在与否不会显著影响输出,从而保护隐私。
实现方式
- 全局差分隐私:在数据发布时添加噪声
- 本地差分隐私:在数据收集时添加噪声
- 隐私预算:控制隐私损失的累积
联邦学习
联邦学习原理
数据不出本地,仅传输模型参数,保护数据隐私。
应用场景
医疗、金融等对数据隐私要求高的领域。