无论查询是什么,两个相邻的数据库返回的结果总是近似的。
要达到数据的差分隐私有四种方法:
1.输出结果变换
2.输入查询变换
3.中间值变换
4.抽样和聚合数据
本文接下来主要介绍输出结果变换的方法,这种方法主要针对查询结果是数值或者数值向量的情况,通过加入噪声使输出结果达到ε-DP。
输出结果变换:加入噪声
在差分隐私中,防止隐私泄露的重要因素是在查询结果中加噪音,对于数值的查询结果,一种常见的方法就是对结果进行数值变换。要解释如何加入噪音,我们先看一下图8的这个例子:假如某公司公开了数据,并且对外提供了查询数据的接口f(x),针对不同的查询x,服务器都会输出一个查询结果f(x)+噪声,加入噪声就是为了保证ε-差分隐私。
那么如何选择噪声呢?
差分隐私方法中,作者巧妙地利用了拉普拉斯分布的特性,找到了合适的噪声方法。针对数值或向量的查询输出,M(x)=f(x)+噪声。我们能得出以下结论: