动机

1、用户智能设备收集的数据对开发人员很重要

(1)智能设备(手机、家用电器、传感器、车辆)等已经成为了我们生活中的一部分

(2)它们收集到的数据对于开发人员是一笔宝贵的财富,例如三星的TouchWiz通过搜集用户自定义的界面信息来了解多模式(例如多窗口、单手模式)的使用情况并进行流行功能的改进

2、隐私问题导致数据收集面临困境

(1)用户不想让其他人知道自己的数据信息,例如浏览器历史、安装的应用程序等

(2)即使用户允许可信组织收集自己的数据,大量敏感的个人数据也会面临泄露的重大安全风险

(3)拥有庞大数据的组织面临两难境地:要么收集用户数据并面临隐私泄露危险,要么不收集这些数据并失去挖掘分析这些数据的机会

3、当时的本地差分隐私算法存在不足

(1)当时已提出的常用LDP算法各自都存在一些问题

【1】Duchi算法在特定情况无法满足差分隐私要求

【2】B & S算法在可能值量较小时效果不佳

【3】RAPPOR算法不能应用于机器学习任务

(2)其他的许多LDP算法在当时大多数处于理论阶段,而没有落实到应用上

技术细节

1、数值属性平均值估计前置算法:Duchi(算法1)

(1)客户端