这段时间有项目在进行,所以对斯坦福Dan Boneh密码学的阅读进度有所放缓,之后会继续更新,这段时间对当前机器学习领域隐私保护的方向做了一点小总结。
近年来,隐私保护机器学习的研究方向大致可以分为三类:
一是以k-匿名为代表的基于等价类的方法。
二是以差分隐私为代表的基于数据失真的方法。
三是以安全多方计算、同态加密、秘密共享、函数加密为代表的密码学方法。
匿名化是最早提出的隐私保护技术,其中应用较多的-匿名方法,要求发布的数据在准标识符上存在至少条不可区分的记录,使攻击者不能判断特定信息所属的具体个体。-匿名在一定程度可以保护数据隐私,但也降低了数据的可用性。
差分隐私是基于数据失真的隐私保护技术,通过注入噪声,使得增加或删除一条数据记录的操作对输出的影响不可区分,保证数据集中个体的隐私。目前已有差分隐私机器学习算法上的工作,大多是通过在训练过程中注入噪声来实现差分隐私。常见的有三种:目标函数扰动、输出扰动、梯度扰动。一般噪声越大隐私保护度越高,数据的实用性越小。
采用密码学技术来解决机器学习中的隐私问题,是研究者们最为关注的主流技术。近年来,基于同态加密、安全多方计算、函数加密等密码学技术纷纷应用于隐私保护计算领域。
这里面我觉得函数加密这版块的内容是相对比较难的,现有的文献资料也相对比较少。
——函数加密到底是什么鬼?
——Boneh等人在2011年的理论密码学会上正式提出函数加密(Functional Encryption)概念。一个函数加密方案包含四个多项式时间的算法:系统设置算法、密钥生成算法、加密算法和解密算法。在系统设置算法中,输入系统安全参数,输出系统公钥mpk和主密钥msk;在密钥生成算法中,输入msk和函数f的描述,输出函数f相应的解密私钥skf;在加密算法中,输入明文m,输出密文c;在解密算法中,输入密文c和函数解密私钥skf,输出函数值f(m)。特别地,解密私钥skf的拥有者不能得到除函数值f(m)和明文长度之外的任何信息。文章来源:https://www.toymoban.com/news/detail-413794.html
更为一般的函数加密,是能够对密文实施选择性计算的,也就是说,解密只是恢复明文的部分信息,此时f(m)¹ m。近年来,函数加密成为密码学研究领域的热点。国内外学者对函数加密展开了大量的研究,主要集中在函数表达能力、安全性、扩展功能以及应用四个方面。文章来源地址https://www.toymoban.com/news/detail-413794.html
到了这里,关于机器学习-隐私保护总览的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!