开放隐私计算
编者按
数据要素的流通共享与协同应用是数字时代中数据要素市场培育的核心内容,数据安全共享技术能够有效实现数据的安全共享,避免“数据孤岛”现象、隐私泄露事件等.本文对国内外数据安全共享技术研究成果及进展进行了全面综述.首先,概述了数据安全共享技术的发展与演进历程,然后从技术特点、解决问题、优缺点等方面对比分析了现有数据安全共享解决方案,并总结了其依赖的关键技术及面临的风险挑战;其次,讨论了数据安全共享技术在电力能源交易、电力物联网、电动汽车等能源电力领域典型场景的应用,为能源电力领域数据合规与治理提供新的思路与启示;最后,展望了数据安全共享技术在能源电力领域应用的未来研究方向及发展前景.(本文较长,请读者朋友们耐心阅读,谢谢!)
目录
1.数据安全共享技术发展与演进
1.1大数据与数据安全共享技术
1.2数据安全共享技术的发展演进历程
1.2.1基于云服务的数据安全共享技术
1.2.2基于分布式技术的数据安全共享技术
1.2.3基于区块链的数据安全共享技术
1.2.4基于联邦学习的数据安全共享技术
2.数据安全共享关键技术
2.1基于隐私计算的数据安全共享技术
2.1.1基于联邦学习的数据安全共享技术
2.1.2基于安全多方计算的数据安全共享技术
2.1.3基于可信执行环境的数据安全共享技术
2.1.4基于差分隐私的数据安全共享技术
2.2基于区块链的数据安全共享技术
2.3基于云环境的数据安全共享技术
2.3.1基于数据审计技术的数据安全共享技术
2.3.2基于属性加密的数据安全共享技术
3.数据安全共享技术风险与挑战
3.1基于隐私计算的数据安全共享面临的风险与挑战
3.2基于区块链的数据安全共享面临的风险与挑战
3.3基于云环境的数据安全共享面临的风险与挑战
4.数据安全共享技术在能源电力领域的应用
4.1数据安全共享技术在能源电力交易中的应用
4.2数据安全共享技术在电力物联网中的应用
4.3数据安全共享技术在电动汽车中的应用
4.4数据安全共享技术在电费结算中的应用
5.总结与展望
余晗、宋继勐(国家电网有限公司大数据中心)
梁音、李何筱、奚溪、原洁璇(华北电力大学控制与计算机工程学院)
2020年,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,数据作为一种新型生产要素正式写入中央文件.数据要素的高效配置,是保证数据安全流通、推动数字经济发展的关键一环.2022年12月,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》,提出构建数据基础制度体系,建立保障权益、合规使用的数据产权制度.从国家顶层设计角度,党中央国务院发布多项政策措施逐步对数据要素各环节提出细致的目标和要求,为推动数据流通共享、进一步发展数字经济指明了方向.
现阶段,数据要素的安全流通共享面临着严峻的数据安全挑战:一方面缺乏能够兼顾数据安全合规和数据共享的合作机制与技术路径,无法消除数据主体之间对秘密泄露风险、利益分配等方面的信任鸿沟;另一方面由于黑灰产的存在加大了数据共享保护成本,也提高了数据共享技术难度,隐私保护等问题为不同主体的数据安全共享带来新威胁.随着数据要素流通共享的快速发展和数据安全共享风险不断扩大,数据安全共享技术相关研究也不断涌现,如区块链、隐私计算等新技术.本文重点整理了新兴的数据安全共享关键技术,介绍了数据安全共享技术的发展与演进,并从不同维度阐述当前数据安全共享的热门解决方案,总结分析当前数据安全共享技术存在的风险与挑战,从用例设计角度阐述数据安全共享技术在能源电力领域典型场景的应用情况,并提出了方向性的总结与展望.
01
数据安全共享技术发展与演进
1.1大数据与数据安全共享技术
2019年,中国信通院发布的《数据资产管理实践白皮书4.0》给出定义:数据共享管理主要是指开展数据共享和交换,实现数据内外部价值的一系列活动;贵阳市第十三届人民代表大会常务委员会第四十八次会议通过的《贵阳市政府数据共享开放条例》中的相关定义为:政府数据共享是指行政机关因履行职责需要使用其他行政机关的政府数据或者为其他行政机关提供政府数据的行为.综上所述,数据共享是组织内部因履行职责、开展相关业务需要使用内部数据的行为.其主要目的是打破组织内部壁垒,消除数据孤岛,提高运营效率.目前已有的研究工作尚未对数据的安全共享进行明确的定义和描述,在借鉴上述数据共享相关定义[1]的基础上,本文认为数据的安全共享是在数据共享的基础上增加了安全要求,主要是针对固有网络框架下数据所呈现出的各类属性进行采集、存储、处理等相关联的操作,保证数据在整个过程中不会产生数据泄露与丢失的风险.
1.2数据安全共享技术的发展演进历程
最早期的数据共享是通过电子邮件等信息软件进行传递,需要共享数据通常以文档的形式保存,缺乏保护数据安全的机制.其次文档在双方之间来回发送,每次文件的上传和下载都必须等待很长时间,导致共享效率低[2].2006年,云服务技术的出现引起了数据共享的革命性转变,基于云服务技术和分布式技术的数据共享开始占据主流.2008年,随着区块链技术的出现,一些研究团队开始将区块链技术与密码学技术结合,实现数据的安全共享.2016年,谷歌提出了一种名叫联邦学习(federated learning, FL)的框架[3]用于保护数据隐私.由于区块链技术在多个方面与联邦学习技术有着很强的共性、互补性和契合度,目前已有许多学术研究将区块链集成于联邦学习中进行数据安全共享.现阶段,区块链与联邦学习技术逐渐成熟,基于区块链和联邦学习的数据安全共享技术已成为当下的研究热点之一.
1.2.1基于云服务的数据安全共享技术
基于云服务的数据共享主要指通过云中心来辅助物联网设备进行数据共享.2012年,Xu等人[4]在原有的加密基础上提出了一种无证书的代理重加密方案,确保公共云上的数据安全共享.2018年,Elhoseny等人[5]为物联网的医疗保健应用提出一种混合云物联网(cloud IoT)模型来处理和分析不同来源的传感器数据,无需人工干预.2020年,王岽[6]设计了一个基于云服务的医疗共享平台.该平台主要使用加密方法来保证共享数据安全,但数据共享传输的是明文数据并且由第三方保管密钥.
1.2.2基于分布式技术的数据安全共享技术
针对中心式系统存在的问题,开始出现利用分布式技术来进行数据共享的系统.数据分别备份在多个服务器中,处于分布式网络中的每个节点都具有独立的计算资源,因此可以进行局部应用和整个网络的全局应用计算[7].早在2003年,Ng等人[8]就提出基于P2P(peer to peer)的分布式数据共享系统,可随时进行数据共享.2017年,Jonathan等人[9]提出了一种分布式数据存储技术dataClay,以安全、简单的方式与外部参与者进行数据共享.
在上述关于云服务技术和分布式技术的数据共享研究中,数据与持有者分离以委托第三方进行数据管理.然而,第三方管理机构并不是完全值得信任,仍存在共享数据被泄露的风险.
1.2.3基于区块链的数据安全共享技术
2008年,一种分布式账本技术(distributed ledger technology, DLT)区块链随着比特币一同问世[10].区块链被认为是计算范式的第5次颠覆式创新[11],受到了各界的广泛关注与研究.2016年,Sun等人[12]提出了一种利用区块链技术实现共享服务的模型.McConaghy 等人[13]提出一个去中心化的数据仓库BigchainDB,然而该解决方案缺少对系统的安全性分析与讨论.2017年,Zikratov等人[14]系统地研究了在去中心化环境下使用区块链来存储和共享文件的方案,首次利用区块链实现了数据的完整性.同年,Shafagh等人[15]提出了一种基于区块链的细粒度数据访问控制和共享的方案,该方案中用户拥有数据的完全持有权.2019年,Muzammal等人[16]首次提出了一种基于区块链的、去中心化的、防篡改的数据库系统.该方案将数据库与区块链技术相结合,高效检索分布式数据.张超等人[17]提出了一种基于联盟链的医疗系统,该系统使用实用拜占庭容错算法,能够有效防止数据泄露和篡改.2020年,Al Zahrani等人[18]基于区块链与数据即服务的概念DAAS(data as a service)提出一种基于订阅的数据共享模型.
综上所述,现有基于区块链的数据共享方案大多把工作重点瞄准解决云存储的安全问题或者区块交易数据本身的完整性问题,却忽视了数据共享过程中数据的主权定义问题.基于区块链系统的数据共享不仅需要在技术层面上有所创新和突破,更要考虑法律、行业实践等多方面的约束问题.
1.2.4基于联邦学习的数据安全共享技术
联邦学习技术是一种新兴的分布式机器学习范式,由于其利用分布式的模型推断代替传统的源数据共享,可降低数据隐私泄露风险,受到学术界和产业界的重点关注.2021年,Elayan等人[19]提出了一种基于深度学习网络的联邦学习框架以实现分布式医疗保健系统,该框架维护用户隐私并提出一种自动采集训练数据的算法.Yang等人[20]提出一种基于联邦学习的电网数据安全共享模型,确保网格数据共享的安全性和可行性.
当前,一些研究团队开始将区块链集成于联邦学习中进行物联网的数据共享.Qu等人[21]提出一种基于区块链的联邦学习(FL Block)方案,区块链的PoW(proof of work)共识机制使各方共同维护和协调全局模型的聚合过程.Chai等人[22]提出一种分层区块链架构来记录联邦学习模型以减少存储消耗,在分层区块链架构上提出一种分层联邦学习算法以提高训练精度.
联邦学习中“bring the code to the data”的基本思路给了业界对于数据共享交换的另一种思路[23].数据存储在各持有机构的安全边界中,而不再作为共享交换的调度单位,通过调度计算的代码和应用到数据持有机构的安全边界中来达成“数据不出库”情况下的数据共享交换过程.由于数据始终处于持有机构可控的范围之内,能够有效避免在第三方存储中心和网络链路传输过程中的数据隐私泄露风险.
02
数据安全共享关键技术
随着公众隐私保护意识的崛起和数据安全法规的逐步建立,数据安全共享问题进一步得到重视.目前数据安全共享技术主要用于隐私计算、区块链技术、云环境等,以下进行总结和分析.
2.1基于隐私计算的数据安全共享技术
以下介绍联邦学习、安全多方计算、可信执行环境和差分隐私这4种隐私计算的核心技术.图1展示了基于隐私计算的数据安全共享技术:
2.1.1基于联邦学习的数据安全共享技术
基于分布式场景,在多个节点上的数据集构建训练机器学习模型,可用于防止数据泄露,保护用户隐私[24].不平衡数据分布和设备诚实可靠性是联邦学习在数据安全共享过程中考虑的主要因素[25].联邦学习利用差分隐私向数据添加噪声,或使用泛化技术来模糊某些敏感属性等方法,可以实现数据安全共享传输.这些方法仍然需要将数据传输到各个分布式节点中,这种情况下需要在信息的准确性和隐私之间进行权衡.文章来源:https://www.toymoban.com/news/detail-738626.html
联邦学习使得各个分布式参与方无需传输本地敏感数据,将模型参数数据进行信息共享,减少由于大量数据而增加的计算复杂性,可以将集中计算分配给参与共享数据的分散实体,实现了不同数据拥有方在不交文章来源地址https://www.toymoban.com/news/detail-738626.html
到了这里,关于深度长文 | 数据安全共享技术发展综述及在能源电力领域应用研究的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!