【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励

这篇具有很好参考价值的文章主要介绍了【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励
先上一幅Swarm Learning 的架构图镇楼

引文114 An Incentive Compatible Reputation Mechanism(worker直接博弈)

我们想干什么?

我们希望实现激励的可协调,也就是让每个节点可以可信地分享reputation的信息
我们引进可转移支付方案,让节点可信地共享reputation信息
我们还通过密码学的方法整合reputation信息

目前的一些问题

1.如果节点报告reputation信息,别人就会掌握有利的信息,从而对自己不利
2.如果反馈真实的正反馈reputation,节点会由于其余节点的average降低自己的reputation,同时也造成了对稀缺资源的更多需求(我的理解是:reputation比较高的话,别人会认为这个节点可靠,从而向其进行交易需求等)
3.如果反馈虚假的负反馈,节点可以增加自己的reputation,同时减少对稀有资源的需求,所以大家倾向提供虚假信息

我们的目标

我们希望设计一个博弈论模型来让一个理性的节点愿意去分享真实的reputation信息

模型设计

【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励

祭上一个囚徒困境的图

我们希望让每一个节点觉得报告真实的信息是有利益的

在我们的机制中,我们引入一个R-agents,负责购买和销售reputation 信息
在博弈游戏中,两个节点要么选择合作要么选择欺骗
游戏双方开始游戏前可以协商合同,但合同不具备强制性

一个节点的行为预测怎么量化?

1.先验类型(固定的概率) =》 innate
2.这个节点的前k次动作 =》 mood

DEF 1

【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励
这里的意思是在时间t某个节点何合作的可能性公式

关于R-agent

每个节点可以从R-agent处以F的价格买reputation信息,也可以以F‘的价格卖reputation信息
节点只能够卖出一些它们买入的其他节点的reputation信息

当两个节点要开始游戏前,它们需要支付给R-agent钱来询问对方的reputation
注意,买reputation的钱和游戏中获得的钱不通用
如果一个node用完了它买reputation的钱,就不能再买

完整的流程

1.两个节点随机组合
2.通过R-agent询问reputation
3.决定是否玩游戏
4.若同意玩,进入协商合约阶段
5.若同意合约,开始玩游戏
6.游戏中,可以记录对方的信用,从而生成报告给R-agent

为什么说是激励可协调的呢?

因为我们的支付函数可以诱使节点公布诚实的reputation信息
由于我们不能保证从R-agent那里获取的reputation的正确性,我们的支付函数依赖于未来的情况

payment function的定义

【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励
小s是A对B的report
大S是后续其他节点的B的reports
他可以证明,如果A说真话(真实的s)可以使得它的收益最大化

TH1

若节点的gamma函数不依赖于之前的actions,那么没有支付函数可以有效诱使诚实的行为
【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励

由于A的诚实概率(reputation)不受之前行为的影响,所以是恒定的
所以它的大S(未来的reports)可以认为和目前是完全一致的S = Sc = Sd

【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励
因此说真话肯定不可能总是有好处
这个要看pi(C,S) and pi(D,S)的大小决定~

这个结果令人震惊,因为很多reputation系统都是只关注先验类型对行为的影响

我们的一个想法

【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励

R-agent只有当下一次关于B的report:S和之前A的report:s相同的时候,才会支付给A报酬F’

TH2

如果满足Def1和Eq2,那么报告真实的reputation信息就是一个纳什均衡
which means, 如果下一个节点讲真话, ‘我’也最好讲真话

概率证明:B在连续两次动作中采用相同的概率大于等于0.5
这个Eq2只能保证系统前期交互的安全的

还有一些问题:Eq2中的支付函数需要引入一些节点行为参数才可以保证长期稳定~~

Th3

【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励
【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励
两个概率指的是假设连续在t时间干了X行为的条件下t+1时间还是保持X行为的概率是大于5成的话
Eq2总会诱使它们交出真实的reputation报告

【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励

条件:A观察到B是正常的合作
如果它诚实报告1的收益期望就是E[pi(1,S)]
然后根据B下一次可能的行为展开条件概率求和就可以得到一头一尾

注意:我们假设下一个汇报B者是诚实的

小结:让节点都倾向说真话

我们这里采用两阶段假设和证明,表明了在模型的前期和后期都会让各个节点倾向于说真话

引文114的一些问题

R-agent变成blockchain node可行吗?(负责买卖?不能以明文记录reputation)

分开game 的money 和reputation的money有什么好处?

引文74 结合reputation和契约理论的中心化激励(reputation由task publisher整合)

主要工作

1.worker selection based on reputation可防止不可靠的模型更新
2.使用多权重主观逻辑模型计算reputation然后用联盟链存reputation
3.基于契约理论的激励机制促进高reputation的worker拥有高quality数据来参与训练防止攻击
4.实验表明这个方案很好很精确。。。

基于联盟链的可信联邦学习模型图

【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励
worker:本地数据集、本地模型训练、生成本地模型、计算资源Fn
task publisher:分配task、计算每个worker提供的模型质量、生成reputation、reputation上链
reputation是评估worker可靠性的重要因素:综合direct reputation和在链上记录的最近几次的indirect reputation计算

step1: task publishers发布FL的任务和合约条款,有相关的数据类型、大小和精确度、时间和CPUT的要求。如果workers觉得可以满足就加入任务,然后给予回应给task publisher

step2:基于direct的reputation和存在链上的indirect的reputation得到综合的reputation;reputation的计算是某种加权平均(交互的效果、交互的新鲜度 =》 direct)(跟其他recommender的worker相似度 =》 indirect)

step3:选出reputation大于某个阈值的作为worker,worker根据他们的条件选择一个最优的合同项进行签署

step4:开始进行FL,然后评估各个worker更新的本地模型

通过两个攻击检测算法评估模型

1.Reject on Negative Influence(RONI)投毒检测方案(IID),通过比较包含剔除某个本地模型,如果加入这个本地模型后,总体表现下降超过一定阈值,则拒绝这个本地模型

2.FoolsGold方案(non IID)通过某个本地模型的梯度更新差异来识别不可靠的worker,由于non-IID 的梯度变化遵循一定的分布函数,如果worker重复上传相似度高的梯度就会被检测出来

基于上述两个方案,task publishers可以移除不可靠节点,然后用联邦平均更新模型
训练完成后,每个可靠的worker根据之前签订合约中的内容,获取与资源贡献模型训练行为对等的奖励

恶意节点的交互会被task publishers记录下来

step5:更新联盟链中的reputation,task publishers更新direct的reputation,这些reputation会被workers数字签名从而不可抵赖(应该是合约中签订的),然后这些reputation提供给以后的task publishers作为indirect参考

对可靠的FL的激励机制

原则:鼓励high-reputation high-quality data的worker加入模型训练

task publisher 发放 reward 的困难

1.task publisher 由于缺乏先验知识并不知道哪些worker希望加入到训练中
2.对于task publisher而言,worker的reputation和data quality是未知的
3.task publisher也不知道worker的可用计算资源和数据量

1、2、3 =》 task publisher在给worker激励的时候会有太多的消耗
因此,本文设计了基于契约理论激励机制

A:worker在一次迭代中的CPU消耗
B:worker在一次迭代中的通信消耗
C:worker按照数据质量进行分级
D:task publisher对type-n worker一次迭代花费时间的满意度函数

因此,由于有了契约理论,恶意节点是不会签署比他等级要高的合约的(否则拿不到奖励)
从而也可以激励高质量的节点加入FL中

引文74的一些问题

reward min?max?sum?(worker应该怎么选择合同签署,具体奖励如何分配?)

pre-set reward 放到 smart contract可行吗?(pre-set reward指的是契约中约定的奖励)

合约里面包括digital signature?(让reputation绑定具体的worker)

每个等级的合同的钱怎么设计?(不同数据质量的奖励梯度如何划分?)

一开始的reputation不确定,worker selection都是基于一定的reputation基础的(初始阶段怎么判断?)文章来源地址https://www.toymoban.com/news/detail-411510.html

到了这里,关于【激励机制】一种去中心化和中心化的reputation的博弈论自洽激励的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 中心化交易所和去中心化交易所优势分别在哪

    块链资产数字货币的特征:去中心化、无修改法式、分布式机制等。目前市场数字货币交易所涵盖中心化和去中心化两种。目前市场上交易所大部分为去中心化,区块链的精神理念就是去中心化,并且去中心化交易所安全系数不高,不安全。中心化交易所被盗的风险系数高,

    2024年02月16日
    浏览(60)
  • Multichain跨链无法到账,DApp真去中心化or伪去中心化?

    团队出问题,DApp就用不了,multichain被不少人质疑伪去中心化,甚至更有人开始质疑web3,那么这到底是怎么回事呢? 跨链桥问题让DApp的去中心化引发质疑 事情是这样的,5月24下午0xscope发推称与multichain有关的钱包地址将3.17M 的MULTI转入到gateio,而此前DC用户反馈自己的跨链资

    2024年02月08日
    浏览(69)
  • 去中心化模型

    文章目录 前言 一、去中心化是什么? 二、比特币如何实现去中心化 三、去中心化优点及意义 总结 比特币引用了一个去中心化的模型,这个模型有何意义? 在说“货币”时,我们讨论的是数字世界中的价值表示。而在互联网上的数字世界中,人们曾设计出各种各样的电子现

    2023年04月09日
    浏览(43)
  • Rollup去中心化

    前序博客有: Rollup Decentralization 所有Rollup项目的目标应为: 构建技术栈 将运营和治理去中心化,并交给社区 从而可实现去中心化世界。“去中心化”一词激发了一种开放、无许可的理念,以及一大批具有更快乐哲学的参与者。 大多数L1区块链系统都是从 Honest Majority 诚实的

    2024年02月08日
    浏览(56)
  • 去中心化身份一般见解

    DID现在一般是”去中心化身份“(Decentralized Identity)的简称,它是一种没有中心化机构做最终担保的数字身份,是Web2”用户画像“概念在Web3的延伸和拓展. DID相关的赛道主要分应用场景、身份、凭证三层。凭证层是DID的构成组件,身份层是DID的具体形态,应用场景层是DID的

    2024年01月21日
    浏览(45)
  • 去中心化 分布式

    简单记录一下对“去中心化”和“分布式”的理解 分布式(decentralized)是一种网络拓扑结构,提出了很久并且应用很广泛。它的节点是分散的,但可以有中心也可以去中心。很显然的例子,爱奇艺为了保证播放体验,它的播放网络是分布式的,但是它是一种中心化服务。 去

    2024年02月11日
    浏览(35)
  • 什么是去中心化?

    去中心化是一种现象或结构,其只能出现在拥有众多用户或众多节点的系统中,每个用户都可连接并影响其他节点。通俗地讲,就是每个人都是中心,每个人都可以连接并影响其他节点,这种扁平化、开源化、平等化的现象或结构,称之为“去中心化”。 Wikipedia、Flickr、Bl

    2024年02月11日
    浏览(42)
  • 什么是去中心化

    为什么去中心化成为当下热议的话题 当今社会,随着科技的迅猛发展,人们对于中心化与去中心化的辩论愈发激烈。但是,为什么去中心化成为了当下热议的话题呢?本文将探讨这一问题,并解析去中心化的重要性。 去中心化可以提高系统的安全性。历史上的许多中心化系

    2024年01月17日
    浏览(54)
  • 去中心化联邦学习思想

    去中心化联邦学习是一种保护用户隐私的分散式机器学习方法。与集中式联邦学习相比,去中心化联邦学习更加注重保护用户数据隐私,同时也更具有扩展性和健壮性。 在去中心化联邦学习中,每个设备都使用本地数据进行模型训练,并将模型更新发送给周围的邻居设备。这

    2024年02月05日
    浏览(39)
  • 高可用架构去中心化重要?

    在互联网高可用架构设计中,应该避免将所有的控制权都集中到一个中心服务,即便这个中心服务是多副本模式。 对某个中心服务(组件)的过渡强依赖,那等同于把命脉掌握在依赖方手里,依赖方的任何问题都可能成为你不稳定的因素。 而 弱化强依赖,实现可降级交互,

    2024年01月17日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包