《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记

这篇具有很好参考价值的文章主要介绍了《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Question

MEC使能的IoT能够解决物联网中时延敏感/计算敏感服务的需要

Contribution

  1. 提出cache-aided MEC卸载框架,允许用户将计算任务卸载到边缘服务器上。
  2. 该框架的目标是最小化计算卸载和资源分类配的系统时延,将系统建模为部分可观测马尔可夫过程的多智能体决策问题。
  3. 提出基于深度图卷积强化学习(deep graph convolution reinforcement learning, DGRL)的方法解决问题。算法使用GNN抓取节点之间的相关性并输入到深度Q网络中进行资源分配决策优化。
  4. 对比仿真,基于DGRL的CA-MEC卸载算法性能良好。

Related works

  • Resource Allocation for Communication, Computing, and Caching
references method
[16] 基于深度Q网络的卸载算法
[27] 双边匹配和凸优化方法
[28] 基于深度学习长短期记忆模型的计算卸载优化算法
[29] 基于基因模拟退火的粒子群算法
  • Reinforcement Learning in Resource Management
references category method
[18] 单智能体 基于深度确定策略梯度(DDPG)的计算卸载、资源分配和服务缓存优化方法
[17] 基于asynchronous advantage actor–critic (A3C)的3C资源优化方法
[9] 基于带有回放记忆的DQN的资源优化算法
[31] 基于DRL的联合计算卸载与资源分配优化算法
[32] 多智能体 基于MADDPG的任务调度与资源分配优化算法
[33] GAT辅助的MARL资源管理算法
[34] 基于带有注意力机制的多智能体actor-critic方法
  • Graph Neural Network in Resource Management
references method
[24] GCN + counterfactual multiagent policy gradient (COMA)-based的通信架构
[39] 使用GCN构建基于DRL信道分配算法
[40] 使用GNN实现可扩展信道分配算法
[41] 无人机中用于增加资源利用率的基于GCN的MARL方法

System model

network architecture

《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记

communication model

用有限马尔可夫信道(FSMC)建模信道资源情况
信道数据传输率:
《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
信道容量:
用Z来表示, Z=[Z1e, …, ZMe]

computing model

定义计算状态al,i:表示i号任务是否在第l个MEC服务器上执行。
《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
本地计算时间Tl,0
《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
边缘计算总时间Tl,1: 上行卸载传输时间+计算时间+下行返回结果传输时间
《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记

caching model

定义缓存状态xi,j:表示编号为j的任务数据是否缓存到第i个服务器上,若为1表示缓存,否则不缓存。
定义用户请求某个任务的概率ql,k:表示第l个用户请求第k个任务的概率。用户请求某个任务的概率服从Zipf分布:
《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
一个任务可以被划分成多任务,若一部分的任务数据被缓存到某个边缘服务器上,那么该任务在卸载时只需要卸载部分数据即可, β \beta β是比例系数,代表需要卸载的数据比例,下式为计算卸载的时延:
《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
此时系统的总时延T可以被表示为:
《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
其中,先由计算决策变量a确定在本地还是MEC上执行,若在MEC上执行,再由缓存决策变量x决定是否缓存某个任务数据,若不缓存则全部卸载,若缓存则部分卸载。

Problem formulation

Optimization Objective

《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记

J是对用户请求任务的时延求期望
C1是对信道容量的限制
C2是对信道干扰的限制
C3是对计算能力的限制
C4是对缓存能力的限制

problem formulation

每个agent只能观测到系统的部分信息,所以建模为POMDP。

  • State: t 时刻的状态向量为st = {hl,i, ql,k} 一个是信道增益,一个是用户请求任务概率。
  • Observation: oi,t代表网络中节点i在t时刻观测的信息。
  • Action: t 时刻的动作向量为at={pl,i(t), al,i(t)},前者为传输功率决策,后者为计算卸载决策。
  • State transition probability: t 时刻从状态st转移到st+1的概率为p(st+1|st,at)。
  • Reward
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
    文章使用deep Q-learning学习最大化未来累积奖励G的最优策略:
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记

DGRL-Based Resource Allocation Algorithm

《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
上图为多智能体网络架构,分为三部分:

  1. Environment Observation Layer
    M个智能体的环境被建模成一个图,在t 时刻,第i个节点观测到动态环境的信息,生成观测空间O(t)为
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
    其中,Z为每个agent的空闲信道容量,F为每个agent的空闲计算资源,C为每个agent的空闲缓存空间,Q为当前时刻接收到的用户请求,X为上一时刻缓存情况。
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
    该观测值O通过多层感知机MLP被编码成特征向量hi,t:
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
  2. Topological Relationship Learning Layer
    上一步编码的特征向量hi,t作为输入进入图卷积网络中,生成隐藏特征,再经过一层卷积层扩大感受野,学习到其他智能体的信息。在该层中,经过了多头注意力机制抓取网络拓扑信息,获得节点相似度特征向量,再通过MLP将其编码为状态,输入到Q网络中进行策略学习。
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
  3. Deep Q-Network Layer:
    Q值更新函数如下:
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
    优化损失函数如下:其中y代表目标网络
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
    算法流程如下图:
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记

Simulation results

  • 参数表
    RL网络参数:
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
    仿真参数:
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记

  • 对比方法:
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记

  • 结果对比

  1. 不同折扣因子对收敛性能的影响
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
  2. 不同算法的收敛性能
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
  3. 不同算法下任务大小对总时延的影响
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
  4. 不同算法下计算能力大小对总时延的影响
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
  5. 不同算法下存储能力大小对总时延的影响
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记
  6. (可扩展分析)固定MEC服务器数量,查看不同数量的用户对总时延的影响
    《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记

7.(可扩展分析)固定用户数量,查看不同数量的MEC server对总时延的影响
《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记,笔记,物联网,笔记

Conclusion

研究了联合缓存、通信、计算资源分配的优化问题,提出CA-MEC卸载框架,建模问题为POMDP并使用DGRL方法求解。

——————————————————————————————————————
参考文献:
[1] D. Wang, Y. Bai, G. Huang, B. Song and F. R. Yu, “Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning,” in IEEE Internet of Things Journal, vol. 10, no. 13, pp. 11486-11496, 1 July1, 2023, doi: 10.1109/JIOT.2023.3244909.文章来源地址https://www.toymoban.com/news/detail-788233.html

到了这里,关于《Cache-Aided MEC for IoT: Resource Allocation Using Deep Graph Reinforcement Learning》阅读笔记的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【已解决】微信小程序编译后白屏(The resource was preloaded using link preload but not used within a few seconds ...)

    事情发生在重装微信小程序开发者工具后。。。微信小程序编译后白屏,控制台报错: 对比之前开发工具的设置,发现不知何时手残多打了一个勾: 使用独立域进行调试 去掉后,正常了。。。 白屏挺常见的,原因也是千奇百怪,此解决方法仅限此原因。。。

    2024年02月08日
    浏览(126)
  • Gtk Unable to load resource for composite template

    在使用 GNOME Builder 构建应用时,设 gnome_semilab_window 为应用主窗口,实现在 gnome-semilab-window.c 中;设 gsp_create_project_widget 为主窗口上的一个子组件,实现在 gsp-create-project-widget.c 中,插入到主窗口的 GUI 中。两个模块各自使用了 GtkBuilder XML UI 文件。在子组件文件中,定义子组件

    2024年02月12日
    浏览(56)
  • 解决oracle死锁,生产问题,ORA-00060: deadlock detected while waiting for resource,

    目录 项目场景: 问题描述 原因分析: 解决方案: 其他解决方案: oracle 数据库在做大量的批量更新同一张表数据。 早上来公司去生产环境查grelog日志,发现ERROR日志,点进去看后报如下错误: 从错误的中一看就知道oracle 数据库发生了死锁。去生产的log日志查看,发现同一

    2024年02月17日
    浏览(40)
  • Reinventing Energy Management for IoT Devices: Techniqu

    作者:禅与计算机程序设计艺术 物联网(IoT)已经成为当今社会发展的一股新力量。从个人生活到商业领域,无处不在的物联网设备已然成为各行各业中的基础设施,但它们也带来了新的复杂性——这就要求它们对能源管理进行重新设计。而对于嵌入式系统来说,能源管理是

    2024年02月07日
    浏览(36)
  • Using Natural Language Processing for Sentiment Analysi

    作者:禅与计算机程序设计艺术 Sentiment analysis is a widely studied and practical technique to extract subjective information from text data such as reviews, social media posts, online comments etc. It has many applications including customer feedback analysis, brand reputation management, product recommendation systems, marketing efforts, and

    2024年02月08日
    浏览(44)
  • Ethereum Using Zero Knowledge Proofs for Anonymousity

    作者:禅与计算机程序设计艺术 Ethereum是一个基于区块链的分布式计算平台,它支持开发者创建自己的去中心化应用程序(dApps)。同时,Ethereum还有一个功能叫做零知识证明(ZKP),这使得Ethereum可以用来实现匿名加密货币。所以,本文将通过具体操作一步步带领读者构建一个

    2024年02月07日
    浏览(37)
  • axios无法加载响应数据:no data found for resource with given identifier

    美好的、令人遐想的日落黄昏里,出现了诡异的bug! 老师上课的时候,不好好听听,不仔细看!那么花了那么多时间找bug问题~翻了好多方案,还未解决,然后遇到了我,这个大冤种就是你(也包括我*~*)!!!  猜想了好多种方案,其中一度被pass的解决方案既然是原因!!

    2024年02月03日
    浏览(49)
  • 无法加载响应数据no data found for resource with given identifier报错解决

    第一种:跨域问题 跨域的解决办法很多,这里不作阐述; 第二种:数据库被锁定,导致长时间未返回结果; 问题描述: 无法加载响应数据no data found for resource with given identifier 生产环境项目实施人员反馈到开发组,有一个用户登录不进去,但是其它用户可以正常登录; 排查

    2024年02月01日
    浏览(48)
  • 【深度学习】WaveMix: A Resource-efficient Neural Network for Image Analysis 论文

    论文:https://arxiv.org/abs/2205.14375 代码:https://github.com/pranavphoenix/WaveMix 我们提出了WaveMix——一种新颖的计算机视觉神经架构,既资源高效,又具有泛化性和可扩展性。WaveMix网络在多个任务上实现了与最先进的卷积神经网络、视觉Transformer和token mixer相当或更好的准确性,为C

    2024年02月15日
    浏览(48)
  • ingress-http部署error: resource mapping not found for name...no matches for kind “Ingress“ in version

    根据一些参考文档,学习部署 ingress-http 服务,出现了一些error信息,网上难找直接的处理方式,最后才发现是资源清单使用问题,还是得看官方文档说明。 创建ingress-http.yaml 使用的基本yaml配置如下—— 部署ingress服务 出现error信息 错误一: 处理方式—— 根据 官方文档:

    2024年02月06日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包