说点人话的强化学习:如何显示当前训练的环境,openai gym不显示画面,env.render()不显示画面,CartPole不显示画面

这篇具有很好参考价值的文章主要介绍了说点人话的强化学习:如何显示当前训练的环境,openai gym不显示画面,env.render()不显示画面,CartPole不显示画面。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

在早期版本gym中,调用env.render()会直接显示当前画面,但是现在的新版本中这一方法无效。现在有一下几种方法显示当前环境和训练中的画面:

1. render_model = "human"

env = gym.make("CartPole-v1", render_mode = "human")

显示效果:

说点人话的强化学习:如何显示当前训练的环境,openai gym不显示画面,env.render()不显示画面,CartPole不显示画面,说点人话的强化学习,python,开发语言,人工智能,深度学习,pytorch

 文章来源地址https://www.toymoban.com/news/detail-646570.html

问题:

该设置下,程序会输出所有运行画面。但是这一步会带来一个问题,因为画面渲染需要时间,导致训练变的非常慢。强化学习的前期是一个一直试错的部分,显然我们并不是每次都想花费时间去观察模型试错,并且多数时候我们想要观察我们想观察的训练阶段。对此我们可以使用下一个方法;

2. render_model = "rgb_array"

env = gym.make("CartPole-v1", render_mode = "rgb_array")

该方法会让env.render()返回一个 rgb_array, 这一rgb_array 表示当前step下的环境画面,当我们需要显示的时候可以使用cv2来进行渲染。方法如下:

# RGB 转化为BGR, cv2显示格式为BGR
img = cv2.cvtColor(env.render(), cv2.COLOR_RGB2BGR)

# 显示画面,test为窗口名称
cv2.imshow("test",img)

# 给cv2一定时间完成渲染,否则无法显示
cv2.waitKey(1)

显示效果如下:

说点人话的强化学习:如何显示当前训练的环境,openai gym不显示画面,env.render()不显示画面,CartPole不显示画面,说点人话的强化学习,python,开发语言,人工智能,深度学习,pytorch

 

到了这里,关于说点人话的强化学习:如何显示当前训练的环境,openai gym不显示画面,env.render()不显示画面,CartPole不显示画面的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 通用人工智能之路:什么是强化学习?如何结合深度学习?

    2015年, OpenAI 由马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得·蒂尔等硅谷科技大亨创立,公司核心宗旨在于 实现安全的通用人工智能(AGI) ,使其有益于人类。 ChatGPT 是 OpenAI 推出的一个基于对话的原型 AI 聊天机器人,2022年12 月 1

    2024年02月16日
    浏览(56)
  • 深度强化学习与人工智能:如何实现高效的资源分配

    深度强化学习(Deep Reinforcement Learning, DRL)是一种人工智能技术,它结合了深度学习和强化学习两个领域的优点,以解决复杂的决策问题。在过去的几年里,DRL已经取得了显著的成果,例如在游戏、机器人控制、自动驾驶等领域的应用。在资源分配方面,DRL可以帮助企业更有效地

    2024年02月21日
    浏览(69)
  • 强化学习与物联网2.02:如何结合物联网2.02技术

    作者:禅与计算机程序设计艺术 《强化学习与物联网2.02:如何结合物联网2.02技术》 1.1. 背景介绍 随着物联网的快速发展,各种设备和传感器可以将实时数据发送到云端进行处理和分析,为企业和人们提供更加智能化的服务和便利。然而,在物联网的发展过程中,安全和隐私

    2024年02月08日
    浏览(44)
  • 如何将强化学习应用于网络安全领域,提高系统的安全性与可靠性

    作者:禅与计算机程序设计艺术

    2024年02月12日
    浏览(49)
  • Element Ui中图片预览功能,点击当前图片显示当前图片。

    #应用场景# 1.页面显示出现多张图片时,需要点击查看预览 2.需要点击当前图片就显示当前图片,点击下一张上一张功能不受影响 #实现思路# 1.使用Element Ui中的图片预览API previewSrcList,可以显示点击预览效果,但是无法做到实时根据当前点击的图片显示预览当前的图片 2.解决方

    2024年04月22日
    浏览(37)
  • VUE实时显示当前时间

            做大屏页面的时候要求在页面上加上当前时间,实现此功能的写法有很多种,我的源码如下,各位拿了直接用就行(根据自己的需求修改下样式): 页面效果:  

    2024年02月11日
    浏览(40)
  • 说点理论-什么叫TED背景

    指technology, entertainment, design在英语中的缩写,即技术、娱乐、设计的3个首字母缩定。 TED背景的投影最小为4米*4米,大的有IMAX宽影幕布来打投影。给人感觉为:非常技术、非常高大上、非常专业、非常Fashion。 因此,头部一些公司会专门对于非常重要类的技术、IT业务在对社会

    2024年02月11日
    浏览(26)
  • 【机器学习】强化学习 (一)强化学习简介

    一、强化学习简介 1.1 问题定义 1.2 马尔可夫决策过程 举例说明马尔可夫决策过程 例1: 例2: 执行动作的策略 强化学习的目标是让智能体通过不断尝试,找到最优的策略(policy),即在每个状态下选择什么动作,以最大化累积的奖励。强化学习的常见算法有: Q学习(Q-lea

    2024年01月20日
    浏览(43)
  • 【前端】JQ实时显示当前日期、时间、星期

    效果图 html JS

    2024年02月10日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包