深度学习15-讨论通用的Web导航和浏览器自动化的实际应用。

这篇具有很好参考价值的文章主要介绍了深度学习15-讨论通用的Web导航和浏览器自动化的实际应用。。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


### Web导航

▪  讨论通用的Web导航和浏览器自动化的实际应用。
▪  探索如何通过RL方法解决Web导航问题。
▪  深入研究由OpenAI实现的一个非常有趣但常被忽略且被抛弃的RL基准,称为比特迷你世界(Mini World of Bits,MiniWoB)。

RL浏览器自动化的潜在实际应用很有吸引力,但有一个非常严重的缺点:这类任务复杂度太高,无法用于研究和方法比较。实际上,实现完整的网页抓取系统可能需要团队花费数月的时间,并且大多数问题不会与RL直接相关,例如数据收集、浏览器引擎通信、输入和输出表示以及很多真实生产系统开发涉及的其他问题。

最重要的参数如下:
▪  remotes:可以是数字或字符串。如果将其指定为数字,则它将给出环境需要启动的本地容器的数量。如果是字符串,此参数可以以vnc://host1:port1+port2, host2:port1+port2的形式指定环境需要连接的已运行容器的URL。第一个端口是VNC协议端口(默认为5900)。第二个端口是奖励器守护进程的端口(默认为15900)。可以在Docker容器启动时重新指定这两个端口。
▪  fps:用于提供智能体观察的预期每秒帧数(FPS)。
▪  vnc_kwargs:该参数必须是一个字典,带有额外的VNC协议参数,用于定义压缩级别和要传输给智能体的图像的质量。这些参数对于性能来说非常重要,尤其是对于在云中运行的容器而言。

**docker参数的含义如下:**
1)-d在分离模式下启动容器。为了能够查看容器的日志,可以将此选项替换为-t。在这种情况下,容器将以交互方式启动,并可以按Ctrl + C停止。
2)-p SRC_PORT:TGT_PORT将源端口从容器的主机转发到容器内的目标端口。此选项使你可以在一台计算机上启动多个MiniWoB容器。每个容器都会在5900端口上启动VNC服务器,并在15900端口上启动奖励器守护进程。参数-p 5900:5900使VNC服务器在主机(运行容器的计算机)的5900端口上启动。对于第二个容器,你应该传递-p 5901:5900,这使其在5901端口上启动,而不是在已占用的5900端口上启动。奖励器也是如此:在容器内部,它监听15900端口。通过提供-p选项,你可以将连接从主机端口转发到容器的端口。
3)--privileged允许容器访问主机的设备(MiniWoB启动时使用此选项可能是因为有一些VNC服务器有需要)。
4)--ipc host使容器能够与主机共享进程间通信(IPC)命名空间。
5)--cap-add SYS_ADMIN扩展了容器的能力,以执行主机设置的扩展配置。
6)<CONTAINER_ID>是容器的标识符。在这里是shmuma/miniwob:v2,它是原始quay.io/openai/universe.world-of-bits:0.20.0的修订版本。关于MiniWoB的稳定性见16.2.4节。
7)<ARGS>使你可以将额外的参数传递给容器以更改其操作模式。稍后我们将需要用它来记录人类演示。目前,它可以为空。

可以尝试以下几项:
▪  通过噪声单击来测试演示的鲁棒性。
▪  使用演示数据对A3C价值输出端进行训练。
▪  实现更复杂的鼠标控制,例如将鼠标向左/右/上/下移动N个像素。
▪  使用一些预训练的OCR网络(或自己训练的!)从观察中提取文本信息。
▪  选择其他环境并尝试解决它们。里面存在一些非常棘手和有趣的问题,例如通过拖放操作对条目进行排序或使用复选框重复给定的模式。
▪  研究来自斯坦福大学NLP Group的MiniWoB++(https://stanfordnlp.github.io/miniwob-plusplus/)。它将需要学习和编写新的包装器。如前所述,Selenium被用于浏览器,而不是使用带VNC和容器的Universe方法。
▪  另一个具有挑战性的问题是使用Q-learning来解决MiniWoB任务。文章来源地址https://www.toymoban.com/news/detail-433436.html

到了这里,关于深度学习15-讨论通用的Web导航和浏览器自动化的实际应用。的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 一.Winform使用Webview2(Edge浏览器核心) 创建demo(Demo1)实现回车导航到指定地址

    往期相关文章目录 专栏目录 WinForms 应用中的 WebView2 入门 按照官方文档一路操作,可以自行百度或者查看WinForms 应用中的 WebView2 入门。为了避坑,本人安装的时vs2022(visual studio 以下简称vs) 打开vs(visual studio 以下简称vs) 点击 创建新项目 ,选择 C# Windows 窗体应用 (.NET Framework

    2024年02月21日
    浏览(34)
  • 在opensuse15.4leap中安装许多解码器让火狐浏览器firefox播放网页视频

    在opensuse15.4leap中安装许多解码器让火狐浏览器firefox播放网页视频 实际难题: 在opensuse15.2和15.3leap中安装flash-player、ffmpeg-4、gstreamer-plugins和vlc-codecs就能让火狐浏览器firefox播放酷狗、网易云音乐、优酷、哔哩哔哩网站的视频,但在opensuse15.4却是不能播放视频,提示:“没有找

    2023年04月23日
    浏览(34)
  • web浏览器脚本的调试

    水一贴。 在浏览器中按F12 点击\\\"source\\\"或者\\\"源程序\\\" 点击html、js、css等源码文件所在的窗口的左边,此时点击处显示为蓝色光标,表示断点中断已经设置完毕。 配合窗口右上角的\\\"继续\\\" “下一步” \\\"跳过\\\"等控制按钮,即可完成对网页源码的调试。

    2024年02月14日
    浏览(41)
  • 微软账户0x80070520错误,edge浏览器“无法使你登录,错误代码3、15 1067”,office登录失败

    edge错误代码3、15 1067 win10设置里登录微软账户报0x80070520错误 解决方法: 删除(系统盘):Users(用户名)AppDataLocalMicrosoftWindows下 UsrClass.dat文件,并从default用户同位置复制一个过来,注销账户重新登陆 这会将视觉样式重置,但是可以解决登录微软账户异常,激活office和同

    2024年02月11日
    浏览(29)
  • web浏览器打开本地exe应用

    浏览器打开本地exe程序我们可以使用ActiveXObject方法,但是只支持IE,谷歌、火狐等浏览器并不支持此操作。 那问题来了,我们又该如何操作? 经过本博主的不断学习探索终于找到了一条,像百度网盘那样打本地exe应用的办法。我们可以通过添加注册表. 向系统添加一个类似于

    2024年02月13日
    浏览(32)
  • web3 :开源区块链浏览器调研

    2024年01月25日
    浏览(33)
  • web大前端面试——浏览器、网络和安全

    (1).DNS解析 当我们在浏览器中输入一个域名的时候,例如www.mi.com,这个域名只是与IP地址的一个映射,这时DNS解析就要充当一个翻译的角色,把域名解析成真实的IP地址。所以DNS解析的过程实际上就是将域名还原成真实IP地址的过程。 DNS的解析又分为以下几个步骤: 1.浏览器会

    2024年02月03日
    浏览(36)
  • 【读书笔记】《白帽子讲web安全》浏览器安全

    目录 第二篇 客户端脚本安全 第2章 浏览器安全 2.1同源策略 2.2浏览器沙箱 2.3恶意网址拦截 2.4高速发展的浏览器安全 近年来随着互联网的发展,人们发现浏览器才是互联网最大的入口,绝大多数用户使用互联网的工具是浏览器。(颇具年代感的开卷语) “浏览器天生就是一

    2024年02月03日
    浏览(31)
  • 03 Web全栈 浏览器内置对象/事件/ajax

    浏览器是一个JS的运行时环境,它基于JS解析器的同时,增加了许多环境相关的内容,用一张图表示各个运行环境和JS解析器的关系如下: 我们把常见的,能够用JS这门语言控制的内容称为一个JS的运行环境,常见的运行环境又Nodejs,浏览器,小程序,一些物联网设备等等,所

    2024年02月11日
    浏览(35)
  • 如何在Web浏览器中运行JavaScript代码

    为大家介绍如何在Web浏览器中运行JavaScript代码。 首先,让我们来了解一下JavaScript是什么。JavaScript是一种编程语言,它广泛用于Web开发中,可以让我们在网页上添加动态效果、交互性和动画等等。如果你想在Web浏览器中运行JavaScript代码,你需要先在浏览器中安装JavaScript引擎

    2024年02月16日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包