用UiPath实现网页抓取——表格数据提取-1-单击选择分类-ISO标准化-01-综合、术语、标准化、文献目录获取

这篇具有很好参考价值的文章主要介绍了用UiPath实现网页抓取——表格数据提取-1-单击选择分类-ISO标准化-01-综合、术语、标准化、文献目录获取。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.下载前的准备

准备获取目录的链接是
全国标准信息公告服务平台链接: https://std.samr.gov.cn/search/iso?tid=&q=
uipath实现点击,UiPath,rpa

2.手动获取数据的过程

第一步,标注啊类型选择——ISO
第二步,标准化状态选择——现行
第三步,ICS分类选择——01_综合、术语标准化、文献
uipath实现点击,UiPath,rpa
uipath实现点击,UiPath,rpa
将数据分别复制到excel文件中,如下图。
由于国际标准分类号在UiPath的实际操作过程中分成了两列进行获取,所以我们在excel中设置了两列,当数据获取后再进行合并就可以了。
uipath实现点击,UiPath,rpa

3.用UiPath网页抓取

第一步,新建一个流程
uipath实现点击,UiPath,rpa
uipath实现点击,UiPath,rpa
第二步,选择使用浏览器,并选择需要获取数据的链接
uipath实现点击,UiPath,rpa
uipath实现点击,UiPath,rpa
uipath实现点击,UiPath,rpa
获取到浏览器的链接
uipath实现点击,UiPath,rpa
第三步,选择文件的分类选项
uipath实现点击,UiPath,rpa
uipath实现点击,UiPath,rpa
uipath实现点击,UiPath,rpa
uipath实现点击,UiPath,rpa

①选择点击的对象是——ISO 选择锚点是——标准类型
②选择点击的对象是——现行 选择锚点是——标准状态
③选择点击的对象是——01-综合、术语、标准化、文献 选择锚点是——标准状态
uipath实现点击,UiPath,rpa
第四步,选择表格数据提取uipath实现点击,UiPath,rpa
获取数据并重命名
uipath实现点击,UiPath,rpa

uipath实现点击,UiPath,rpa
如果要获取多个页面中的数据,选择从多个页面提取数据为是
选择下一页的按钮
uipath实现点击,UiPath,rpa
如果遇到页码和下一页按钮不能显示的问题,将谷歌中的页面放大即刻看到页码和下一页
uipath实现点击,UiPath,rpa
uipath实现点击,UiPath,rpa
点击设置,设定最大行数为多少或者最大页数为多少
uipath实现点击,UiPath,rpa

uipath实现点击,UiPath,rpa

第五步,写入范围 Workbook

uipath实现点击,UiPath,rpa
uipath实现点击,UiPath,rpa

填excel文件名和表单名
uipath实现点击,UiPath,rpa

uipath实现点击,UiPath,rpa
uipath实现点击,UiPath,rpa
uipath实现点击,UiPath,rpa
完整流程如下图
uipath实现点击,UiPath,rpa

第六步,调试文件获取目录
注意:在调试文件前关闭浏览器
uipath实现点击,UiPath,rpa
下载完成
uipath实现点击,UiPath,rpa
获取到的目录
uipath实现点击,UiPath,rpa
添加每列的标题即可
uipath实现点击,UiPath,rpa文章来源地址https://www.toymoban.com/news/detail-765187.html

到了这里,关于用UiPath实现网页抓取——表格数据提取-1-单击选择分类-ISO标准化-01-综合、术语、标准化、文献目录获取的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 如何使用 Python 爬虫抓取动态网页数据

    随着 Web 技术的不断发展,越来越多的网站采用了动态网页技术,这使得传统的静态网页爬虫变得无能为力。本文将介绍如何使用 Python 爬虫抓取动态网页数据,包括分析动态网页、模拟用户行为、使用 Selenium 等技术。 在进行动态网页爬取之前,我们需要先了解动态网页和静

    2023年04月24日
    浏览(48)
  • Puppeteer让你网页操作更简单(2)抓取数据

    Puppeteer让你网页操作更简单(1)屏幕截图】 现在您已经了解了Headless Chrome和Puppeteer的工作原理基础知识,让我们看一个更复杂的示例,其中我们实际上可以抓取一些数据。 首先,请查看此处的Puppeteer API文档。如您所见,有大量不同的方法我们可以使用不仅可以在网站上点击,还可以

    2024年01月16日
    浏览(45)
  • 小白用chatgpt编写python 爬虫程序代码 抓取网页数据(js动态生成网页元素)

    jS动态生成,由于呈现在网页上的内容是由JS生成而来,我们能够在浏览器上看得到,但是在HTML源码中却发现不了        如果不加,如果网站有防爬技术,比如频繁访问,后面你会发现什么数据都取不到 User-Agent获取地方:  网页获取位置: 使用代理IP解决反爬。(免费代理

    2024年02月01日
    浏览(63)
  • Python从一个Excel表格提取数据填到另一个表格

    本文,用Python从一个Excel表格提取数据填到另一个表格,详情代码中注释都说明了,请亲们详细查阅:

    2024年02月12日
    浏览(30)
  • python表格操作,数据提取分析的用法(2)

      之前我在博客里贴出了操作表格的代码,后面有2位粉丝私聊我说不会用啊,不知道怎么用,我听了之后就立马想出一篇如何使用的博客,谁叫我爱粉丝咧 好废话不多说,先贴出操作表格代码的地址 点这里 1)代码段 我们只需要传入表的路径和表页就能自动读取我们的数据

    2023年04月18日
    浏览(25)
  • ChatGPT实现HTML网页文本提取

    既然ChatGPT对于编程语言有非常强大的理解能力,那么它是否可以用来自动化地处理网页呢?答案是肯定的。ChatGPT可以使用机器学习算法来识别网页元素中的文本,并抽取出有用的信息。 例如我们提供一段层数比较多的相对来说较为复杂的 HTML 代码,如下图所示: 图中我们用

    2024年02月02日
    浏览(31)
  • 『爬虫四步走』手把手教你使用Python抓取并存储网页数据!

    爬虫是Python的一个重要的应用,使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据,**本文将基于爬取B站视频热搜榜单数据并存储为例,详细介绍Python爬虫的基本流程。**如果你还在入门爬虫阶段或者不清楚爬虫的具体工作流程,那么应该仔细阅读本文! 第一步:

    2024年02月04日
    浏览(42)
  • 通过Python的pdfplumber库提取pdf中表格数据

    大家好,我是空空star,本篇给大家分享一下 《通过Python的pdfplumber库提取pdf中表格数据》 。 pdfplumber是一个用于从PDF文档中提取文本和表格数据的Python库。它可以帮助用户轻松地从PDF文件中提取有用的信息,例如表格、文本、元数据等。pdfplumber库的特点包括:简单易用、速度

    2024年02月06日
    浏览(30)
  • .Net core 采集网页表格数据方法

    使用 HtmlAgilityPack 库来将 HTML 表格转换为 DataTable。 首先,确保已经安装了 HtmlAgilityPack 包。可以通过 NuGet 包管理器或者通过命令行安装。 按照以下步骤将 HTML 表格转换为 DataTable: 导入命名空间: csharp Copy Code 创建一个方法来进行转换: csharp Copy Code 调用方法进行转换: c

    2024年02月11日
    浏览(36)
  • 【EXCEL】通过url获取网页表格数据

    目录 0.环境 1.背景 2.具体操作 windows + excel2021 之前我用python的flask框架的爬虫爬取过豆瓣网的电影信息,没想到excel可以直接通过url去获取网页表格内的信息,比如下图这是电影信息界面 即将上映电影 (douban.com) 通过excel操作,将电影信息爬取到表格内,如下图 1)点击菜单栏

    2024年02月16日
    浏览(24)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包