用UiPath实现网页抓取——表格数据提取-1-单击选择分类-ISO标准化-01-综合、术语、标准化、文献目录获取

1年前作者：椰子的代码世界分类：Toy博客阅读(12)违法举报

这篇具有很好参考价值的文章主要介绍了用UiPath实现网页抓取——表格数据提取-1-单击选择分类-ISO标准化-01-综合、术语、标准化、文献目录获取。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1.下载前的准备

准备获取目录的链接是
全国标准信息公告服务平台链接: https://std.samr.gov.cn/search/iso?tid=&q=
uipath实现点击,UiPath,rpa

2.手动获取数据的过程

第一步，标注啊类型选择——ISO
第二步，标准化状态选择——现行
第三步，ICS分类选择——01_综合、术语标准化、文献
uipath实现点击,UiPath,rpa

将数据分别复制到excel文件中，如下图。
由于国际标准分类号在UiPath的实际操作过程中分成了两列进行获取，所以我们在excel中设置了两列，当数据获取后再进行合并就可以了。

3.用UiPath网页抓取

第一步，新建一个流程
uipath实现点击,UiPath,rpa

第二步，选择使用浏览器，并选择需要获取数据的链接

获取到浏览器的链接

第三步，选择文件的分类选项

①选择点击的对象是——ISO 选择锚点是——标准类型
②选择点击的对象是——现行选择锚点是——标准状态
③选择点击的对象是——01-综合、术语、标准化、文献选择锚点是——标准状态
uipath实现点击,UiPath,rpa
第四步，选择表格数据提取
获取数据并重命名

uipath实现点击,UiPath,rpa
如果要获取多个页面中的数据，选择从多个页面提取数据为是
选择下一页的按钮

如果遇到页码和下一页按钮不能显示的问题，将谷歌中的页面放大即刻看到页码和下一页

点击设置，设定最大行数为多少或者最大页数为多少
uipath实现点击,UiPath,rpa

uipath实现点击,UiPath,rpa

第五步，写入范围 Workbook

uipath实现点击,UiPath,rpa

填excel文件名和表单名
uipath实现点击,UiPath,rpa

uipath实现点击,UiPath,rpa

完整流程如下图

第六步，调试文件获取目录
注意：在调试文件前关闭浏览器
uipath实现点击,UiPath,rpa
下载完成

获取到的目录

添加每列的标题即可
文章来源地址https://www.toymoban.com/news/detail-765187.html

到了这里，关于用UiPath实现网页抓取——表格数据提取-1-单击选择分类-ISO标准化-01-综合、术语、标准化、文献目录获取的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

如何使用 Python 爬虫抓取动态网页数据
随着 Web 技术的不断发展，越来越多的网站采用了动态网页技术，这使得传统的静态网页爬虫变得无能为力。本文将介绍如何使用 Python 爬虫抓取动态网页数据，包括分析动态网页、模拟用户行为、使用 Selenium 等技术。在进行动态网页爬取之前，我们需要先了解动态网页和静
2023年04月24日
浏览(27)
Puppeteer让你网页操作更简单(2)抓取数据
Puppeteer让你网页操作更简单(1)屏幕截图】现在您已经了解了Headless Chrome和Puppeteer的工作原理基础知识,让我们看一个更复杂的示例,其中我们实际上可以抓取一些数据。首先,请查看此处的Puppeteer API文档。如您所见,有大量不同的方法我们可以使用不仅可以在网站上点击,还可以
2024年01月16日
浏览(10)
小白用chatgpt编写python 爬虫程序代码抓取网页数据(js动态生成网页元素)
jS动态生成，由于呈现在网页上的内容是由JS生成而来，我们能够在浏览器上看得到，但是在HTML源码中却发现不了如果不加，如果网站有防爬技术，比如频繁访问，后面你会发现什么数据都取不到 User-Agent获取地方：网页获取位置：使用代理IP解决反爬。（免费代理
2024年02月01日
浏览(14)
Python从一个Excel表格提取数据填到另一个表格
本文，用Python从一个Excel表格提取数据填到另一个表格，详情代码中注释都说明了，请亲们详细查阅：
2024年02月12日
浏览(9)
python表格操作，数据提取分析的用法（2）
之前我在博客里贴出了操作表格的代码，后面有2位粉丝私聊我说不会用啊，不知道怎么用，我听了之后就立马想出一篇如何使用的博客，谁叫我爱粉丝咧好废话不多说，先贴出操作表格代码的地址点这里 1）代码段我们只需要传入表的路径和表页就能自动读取我们的数据
2023年04月18日
浏览(8)
ChatGPT实现HTML网页文本提取
既然ChatGPT对于编程语言有非常强大的理解能力，那么它是否可以用来自动化地处理网页呢？答案是肯定的。ChatGPT可以使用机器学习算法来识别网页元素中的文本，并抽取出有用的信息。例如我们提供一段层数比较多的相对来说较为复杂的 HTML 代码，如下图所示：图中我们用
2024年02月02日
浏览(11)
『爬虫四步走』手把手教你使用Python抓取并存储网页数据！
爬虫是Python的一个重要的应用，使用Python爬虫我们可以轻松的从互联网中抓取我们想要的数据，**本文将基于爬取B站视频热搜榜单数据并存储为例，详细介绍Python爬虫的基本流程。**如果你还在入门爬虫阶段或者不清楚爬虫的具体工作流程，那么应该仔细阅读本文！第一步：
2024年02月04日
浏览(21)
通过Python的pdfplumber库提取pdf中表格数据
大家好，我是空空star，本篇给大家分享一下《通过Python的pdfplumber库提取pdf中表格数据》。 pdfplumber是一个用于从PDF文档中提取文本和表格数据的Python库。它可以帮助用户轻松地从PDF文件中提取有用的信息，例如表格、文本、元数据等。pdfplumber库的特点包括：简单易用、速度
2024年02月06日
浏览(10)
【EXCEL】通过url获取网页表格数据
目录 0.环境 1.背景 2.具体操作 windows + excel2021 之前我用python的flask框架的爬虫爬取过豆瓣网的电影信息，没想到excel可以直接通过url去获取网页表格内的信息，比如下图这是电影信息界面即将上映电影 (douban.com) 通过excel操作，将电影信息爬取到表格内，如下图 1）点击菜单栏
2024年02月16日
浏览(12)
.Net core 采集网页表格数据方法
使用 HtmlAgilityPack 库来将 HTML 表格转换为 DataTable。首先，确保已经安装了 HtmlAgilityPack 包。可以通过 NuGet 包管理器或者通过命令行安装。按照以下步骤将 HTML 表格转换为 DataTable：导入命名空间： csharp Copy Code 创建一个方法来进行转换： csharp Copy Code 调用方法进行转换： c
2024年02月11日
浏览(10)