linux系统下如何部署selenium爬虫程序

这篇具有很好参考价值的文章主要介绍了linux系统下如何部署selenium爬虫程序。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

随着互联网时代的到来,越来越多的企业热衷于通过大数据比对的方法获取一些有价值的行业信息,进而增加自己的企业竞争力。如何获取或者大面积收集有用的行业信息,是每一个数据公司都要考虑的事情。linux系统下部署selenium做网页爬虫,可以顶几十上百个人工采集数据。linux系统做爬虫方案也被越来越多的企业接受。

下面我就聊一聊怎么把selenium 爬虫程序部署到Linux 服务器上面 。
linux系统下如何部署selenium爬虫程序
一、selenium是什么?

Selenium其实就是一个用于Web应用程序测试的一个工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样, 数据抓取用它来爬取一些js动态加载的数据非常方便快捷。

二、具体使用步骤

1、引入库

代码如下

1 from selenium.webdriver import Chrome

2 from selenium.webdriver.chrome.service import Service

3 from selenium.webdriver.chrome.options import Options # 使用无头浏览器

4 from selenium.webdriver import ChromeOptions

5 chrome_options = Options()

6 options = ChromeOptions()

7 options.add_experimental_option(‘excludeSwitches’, [‘enable-automation’]) # =>去掉浏览器正在受到自动测试软件的控制

8 options.add_experimental_option(‘useAutomationExtension’, False)

9 chrome_options.add_argument(“–headless”) # => 为Chrome配置无头模式

10 chrome_options.add_argument(‘–no-sandbox’)

11 chrome_options.add_argument(‘–disable-gpu’)

12 chrome_options.add_argument(‘–disable-dev-shm-usage’)

2、测试代码

代码如下:

1 s = Service(r"/home/driver/chromedriver")

2 driver = Chrome(

3 service=s, options=chrome_options

4 )

5 driver.get(“百度一下,你就知道”)

6 print(diiver.title)

三、部署程序

1、安装chrome

命令如下:

1 yum install https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm

2 检查chrome的版本

3 google-chrome --version

2、安装chromedriver驱动

命令如下:

1 按照对应的chrome版本下载chromedriver驱动

2 地址: https://npm.taobao.org/mirrors/chromedriver

3 目前测试的版本号是: 96.0.4664.45

4 wget https://npm.taobao.org/mirrors/chromedriver/96.0.4664.45/chromedriver_linux64.zip

5 yum install -y unzip zip

6 unzip chromedriver_linux64.zip # 解压zip文件

7 mkdir driver #新建文件夹用来存放驱动

8 chmod 777 driver/chromedriver # 这是权限 这里我分配的是 777

3、运行测试代码

新建test.py文件

1 vi test.py
linux系统下如何部署selenium爬虫程序
保存 test.py run 一下看看
linux系统下如何部署selenium爬虫程序
如上图结果就说明请求成功

上面就是关于在linux系统下部署selenium爬虫程序简单步骤,欢迎相互交流。文章来源地址https://www.toymoban.com/news/detail-407850.html

到了这里,关于linux系统下如何部署selenium爬虫程序的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 使用Selenium模块编写自动化爬虫程序

    使用Selenium模块编写自动化爬虫程序可以实现更复杂的爬取操作,模拟浏览器的行为。以下是关于使用Selenium模块编写自动化爬虫程序的总结: 模拟浏览器行为:Selenium模块可以模拟浏览器的行为,如点击按钮、填写表单、滚动页面等。这使得爬虫可以处理需要交互操作或动态

    2024年02月07日
    浏览(47)
  • Python 爬虫使用 Selenium 如何在 WebElement 获得属性

    首先,我们需要初始化驱动和指定使用特定的流量器。 代码如下: 上面的代码可以简单的理解为启动一个 Firefox 的实例。 可以把程序读取的 HTML 理解为一个 Doc。 我们需要在 Doc 中选择我们的元素,这个叫做选择器,通常来说 HTML 很多不同的选择器。 上面的代码是使用 css

    2024年02月07日
    浏览(46)
  • 如何利用 Selenium 对已打开的浏览器进行爬虫

    大家好! 在对某些网站进行爬虫时,如果该网站做了限制,必须完成登录才能展示数据,而且只能通过短信验证码才能登录 这时候,我们可以通过一个已经开启的浏览器完成登录,然后利用程序继续操作这个浏览器,即可以完成数据的爬取了 具体操作步骤如下: 1-1 安装依

    2024年02月09日
    浏览(46)
  • Selenium自动化程序被检测为爬虫,怎么屏蔽和绕过

    使用selenium自动化网页时,有一定的概率会被目标网站识别,一旦被检测到,目标网站会拦截该客户端做出的网页操作。 比如淘宝和大众点评的登录页,当手工打开浏览器,输入用户名和密码时,是能正常进入首页的,但是如果是通过selenium打开, 会直接提示验证失败,点击

    2024年02月16日
    浏览(38)
  • Linux 系统之部署 h5ai 目录列表程序

    h5ai 是用于 HTTP Web 服务器的现代文件索引器,专注于您的文件。目录以吸引人的方式显示,浏览它们通过不同的视图、面包屑和树概述得到增强。最初 h5ai 是 HTML5 Apache Index 的首字母缩写,但现在它也支持其他 Web 服务器。 有许多可用的扩展和配置选项,允许用户自定义目录

    2024年01月25日
    浏览(37)
  • 如何在Linux系统Docker本地部署SimpleMindMap并实现远程访问?

    SimpleMindMap 是一个可私有部署的web思维导图工具。它提供了丰富的功能和特性,包含插件化架构、多种结构类型(逻辑结构图、思维导图、组织结构图等)、节点内容支持文本、图片、图标、超链接等,支持拖拽、导入导出功能、快捷键等。 cpolar是一个安全的内网穿透云服务

    2024年03月09日
    浏览(61)
  • 一文带你快速掌握如何在Windows系统和Linux系统中安装部署MongoDB

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【宝藏入口】。 为了巩固所学的知识,作者尝试着开始发布一些学习笔记类的博客,方便日后回顾。当然,如果能帮到一些萌新进行新技术的学习那也是极好的。作者菜菜一枚,文章

    2024年02月13日
    浏览(44)
  • 如何在Linux部署OpenGauss数据管理系统并实现固定公网地址访问

    openGauss是一款开源关系型数据库管理系统,采用木兰宽松许可证v2发行。openGauss内核深度融合华为在数据库领域多年的经验,结合企业级场景需求,持续构建竞争力特性. 结合cpolar 内网穿透工具,即可实现远程访问本地openGauss,实现远程访问,下面介绍从Linux安装到远程访问的方式

    2024年02月02日
    浏览(56)
  • 如何在Linux系统部署ONLYOFFICE协作办公利器并实现多人实时编辑文档

    本篇文章讲解如何使用Docker在本地服务器上安装ONLYOFFICE,并结合cpolar内网穿透实现公网访问。 Community Edition允许您在本地服务器上安装ONLYOFFICE文档,并将在线编辑器与ONLYOFFICE协作平台或其他流行系统集成。它是一个在线办公套件,包括文本、电子表格和演示文稿的查看器和

    2024年04月17日
    浏览(47)
  • unity,如何让人物随着鼠标滑动而转向?

    unity,如何让人物随着鼠标滑动而转向? 这段代码是一个基于Unity引擎实现玩家移动的脚本,主要作用如下: 定义并初始化变量: speed:玩家移动速度; movement:玩家的移动方向; playerAC:玩家的动画控制器; playerRigidbody:玩家的刚体组件; floorMask:用于射线检测的地板层

    2024年02月07日
    浏览(102)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包