【小5聊】Python3 使用selenium模块实现简单爬虫系列一

这篇具有很好参考价值的文章主要介绍了【小5聊】Python3 使用selenium模块实现简单爬虫系列一。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

第一次听说Python还是在工作的时候,还是一位女生在用,当时她说可以用来处理excel文档,特别是一些统计分析。第二次让我真正进入python世界,还是在一次C站举办的大赛上。聊聊你是因为什么机缘巧合进入到python圈的呢?不妨留言说说

本期主要是聊聊,我接触到的selenium模块实现简单的爬虫效果

爬虫输出标题效果

【小5聊】Python3 使用selenium模块实现简单爬虫系列一 

 

1、开发环境

1)windows 11 家庭中文版

说实在的,win11真心不够稳定和好用,特别是改了那个鼠标右键出菜单那个,非常不习惯

【小5聊】Python3 使用selenium模块实现简单爬虫系列一 

 2)Visual Studio 2022 社区版

3)Python 3.9

【小5聊】Python3 使用selenium模块实现简单爬虫系列一

 2、爬虫场景

1)什么是爬虫

一般指网络爬虫,自动获取网页内容的程序

2)先简单设置一个爬虫场景

当程序运行后,能够爬取C站首页推荐区域的前10条资讯标题

3、小知识点

1)函数和模块

python本身内置了一些常用函数,以及一些内置的模块,模块下又有很多函数方法

比如:math和random模块分别包含了数学运算相关的函数以及随机数相关的函数

2)引入模块必不可少

3)import和from import的区别

两者都可以为导入目标重新命名

import 具体到模块,不能具体到函数和类等

from import可以具体到类、函数

4、爬虫编码分析

1)Selenium

主要用于Web应用程序的自动化测试工具包

2)Webdriver

调用浏览器的API(程序接口),并返回响应结果的工具,这个工具包在Selenium包里面

3)安装模块

【小5聊】Python3 使用selenium模块实现简单爬虫系列一

【小5聊】Python3 使用selenium模块实现简单爬虫系列一 

 4)对目标内容进行分析

爬虫目标的标题为span标签,且class为blog-text

【小5聊】Python3 使用selenium模块实现简单爬虫系列一

 

5)下载chromedriver.exe

点击下载-chromedriver.exe,尽量放到英文目录

6)常见问题 - 编码无法识别

在脚本开头写上:# coding=gb2312 或者 # coding=utf-8

【小5聊】Python3 使用selenium模块实现简单爬虫系列一

7)'WebDriver' object has no attribute 

可能已经使用了新的写法文章来源地址https://www.toymoban.com/news/detail-459658.html

5、完整代码

# coding=gb2312
from selenium import webdriver
from selenium.webdriver.common.by import By
# 导入selenium自动化模块的子模块-webdriver-浏览器驱动模块

# chrom谷歌浏览器方式打开指定网站
driver = webdriver.Chrome()
driver.get("https://blog.csdn.net")
 
# 获取返回多个span标签对象
spans = driver.find_elements(by=By.CLASS_NAME,value='blog-text')

for span in spans:
    # 标题文本
    print(span.text)

到了这里,关于【小5聊】Python3 使用selenium模块实现简单爬虫系列一的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • python网络爬虫之selenium的详细安装配置以及简单使用--菜鸟复习日记

     学习python selenium已经是好久以前的事情了,自己都快要忘记了,所以写篇博客复习复习,本文包括安装selenium驱动以及selenium的一些简单使用。本文默认安装python以及selenium库。 目录 一、安装seleium的驱动(以谷歌浏览器为例) 二、selenium库的一些简单用法。         1.向输入框

    2024年02月06日
    浏览(26)
  • 解决Python爬虫中selenium模块中的find_element_by_id方法无法使用

    如有错误,敬请谅解! 此文章仅为本人学习笔记,仅供参考,如有冒犯,请联系作者删除!!         我们在学习selenium模块的时候,经常会用到 browser.find_element_by_id命令,但随着selenuim版本更新,我们会发现运行时会报错,非常苦恼。         示例:         错误如下:

    2024年02月05日
    浏览(34)
  • 【Python爬虫】Python爬虫三大基础模块(urllib & BS4 & Selenium)

    参考资料 Python爬虫教程(从入门到精通) Python urllib | 菜鸟教程 Beautiful Soup 4 入门手册_w3cschool Selenium入门指南 Selenium教程 什么是 Scrapy|极客教程 Scrapy入门教程 1、网络爬虫是什么? 我们所熟悉的一系列 搜索引擎都是大型的网络爬虫 ,比如百度、搜狗、360浏览器、谷歌搜索等

    2024年02月12日
    浏览(33)
  • 使用 Python 实现简单的爬虫框架

    爬虫是一种自动获取网页内容的程序,它可以帮助我们从网络上快速收集大量信息。在本文中,我们将学习如何使用 Python 编写一个简单的爬虫框架。 一、请求网页 首先,我们需要请求网页内容。我们可以使用 Python 的 requests 库来发送 HTTP 请求。在使用之前,请确保已安装该

    2024年02月03日
    浏览(26)
  • Python3,爬虫有多简单,一个库,一行代码,就OK, 你确定不来试试?

    小屌丝 :鱼哥, 我最近在练习写爬虫, 你有没有什么便捷的方式… 小鱼 :比如呢? 小屌丝 :比如,一句话就可以搞得定爬取整个网站。 小鱼 :我不是写过挺多的爬虫案例嘛,你咋还问这个问题, 小屌丝 :你写的哪些教程,像我这种比较懒散的人,不适用! 小鱼 :我擦

    2024年02月05日
    浏览(70)
  • 【Python爬虫01】Selenium简单认识

    在现代的Web开发中,自动化测试是不可或缺的一环。而Selenium是一个强大的Python库,用于自动化Web浏览器的操作和测试。本篇博文将为您介绍Selenium的基础知识和使用方法,并通过案例说明如何进行Web自动化测试。 Selenium是一个开源的自动化测试框架,主要用于模拟用户与We

    2024年02月16日
    浏览(25)
  • python spider 爬虫 之 Selenium 系列 (-) Selenium

    京东的 seckill 秒杀 专区 用 urllib 是获取不到的 回顾一下urllib 爬虫 Selenium Selenium定义 Selenium是一个用于Web应用程序测试的工具 Selenium测试 直接 运行在浏览器中,就像真实的用户在操作一样 支持通过各种driver ( FireFoxDriver, InternetExplorerDriver、OperaDriver、ChromeDriver)驱动真实浏

    2024年02月16日
    浏览(26)
  • Python爬虫—requests模块简单应用

    requests的作用与安装 作用:发送网络请求,返回响应数据 安装:pip install requests requests模块发送简单的get请求、获取响应 需求:通过requests向百度首页发送请求,获取百度首页的数据 response的常用属性: response.text 响应体str类型 response.encoding 从HTTP header中猜测的响应内容的编

    2024年01月24日
    浏览(36)
  • 使用Selenium模块编写自动化爬虫程序

    使用Selenium模块编写自动化爬虫程序可以实现更复杂的爬取操作,模拟浏览器的行为。以下是关于使用Selenium模块编写自动化爬虫程序的总结: 模拟浏览器行为:Selenium模块可以模拟浏览器的行为,如点击按钮、填写表单、滚动页面等。这使得爬虫可以处理需要交互操作或动态

    2024年02月07日
    浏览(29)
  • Python爬虫:Selenium的介绍及简单示例

    Selenium是一个用于自动化Web应用程序测试的开源工具。它允许开发人员模拟用户在浏览器中的交互行为,以便自动执行各种测试任务,包括功能测试、性能测试和回归测试等。Selenium最初是为Web应用程序测试而创建的,但它也可用于Web数据抓取和其他自动化任务。 以下是关于

    2024年02月09日
    浏览(26)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包