【python爬虫】—图片爬取

1年前作者：木叶清风666分类：Toy博客阅读(29)违法举报

这篇具有很好参考价值的文章主要介绍了【python爬虫】—图片爬取。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

需求分析

从https://pic.netbian.com/4kfengjing/网站爬取图片，并保存

Python实现

获取待爬取网页

def get_htmls(pages=list(range(2, 5))):
    """获取待爬取网页"""
    pages_list = []
    for page in pages:
        url = f"https://pic.netbian.com/4kfengjing/index_{page}.html"
        response = requests.get(url)
        response.encoding = 'gbk'
        pages_list.append(response.text)
    return pages_list
get_htmls(pages=list(range(2, 5)))

获取所有图片，并下载

def get_picturs(htmls):
    """获取所有图片，并下载"""
    for html in htmls:
        soup = BeautifulSoup(html, 'html.parser')
        pic_li = soup.find('div', id='main').find('div', class_='slist').find('ul', class_='clearfix')
        image_path = pic_li.find_all('img')
        for file in image_path:
            pic_name = './practice05/' + file['alt'].replace(" ",'_') + '.jpg'
            src = file['src']
            src = f"https://pic.netbian.com/{src}"

            response = requests.get(src)

            with open(pic_name, 'wb') as f:
                f.write(response.content)
                print("图片已下载并保存为:{}".format(pic_name))
                
htmls = get_htmls(pages=list(range(2, 5)))
get_picturs(htmls)

爬取结果展示

文章来源地址https://www.toymoban.com/news/detail-686457.html

到了这里，关于【python爬虫】—图片爬取的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Python爬虫之Scrapy框架系列（21）——重写媒体管道类实现保存图片名字自定义及多页爬取
spider文件中要拿到图片列表并yield item； item里需要定义特殊的字段名：image_urls=scrapy.Field()； settings里设置IMAGES_STORE存储路径，如果路径不存在，系统会帮助我们创建；使用默认管道则在s
2024年02月10日
浏览(37)
基于Python的网络爬虫爬取天气数据可视化分析
目录摘要 1 一、设计目的 2 二、设计任务内容 3 三、常用爬虫框架比较 3 四、网络爬虫程序总体设计 3 四、网络爬虫程序详细设计 4 4.1设计环境和目标分析 4 4.2爬虫运行流程分析 5 爬虫基本流程 5 发起请求 5 获取响应内容 5 解析数据 5 保存数据 5 Request和Response 5 Request 5
2024年02月08日
浏览(9)
【Python网络爬虫】三分钟教会你使用SeleniumWire快速爬取数据
在终端使用pip进行安装 pip install xxx 这里我使用的是Chrome，其中列举了几个常用的option，供大家学习使用 option = webdriver.ChromeOptions()：设置Chrome启动选项 option.add_argument(‘headless’)：不打开浏览器进行数据爬取，因为没有可视化过程，所以推荐整个流程开发完毕后，在使用此条
2024年02月21日
浏览(6)
〖Python网络爬虫实战㉔〗- Ajax数据爬取之Ajax 分析案例
订阅：新手可以订阅我的其他专栏。免费阶段订阅量1000+ python项目实战 Python编程基础教程系列（零基础小白搬砖逆袭) 说明：本专栏持续更新中，目前专栏免费订阅，在转为付费专栏前订阅本专栏的，可以免费订阅付费专栏，
2024年02月07日
浏览(19)
〖Python网络爬虫实战㉕〗- Ajax数据爬取之Ajax 案例实战
订阅：新手可以订阅我的其他专栏。免费阶段订阅量1000+ python项目实战 Python编程基础教程系列（零基础小白搬砖逆袭) 说明：本专栏持续更新中，目前专栏免费订阅，在转为付费专栏前订阅本专栏的，可以免费订阅付费专栏，
2024年02月06日
浏览(19)
Python网络爬虫爬取招聘数据（利用python简单零基础）可做可视化
身为一个求职者，或者说是对于未来的职业规划还没明确目标的大学生来说，获取各大招聘网上的数据对我们自身的发展具有的帮助作用，本文章就简答零基础的来介绍一下如何爬取招聘数据。我们以东莞的Python数据分析师这个职位来做一个简单的分析，页面如下图所示：
2024年02月03日
浏览(17)
python爬取豆瓣电影排行前250获取电影名称和网络链接[静态网页]————爬虫实例（1）
目录 1.算法原理： 2.程序流程： 3.程序代码： 4.运行结果(部分结果展示)： 5.结果分析：（1）利用import命令导入模块或者导入模块中的对象； ①利用requests库获取数据； ②用BeautifulSoup库将网页源代码转换成BeautifulSoup类型，以便于数据的解析和处理； ③用time库进行时间延时
2023年04月16日
浏览(30)
Python网络爬虫逆向分析爬取动态网页、使用Selenium库爬取动态网页、编辑将数据存储入MongoDB数据库
目录逆向分析爬取动态网页了解静态网页和动态网页区别 1.判断静态网页 2.判断动态网页逆向分析爬取动态网页使用Selenium库爬取动态网页安装Selenium库以及下载浏览器补丁页面等待页面操作 1.填充表单 2.执行JavaScript 元素选取 Selenium库的find_element的语法使用格式如下
2024年02月15日
浏览(28)
（十五）python网络爬虫（理论+实战）——实战：eastmoney沪深京A股股票数据爬取，表格解析
目录 7 爬取沪深京A股股票数据 7.1 爬取目标
2023年04月22日
浏览(12)
《爬虫》爬取页面图片并保存
title: 《小·意·思》爬取页面图片并保存 date: 2023-08-10 22:12:30 updated: 2023-08-29 17:07:55 categories: 番外：小·意·思 excerpt: 上下标号、标点、运算符、标号、时间相关、语言、货币、音乐、形状符号、其他符号。 comments: false tags: top_image: /images/backimg/SunsetClimbing.png 简单的爬取图片
2024年02月13日
浏览(9)