Python采集<灵剑尊>全本内容,一次性看个爽~

这篇具有很好参考价值的文章主要介绍了Python采集<灵剑尊>全本内容,一次性看个爽~。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

嗨喽,大家好呀~这里是爱看美女的茜茜呐

Python采集<灵剑尊>全本内容,一次性看个爽~

环境使用:

  • Python 3.8

  • Pycharm

模块使用:

  • requests >>> pip install requests 数据请求模块

  • parsel >>> pip install parsel 数据解析模块

使用知识点:

python基础语法:

  • print 输出函数

  • 字符串创建

  • 字典创建 / 取值

  • 列表取值

  • for循环遍历

  • open函数数据保存

python爬虫语法:

  • requests简单使用

  • re.sub替换方法

  • parsel css选择器数据解析

代码展示

# 导入数据请求模块
import requests
# 导入正则表达式模块
import re
# 导入数据解析模块
import parsel

1. 发送请求, 模拟浏览器对于 漫画列表页面url地址发送请求

模拟浏览器

headers = {
    # user-agent 用户代理, 表示浏览器基本身份信息
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}

请求链接

url = 'https:/*-***/209412/'

发送请求

response = requests.get(url=url, headers=headers)

2. 获取数据, 获取服务器返回响应数据

开发者工具: response

3. 解析数据, 提取我们想要的数据内容

章节ID / 章节标题

本次案例选择css选择器: 根据标签属性提取数据内容

转换数据类型, 转成可解析对象

selector = parsel.Selector(response.text)

获取所有li标签内容

lis = selector.css('.j-chapter-item')

for循环遍历

for li in list(reversed(lis)):
    # 提取具体数据内容
    title = li.css('a::text').getall()[-1].strip()
    chapter_id = li.css('a::attr(data-chapterid)').get()

4. 发送请求, 模拟浏览器对于 漫画数据包url地址 发送请求

    link = 'https://****/chapter/content/v1/'
    data = {
        'chapter_id': chapter_id,
        'comic_id': '209412',
        'format': '1',
        'quality': '1',
        'sign': '2088fa70abcab5071cf781ceeb48ace1',
        'type': '1',
        'uid': '63473042',
    }

5. 获取数据, 获取服务器返回响应数据

    json_data = requests.get(url=link, params=data, headers=headers).json()
    print(title, chapter_id)
    new_title = re.sub(r'[\/:*?"<>|]', '', title)

6. 解析提取我们想要图片链接

    num = 1
    for img in json_data['data']['page']:
        img_url = img['image']

7. 保存数据

        img_content = requests.get(url=img_url, headers=headers).content
        with open('img\\' + new_title + str(num) + '.jpg', mode='wb') as f:
            f.write(img_content)
            num += 1
        print(img_url)

尾语

感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

Python采集<灵剑尊>全本内容,一次性看个爽~

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇文章来源地址https://www.toymoban.com/news/detail-447583.html

到了这里,关于Python采集<灵剑尊>全本内容,一次性看个爽~的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python:一次性输出多个量

    有的时候我们在输入一个字符串时,需要在中间加一个int类型变量时,如果一段一段输出就要写三个print,非常麻烦。今天bug君就给大家讲讲如何在Python里一次性输出多个量。 粽所粥汁,在Python里输出需要写 print(\\\"输出内容\\\") ,而输出一个变量则需要写 print(变量名) 。 注意:

    2024年02月04日
    浏览(89)
  • 如何一次性更新python所有的库?

    我们可以使用  pip  命令来更新 Python 库。 在命令提示符或终端中,使用pip install --upgrade后面跟上要更新的库的名称。 例如,如果你想更新名为  numpy  的库,你可以在 Windows 上打开命令提示符,在 macOS 或 Linux 上打开终端,然后输入以下命令: 这将升级  numpy  库到最新版

    2024年02月09日
    浏览(33)
  • 使用Python将图像转换为PDF:一次性解决您的批量转换需求

    导语: 在数字化时代,我们经常需要处理大量的图像文件。将这些图像转换为PDF格式可以方便地存档、分享和打印。本文将介绍如何使用Python编程语言将图像批量转换为PDF,并提供了一个简单易用的图形界面来跟踪转换进度。 在开始之前,请确保您已经安装了以下库: PyM

    2024年02月14日
    浏览(30)
  • chatgpt赋能python:Python如何一次性输入多个数?教你使用Python中的多种方法

    在python编程中,我们经常需要输入多个数值。为了提高效率,Python提供了多种方法可以一次性输入多个数值。本篇文章将介绍几种常见的,在Python中如何一次性输入多个数值的方法。 最基础的方法是使用Python中内置的 input() 函数以及字符串的 split() 函数。 input() 函数用于从控

    2024年02月12日
    浏览(42)
  • [python]使用pyqt5搭建yolov8 竹签计数一次性筷子计数系统

    【官方框架地址】 github地址:https://github.com/ultralytics/ultralytics 【算法介绍】 Yolov8是一种先进的深度学习算法,用于目标检测任务,特别是针对图像中物体的实时检测。它是Yolov3和Yolov4之后的又一重要迭代,带来了诸多改进和新特性。本文将详细介绍Yolov8算法的原理、特点、

    2024年04月10日
    浏览(32)
  • Python爬虫(1)一次性搞定Selenium(新版)8种find_element元素定位方式

    selenium中有8种不错的元素定位方式,每个方式和应用场景都不一样,需要根据自己的使用情况来进行修改 目前selenium已经出现了新的版本的定位方式,虽然说定位语法不一样,但是万变不离其宗。 用旧版的定位语法就会出现这个删除线,你用他来进行爬虫的时候运行时就会提

    2024年02月03日
    浏览(32)
  • 《一次性分割一切》阅读笔记

    目录 0 体验 1 摘要 2 十个问题 参考文献 体验地址 :SEEM - a Hugging Face Space by xdecoder 体验结果 : 将哈士奇和汽车人从图片中分割出来。 尽管对于交互式人工智能系统的需求不断增长,但在视觉理解(例如分割)中的人工智能交互方面,很少有全面的研究。本文受到基于提示的

    2024年02月01日
    浏览(48)
  • 公众号一次性订阅消息

    洛塔服务号回复007获取代码。 之前发布通知,要用订阅通知替代一次性订阅消息,不知道是被骂的太惨还是技术原因,一次性订阅消息还是一直能用。 和模板消息不同的是,一次性订阅消息无需用户关注公众号,但是必须用户点击同意发送才能接收消息。 模板消息:需要关

    2024年02月09日
    浏览(47)
  • 一次性打包学透 Spring

    不知从何时开始,Spring 这个词开始频繁地出现在 Java 服务端开发者的日常工作中,很多 Java 开发者从工作的第一天开始就在使用 Spring Framework,甚至有人调侃“不会 Spring 都不好意思自称是个 Java 开发者”。 之所以出现这种局面,源于 Spring 是一个极为优秀的一站式集成框架

    2023年04月19日
    浏览(39)
  • charles证书安装,一次性说明白

    windows上安装好charles后,需要给软件安装证书。 1、点击help - SSL proxying,选择第二个install Charles Root Certificate证书安装   2、如果以前安装过证书,但是过期了(有效期一般1年),证书界面会显示过期字样,此时就要先点击一下Reset Charles Root Certificate,然后再点击第一步中的

    2024年02月05日
    浏览(82)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包