当我学会了Python之后,某文库所有文档轻松下载,确定不来薅羊毛吗?

这篇具有很好参考价值的文章主要介绍了当我学会了Python之后,某文库所有文档轻松下载,确定不来薅羊毛吗?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

嗨喽~大家好呀,这里是魔王呐 ❤ ~!

当我学会了Python之后,某文库所有文档轻松下载,确定不来薅羊毛吗?,python爬虫,python,开发语言,pycharm

本账号也发了很多关于python相关的案例教程文章,

这里很感谢各位粉丝一直以来的关注, 这里也单独为各位粉丝开设一个特别专栏!

🧡 关注
🧡 点赞
🧡 收藏
🧡 评论

评论留下你需求, 下一期的文章内容, 由你来定!

今天就教大家如何实现 某Bai文库内容获取

需求如下:

对于这类的文档, 我们想要点击下载, 都是需要 “氪金” 才行,

但是作为咱们这类人来说, 能白嫖就白嫖!

当我学会了Python之后,某文库所有文档轻松下载,确定不来薅羊毛吗?,python爬虫,python,开发语言,pycharm

python资料、源码、教程\福利皆: 点击此处跳转文末名片获取

找数据源:

通过开发者工具抓包, 可以看到数据都是图片的形式存在, 那我们可以获取它所有的数据内容, 然后保存下载下来, 以PPT的形式保存

当我学会了Python之后,某文库所有文档轻松下载,确定不来薅羊毛吗?,python爬虫,python,开发语言,pycharm

代码如下:

# 导入数据请求模块
import requests
# 导入ppt模块
from pptx import Presentation
# 导入ppt模块 设置边距
from pptx.util import Cm
# 导入文件操作模块
import os

# 请求链接
url = 'https://.com/ndocview/readerinfo'
# 请求参数
data = {
    'docId': '5330607f541810a6f524ccbff121dd36a32dc482',
    'clientType': '1',
    'powerId': '2',
    'pn': '1',
    'rn': '100',
    'bizName': 'mainPc',
    'edtDocSrc': '0',
    'bdQuery': '百度文库',
    'wkQuery': 'python编程ppt',
}
# 伪装
headers = {
    # 用户代理
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36',
}
# 发送请求
response = requests.get(url=url, params=data, headers=headers)
# 循环次数
page = 1
# for 循环遍历
for index in response.json()['data']['htmlUrls']:
    # 获取图片数据
    img_content = requests.get(url=index, headers=headers).content
    # 保存数据
    with open('img\\' + str(page) + '.jpg', mode='wb') as f:
        # 写入数据
        f.write(img_content)
    print(index)
    # 每次循环+1
    page += 1


# 实例化对象
prs = Presentation()
# 使用第7个模块
blank_slide_layout = prs.slide_layouts[6]
# 读取文件
files = os.listdir('img\\')
# 遍历文件名
for file in files:
    # 文件路径
    filename = f'img\\{file}'
    # 添加图片
    # slide.shapes.add_picture(图片路径, 距离左边,距离顶端, 宽度,高度)
    slide = prs.slides.add_slide(blank_slide_layout)
    slide.shapes.add_picture(filename, Cm(0), Cm(0), Cm(25.40), Cm(19.06))

# 保存ppt
prs.save('python编程.pptx')

采集效果:

当我学会了Python之后,某文库所有文档轻松下载,确定不来薅羊毛吗?,python爬虫,python,开发语言,pycharm

Python学习交流群:926207505

尾语

感谢你观看我的文章呐~本次航班到这里就结束啦 🛬

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

当我学会了Python之后,某文库所有文档轻松下载,确定不来薅羊毛吗?,python爬虫,python,开发语言,pycharm

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇文章来源地址https://www.toymoban.com/news/detail-638746.html

到了这里,关于当我学会了Python之后,某文库所有文档轻松下载,确定不来薅羊毛吗?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【开源】无忧企业文档文库管理界面介绍

    无忧企业文档是软开企服研发的一款集知识库、网盘、在线协同为一体的企业级办公软件,有完全免费的开源版,也有功能丰富的商业版。开源版在社区开放了全量源码,商业版支持提供源码,支持二次开发,适合中小企业使用。 文件管理界面介绍 文档采用目录资源管理模

    2024年02月07日
    浏览(28)
  • 【AIGC】百度文库文档助手之 - 一键生成PPT

    就在上个月百度文库升级为一站式智能文档平台,开放四大AI能力: 智能PPT 、智能总结、智能创作和智能编辑。个人最喜欢 智能PPT ,给定一个题目就可以自动生成PPT,细节上可能不太完善,但整体和布局上较美观,值得参考。 套娃式生成PPT,告诉 文档助手 : 帮我写一个使

    2024年02月08日
    浏览(45)
  • 在 Python 中如何删除指定字符之前或之后的所有内容

    要删除字符串中某个字符后的所有内容: 使用 str.split() 方法在分隔符上拆分字符串。 访问索引 0 处的列表元素以获取分隔符之前的所有内容。 或者,使用加法 + 运算符添加分隔符。 我们使用 str.split() 方法删除字符(示例中的!)之后的所有内容。 str.split() 方法使用定界符

    2024年02月08日
    浏览(41)
  • 轻松学会Python--openpyxl库,处理Excel有如神助

    Excel是Windows环境下流行的、强大的电子表格应用。无论是在工作中还是学习中。我们几乎都在不间断的使用Excel来记录或处理一些数据。例如:可能有一个无聊的任务,需要从一个电子表格拷贝数据,粘贴到另一表格。 或者可能需要从几千上万行中挑选几行,根据各种条件稍

    2024年02月19日
    浏览(38)
  • Python 轻松生成PDF文档

    PDF(Portable Document Format)是一种常用的文档格式,具有跨平台兼容性、保真性、安全性和交互性等特点。我们日常生活工作中的合同、报告、论文等通常都采用PDF格式,以确保文档在不同的操作系统(例如 Windows、Mac、Linux)和设备上被查看时都能保持外观的一致性。 Python是

    2024年02月08日
    浏览(37)
  • Python操作Word:轻松实现文档的创建、编辑与自动化处理

    引言: 在日常工作和学习中,我们经常需要使用Microsoft Word来创建、编辑和处理文档。然而,手动操作Word可能会耗费大量的时间和精力。为了提高工作效率,我们可以使用Python编程语言来操作Word文档,实现文档的自动化处理。本文将详细介绍如何使用Python操作Word,包括创建

    2024年01月21日
    浏览(41)
  • [python]裁剪文件夹中所有pdf文档并按名称保存到指定的文件夹

    最近在写论文的实验部分,由于latex需要pdf格式的文档,审稿专家需要对pdf图片进行裁剪放大,以保证图片质量。 原图: 裁剪后的图像: 代码粘贴如下。将input_folder和output_folder替换即可。(x1, y1), (x2, y2) 分别代表裁剪框的像素位置。

    2024年01月19日
    浏览(49)
  • 轻松学会Elasticsearch+kibana

    返回值 返回值 返回值 返回值 返回值 返回值 再次查看确认即可看到新增的字段 示例中更没有加 任何筛选条件 ,默认是全部数据初始化值为2 修改数据请慎重!!!!!! 返回值 返回值 Elasticsearch和Kibana是一对非常强大的开源工具,用于构建实时搜索和分析平台。 Elastics

    2024年01月16日
    浏览(28)
  • 用Python写了一个下载网站所有内容的软件,可见即可下

    前言 嗨喽~大家好呀,这里是魔王呐 ❤ ~! 今天我们分享一个用Python写下载视频+弹幕+评论的代码。 顺便把这些写成GUI,把这些功能放到一起让朋友用起来更方便~ 环境介绍: python 3.8 pycharm 2022专业版 免费使用教程文末名片获取 python资料、源码、教程福利皆: 点击此处跳转文末

    2024年02月09日
    浏览(43)
  • 学会XPath,轻松抓取网页数据

    XPath(XML Path Language)是一种用于在 XML 文档中定位和选择节点的语言。XPath的选择功能非常强大,可以通过简单的路径选择语法,选取文档中的任意节点或节点集。学会XPath,可以轻松抓取网页数据,提高数据获取效率。 节点(Nodes): XML 文档的基本构建块,可以是元素、属

    2024年02月05日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包