【python】无限量PPT免费下载?找模板在不怕心仪得不能用啦

这篇具有很好参考价值的文章主要介绍了【python】无限量PPT免费下载?找模板在不怕心仪得不能用啦。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

大家早好、午好、晚好吖 ❤ ~欢迎光临本文章

【python】无限量PPT免费下载?找模板在不怕心仪得不能用啦

开发环境:

  • python 3.8

  • pycharm

不会安装的可以文末名片+我获取哦 😎

模块使用:

第三方模块,需要安装

win + R 输入cmd 输入安装命令 pip install 模块名

(如果出现爆红 可能是因为 网络连接超时 切换国内镜像源)

  • requests

内置模块

  • re

代码实现步骤:

基本四大步骤 发送请求 -> 获取数据 -> 解析数据 -> 保存数据

  1. 发送请求, 模拟浏览器对url地址发送请求

    请求链接 --> PPT列表页面: https://***/moban/

  2. 获取数据, 获取 PPT列表页面 网页源代码

  3. 解析数据, 提取我们想要的数据内容 < aid参数 / ppt标题 >

  4. 发送请求, 模拟浏览器对url地址发送请求

    请求链接 --> PPT下载页面: https://***/plus/download.php?open=0&aid={aid参数}&cid=3

  5. 获取数据, 获取 PPT下载页面 网页源代码

  6. 解析数据, 提取我们想要的数据内容 < ppt压缩包下载地址 >

  7. 保存数据, 把ppt压缩包数据保存本地文件夹

代码展示

# 导入数据请求模块 --> 第三方模块, 需要安装 pip install requests
import requests
# 导入正则表达式模块 --> 内置模块, 不需要安装
import re
# 导入进度条
from tqdm import tqdm

“”"

  1. 发送请求, 模拟浏览器对url地址发送请求

    • <Response [200]> 表示请求成功

      requests <手机>

      url <电话号码>

      requests.get(url) <拨号>

      <Response [200]> <电话打通了>

分析 PPT列表页面 请求链接变化规律

“”"

多页采集

for page in range(2, 194):
    print(f'------------正在采集第{page}页的数据内容------------')

请求链接 PPT列表页面

    url = f'https://****/moban/ppt_moban_{page}.html'

加入伪装

    headers_1 = {
        # 'Cookie': '__51vcke__Je1p5lxAB8oshp4Q=a2d09e14-b8e3-549b-8f57-6aca0caa5b7c; __51vuft__Je1p5lxAB8oshp4Q=1653891497436; __gads=ID=692fabf3df9f56a5-222407aa9bd3001e:T=1653891498:RT=1653891498:S=ALNI_MZpycjl_goCBeDo2c9SHKGt40wXzQ; __bid_n=18432ecf98ba9acd9e4207; FPTOKEN=30$1DzFg9/Q5i/1OYLGx8BGVb1DDCKC+Gz58Jrwp1AzRDntdzyLdjrMqJIhdpXsGktzZYiZA7eZE4m32nad5rK0TbanAbCcyCxZrcsnriCl9YmmC5UN4bqieT032UzJlT53xEUd1j1vpWC+p2NI70JLAubaanckO+d82HROhCY1Lh5lulkTGCAdfPKCZz2S8OPONy0NyL8GsKWfKGM95ReKgAtoJL0ngVj0smpDEsTFGOaPSW0M+dsO0gUmneWw05mgySVC71/qbUUG8o3mKEyD5aBnZdYUFP8ig8mnH2xVizJkAPRbXeRELe5e9Fk5DM9pZlZooM7+L8NQuSua5rakld1fZXhXX3vsH9w8lGYHQhKrU/9HDlhKZzcBgVRZIoDB|QmVxOaY5NuD0YXxzaJ0mCnE/9qJLssQcIEB76DcwEGA=|10|946497589a754b58cc2352d773d7c8ab; _tcnyl=1; FPTOKEN=ZoGr4lqRpDB41aS7g3xbphkNZxlAFkMrslWEy2CJ+sJG7a0uxWmB0OK4zvSzYlUIAyPbHFd2qaqVHYwEI55/5irbrxKYI8Vd1fujkpMY+9HkcQw/QadJLWoHpVPupduCcPwfWxY33ihlqzEjtKiiNB3oq3b81i61ONtX77MQyiMYXoXXqW0QWQB2EVlg8qO2wiEbHCR+PiPSEQqmbP5Q96aFOMITQ8d8UVupKIphS4IsNM3qrx5lv1CDcUpew1Hf6aDUIQ5cvPp89BOCvyPlotw1XYJMLhz3z8Dq0+PWbZVdHy31HRxy1QZN4YKbZce/wVsmNNctThVXPYZiWJxsLfusq51dpBeNQZ5jvXyYj1CtF1commhHj/AyhOtfDgNERt9Vj9AzhMteoP6fhEDquA==|uPT50p/sXbaj1jWrP5LTDsFYuTBOKGVO+5MF4s+Jb8c=|10|82feab40fd6338ee92047277cdbe5297; acw_sc__v2=643e912a51d7da10f6ad3d5cc1d79f0d6593c37f; __gpi=UID=0000060294537c8f:T=1653891498:RT=1681822116:S=ALNI_MZtPzSlNJpybAKucVMv0sKEvcwOjg; acw_tc=276077b216818245849326986e88fe8a2f8d876a94ab44cc5122ad34acd3cd; __51uvsct__Je1p5lxAB8oshp4Q=17; __vtins__Je1p5lxAB8oshp4Q=%7B%22sid%22%3A%20%22a46f87fa-bb28-5e18-b3bf-a82380a1b6eb%22%2C%20%22vd%22%3A%207%2C%20%22stt%22%3A%20226266%2C%20%22dr%22%3A%20104449%2C%20%22expires%22%3A%201681826611441%2C%20%22ct%22%3A%201681824811441%7D',
        # 'Referer': f'https://****/moban/ppt_moban_{page}.html',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
    }
    # 发送请求
    response = requests.get(url=url, headers=headers_1)

“”"

  1. 获取数据, 获取 PPT列表页面 网页源代码

    response.text 获取响应文本数据

  2. 解析数据, 提取我们想要的数据内容 < aid参数 / ppt标题 >

    正则表达式

    re.findall(‘什么数据’, ‘什么地方’) --> 调用re模块里面findall方法 <找到所有我们想要的数据>
    你从什么地方, 去匹配什么数据

“”"

    # 转码
    response.encoding = 'gb2312'
    # 提取数据 < aid参数 / ppt标题 >
    info = re.findall('<h2><a href="/article/(.*?).html" target="_blank">(.*?)</a></h2>', response.text)

    # for循环遍历, 把列表里面元素一个一个提取出来
    for aid, title in info:

“”"

  1. 发送请求, 模拟浏览器对url地址发送请求

    请求链接 --> PPT下载页面

    • 打开开发者工具: F12

    • 刷新网页

    • 选中请求数据包, 点击数据包

    • 选择headers下面 request headers

    批量替换:

    • 选中替换内容 ctrl + R

    • 勾选 .* 正则

    • 输入正则匹配命令

      (.?): (.)

      ‘$1’: ‘$2’,

“”"

        # 字符串格式化方法
        link = f'https://****/plus/download.php?open=0&aid={aid}&cid=3'
        print(link)
        # 伪装模拟浏览器 headers
        headers = {
            'Cookie': 'mizToken=202206071322080.098771721239192310.8670471172054548; __51vcke__Je1p5lxAB8oshp4Q=a2d09e14-b8e3-549b-8f57-6aca0caa5b7c; __51vuft__Je1p5lxAB8oshp4Q=1653891497436; __gads=ID=692fabf3df9f56a5-222407aa9bd3001e:T=1653891498:RT=1653891498:S=ALNI_MZpycjl_goCBeDo2c9SHKGt40wXzQ; __bid_n=18432ecf98ba9acd9e4207; FPTOKEN=30$1DzFg9/Q5i/1OYLGx8BGVb1DDCKC+Gz58Jrwp1AzRDntdzyLdjrMqJIhdpXsGktzZYiZA7eZE4m32nad5rK0TbanAbCcyCxZrcsnriCl9YmmC5UN4bqieT032UzJlT53xEUd1j1vpWC+p2NI70JLAubaanckO+d82HROhCY1Lh5lulkTGCAdfPKCZz2S8OPONy0NyL8GsKWfKGM95ReKgAtoJL0ngVj0smpDEsTFGOaPSW0M+dsO0gUmneWw05mgySVC71/qbUUG8o3mKEyD5aBnZdYUFP8ig8mnH2xVizJkAPRbXeRELe5e9Fk5DM9pZlZooM7+L8NQuSua5rakld1fZXhXX3vsH9w8lGYHQhKrU/9HDlhKZzcBgVRZIoDB|QmVxOaY5NuD0YXxzaJ0mCnE/9qJLssQcIEB76DcwEGA=|10|946497589a754b58cc2352d773d7c8ab; _tcnyl=1; FPTOKEN=ZoGr4lqRpDB41aS7g3xbphkNZxlAFkMrslWEy2CJ+sJG7a0uxWmB0OK4zvSzYlUIAyPbHFd2qaqVHYwEI55/5irbrxKYI8Vd1fujkpMY+9HkcQw/QadJLWoHpVPupduCcPwfWxY33ihlqzEjtKiiNB3oq3b81i61ONtX77MQyiMYXoXXqW0QWQB2EVlg8qO2wiEbHCR+PiPSEQqmbP5Q96aFOMITQ8d8UVupKIphS4IsNM3qrx5lv1CDcUpew1Hf6aDUIQ5cvPp89BOCvyPlotw1XYJMLhz3z8Dq0+PWbZVdHy31HRxy1QZN4YKbZce/wVsmNNctThVXPYZiWJxsLfusq51dpBeNQZ5jvXyYj1CtF1commhHj/AyhOtfDgNERt9Vj9AzhMteoP6fhEDquA==|uPT50p/sXbaj1jWrP5LTDsFYuTBOKGVO+5MF4s+Jb8c=|10|82feab40fd6338ee92047277cdbe5297; __gpi=UID=0000060294537c8f:T=1653891498:RT=1681822116:S=ALNI_MZtPzSlNJpybAKucVMv0sKEvcwOjg; acw_tc=276077b216818245849326986e88fe8a2f8d876a94ab44cc5122ad34acd3cd; __51uvsct__Je1p5lxAB8oshp4Q=17; acw_sc__v2=643e9ca58cde54eeeb856549844efeccbfb00b49; __vtins__Je1p5lxAB8oshp4Q=%7B%22sid%22%3A%20%22a46f87fa-bb28-5e18-b3bf-a82380a1b6eb%22%2C%20%22vd%22%3A%2010%2C%20%22stt%22%3A%20384263%2C%20%22dr%22%3A%2038456%2C%20%22expires%22%3A%201681826769438%2C%20%22ct%22%3A%201681824969438%7D',
            'Referer': f'https://*****/plus/download.php?open=0&aid={aid}&cid=3',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36',
        }
        # 发送请求
        response_1 = requests.get(url=link, headers=headers)
        print(response_1.text)

“”"

  1. 获取数据, 获取 PPT下载页面 网页源代码

    请问: 为什么我请求获取网页源代码和网站上面显示不一样?

    答: 被反pa了, 因为没有伪装, 模拟, 被识别出来是程序, 从而得不到数据内容

    解决: 加headers请求头

  2. 解析数据, 提取我们想要的数据内容 < ppt压缩包下载地址 >

“”"

        # 提取下载链接
        download = re.findall('<li class="c1"><a href="(.*?)"', response_1.text)[0]

“”"

  1. 保存数据, 把ppt压缩包数据保存本地文件夹

    发送请求 + 获取数据

“”"

        # 发送请求获取数据
        content = requests.get(url=download).content
        with open('ppt\\' + title + '.zip', 'wb') as f:
            # 写入内容
            f.write(content)
        print(title, download)

尾语 💝

好了,今天的分享就差不多到这里了!

完整代码、更多资源、疑惑解答直接点击下方名片自取即可。

对下一篇大家想看什么,可在评论区留言哦!看到我会更新哒(ง •_•)ง

喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

【python】无限量PPT免费下载?找模板在不怕心仪得不能用啦

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇👇文章来源地址https://www.toymoban.com/news/detail-444322.html

到了这里,关于【python】无限量PPT免费下载?找模板在不怕心仪得不能用啦的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python免费下载安装全流程,新手小白必看!

    Python——一种解释型、面向对象、动态数据类型的高级程序设计语言,是人工智能首选的变成语言。 Python可以应用于Web应用开发、网络爬虫、人工智能、数据处理、服务器运维工作等。 以下为免费的资源 下载网址 (推荐官方网站直接下载): https://www.python.org/downloads/ 建议

    2024年02月02日
    浏览(61)
  • python和pycharm的安装(安装包免费下载共享)

    说明: 本文内容包括Python和Pycharm安装。 python是一门编程语言,安装python是为了能在电脑上使用这门语言。 1、python下载 下载链接:https://pan.baidu.com/s/1mWsJjO8HngNQtINCzu0bBA 提取码:90mq 2、python安装 新建文件夹“Python”,并将安装包放于此目录下。 3、到此,第一步:python 安装完

    2024年02月05日
    浏览(82)
  • Python免费下载安装全流程(Python 最新版本),新手小白必看!

    今天换了新的电脑,需要重新安装python和PyCharm,就简单的写个教程吧~ 1、进入Python官网 官网地址:https://www.python.org 2、点击【Downloads】展开后点击【Windows】跳转到下载python版本页面,选择\\\"Stable Releases\\\"稳定版本,我下载的是Python 3.10.10版本,所以找到【Python 3.10.10-Feb.8,2023】

    2024年02月07日
    浏览(64)
  • sonar-scanner-Windows本地Python代码检查使用方法【免费下载sonar-scanner验证有效】

    背景介绍: sonar作为开源的代码扫描工具,sonar-scanner是windows扫描器。SonarQube是一个开源的代码质量管理平台,可以将 sonar-scanner扫描的结果进行分析。 公司有搭建SonarQube质量管理平台,支持本地扫描和gitlab集成扫描。现在需要将本地的代码进行扫描,于是尝试了Windows本地

    2024年02月09日
    浏览(228)
  • Python实战之小说下载神器(完结)今天教你如何白拿一款代码版资源丰富的小说下载器GUI界面编程,海量资源免费看~(追书必备神器)

    爱看小伙伴想要一款资源丰富,好用的看小说的软件。 所以为大家做了一款Python版的小程序,这个系列内容已经到尾声了,上一期爬了小说排行榜 的所有小说内容采集,这一期的话终于到最后的阶段啦~ 这一期的代码有点儿多,本来是分为两个内容文章的,想了下阅读量不行

    2024年02月09日
    浏览(60)
  • 中文编程工具免费版下载,中文开发语言工具免费版下载

    中文编程工具免费版下载,中文开发语言工具免费版下载 中文编程工具开发的实际部分案例如下图 编程系统化课程总目录及明细,点击进入了解详情。https://blog.csdn.net/qq_29129627/article/details/134073098?spm=1001.2014.3001.5502

    2024年02月08日
    浏览(80)
  • 文章纠错免费软件-文字校对软件免费下载

    自动校对稿件的软件是一种基于自然语言处理(Natural Language Processing, NLP)和机器学习(Machine Learning)技术的工具,可以较为准确地检测和纠正文本中出现的语法、拼写、标点符号以及其他笔误等语言问题。相比于人工校对,自动校对软件可以大大提高校对效率,减少由于人

    2024年02月03日
    浏览(87)
  • Studio One免费版下载-Studio One免费版中文版下载安装

    软件介绍 Studio One 6是一款很好用的专业音乐编曲软件。Studio One 6会有很多的功能可以使用,能够帮助大家快速的编辑软件,能够让用户们可以很方便的编辑音乐。 studio one 6新功能 智能模板  更快的启动: 全新的智能模板为你手头的任务提供了必要的工具集,包括基本录制、

    2024年02月07日
    浏览(82)
  • phpstudy免费下载

    百度网盘分享 CDN下载 安装完成打开的面板相对旧版多了一些广告毕竟是为了白嫖的。当然相应的也更适合第一安装和使用的小白 1、启动Apache 和 MysQL后就可以在浏览器中地址栏属于localhost打开对应的网站 2、网站存放的地址是安装软件时候的对应磁盘里面phpstudy pro文件夹中的

    2024年02月09日
    浏览(44)
  • 微软文字转语音免费下载

    网上可以找到很多语音合成工具,但大部分是要注册收费的,很不方便。 这是微软的语音合成产品,可以在线免费试听: 文本转语音 – 真实 AI 语音生成器 | Microsoft Azure 微软的文字转语音效果挺好的,在抖音上经常听到微软的合成语音,但是网页上没有下载的入口,如果要

    2024年02月11日
    浏览(65)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包