【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

这篇具有很好参考价值的文章主要介绍了【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

嗨喽~大家好呀,这里是魔王呐 ❤ ~!

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

在我们的生活中,总少不了表情包来调剂

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

少了表情包就会少了很多趣味

今天就来教大家如何批量下载我们的表情包

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

环境使用:

  • Python 3.8

  • Pycharm 2021.2版本

模块使用:

内置模块:

  • import re

第三方模块:

  • import requests >>> pip install requests

第三方模块安装:

win + R 输入cmd 输入安装命令 或 在pycharm中点击Terminal(终端) 输入安装命令

如果出现爆红, 可能是因为 网络连接超时, 可切换国内镜像源,命令如下:

pip install -i https://pypi.doubanio.com/simple/ requests

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

如何去实现本次案例: <通用模板>

一. 数据来源分析

1. 明确自己采集数据, 是来自于哪里

    - 图片标题

    - 图片链接


通过浏览器自带工具: 开发者工具

    进行抓包分析

    1. 打开开发者工具: 鼠标右键点击检查选择network / F12

    2. 刷新网页: 为了让本网页数据内容重新加载一遍

    找到图片链接: 

    ---> 分析有没有地方, 把所有图片地址都包含

    3. 通过开发者工具: 搜索功能去搜索查询对应数据包在哪里

       由一个数据 ---> 分析找到相关所有数据来源地址

二. 代码实现步骤: 基本四大步骤 发送请求, 获取数据, 解析数据, 保存数据

采集一页数据:

1. 发送请求, 模拟浏览器对于url地址发送请求

2. 获取数据, 获取服务器返回响应数据

    开发者工具: response <网页源代码>

3. 解析数据, 提取我们想要的数据内容

    - 图片标题

    - 图片链接

4. 保存数据, 把图片内容保存到本地文件夹

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

代码展示

导入模块

# 导入数据请求模块 --> 第三方模块 需要安装 pip install requests  <手机第三方APP 需要自己下载>
import requests
# 导入正则模块 --> 内置模块 不需要安装  <相当于手机自带APP>
import re
# 导入文件操作模块 --> 内置模块 不需要安装
import os

“”"

- 导入模块是灰色, 不是报错 <没有使用模块>

- 模拟浏览器
    如果不伪装模拟: 可能会被识别出来是爬虫程序, 从而得不到数据
    headers 请求头 --> 直接去复制
    
- 请求方法选择是根据开发者工具来的 <根据浏览器来的>

- <Response [200]> 
    Response: 响应
    <> : 对象
    200:状态码 表示请求成功

“”"

采集多页数据内容: 分析请求url的参数变化规律

for page in range(26, 251):
    print(f'=====================正在采集第{page}页的数据内容=====================')

确定请求链接 f 字符串格式化方法, 把page传入到 url 这个字符串中间

    url = f'https://fabiaoqing.com/biaoqing/lists/page/{page}.html'

伪装模拟 字典数据类型, 构建完整键值对

    headers = {
        # User-Agent 用户代理, 表示浏览器基本身份信息
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
    }

调用requests模块里面get请求方法, 对于url地址发送请求, 并且携带上headers请求头伪装, 最后用自定义变量名response接收返回数据

    response = requests.get(url=url, headers=headers)
"""

开发者工具: response <网页源代码>

response --> <Response [200]>

text --> 文本

response.text: 获取响应文本数据, 网页源代码

re模块findall方法 找到所有数据

re.findall('匹配什么数据', '什么地方')

"""
    img_info = re.findall('<img class="ui image lazy" data-original="(.*?)" src=".*?" title="(.*?)" ', response.text)

for循环遍历, 把列表里面元素 一个一个提取出来

    for img_url, img_name in img_info:
        # img_info <列表: 箱子盒子> img_url, img_name <箱子里面东西>
        print(img_url, img_name)
    """

        response.content 获取二进制数据
        保存 音频/视频/图片/特定格式文件<PDF, zip...>

    """
        img_content = requests.get(url=img_url, headers=headers).content

自动创建文件夹 \ 转义字符串, 把含有特殊含义字符, 转义成除了本身以外不含有其他特殊含义

        filename = 'data\\'
        # 判断是否存在这个文件
        if not os.path.exists(filename):
            # 自动创建文件夹
            os.mkdir(filename)
        # 根据图片自己的后缀
        img = img_url.split('.')[-1]
        # 替换特殊字符
        new_name = re.sub(r'[\/:*?"<>|]', '', img_name)
        # len() 统计元素个数
        if len(new_name) > 20:
            new_name = new_name[:10]
    """
    OSError: [Errno 22] Invalid argument: 'data\\这盒里吗?.gif'
        含有特殊字符
    """
        with open(filename + new_name + '.' + img, mode='wb') as f:

写入数据

            f.write(img_content)

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

尾语 💝

要成功,先发疯,下定决心往前冲!

学习是需要长期坚持的,一步一个脚印地走向未来!

未来的你一定会感谢今天学习的你。

—— 心灵鸡汤

本文章到这里就结束啦~感兴趣的小伙伴可以复制代码去试试哦 😝

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~文章来源地址https://www.toymoban.com/news/detail-432679.html

👇问题解答 · 源码获取 · 技术交流 · 抱团学习请联系👇

到了这里,关于【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 《python爬虫练习2》爬取网站表情包

    运行环境: 1.分析: 目标网址:https://www.runoob.com/ 首先想要获取什么就从哪里入手,打开图所在的网页,F12查看代码的内容,此处抓取的是资源文件,爬取中发现ajax类型的文件加载出来的无法知道图片的源地址所以暂时不能用这种方式获取。因此可以生成第一步的代码。

    2024年02月01日
    浏览(31)
  • 使用Python监听并下载微信聊天表情包

    只要有人给你发了表情包,不管是群聊还是个人发的,都将它保存到本地。也许某天斗图的时候就能用到,不过即使有了表情包,还需要一个检索功能,不然这一张一张看也太费眼睛了。 检索表情包 检索表情包的功能实现比较麻烦,至少需要两个模型:ocr和图片描述生成,

    2024年01月19日
    浏览(22)
  • 【精选】Python+OpenCV表情识别系统(源码和部署教程)

    随着计算机视觉和人工智能技术的不断发展,表情识别系统在各个领域中得到了广泛的应用。表情是人类情感的重要表达方式之一,通过识别和理解人脸表情,计算机可以更好地与人类进行交互,从而提升用户体验和服务质量。基于OpenCV的表情识别系统成为了当前研究的热点

    2024年04月25日
    浏览(27)
  • 基于ChatGPT上线《你说我猜》小游戏

    AIGC、GPT、休闲小游戏三者可以怎么结合? AIGC、GPT与小游戏的结合为游戏体验带来了新的可能性。AIGC(Artificial Intelligence Game Content)作为一种人工智能技术,可以自动生成任务、剧情和角色对话等游戏元素,为小游戏注入丰富多样的内容。GPT(Generative Pre-trained Transformer)作

    2024年02月16日
    浏览(24)
  • 从斗鱼Android开发二面被刷,到VR微创公司收留,我的NDK开发梦究竟缺了什么

    除了Retrofit,你还知道哪些网络框架?用过吗? 安卓的最新版本知道是几吗?有哪些最新特性? 有自己适配过Dark Mode吗? Android的权限了解吗?如何申请一个权限? Android的通知了解吗?现在APP如何发出一个通知? Java中==和equals的区别? equals和hashcode有什么关系? 默认情况下

    2024年04月16日
    浏览(33)
  • 自动化测试,我猜它是你想要的优选

    在测试领域中,一个好平台可以实现高效率工作,进而降低人力物力的消耗,今天就给大家安利一个自动化平台,它是一站式自动化测试工具,全称为 AI-TestOps****云平台 ,具有的强大优势值得我们一一细说,接下来让我带领你们一同体验。 有兴趣的小伙伴也可以亲自体验一

    2024年01月15日
    浏览(30)
  • 强烈建议互联网人转战实体和农业,去了就是降维打击!实体太缺人才了,老板也不缺钱!...

    大环境不好,互联网人该何去何从? 一位网友提出了一个新思路:强烈建议互联网同学转战实体、农业这些行业。实体真的太缺人才了,目前大部分实体都留下70后、80后在继续奋斗。其实实体老板很多都不缺钱,经过多年积累,口袋现金流很充裕。互联网同学的工作能力完

    2024年02月01日
    浏览(26)
  • 要和文心一言来一把你画我猜吗?

    想和文心一言来一把你画我猜吗? ChatGPT的爆火,让AI对话模型再次走入大众视野。大家在感叹ChatGPT的智能程度时,总会忍不住想:如果我们也有自己的AI对话模型就好了。在社会的压力下,国内的厂商和研究机构也纷纷做出尝试。最早是复旦的MOSS,随后百度也加入了战场,

    2024年02月08日
    浏览(31)
  • 基于Python+OpenCV+dlib+Tensorflow深度学习的人脸表情识别系统

    欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。   人脸表情识别是一种重要的计算机视觉任务,它涉及到对人脸图像中的表情进行分类和理解。在这个系统中,我们将使用Python、OpenCV、dlib和Tensorflow来实现深度学习模型,以识别人脸表情。

    2024年02月01日
    浏览(33)
  • 计算机设计大赛 深度学习人脸表情识别算法 - opencv python 机器视觉

    🔥 优质竞赛项目系列,今天要分享的是 🚩 深度学习人脸表情识别系统 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🥇学长这里给一个题目综合评分(每项满分5分) 难度系数:3分 工作量:3分 创新点:4分 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/

    2024年02月21日
    浏览(72)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包