【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

这篇具有很好参考价值的文章主要介绍了【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

嗨喽~大家好呀,这里是魔王呐 ❤ ~!

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

在我们的生活中,总少不了表情包来调剂

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

少了表情包就会少了很多趣味

今天就来教大家如何批量下载我们的表情包

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

环境使用:

  • Python 3.8

  • Pycharm 2021.2版本

模块使用:

内置模块:

  • import re

第三方模块:

  • import requests >>> pip install requests

第三方模块安装:

win + R 输入cmd 输入安装命令 或 在pycharm中点击Terminal(终端) 输入安装命令

如果出现爆红, 可能是因为 网络连接超时, 可切换国内镜像源,命令如下:

pip install -i https://pypi.doubanio.com/simple/ requests

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

如何去实现本次案例: <通用模板>

一. 数据来源分析

1. 明确自己采集数据, 是来自于哪里

    - 图片标题

    - 图片链接


通过浏览器自带工具: 开发者工具

    进行抓包分析

    1. 打开开发者工具: 鼠标右键点击检查选择network / F12

    2. 刷新网页: 为了让本网页数据内容重新加载一遍

    找到图片链接: 

    ---> 分析有没有地方, 把所有图片地址都包含

    3. 通过开发者工具: 搜索功能去搜索查询对应数据包在哪里

       由一个数据 ---> 分析找到相关所有数据来源地址

二. 代码实现步骤: 基本四大步骤 发送请求, 获取数据, 解析数据, 保存数据

采集一页数据:

1. 发送请求, 模拟浏览器对于url地址发送请求

2. 获取数据, 获取服务器返回响应数据

    开发者工具: response <网页源代码>

3. 解析数据, 提取我们想要的数据内容

    - 图片标题

    - 图片链接

4. 保存数据, 把图片内容保存到本地文件夹

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

代码展示

导入模块

# 导入数据请求模块 --> 第三方模块 需要安装 pip install requests  <手机第三方APP 需要自己下载>
import requests
# 导入正则模块 --> 内置模块 不需要安装  <相当于手机自带APP>
import re
# 导入文件操作模块 --> 内置模块 不需要安装
import os

“”"

- 导入模块是灰色, 不是报错 <没有使用模块>

- 模拟浏览器
    如果不伪装模拟: 可能会被识别出来是爬虫程序, 从而得不到数据
    headers 请求头 --> 直接去复制
    
- 请求方法选择是根据开发者工具来的 <根据浏览器来的>

- <Response [200]> 
    Response: 响应
    <> : 对象
    200:状态码 表示请求成功

“”"

采集多页数据内容: 分析请求url的参数变化规律

for page in range(26, 251):
    print(f'=====================正在采集第{page}页的数据内容=====================')

确定请求链接 f 字符串格式化方法, 把page传入到 url 这个字符串中间

    url = f'https://fabiaoqing.com/biaoqing/lists/page/{page}.html'

伪装模拟 字典数据类型, 构建完整键值对

    headers = {
        # User-Agent 用户代理, 表示浏览器基本身份信息
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
    }

调用requests模块里面get请求方法, 对于url地址发送请求, 并且携带上headers请求头伪装, 最后用自定义变量名response接收返回数据

    response = requests.get(url=url, headers=headers)
"""

开发者工具: response <网页源代码>

response --> <Response [200]>

text --> 文本

response.text: 获取响应文本数据, 网页源代码

re模块findall方法 找到所有数据

re.findall('匹配什么数据', '什么地方')

"""
    img_info = re.findall('<img class="ui image lazy" data-original="(.*?)" src=".*?" title="(.*?)" ', response.text)

for循环遍历, 把列表里面元素 一个一个提取出来

    for img_url, img_name in img_info:
        # img_info <列表: 箱子盒子> img_url, img_name <箱子里面东西>
        print(img_url, img_name)
    """

        response.content 获取二进制数据
        保存 音频/视频/图片/特定格式文件<PDF, zip...>

    """
        img_content = requests.get(url=img_url, headers=headers).content

自动创建文件夹 \ 转义字符串, 把含有特殊含义字符, 转义成除了本身以外不含有其他特殊含义

        filename = 'data\\'
        # 判断是否存在这个文件
        if not os.path.exists(filename):
            # 自动创建文件夹
            os.mkdir(filename)
        # 根据图片自己的后缀
        img = img_url.split('.')[-1]
        # 替换特殊字符
        new_name = re.sub(r'[\/:*?"<>|]', '', img_name)
        # len() 统计元素个数
        if len(new_name) > 20:
            new_name = new_name[:10]
    """
    OSError: [Errno 22] Invalid argument: 'data\\这盒里吗?.gif'
        含有特殊字符
    """
        with open(filename + new_name + '.' + img, mode='wb') as f:

写入数据

            f.write(img_content)

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~

尾语 💝

要成功,先发疯,下定决心往前冲!

学习是需要长期坚持的,一步一个脚印地走向未来!

未来的你一定会感谢今天学习的你。

—— 心灵鸡汤

本文章到这里就结束啦~感兴趣的小伙伴可以复制代码去试试哦 😝

【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~文章来源地址https://www.toymoban.com/news/detail-432679.html

👇问题解答 · 源码获取 · 技术交流 · 抱团学习请联系👇

到了这里,关于【python】你的表情包缺不缺?我猜你缺了~来批量获取一波吧~的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python爬虫:抓取表情包的下载链接

    1. 前言 最近发现了一个提供表情包的网址,觉得上面的内容不错,于是就考虑用Python爬虫获取上面表情包的下载链接。整体而言,实现这个挺简单的,就是找到提供表情包json数据的api接口即可,接口中没有任何加密操作。网址为:表情包 2. 具体实现 还是通过搜索功能,找到

    2024年02月13日
    浏览(46)
  • 【精选】Python+OpenCV表情识别系统(源码和部署教程)

    随着计算机视觉和人工智能技术的不断发展,表情识别系统在各个领域中得到了广泛的应用。表情是人类情感的重要表达方式之一,通过识别和理解人脸表情,计算机可以更好地与人类进行交互,从而提升用户体验和服务质量。基于OpenCV的表情识别系统成为了当前研究的热点

    2024年04月25日
    浏览(40)
  • 使用Python监听并下载微信聊天表情包

    只要有人给你发了表情包,不管是群聊还是个人发的,都将它保存到本地。也许某天斗图的时候就能用到,不过即使有了表情包,还需要一个检索功能,不然这一张一张看也太费眼睛了。 检索表情包 检索表情包的功能实现比较麻烦,至少需要两个模型:ocr和图片描述生成,

    2024年01月19日
    浏览(30)
  • 基于ChatGPT上线《你说我猜》小游戏

    AIGC、GPT、休闲小游戏三者可以怎么结合? AIGC、GPT与小游戏的结合为游戏体验带来了新的可能性。AIGC(Artificial Intelligence Game Content)作为一种人工智能技术,可以自动生成任务、剧情和角色对话等游戏元素,为小游戏注入丰富多样的内容。GPT(Generative Pre-trained Transformer)作

    2024年02月16日
    浏览(36)
  • 从斗鱼Android开发二面被刷,到VR微创公司收留,我的NDK开发梦究竟缺了什么

    除了Retrofit,你还知道哪些网络框架?用过吗? 安卓的最新版本知道是几吗?有哪些最新特性? 有自己适配过Dark Mode吗? Android的权限了解吗?如何申请一个权限? Android的通知了解吗?现在APP如何发出一个通知? Java中==和equals的区别? equals和hashcode有什么关系? 默认情况下

    2024年04月16日
    浏览(40)
  • 自动化测试,我猜它是你想要的优选

    在测试领域中,一个好平台可以实现高效率工作,进而降低人力物力的消耗,今天就给大家安利一个自动化平台,它是一站式自动化测试工具,全称为 AI-TestOps****云平台 ,具有的强大优势值得我们一一细说,接下来让我带领你们一同体验。 有兴趣的小伙伴也可以亲自体验一

    2024年01月15日
    浏览(44)
  • 强烈建议互联网人转战实体和农业,去了就是降维打击!实体太缺人才了,老板也不缺钱!...

    大环境不好,互联网人该何去何从? 一位网友提出了一个新思路:强烈建议互联网同学转战实体、农业这些行业。实体真的太缺人才了,目前大部分实体都留下70后、80后在继续奋斗。其实实体老板很多都不缺钱,经过多年积累,口袋现金流很充裕。互联网同学的工作能力完

    2024年02月01日
    浏览(38)
  • 要和文心一言来一把你画我猜吗?

    想和文心一言来一把你画我猜吗? ChatGPT的爆火,让AI对话模型再次走入大众视野。大家在感叹ChatGPT的智能程度时,总会忍不住想:如果我们也有自己的AI对话模型就好了。在社会的压力下,国内的厂商和研究机构也纷纷做出尝试。最早是复旦的MOSS,随后百度也加入了战场,

    2024年02月08日
    浏览(43)
  • 基于Python+OpenCV+dlib+Tensorflow深度学习的人脸表情识别系统

    欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。   人脸表情识别是一种重要的计算机视觉任务,它涉及到对人脸图像中的表情进行分类和理解。在这个系统中,我们将使用Python、OpenCV、dlib和Tensorflow来实现深度学习模型,以识别人脸表情。

    2024年02月01日
    浏览(50)
  • 计算机设计大赛 深度学习人脸表情识别算法 - opencv python 机器视觉

    🔥 优质竞赛项目系列,今天要分享的是 🚩 深度学习人脸表情识别系统 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🥇学长这里给一个题目综合评分(每项满分5分) 难度系数:3分 工作量:3分 创新点:4分 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/

    2024年02月21日
    浏览(171)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包