python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息

这篇具有很好参考价值的文章主要介绍了python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

爬虫的步骤:
(1)申请自己的公众号
(2)使用fiddler抓包工具
(3)pycharm
(一)申请公众号
官网:微信公众平台
填入相关信息创建微信公众号
进入公众号界面如下:
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
找到新的创作-图文信息
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
在弹出的界面中查找公众号文章-输入公众号名称-确定
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
点击确认之后,进入公众号,可以查看相应文章。
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
右键单击空白处,选择检查-网络,显示界面如下:
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息

在请求标头中获取cookieuser-agent
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息

同时还需要获取Fakeidtoken
fakeid:是公众号独一无二的一个id
token:是自己的公众号独有的id
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
以上已经获取到了电脑端需要的4个重要参数:
Cookies、user-Agent 、fakeid 、token
爬取点赞数和阅读数:
在之前查找公众号的文章时,可以在相应信息中查找到文章的相关信息:
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
观察这些信息,可以在信息中找到公众号的文章标题,文章对应的链接
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
将文章链接复制到浏览器中,可以看到对应的公众号文章:
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
得到文章的链接之后,需要从链接中找到pass_ticket 、 appmsg_tojen 、 cookies 、user-Agent 、key。
通过fiddler抓包,得到这些参数
打开fiddler,选择过滤器
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
设置以下参数,点击action,设定只抓取关于微信公众相关的包
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
之后进入自己的微信客户端-选择公众号-查看历史信息-点开公众号的文章。
这时可以看到fiddler中出现一系列的包,依次点击抓取的包,在inspectors中查看以下信息,获取 pc微信端cookie 和user-agent
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
切换点击界面,可以看到如下信息:
python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息
可以从上面的界面中找到需要保存的参数:

更换公众号爬虫只需要更换PC微信的Key、 pass_ticket、 appmsg_tojen以及公众号的Fakeid。对某一公众号爬虫时,KEY大约20-30分钟会失效。可以再次打开fiddler重新进行获取。

贴一下我的代码:文章来源地址https://www.toymoban.com/news/detail-452549.html

# -*- coding: utf-8 -*-
import requests
import time
import json
from openpyxl import Workbook
import random

# 目标url
url = "https://mp.weixin.qq.com/cgi-bin/appmsg"

Cookie = "自己的cookies"
# 使用Cookie,跳过登陆操作
headers = {
   
    "Cookie": Cookie,
    "User-Agent": "自己的user-agent",
}

"""
需要提交的data
以下个别字段是否一定需要还未验证。
注意修改yourtoken,number
number表示从第number页开始爬取,为5的倍数,从0开始。如0、5、10……
token可以使用Chrome自带的工具进行获取
fakeid是公众号独一无二的一个id,等同于后面的__biz
"""
token = "自己公众号的token"#公众号
fakeid = "Mzk0NzI5NDc5MA%3D%3D"#公众号对应的id
type = '9'
#爬虫网址中的参数
data1 = {
   
    "token": token,
    "lang": "zh_CN",
    "f": "json",
    "ajax": "1",
    "action": "list_ex",
    "begin": "0",
    "count": 

到了这里,关于python爬虫爬取微信公众号的阅读数、喜爱数、文章标题和链接等信息的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【经典爬虫案例】用Python爬取微博热搜榜!

    目录 一、爬取目标 二、编写爬虫代码 2.1 前戏 2.2 获取cookie 2.3 请求页面 2.4 解析页面 2.5 转换热搜类别 2.6 保存结果 2.7 查看结果数据 三、获取完整源码 您好,我是@马哥python说,一名10年程序猿。 本次爬取的目标是: 微博热搜榜 ​ 分别爬取每条热搜的: 热搜标题、热搜排名

    2024年02月13日
    浏览(45)
  • Python爬虫 | 爬取微博和哔哩哔哩数据

    目录 一、bill_comment.py 二、bili_comment_pic.py 三、bilibili.py 四、bilihot_pic.py 五、bilisearch_pic.py 六、draw_cloud.py 七、weibo.py 八、weibo_comment.py 九、weibo_comment_pic.py 十、weibo_pic.py 十一、weibo_top.py 十二、weibo_top_pic.py 十三、weibo_top_pie.py 十四、pachong.py 十五、代码文件说明 pachong: b站、

    2024年02月12日
    浏览(57)
  • 爬虫 | Python爬取微博实时热搜榜信息

    大家好,我是程序员晓晓~ 本期给大家分享一下如何 用python获取微博热搜榜 信息,包含 爬取时间、序号、、热度 等信息,希望对大家有所帮助。 所有内容仅供参考,不做他用。 1. 网页分析 目标网址(微博热搜榜): https://s.weibo.com/top/summary 实时热搜榜一共有50条,每个

    2024年02月02日
    浏览(58)
  • python爬取微信小程序数据,python爬取小程序数据

    大家好,小编来为大家解答以下问题,python爬取微信小程序数据,python爬取小程序数据,现在让我们一起来看看吧! 最近需要获取微信小程序上的数据进行分析处理,第一时间想到的方式就是采用python爬虫爬取数据,尝试后发现诸多问题,比如无法获取目标网址、解析网址中

    2024年02月04日
    浏览(47)
  • 【爬虫实战】用python爬取微博任意关键词搜索结果、exe文件

    项目功能简介: 1.交互式配置; 2.两种任意来源(直接输入、本地文件); 3.自动翻页(无限爬取); 4.指定最大翻页页码; 5.数据保存到csv文件; 6.程序支持打包成exe文件; 7.项目操作说明文档; 一.最终效果 视频演示: 用python爬取微博搜索结果、exe文件

    2024年02月02日
    浏览(70)
  • 用python语言爬虫爬取微博评论--上--初步爬虫(超详细版,大学生不骗大学生)

    目录 一、找到页面  二、学会使用检查元素 2.1 打开检查元素界面 2.2 找到所有评论所在的位置 2.2.1 搜索评论 2.2.2  找到data表 三、基础部分代码实现 ​​​​​​​ 全部已经更完(下面两个链接是中和下) https://blog.csdn.net/m0_68325382/article/details/137234661?spm=1001.2014.3001.5502 爬

    2024年04月10日
    浏览(56)
  • 关于微信公众号的h5页面跳转微信小程序的详细介绍

    关于微信公众号跳转小程序的功能,我也是研究了一整天才弄好的,主要是微信官方文档写的不清楚,百度上的各种文章也各说各的,不过最后还是要相信官网文档,接下来我会一步一步分析,希望对你有帮助,并且最后会贴上全部代码。 一、条件 已认证的 服务号 ,服务号

    2024年02月10日
    浏览(65)
  • 微信小程序official-account组件 关注公众号的使用

    官方文档链接official-account 1.使用组件前,需前往小程序后台,在“设置”-“关注公众号”中设置要展示的公众号。注:设置的公众号需与小程序为同主体或关联主体。 只需写下面一行代码 其实有上面的代码就够了 效果已经出来了 下面代码起辅助作用 调试 扫码打开也可以

    2024年02月16日
    浏览(58)
  • 爬取微博热搜榜并进行数据分析

    :爬取微博热搜榜数据。 用requests库访问页面用get方法获取页面资源,登录页面对页面HTML进行分析,用beautifulsoup库获取并提取自己所需要的信息。再讲数据保存到CSV文件中,进行数据清洗,数据可视化分析,绘制数据图表,并用最小二乘法进行拟合分析。 :通过观察页面HT

    2024年02月15日
    浏览(54)
  • 使用selenium自动化工具爬取微博内容和评论

    任务需求是爬取微博的内容和评论。一开始我是准备直接用正常的爬虫来做,但是发现微博上的内容几乎都是动态加载生成的。所以了解了一下就学习使用·selenium自动化测试工具来爬取相关数据。 首先是不登录微博,发现只能查看最多二十条数据,这自然限制太大所以还是

    2024年02月02日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包