【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论-Toy模板网

这篇具有很好参考价值的文章主要介绍了【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

一、目标整理

今天的目标是爬取小红书上指定笔记下的所有评论数据。

以某篇举例，有2千多条评论。
以下代码，截止2023-12-01 有效。

python爬取小红书,爬虫案例,爬虫,python

效果如下：

python爬取小红书,爬虫案例,爬虫,python

每条评论获取多个字段，

笔记链接
页码
评论者昵称
评论者ID
评论者主页链接
评论时间
评论IP属地
评论点赞数
评论级别
评论内容

而评论包含根级评论、二级评论和二级展开评论（评论回复）。

二、逻辑分析

接口分析

python爬取小红书,爬虫案例,爬虫,python

可以看到从这个接口中获取了我们想要的数据，左边是内容展示，右边是接口返回的相关字段。

请求头

python爬取小红书,爬虫案例,爬虫,python

# 请求头
headers = {
   
	'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36',
	# cookie需定期更换
	'Cookie': 'xxxxxx',
}

请求头这部分主要的就是UA和Cookie，其中Cookie需要定期更换，否则会出现响应数据为空的情况。

请求参数

python爬取小红书,爬虫案例,爬虫,python

简单说明一下这几个参数：文章来源地址https://www.toymoban.com/news/detail-753297.html

note_id 这个是笔记的ID，为固定值
cusor，获取第一页的时候可以为空，获取后面评论的时候需要使用，稍后再讲
top_comment_id ，同样首次请求可以为空，之后才需要。
image_scenes 固定值</

到了这里，关于【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

【爬虫实战】使用Python获取小红书笔记下的几千条评论和多级评论

一、目标整理

二、逻辑分析

接口分析

请求头

请求参数

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2