【爬虫+数据清洗+可视化分析】用Python分析哔哩哔哩“狂飙”的评论数据

这篇具有很好参考价值的文章主要介绍了【爬虫+数据清洗+可视化分析】用Python分析哔哩哔哩“狂飙”的评论数据。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、背景介绍

二、爬虫代码

三、可视化代码

3.1 读取数据

3.2 数据清洗

3.3 可视化

3.3.1 IP属地分析-柱形图

3.3.2 评论时间分析-折线图

3.3.3 点赞数分布-直方图

3.3.4 评论内容-情感分布饼图

3.3.5 评论内容-词云图

四、演示视频


一、背景介绍

您好,我是@马哥python说,一枚10年程序猿。

2023开年这段时间,《狂飙》这部热播剧引发全民追剧,不仅全员演技在线,更是符合反黑主旋律,因此创下多个收视率记录!

基于此热门事件,我用python抓取了B站上千条评论,并进行可视化舆情分析,下面详细讲解代码。

二、爬虫代码

爬虫部分不做讲解。

三、可视化代码

为了方便看效果,以下代码采用jupyter notebook进行演示。

3.1 读取数据

用read_csv读取刚才爬取的评论数据:

怎么对爬到的评论进行数据清洗,python数据可视化,python爬虫,python数据分析,python,爬虫,可视化,数据可视化,情感分析

读取数据

查看前3行及数据形状:

怎么对爬到的评论进行数据清洗,python数据可视化,python爬虫,python数据分析,python,爬虫,可视化,数据可视化,情感分析

前3行

3.2 数据清洗

怎么对爬到的评论进行数据清洗,python数据可视化,python爬虫,python数据分析,python,爬虫,可视化,数据可视化,情感分析

数据清洗

3.3 可视化

3.3.1 IP属地分析-柱形图

怎么对爬到的评论进行数据清洗,python数据可视化,python爬虫,python数据分析,python,爬虫,可视化,数据可视化,情感分析

柱形图

可得结论:TOP10地区中,评论里关注度最高为广东、山东、江苏等地区,其中,广东省的关注度最高。

3.3.2 评论时间分析-折线图

分析出评论时间的分布情况:

怎么对爬到的评论进行数据清洗,python数据可视化,python爬虫,python数据分析,python,爬虫,可视化,数据可视化,情感分析

折线图

可得结论:关于"狂飙"这个话题,在抓取到的数据范围内,2月2日的评论数据量最大,网友讨论最热烈,达到了将近1200的数量峰值。

3.3.3 点赞数分布-直方图

由于点赞数大部分为0或个位数情况,个别点赞数到达成千上万,直方图展示效果不佳,因此,仅提取点赞数<30的数据绘制直方图。

怎么对爬到的评论进行数据清洗,python数据可视化,python爬虫,python数据分析,python,爬虫,可视化,数据可视化,情感分析

直方图

可得结论:从直方图的分布来看,点赞数在0-3个的评论占据大多数,很少点赞数达到了上千上万的情况。证明网友对狂飙这部作品的态度分布比较均匀,没有出现态度非常聚集的评论内容。

3.3.4 评论内容-情感分布饼图

针对中文评论数据,采用snownlp开发情感判定函数:

怎么对爬到的评论进行数据清洗,python数据可视化,python爬虫,python数据分析,python,爬虫,可视化,数据可视化,情感分析

情感判定

情感分布饼图,如下:

怎么对爬到的评论进行数据清洗,python数据可视化,python爬虫,python数据分析,python,爬虫,可视化,数据可视化,情感分析

饼图

可得结论:关于狂飙这部电视剧,网友的评论情感以正面居多,占据了70.43%,说明这部电视剧获得了网友们很高的评价。

3.3.5 评论内容-词云图

除了哈工大停用词之外,还新增了自定义停用词:

怎么对爬到的评论进行数据清洗,python数据可视化,python爬虫,python数据分析,python,爬虫,可视化,数据可视化,情感分析

停用词

jieba分词之后,对分词后数据进行绘制词云图:

怎么对爬到的评论进行数据清洗,python数据可视化,python爬虫,python数据分析,python,爬虫,可视化,数据可视化,情感分析

词云图

可得结论:在词云图中,阳、感染、发烧、症状、疼、嗓子等词汇较大,出现频率较高,反应出众多网友对确诊阳性后描述病症、积极探讨病情的现状。

附原始背景图,可对比看:(需要先人物抠图)

怎么对爬到的评论进行数据清洗,python数据可视化,python爬虫,python数据分析,python,爬虫,可视化,数据可视化,情感分析

背景图

四、演示视频

代码演示视频:【爬虫+数据清洗+数据可视化】用python分析"狂飙"的B站评论


五、获取源码

完整源码:【爬虫+数据清洗+可视化分析】舆情分析哔哩哔哩"狂飙"的评论


我是马哥,全网累计粉丝上万,欢迎一起交流python技术。

各平台搜索“马哥python说”:知乎、哔哩哔哩、小红书、新浪微博。文章来源地址https://www.toymoban.com/news/detail-783471.html

到了这里,关于【爬虫+数据清洗+可视化分析】用Python分析哔哩哔哩“狂飙”的评论数据的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 大数据毕设 大数据招聘岗位数据分析与可视化 - 爬虫 python 大屏可视化

    # 1 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。 为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项

    2024年02月10日
    浏览(56)
  • Python爬虫+数据可视化:分析唯品会商品数据

    唯品会是中国领先的在线特卖会电商平台之一,它以“品牌特卖会”的模式运营,为会员提供品牌折扣商品。唯品会的商品包括服装、鞋类、箱包、美妆、家居、母婴、食品等各类品牌产品。 这就是今天的受害者,我们要拿取上面的泳衣数据,然后可以做些数据可视化 1. 明

    2024年02月15日
    浏览(57)
  • 大数据毕设项目 大数据招聘岗位数据分析与可视化 - 爬虫 python 大屏可视化

    # 1 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。 为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项

    2024年02月05日
    浏览(48)
  • 大数据毕设分享 大数据招聘岗位数据分析与可视化 - 爬虫 python 大屏可视化

    # 1 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。 为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项

    2024年02月04日
    浏览(61)
  • Python爬虫:批量采集58同城数据,进行可视化分析!

    哈喽大家好,今天我们来获取一下某个生活平台网站数据,进行可视化分析。 采集58的数据可以使用Python的requests库和beautifulsoup库,数据可视化分析可以使用matplotlib库和seaborn库。下面是一个简单的例子: 1、首先导入需要使用的模块   2、设置请求头,模拟浏览器请求。  

    2024年02月06日
    浏览(51)
  • python爬虫分析基于python图书馆书目推荐数据分析与可视化

    收藏关注不迷路 随着电子技术的普及和快速发展,线上管理系统被广泛的使用,有很多商业机构都在实现电子信息化管理,图书推荐也不例外,由比较传统的人工管理转向了电子化、信息化、系统化的管理。 传统的图书推荐管理,一开始都是手工记录,然后将手工记录的文

    2024年02月08日
    浏览(50)
  • Python招聘信息爬虫数据可视化分析大屏全屏系统

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,学习后应对毕业设计答辩。 项目配有对应开发文档、

    2024年04月09日
    浏览(64)
  • Python淘宝手机爬虫数据可视化分析大屏全屏系统

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,学习后应对毕业设计答辩。 项目配有对应开发文档、

    2024年04月17日
    浏览(51)
  • Python爬虫淘宝手机数据可视化分析大屏全屏系统

     博主介绍 :黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程,免费 项目配有对应开发文档、开题报告、任务书、

    2024年02月03日
    浏览(51)
  • 基于Python的网络爬虫爬取天气数据可视化分析

    目录 摘 要 1 一、 设计目的 2 二、 设计任务内容 3 三、 常用爬虫框架比较 3 四、网络爬虫程序总体设计 3 四、 网络爬虫程序详细设计 4 4.1设计环境和目标分析 4 4.2爬虫运行流程分析 5 爬虫基本流程 5 发起请求 5 获取响应内容 5 解析数据 5 保存数据 5 Request和Response 5 Request 5

    2024年02月08日
    浏览(52)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包