简单的用Python获取一下视频弹幕,新手练手实战项目,非常简单!

这篇具有很好参考价值的文章主要介绍了简单的用Python获取一下视频弹幕,新手练手实战项目,非常简单!。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

昨天看到个视频,弹幕挺有意思的,于是想着用Python给他全部扒下来。

代码非常简单,接下来我们看看 具体操作。

需要准备这些

软件

  • Python 3.8
  • Pycharm

模块使用

  • import requests 数据请求
  • import jieba 分词
  • import wordcloud 词云
  • import parsel 数据解析
  • import re 正则

win + R 输入cmd 输入安装命令 pip install 模块名 (如果你觉得安装速度比较慢, 你可以切换国内镜像源)

本次目标

视频地址: https://www.bilibili.com/video/BV1Nz4y1x7tA/
弹幕内容: https://www.ibilibili.com/video/BV1Nz4y1x7tA/
弹幕地址: https://api.bilibili.com/x/v1/dm/list.so?oid=1205968547

流程步骤

基本实现步骤: <公式>

  1. 发送请求 --> 数据所对应链接地址
    https://api.bilibili.com/x/v1/dm/list.so?oid=1205968547
  2. 获取数据 --> 获取整个页面数据内容
  3. 解析数据 --> 提取具体数据内容
  4. 保存数据 --> 保存本地文件

代码展示

模块导入# 数据请求模块 --> 第三方模块 需要安装 pip install requests

import requests   
# 导入正则表达式 --> 内置模块不需要安装
import re
# 导入数据解析模块 --> 第三方模块 需要安装 pip install parsel
# 视频讲解+代码我都打包好了,直接在这个q裙自取:708525271
import parsel

 

发送请求

# 请求链接
url = 'https://api.bilibili.com/x/v1/dm/list.so?oid=1205968547'
# 调用requests模块里面get请求方法对于url地址发送请求
response = requests.get(url)
print(response)

 

获取数据

获取文本响应数据

print(response.text)

 

当我们获取数据出现乱码怎么办呢?

response .encoding = 'utf-8'

 

数据解析

正则匹配数据

re_content = re.findall('<d p=".*?">(.*?)</d>',html_data)
content = re.findall('<source>(.*?)</source>', html_data)
print(re_content)
print(content)

 

转化数据

把获取到响应文本数据,转成可解析对象。

selector = parsel.Selector(html_data) # 选择器对象

# d 标签名字 d::text -提取d标签里的文本内容
css_content = selector.css('d::text').getall()

print(selector)

 

保存数据

for content in css_content:
    # mode 保存方式 --> w写入数据, 会覆盖 a 追加保存
    with open('弹幕_1.txt', mode='a', encoding='utf-8') as f:
        f.write(content)
        f.write('\n')
    print(content)

 

好了,今天的分享就到这里结束了,咱们下次见!文章来源地址https://www.toymoban.com/news/detail-626240.html

到了这里,关于简单的用Python获取一下视频弹幕,新手练手实战项目,非常简单!的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 简单的用Python抓取动态网页数据,实现可视化数据分析

    一眨眼明天就周末了,一周过的真快! 今天咱们用Python来实现一下动态网页数据的抓取 最近不是有消息说世界首富马上要变成中国人了吗,这要真成了,可就是历史上首位中国世界首富了! 那我们就以富豪排行榜为例,爬取一下2023年国内富豪五百强,最后实现一下可视化分

    2024年02月05日
    浏览(50)
  • 简单的用Python采集下微博评论,制作可视化词云图

    简单的用Python来获取微博评论,制作词云图。 环境使用 Python 3.8或以上版本即可 Pycharm 任意版本 模块使用   以上三个模块都需要安装,直接pip install 加上模块名安装即可。 一. 数据来源分析 明确需求: 明确采集的网站以及数据内容 - 网址: https://weibo.com/2803301701/NxcPMvW2l - 数据

    2024年02月04日
    浏览(40)
  • 简单的用Python采集猎聘招聘数据内容,并做可视化分析!

    现在刚毕业,很多小伙伴因为找不到工作或者找了很多也不喜欢,再有懒一点的,太热了根本不想出门到处找。 所以今天给大家分享如何在家就能找到心仪工作 使用Python批量采集招聘数据,进行可视化分析,轻松找到心仪工作! 话不多说,我们直接开始~ 软件工具 Python 3.

    2024年02月17日
    浏览(35)
  • python爬虫练手项目之获取某地企业名录

    因为很多网站都增加了登录验证,所以需要添加一段利用cookies跳过登陆验证码的操作 cookies获取方式 chrmoe浏览器,F12,把name和value填入cookies agent获取方式 任意点击一条网络资源,右侧headers往下翻到底 测试访问是否成功 访问成功的话进入下一步 一般翻页后查看网址变化就能

    2024年02月07日
    浏览(41)
  • 利用python对b站某GPT-4解说视频的近万条弹幕进行爬取、数据挖掘、数据分析、弹幕数量预测及情绪分类

             目录 一、利用Python爬取弹幕  二、利用几行代码直接生成词云 三、将弹幕属性和内容放入mysql当中  四、分析弹幕在视频各节点的数量 1、分析视频各个片段出现的弹幕数量 2、分析视频各大章节出现的弹幕数量 3.分析视频各小节出现的弹幕数量 五、分析弹幕数

    2024年02月11日
    浏览(38)
  • Node.js新手在哪儿找小项目练手?

    前言 可以参考一下下面的nodejs相关的项目,希望对你的学习有所帮助,废话少说,让我们直接进入正题 1、  NodeBB Star: 13.3k 一个基于Node.js的现代化社区论坛软件,具有快速、可扩展、易于使用和灵活的特点。它支持多种数据库,包括MongoDB、Redis和PostgreSQL,并且可以轻松地进

    2024年02月13日
    浏览(29)
  • 最近台风肆虐,让我们用Python获取天气数据,分析一下台风到底要去哪!

    最近台风肆虐,已进入我国24小时警戒线!台风“卡努”到底要去哪儿? 作为一个Python程序员,虽然我帮不上忙,但是时时关注一下还是可以的,顺便祈祷一下台风往东边某个小日子过得不错的小岛吹。 于是我花了一分钟,用Python写了一个获取天气数据的代码,然后进行数据

    2024年02月14日
    浏览(42)
  • 视频号直播弹幕采集

    训练地址:https://www.qiulianmao.com websocket逆向 http拦截 websocket拦截 视频号直播弹幕采集 实战一:Http轮询弹幕拦截 更新中

    2024年02月06日
    浏览(47)
  • 爬虫练手项目——获取龙族小说全文

    目标网站信息如下:包含了龙族1-5全部内容  视频录制:真实记录写爬虫代码全过程【以龙族小说为例】_哔哩哔哩_bilibili

    2024年02月13日
    浏览(50)
  • python简单认识一下字面量并尝试编写输出字面量在控制台

    首先 还是顾名思义 什么是字面量? 在代码中写下来的固定的值 我们称之为 字面量 python的字面量主要是以下几种 当然 前期不需要那么急 我们先熟悉 数字类型中的 整数 浮点数 和字符串类型 然后后续再慢慢扩展即可 整数呢 就相当于 我们数学中的 正整数 例如 1 10 45 50 浮点

    2023年04月11日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包