如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

这篇具有很好参考价值的文章主要介绍了如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一.前言

Whisper是Open AI开源的语音识别网络,支持98中语言,用于语音识别和翻译等任务。我们可以将歌曲的歌词进行识别,将无字幕的视频资源自动生成字母,极大方便了用户。同时,whisper可以在本地运行,充分保障了个人隐私。在识别方面也具有较准确的识别能力。
因此想通过本文对whisper的安装和使用进行说明,希望能对正在学习的伙伴给予参考。

二.本机环境

本设备基于Python环境:3.8.1,pip:23.0.1,torch:2.0.0+cpu
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

三.安装步骤:

步骤1:下载Git并添加环境变量

1.在以下网址进行安装Git:

https://git-scm.com/download/win

安装过程只需无脑点next,直至安装成功。

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!


win+R进入cmd控制台输入git,若显示如下,则表示安装成功!

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

若显示’git’ 不是内部或外部命令,也不是可运行的程序,则未安装成功

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

2.找到git.exe所在的位置,一般在bin下,本机为:

D:\Program Files\Git\bin

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

3.将git添加到环境变量中
win+R输入Sysdm.cpl进入环境变量配置

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

双击path
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

新建一个环境变量路径,填入所找到的git.exe所在的路径
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

步骤2:下载ffmpeg并添加环境变量

下载地址:

https://github.com/BtbN/FFmpeg-Builds/releases

1.选择 ffmpeg-master-latest-win64-gpl-shared.zip 版本点击下载
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!
2.找到ffmpeg.exe所在的位置,一般在bin下,本机为:

D:\ffmpeg\ffmpeg-master-latest-win64-gpl-shared\bin

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

3.将ffmpeg添加到环境变量中
win+R输入Sysdm.cpl进入环境变量配置

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

步骤3:安装pytorch

进入PyTorch官方网站:

https://pytorch.org/

选择cpu版本,最下面一行会提供一个pip命令用于安装torch

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

这里有个注意点:在原命令基础上加入参数 -i [镜像源地址],即可把国外的源换成国内源,可以极大程度上加快下载速度,命令如下:

pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

步骤4:安装whisper

在以上步骤均完成后,即可安装whisper,分别执行以下命令:

pip install git+https://github.com/openai/whisper.git

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

pip install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

至此,whisper的安装步骤就全部结束了。

四.whisper的应用

应用1:识别mp3歌曲中的歌词

在音频所在文件夹的空白处按住shift,然后鼠标右键单击,打开powershell窗口,如图:

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

进入PowerShell后,输入命令 :whisper + [你需要识别的音频],就可以开始识别了,首次识别时会先下载模型文件,如图:
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

这里以识别歌曲 爱在天际.mp3 为例,在PowerShell中输入:

whisper 爱在天际.mp3

识别结果如下:
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

需要注意的是,在不添加任何参数的情况下,whisper默认以其small模型进行训练。官方的模型有以下几种,分别为tiny、base、small、medium、large。各模型的大小以及速度对比如下图所示:

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

我们该如何选择其他模型进行语音识别呢?只需在命令后面加入参数即可,如我们要用medium模型识别爱在天际.mp3,只需在PowerShell中输入:

whisper 爱在天际.mp3 --model medium

同样,在首次使用模型的情况下,会先自动下载模型文件,再对音频进行识别

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

那我们下载的模型会存储在哪里呢?具体位置为

C:\Users[你的用户名].cache\whisper

以本机为例,在以下目录下即可找到所下载的模型文件:

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

当语音识别完成以后会在相应的目录下生成.vtt .json .str .tsv .txt 文件,其中 .srt 为字幕文件:

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

对.json .tsv .txt .vtt 文件进行对比:

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

应用2:识别mp4视频文件,以MV歌曲和英文TED演讲为例进行测试

① whisper识别MV歌曲

识别的操作和命令与.mp3文件的识别无异,命令均为 whisper + [待识别的文件名]
MV:念风及你.mp4识别结果如下:

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

同样,识别结束后生成了以下文件

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

② whisper识别TED英文演讲

识别结果可以看出,英文的识别也是毫无压力,识别准确率高:
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

应用3:whisper识别生成文件.srt字幕的使用

我们对音频识别产生的字幕文件该如何使用呢?
这里借助一个视频软件PotPlayer,该视频软件可以方便的读取.srt文件,在双击文件后就能自动将字幕与原视频对应上。PotPlayer下载地址:

http://potplayer.tv/?lang=zh_CN

PotPlayer安装完成后,接下来只需直接双击.srt文件即可。最后我们来看看字幕效果吧!

爱在天际.mp3
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

念风及你.mp4
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

TED演讲:如何有效地学习.mp4
如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!

五.结语

  从不同的测试结果可以看到,whisper的识别效果还是不错的,最后的字幕的显示结果也讨人欢喜。小伙伴们在使用的过程中也可以尝试使用whisper不同大小的模型进行识别,来提高识别的准确率哦!
  当然在具体安装和配置环境的过程中,我还是遇到了不少的问题的,感兴趣的小伙伴可看看我的上一篇博客的踩坑点,希望可以有效的帮助到大家。博客链接我放在下面啦。
  最后,特别感谢我同学zeyu对我的帮助!
  当然,也感谢大家的大力支持,你们的支持是我前进的最大动力,欢迎大家在评论区积极讨论哦~

链接<点击进入>:我的上一篇博客之whisper踩坑与解决 文章来源地址https://www.toymoban.com/news/detail-432394.html

到了这里,关于如何一键生成字幕,如何快速处理生肉资源?借助whisper语音识别系统生成.srt字幕文件 手把手教学在Windows、CPU版本下whisper的安装与使用,快速上手!的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【快速搞定Webpack5】处理样式资源(三)

    本次内容我们将学习使用 webpack 如何处理 css、less、sass、scss 等样式资源 webpack 本身是不能识别样式资源的,所以我们需要借助 loader 包来帮助 webpack 解析样式资源 我们找loader都应该去官方文档中查找对应的 loader ,然后学习使用。 官方文档找不到的话,可以从社区、 GitHub

    2024年02月22日
    浏览(43)
  • 【快速搞定Webpack5】处理图片资源(四)

    过去在 webpack4 中,我们处理图片资源通过file-loader和url-loader进行处理 现在 webpack5 已经将两个loader功能内置到webpack中了,我们只需要简单配置即可处理图片资源。 1、配置 新增37-38行配置 2、添加图片资源 src/images/1.jpg src/images/2.jpeg 3、使用图片资源 src/css/index.css src/less/index

    2024年02月22日
    浏览(50)
  • 【快速搞定Webpack5】处理字体图标资源(六)

    在实际开发中,几乎每个项目都需要用户 icon 图标以及部分项目会用到有特色的字体需求。 今天我们学习的内容就是如何在 webpack 中处理字体及 icon 图标的使用。 1、打开 阿里巴巴矢量图库 2、登录或注册账号 3、选择想要的图标添加到购物车,统一下载到本地 ● src/fonts/i

    2024年02月22日
    浏览(51)
  • 提升绘图效率不再难,看看这8款AI流程图软件,一键快速生成流程图!

    流程图是表示流程、系统和思想的重要视觉辅助工具。在当今数字时代,AI技术的出现已经彻底改变了制作流程图的方式。 在本文中,我们将与各位分享 8款好用的AI流程图软件 ,借助每款软件内置的AI能力,可以快速绘制出一份完整的流程图,以简化和增强你的绘图体验。

    2024年02月03日
    浏览(57)
  • 免费AI写作网站,如何一键生成文章?

    写作本不是一件轻松的事情,无论是写文章也好,还是写文案也罢,长期的写作总会出现无灵感可写的困境,所以免费AI写作网站就成了大家的智能创作助手了,许多的写作人员都想找到一个靠谱的免费AI写作网站帮助自己写作文章,可是面对信息量极为丰富的网络,我们想找

    2024年02月16日
    浏览(58)
  • 在word表格中一键生成序号,如何操作?

    目录 在word表格中一键生成序号,如何操作? 1、首先选中需要填序号的这一列​  2、在【开始】菜单中找到【多级列表】点击,再点击【定义新的多级列表】​  3、点击【修改级别中的1】,再点击【确定】,序号自动生成。  动图效果图如下  喜欢的记得点赞收藏哦! 安

    2024年02月06日
    浏览(38)
  • 【AIGC】如何让AI一键生成PPT

    这估计是职场人最关心的事儿了,当然,最好是免费的! 当然,我不认为PPT是个很好的效率工具,字节就不主张做PPT,能用一句话说清楚的事,绝对不要忽悠成一段话。但是,这并不影响PPT作为一个好的沟通工具,而且,这个PPT,代表了你或者你们公司的综合水平,对客户的

    2024年02月05日
    浏览(52)
  • 《AI上字幕》基于openAI研发的whisper模型,语音(视频)一键转文本/字幕/带时间轴/支持多语言/自带翻译《桌面版教程》

    OpenAI的chatGPT非常火爆,其实OpenAI旗下的另一个模型实力也十分强大,它就是开源免费的Whisper语音转文本模型,目前为止它是较为顶尖的语音转文本模型 当前github上也有许多出色的开发者根据此模型开发出桌面版语音转文字应用。较为出色的分别是Buzz和WhisperDesktop 支持将多种

    2023年04月19日
    浏览(48)
  • 教程 | 如何10秒内一键生成高质量PPT

    Hi! 大家好,我是赤辰! 近期新进的学员不少职场小白,对AI工具提效办公很感兴趣,今天火速给大家安排,ChatGPT+MindShow强强联合,30秒内快速生成PPT,对于策划小白来说简直是福音呀! 市场营销方案、活动策划方案、市场调研方案,那些让人头痛的方案框架,咱就说通通可

    2024年02月16日
    浏览(49)
  • 如何利用ChatGPT AI一键生成优秀员工获奖感言

    在当今竞争激烈的工作环境中,有效地表彰优秀员工不仅能提升团队士气,也能激励其他员工追求卓越。ChatGPT AI作为一种先进的工具,提供了快速生成个性化获奖感言的能力,使得表彰过程既高效又感人。 ChatGPT是OpenAI开发的基于GPT模型的语言处理工具,专门设计用于理解和

    2024年01月19日
    浏览(62)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包