Whisper 从0安装教程 windows
因为需要把语音变成文字稿,问了做语言相关的朋友,决定使用whisper来做这个工作
官方网站:https://github.com/ggerganov/whisper.cpp
但是官网的教程一般小白很难从0开始。我一共折腾了两天,找了不少教程,走了两次弯路终于搞定了。
安装过程
安装python3.11
因为看到Anaconda官网上最新的版本是基于python3.11的,但是我自己电脑上的版本是python3.10,为了避免我这种不太会搞环境的人不装错,还是先卸载3.10,装上3.11
在这里下载3.11最新版本,之后双击安装。
安装完成之后能够在开始菜单看到新安装的python3.11.
安装Anaconda
ref:https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf
在Anaconda官网下载
下载后双击安装,记住Anaconda的安装路径
之后一路默认选项直到安装完毕。
在Anaconda里面安装whisper
打开anaconda prompt
要以管理员权限打开,否则会装不上whisper
conda create --name whisper python=3.11
安装 ffmpeg
conda activate whisper
pip install ffmpeg-python
ffmpeg -version
检查一下whisper是不是装好了
第一次运行whisper
去到语音文件在的路径下,运行whisper,然后发现GPU没用上。
检查GPU
在任务管理器中检查GPU型号,这里可以看到这个gpu是6BG的。
然后就是检查cuda版本。
这里cuda版本是12.2
但是pytorch官方只有cuda12.1的版本的对应版本。但是不要担心,直接用这个就行,cuda12.2 对cuda12.1向下兼容。(我试了把指令里的12.1,改成12.2,然后没找到这个版本的pytorch)
安装
Check 是否能用GPU
运行:
后面加 --model medium可以用中等的模型(需要GPU在5G及以上)
然后就可以了!
会生成对应的字幕文件和txt文件
好像还可以指定语言
whisper xxxxx.mp4 --model medium --language Chinese
一些弯路
中间我用到的教程有:
https://zhuanlan.zhihu.com/p/595691785
这个教程是装在系统中运行的,我一开始是想按照这个教程来装的,但是我后来在anaconda里面装了pytorch,感觉都在anaconda里面搞算了,毕竟装到系统里面还要改环境变量啥的很麻烦。
https://www.csrc.ac.cn/upload/file/20200721/1595289784836646.pdf
这个是anaconda里面pytorch的安装,写得非常详细,我基本就是照这个装的pytorch,但是我后来发现我把pytorch装在了base里面。。。。。第一次运行的whisper只能用cpu,用不了gpu
https://medium.com/@steel540/whisper-teach-article-90a68687b912
最后用了这个教程,在anaconda里面装好了运行。
一些走弯路的时候的截图:
文章来源:https://www.toymoban.com/news/detail-755345.html
文章来源地址https://www.toymoban.com/news/detail-755345.html
到了这里,关于Whisper 从0安装教程 windows的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!