目录
环境配置
代码实现
****** 实现 .mp4转换为 .wav文件,识别后进行关键词匹配并输出关键词出现的次数
****** 完整代码实现请私信
环境配置
安装 ffmpeg
- 打开网址 https://github.com/BtbN/FFmpeg-Builds/releases
- 下载如下图所示的文件
- 下载后解压
我的路径是G:\ffmpeg-master-latest-win64-gpl-shared\bin
找到自己的安装路径,进入到 bin 目录,复制这个路径
- 在我的电脑中添加环境变量
右击 ---> 属性
高级系统设置
环境变量
找到 path,双击
新建 ---> 把刚刚的路径粘贴进来,确定
在搜索框中输入 cmd ,打开终端,输入 ffmpeg -version,显示如下则表示安装成功
安装 opencc库
pip install opencc -i https://pypi.tuna.tsinghua.edu.cn/simple
安装 torch
pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple
注:若运行时报关于 numpy 的错误,需要执行下面这个命令,更新 numpy 库文章来源:https://www.toymoban.com/news/detail-543735.html
pip install numpy --upgrade
代码实现
只展示核心,完整的请关注并私信文章来源地址https://www.toymoban.com/news/detail-543735.html
# 利用训练好的模型进行识别
result = whisper_model.transcribe('录音.wav')
到了这里,关于OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!