本地部署_语音识别工具_Whisper

1年前作者：xieyan0811分类：Toy博客阅读(7)违法举报

这篇具有很好参考价值的文章主要介绍了本地部署_语音识别工具_Whisper。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1 简介

Whisper 是 OpenAI 的语音识别系统（几乎是最先进），它是免费的开源模型，可供本地部署。

2 docker

https://hub.docker.com/r/onerahmet/openai-whisper-asr-webservice

3 github

https://github.com/ahmetoner/whisper-asr-webservice

4 运行

nvidia-docker run -d --gpus all -p 9000:9000 -e ASR_MODEL=base -e ASR_ENGINE=openai_whisper onerahmet/openai-whisper-asr-webservice:latest-gpu

image 大小：11.5G
运行后，即可在9000端口通过swagger调用，我先用手机录了一些简单的中文，识别效果还不错，除了第一次调用时可能是下载和加载模型时间比较长，后面再调用速度就很快。
又用它识别了一个25分钟的mp3（约27M），是一位小哥哥B站视频对应的音频文件，识别时间约为不到1分钟，使用GPU内存占用在1G之内，尽管有一小部分乱码和一些重复，但整体效果不错。
我觉得速度和效果都相当美丽，绝对可以作为一些收费产品的平替了～～文章来源地址https://www.toymoban.com/news/detail-751788.html

5 注意事项

上传的音频文件使用时尽量不要用中文文件名

到了这里，关于本地部署_语音识别工具_Whisper的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Whisper——部署fast-whisper中文语音识别模型
whisper：https://github.com/openai/whisper/tree/main 参考文章：Whisper OpenAI开源语音识别模型需要其他版本的可以自己下载：https://huggingface.co/openai 原始中文语音模型：微调后的中文语音模型：补下一个： tokenizer.json 模型转换 float16 ： int8 ：
2024年01月22日
浏览(20)
whisper 语音识别项目部署
1.安装anaconda软件在如下网盘免费获取软件：链接：https://pan.baidu.com/s/1zOZCQOeiDhx6ebHh5zNasA 提取码：hfnd 2.使用conda命令创建python3.8环境 3.进入whisper虚拟环境 4.安装cuda10.0的PyTorch环境 5.使用命令安装whisper库包 6.简单使用命令识别一段语音： 6.安装和配置ffmpeg软件在如下网盘免费
2024年02月11日
浏览(7)
whisper语音识别部署及WER评价
1.whisper部署详细过程可以参照：🏠 创建项目文件夹 conda创建虚拟环境安装pytorch 下载whisper 安装相关包测试一下whispet是否安装成功（默认识别为中文） whisper识别中文的时候经常会输出繁体，加入一下参数可以避免： 2.脚本批量测试创建test.sh脚本，输入一下内容，可以实
2024年02月10日
浏览(9)
极速进化,光速转录,C++版本人工智能实时语音转文字(字幕/语音识别)Whisper.cpp实践
业界良心OpenAI开源的Whisper模型是开源语音转文字领域的执牛耳者，白璧微瑕之处在于无法通过苹果M芯片优化转录效率，Whisper.cpp 则是 Whisper 模型的 C/C++ 移植版本，它具有无依赖项、内存使用量低等特点，重要的是增加了 Core ML 支持，完美适配苹果M系列芯片。 Whisper.cpp的张量
2024年02月02日
浏览(11)
whisper实践--基于whisper+pyqt5开发的语音识别翻译生成字幕工具
大家新年快乐，事业生活蒸蒸日上，解封的第一个年，想必大家都回家过年，好好陪陪家人了吧，这篇文章也是我在老家码的，还记得上篇我带大家基本了解了whisper，相信大家对whisper是什么，怎么安装whisper，以及使用都有了一个认识，这次作为新年第一篇文章，我将介绍一
2024年02月01日
浏览(8)
学习实践-Whisper语音识别模型实战（部署+运行）
OpenAI的语音识别模型Whisper，Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集，可以提高对口音、背景噪音
2024年02月06日
浏览(6)
开源语音识别faster-whisper部署教程
源码地址模型下载地址：下载 cuBLAS and cuDNN 在 conda 环境中创建 python 运行环境激活虚拟环境安装 faster-whisper 依赖执行完以上步骤后，我们可以写代码了说明：更多内容欢迎访问博客对应视频内容欢迎访问视频
2024年02月04日
浏览(8)
ubuntu16.04安装语音识别whisper及whisper-ctranslate2工具（填坑篇）
环境：系统ubuntu16.04，显卡是NVIDIA Quadro RTX5000 目标：安装语音识别工具whipser/whipser-ctranslate2 因之前有过几次在linux和windows上有过部署whisper经验和使用经验，其中有使用GPU的，有CPU的，各自语音识别效率一言难尽，建议直接装whipser-ctranslate2。同时，感谢B站博主
2024年02月04日
浏览(6)
语音识别whisper
Whisper是一个通用的语音识别模型，它使用了大量的多语言和多任务的监督数据来训练，能够在英语语音识别上达到接近人类水平的鲁棒性和准确性1。Whisper还可以进行多语言语音识别、语音翻译和语言识别等任务2。Whisper的架构是一个简单的端到端方法，采用了编码器-解码器
2024年02月12日
浏览(8)
python语音识别whisper
一、背景最近想提取一些视频的字幕，语音文案，研究了一波二、whisper语音识别 Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。 stable-ts在 OpenAI 的 Whisper 之上修改并添加
2024年02月05日
浏览(29)