记录第一个复现的实时whisper语音转文字demo

9月前作者：一个女橙续圆分类：Toy博客阅读(40) 违法举报

这篇具有很好参考价值的文章主要介绍了记录第一个复现的实时whisper语音转文字demo。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

使用的源码来自于github: GitHub - davabase/whisper_real_time: Real time transcription with OpenAI Whisper.

安装speech_recognition时需要安装依赖包PyAudio、pocketsphinx

还需要安装ffmpeg-python否则会报错

运行效果如下：

记录第一个复现的实时whisper语音转文字demo,whisper,语音识别,人工智能,python,pip

点击运行程序后出现model loaded 没有错误然后直接对着麦克风说话即可文章来源地址https://www.toymoban.com/news/detail-605889.html

到了这里，关于记录第一个复现的实时whisper语音转文字demo的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

[python]基于faster whisper实时语音识别语音转文本

语音识别转文本相信很多人都用过，不管是手机自带，还是腾讯视频都附带有此功能，今天简单说下： faster whisper地址： https://github.com/SYSTRAN/faster-whisper https://link.zhihu.com/?target=https%3A//github.com/SYSTRAN/faster-whisper 实现功能：从麦克风获取声音进行实时语音识别转文本代码仅仅

2024年02月03日
浏览(43)
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型，它具有高精度、高

2024年02月03日
浏览(51)
语音识别whisper的介绍、安装、错误记录

Whisper是OpenAI于2022年9月份开源的通用的语音识别模型。它是在各种音频的大型数据集上训练的模型，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。论文链接：https://arxiv.org/abs/2212.04356 github链接：https://github.com/openai/whisper Whisper主要是基于Pytorch实现，

2024年02月08日
浏览(56)
Windows 实时语音转文字|免费语音视频翻译转文字|语音会议记录方案

经常在网站浏览视频的时想要把文字摘录成文本,但是实现这样的方案往往很复杂,怎么把实时语音或视频等会议记录转换成文本呢？有了这样的需求那么就得找解决方案 1. 将视频下载到本地磁盘通过第三方语音转文字工具实现 2. 实时

2023年04月25日
浏览(46)
基于whisper的语音转文字（视频字幕）

由于之前在学习油管的视频的时候，发现没有字幕，自己的口语听力又不太好，所以，打算开发一个能够语音或者视频里面，提取出字幕的软件。在寻找了很多的开源仓库，发现了openai早期发布的whisper 原仓库链接如下 openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervis

2024年02月08日
浏览(62)
whisper 强大且开源的语音转文字

说起来语音转换文字，openai旗下的whisper很是好用，推理也很快，同时支持cpu和GPU。 GitHub：GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision 相关的参数和内存使用如下： Size Parameters English-only model Multilingual model Required VRAM Relative speed tiny 39 M tiny.en tiny ~1 GB ~32x

2024年02月10日
浏览(41)
使用openai-whisper实现语音转文字

FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。在官网上选择windows版本在GitHub上可以选择最新版本，选择 ffmpeg-master-latest-win64-gpl.zip ；如果python程序出现“

2024年02月20日
浏览(48)
【openAI】Whisper如何高效语音转文字（详细教程）

语音转文字在许多不同领域都有着广泛的应用。以下是一些例子： 1.字幕制作：语音转文字可以帮助视频制作者快速制作字幕，这在影视行业和网络视频领域非常重要。通过使用语音转文字工具，字幕制作者可以更快地生成字幕，从而缩短制作时间，节省人工成本，并提高制

2024年02月09日
浏览(45)
无脑018——win11部署whisper，语音转文字

安装pytorch 安装whisper 因为我的电脑是GTX 1060 显存只有6G 最大运行的模型是medium 所以去官网下载medium.pt模型连接在这里： https://github.com/openai/whisper/blob/main/whisper/ init .py 然后自己录制一段mp3格式的音频放在如下文件夹中 G:desktopwhisper 打开conda窗口，进入该文件夹，用command窗

2024年02月04日
浏览(33)
Buzz语音转文字安装使用(含Whisper模型下载)

Transcribe and translate audio offline on your personal computer. Powered by OpenAI’s Whisper. 转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。可以简单理解为QT的前端界面，python语言构建服务端，使用Whisper语言模型进行计算语音转文字的软件。痛点在于离线，缺点也很明显，

2024年02月05日
浏览(38)