记录第一个复现的实时whisper语音转文字demo

这篇具有很好参考价值的文章主要介绍了记录第一个复现的实时whisper语音转文字demo。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

使用的源码来自于github: GitHub - davabase/whisper_real_time: Real time transcription with OpenAI Whisper.

安装speech_recognition时需要安装依赖包PyAudio、pocketsphinx

还需要安装ffmpeg-python否则会报错

运行效果如下:

记录第一个复现的实时whisper语音转文字demo,whisper,语音识别,人工智能,python,pip

 点击运行程序后出现model loaded 没有错误然后直接对着麦克风说话即可文章来源地址https://www.toymoban.com/news/detail-605889.html

到了这里,关于记录第一个复现的实时whisper语音转文字demo的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • [python]基于faster whisper实时语音识别语音转文本

    语音识别转文本相信很多人都用过,不管是手机自带,还是腾讯视频都附带有此功能,今天简单说下: faster whisper地址: https://github.com/SYSTRAN/faster-whisper https://link.zhihu.com/?target=https%3A//github.com/SYSTRAN/faster-whisper 实现功能: 从麦克风获取声音进行实时语音识别转文本 代码仅仅

    2024年02月03日
    浏览(43)
  • 中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

    君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型,它具有高精度、高

    2024年02月03日
    浏览(51)
  • 语音识别whisper的介绍、安装、错误记录

    Whisper是OpenAI于2022年9月份开源的通用的语音识别模型。它是在各种音频的大型数据集上训练的模型,也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。 论文链接:https://arxiv.org/abs/2212.04356 github链接:https://github.com/openai/whisper Whisper主要是基于Pytorch实现,

    2024年02月08日
    浏览(56)
  • Windows 实时语音转文字|免费语音视频翻译转文字|语音会议记录方案

            经常在网站浏览视频的时想要把文字摘录成文本,但是实现这样的方案往往很复杂,怎么把实时语音或视频等会议记录 转换成文本呢?有了这样的需求那么就得找解决方案             1.   将视频下载到本地磁盘 通过第三方 语音转文字工具 实现         2.   实时

    2023年04月25日
    浏览(46)
  • 基于whisper的语音转文字(视频字幕)

    由于之前在学习油管的视频的时候,发现没有字幕,自己的口语听力又不太好,所以,打算开发一个能够语音或者视频里面,提取出字幕的软件。 在寻找了很多的开源仓库,发现了openai早期发布的whisper 原仓库链接如下 openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervis

    2024年02月08日
    浏览(62)
  • whisper 强大且开源的语音转文字

    说起来语音转换文字,openai旗下的whisper很是好用,推理也很快,同时支持cpu和GPU。 GitHub:GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision 相关的参数和内存使用如下: Size Parameters English-only model Multilingual model Required VRAM Relative speed tiny 39 M tiny.en tiny ~1 GB ~32x

    2024年02月10日
    浏览(41)
  • 使用openai-whisper实现语音转文字

    FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。 在官网上选择windows版本 在GitHub上可以选择最新版本,选择 ffmpeg-master-latest-win64-gpl.zip ; 如果python程序出现“

    2024年02月20日
    浏览(48)
  • 【openAI】Whisper如何高效语音转文字(详细教程)

    语音转文字在许多不同领域都有着广泛的应用。以下是一些例子: 1.字幕制作:语音转文字可以帮助视频制作者快速制作字幕,这在影视行业和网络视频领域非常重要。通过使用语音转文字工具,字幕制作者可以更快地生成字幕,从而缩短制作时间,节省人工成本,并提高制

    2024年02月09日
    浏览(45)
  • 无脑018——win11部署whisper,语音转文字

    安装pytorch 安装whisper 因为我的电脑是GTX 1060 显存只有6G 最大运行的模型是medium 所以去官网下载medium.pt模型 连接在这里: https://github.com/openai/whisper/blob/main/whisper/ init .py 然后自己录制一段mp3格式的音频放在如下文件夹中 G:desktopwhisper 打开conda窗口,进入该文件夹, 用command窗

    2024年02月04日
    浏览(33)
  • Buzz语音转文字安装使用(含Whisper模型下载)

    Transcribe and translate audio offline on your personal computer. Powered by OpenAI’s Whisper. 转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。 可以简单理解为QT的前端界面,python语言构建服务端,使用Whisper语言模型进行计算语音转文字的软件。 痛点在于离线,缺点也很明显,

    2024年02月05日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包