OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】

这篇具有很好参考价值的文章主要介绍了OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

环境配置

代码实现


******  实现 .mp4转换为 .wav文件,识别后进行关键词匹配并输出关键词出现的次数

******  完整代码实现请私信

环境配置

安装 ffmpeg

  • 打开网址   https://github.com/BtbN/FFmpeg-Builds/releases
  • 下载如下图所示的文件

OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】,whisper,语音识别,人工智能

  • 下载后解压

 我的路径是G:\ffmpeg-master-latest-win64-gpl-shared\bin

找到自己的安装路径,进入到 bin 目录,复制这个路径

OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】,whisper,语音识别,人工智能

  • 在我的电脑中添加环境变量

右击 ---> 属性

OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】,whisper,语音识别,人工智能

 高级系统设置

OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】,whisper,语音识别,人工智能

 环境变量

OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】,whisper,语音识别,人工智能

 找到 path,双击

OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】,whisper,语音识别,人工智能

新建 --->  把刚刚的路径粘贴进来,确定

OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】,whisper,语音识别,人工智能

在搜索框中输入 cmd ,打开终端,输入 ffmpeg -version,显示如下则表示安装成功

OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】,whisper,语音识别,人工智能

安装 opencc库

pip install opencc -i https://pypi.tuna.tsinghua.edu.cn/simple

安装 torch

pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple

注:若运行时报关于 numpy 的错误,需要执行下面这个命令,更新 numpy 库

pip install numpy --upgrade

代码实现

只展示核心,完整的请关注并私信文章来源地址https://www.toymoban.com/news/detail-543735.html

# 利用训练好的模型进行识别
result = whisper_model.transcribe('录音.wav')

到了这里,关于OpenAI开源!!Whisper语音识别实战!!【环境配置+代码实现】的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 可以白嫖的语音识别开源项目whisper的搭建详细过程 | 如何在Linux中搭建OpenAI开源的语音识别项目Whisper

    原文来自我个人的博客。 服务器为GPU服务器。点击这里跳转到我使用的GPU服务器。我搭建 whisper 选用的是 NVIDIA A 100显卡,4GB显存。 Python版本要在3.8~3.11之间。 输入下面命令查看使用的Python版本。 为啥要安装Anaconda? 为了减少不同项目使用的库的版本冲突,我们可以使用An

    2024年02月09日
    浏览(50)
  • chatGPT的耳朵!OpenAI的开源语音识别AI:Whisper !

    语音识别是通用人工智能的重要一环!可以说是AI的耳朵! 它可以让机器理解人类的语音,并将其转换为文本或其他形式的输出。 语音识别的应用场景非常广泛,比如智能助理、语音搜索、语音翻译、语音输入等等。 然而,语音识别也面临着很多挑战,比如不同的语言、口

    2024年03月14日
    浏览(48)
  • OpenAI开源全新解码器和语音识别模型Whisper-v3

    在11月7日OpenAI的首届开发者大会上,除了推出一系列重磅产品之外,还开源了两款产品,全新解码器Consistency Decoder(一致性解码器)和最新语音识别模型Whisper v3。 据悉,Consistency Decoder可以替代Stable Diffusion VAE解码器。该解码器可以改善所有与Stable Diffusion 1.0+ VAE兼容的图像,

    2024年02月05日
    浏览(54)
  • OpenAI开源语音识别模型Whisper在Windows系统的安装详细过程

    Python的安装很简单,点击这里进行下载。 安装完成之后,输入python -V可以看到版本信息,说明已经安装成功了。 如果输入python -V命令没有看到上面的这样的信息,要么是安装失败,要么是安装好之后没有自动配置环境变量,如何配置环境变量可以从网上搜索。 Python的具体安

    2024年02月08日
    浏览(54)
  • 【语音识别】OpenAI whisper

    目录 1. 简单介绍 2. 代码调用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的开源自动语音识别神经网络 whisper 安装 Python 调用

    2024年02月13日
    浏览(50)
  • OpenAI Whisper 语音识别 API 模型使用 | python 语音识别

    OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外,又推出了一个 Whisper 的语音识别模型。支持96种语言。 Python 安装 openai 库后,把需要翻译的音频目录放进去,运行程序即可生成音频对应的文字。 以上。

    2024年02月16日
    浏览(56)
  • openai的whisper语音识别介绍

    openAI发布了chatgpt,光环一时无两。但是openAI不止有这一个项目,它的其他项目也非常值得我们去研究学习。 今天说说这个whisper项目 https://github.com/openai/whisper ta是关于语音识别的。它提出了一种通过大规模的弱监督来实现的语音识别的方法。弱监督是指使用不完全或不准确的

    2024年02月09日
    浏览(45)
  • OpenAI-whisper语音识别模型

    Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 whisper有五种模型尺寸,提供速度和准确性的平衡,其中English-only模型提供了四种选择。下面是可用模型的名称、大致内存需求

    2024年02月09日
    浏览(56)
  • 使用OpenAI的Whisper 模型进行语音识别

    原文:https://baijiahao.baidu.com/s?id=1756232395896695428wfr=spiderfor=pc 语音识别是人工智能中的一个领域,它允许计算机理解人类语音并将其转换为文本。 该技术用于 Alexa 和各种聊天机器人应用程序等设备。 而我们最常见的就是语音转录,语音转录可以语音转换为文字记录或字幕。

    2024年02月03日
    浏览(58)
  • OpenAI Whisper中文语音识别效果尝试和应用(一)

            近期,OpenAI发布了Whisper语音识别模型,声称其在英语语音识别方面已接近人类水平的鲁棒性和准确性。出于对自动语音识别的兴趣,本人对此进行了一些尝试,看看它对中文语音识别的效果。         本内容仅供对语音识别有兴趣或者仅仅希望应用的入门朋友

    2023年04月18日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包