OpenAI Whisper探索(一)

这篇具有很好参考价值的文章主要介绍了OpenAI Whisper探索(一)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.根据提示安装依赖 :

安装Whisper前先安装依赖

1.1安装torch:

ERROR: Could not find a version that satisfies the requirement torch (from versions: none)

经过了解torch是

pip install torch
Looking in indexes: https://mirrors.aliyun.com/pypi/simple/
Collecting torch
  Downloading https://mirrors.aliyun.com/pypi/packages/a6/41/122f37c99422566ea74b9cce90eb9218f5e8fb2582466da220f95842a0a0/torch-1.13.1-cp38-cp38-win_amd64.whl (162.6 MB)
     ---------------------------------------- 162.6/162.6 MB 502.9 kB/s eta 0:00:00
Requirement already satisfied: typing-extensions in 。。。 (from torch) (3.10.0.2)
Installing collected packages: torch
Successfully installed torch-1.13.1
  • PS: 运行的时候还会遇到提示缺少VC环境,按照提示地址下载安装就可以了

Microsoft Visual C++ Redistributable is not installed, this may lead to the DLL
load failure.
It can be downloaded at https://aka.ms/vs/16/release/vc_redist.x64.exe
OSError: [WinError 126] 找不到指定的模块。 Error loading “c:\python\python38\lib
\site-packages\torch\lib\c10.dll” or one of its dependencies.

1.2安装transformers

ERROR: Could not find a version that satisfies the requirement transformers>=4.19.0 (from whisper) (from versions: none)

pip install transformers
Looking in indexes: https://mirrors.aliyun.com/pypi/simple/
Collecting transformers
  Downloading https://mirrors.aliyun.com/pypi/packages/90/5b/02becd3e137fdacdc30c6442d04094d0b92e500f978df00b1a197b68fd2b/transformers-4.25.1-py3-none-any.whl (5.8 MB)
     ---------------------------------------- 5.8/5.8 MB 670.1 kB/s eta 0:00:00
Installing collected packages: tokenizers, regex, packaging, filelock, huggingface-hub, transformers
Successfully installed filelock-3.8.2 huggingface-hub-0.11.1 packaging-22.0 regex-2022.10.31 tokenizers-0.13.2 transformers-4.25.1

1.3安装ffmpeg-python

ERROR: Could not find a version that satisfies the requirement ffmpeg-python==0.2.0 (from whisper) (from versions: none)文章来源地址https://www.toymoban.com/news/detail-485498.html

pip install ffmpeg-python
Looking in indexes: https://mirrors.aliyun.com/pypi/simple/
Collecting ffmpeg-python
  Downloading https://mirrors.aliyun.com/pypi/packages/d7/0

到了这里,关于OpenAI Whisper探索(一)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • OpenAI Whisper论文笔记

    OpenAI 收集了 68 万小时的有标签的语音数据,通过多任务、多语言的方式训练了一个 seq2seq (语音到文本)的 Transformer 模型,自动语音识别(ASR)能力达到商用水准。本文为李沐老师论文精读的学习笔记。本文的模型权重,推理代码及 API 均以开源,相关博客也介绍了一些有

    2024年02月01日
    浏览(40)
  • OpenAI 开源语音识别 Whisper

            Whisper是一个通用语音识别模型。它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。                人工智能公司 OpenAI 拥有 GTP-3 语言模型,并为 GitHub Copilot 提供技术支持的 ,宣布开源了

    2024年02月09日
    浏览(68)
  • 如何使用OpenAI的whisper

    如果上述报错,就改为下面的方法: 模型的默认下载路径在:~/.cache/whisper/large-v2.pt 如果网速不佳,可以先在网速好的服务器上先下载好模型,再拷贝到本机 从下面cpu的结果看,tiny模型的结果不忍直视,而large_model的耗时,也无法忍受。 模型名称 cpu执行时间 结果 gpu执行时

    2024年02月08日
    浏览(48)
  • openai的whisper语音识别介绍

    openAI发布了chatgpt,光环一时无两。但是openAI不止有这一个项目,它的其他项目也非常值得我们去研究学习。 今天说说这个whisper项目 https://github.com/openai/whisper ta是关于语音识别的。它提出了一种通过大规模的弱监督来实现的语音识别的方法。弱监督是指使用不完全或不准确的

    2024年02月09日
    浏览(45)
  • Whisper OpenAI开源语音识别模型

    Whisper 是一个自动语音识别(ASR,Automatic Speech Recognition)系统,OpenAI 通过从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集,可以提高对口音、背景噪音和技术术语的识别能力。除

    2024年02月16日
    浏览(52)
  • OpenAI-whisper语音识别模型

    Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 whisper有五种模型尺寸,提供速度和准确性的平衡,其中English-only模型提供了四种选择。下面是可用模型的名称、大致内存需求

    2024年02月09日
    浏览(56)
  • 基于OpenAI的Whisper构建的高效语音识别模型:faster-whisper

    faster-whisper是基于OpenAI的Whisper模型的高效实现,它利用CTranslate2,一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度,还优化了内存使用效率。faster-whisper的核心优势在于其能够在保持原有模型准确度的同时,大幅提升处理速度,这使得它在处理

    2024年02月02日
    浏览(58)
  • OpenAI的Whisper蒸馏:蒸馏后的Distil-Whisper速度提升6倍

    Whisper 是 OpenAI 研发并开源的一个自动语音识别(ASR,Automatic Speech Recognition)模型,他们通过从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集,可以提高模型对口音、背景噪音和技

    2024年02月04日
    浏览(36)
  • OpenAI Whisper and ChatGPT 语音助手

    麦克风输入,展示三种结果 输入ASR结果 输出文本 输出TTS结果 gradio==3.19.1 gTTS==2.3.1 openai==0.27.0 openai-whisper==20230124 使用以下命令安装 ffmpeg 需要科学上网,否则连接超时 参考:https://github.com/bhattbhavesh91/voice-assistant-whisper-chatgpt

    2024年02月03日
    浏览(41)
  • 语音识别开源框架 openAI-whisper

    Whisper 是一种通用的语音识别模型。 它是OpenAI于2022年9月份开源的在各种音频的大型数据集上训练的语音识别模型,也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。 GitHub - yeyupiaoling/Whisper-Finetune: 微调Whisper语音识别模型和加速推理,支持Web部署和Andr

    2024年02月17日
    浏览(60)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包