whisper-v3模型部署环境执行

这篇具有很好参考价值的文章主要介绍了whisper-v3模型部署环境执行。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. 安装whisperV3

  1. github git clone https://github.com/openai/whisper.git
  2. pip install -U openai-whisper
  3. pip install setuptools-rust
    这些都没有安装 但是github下载的版本是能执行成功的
  4. pip install accelerate
  5. pip install soundfile
  6. pip install librosa
  7. pip install torchaudio

requirements.txt

numba
numpy
torch
tqdm
more-itertools
tiktoken
triton>=2.0.0,<3;platform_machine=="x86_64" and sys_platform=="linux" or sys_platform=="linux2"

github官方版本

要进到whisper目录里面, 执行脚本要和whisper/whisper目录同级。这样就执行成功了。

import whisper

model = whisper.load_model("base")
result = model.transcribe("audio.mp3")
print(result["text"])

遇到的名词解释

1. 大模型的弱标签

在大模型中,弱标签(Weak Labels)通常指的是相对于强标签(Strong Labels)而言的标签类型。强标签是指对每个样本都有明确、准确的标签,可以直接用于训练模型的监督学习任务。而弱标签则指的是对样本的标签信息不够准确或完整,可能存在噪声、不确定性或模糊性。

弱标签可以是多种形式,常见的包括但不限于:

  1. 部分标签(Partial Labels):只对样本的部分特征或属性进行标记,而不是对整个样本进行标记。
  2. 噪声标签(Noisy Labels):由于标注过程中的错误或不确定性而产生的标签。
  3. 不确定标签(Uncertain Labels):对于某些样本标签的确定性不高,存在一定程度的不确定性。
  4. 模糊标签(Ambiguous Labels):标签含义不明确或模糊,可能存在多种解释或理解。

在使用弱标签进行训练时,通常需要采取一些特殊的处理方法来处理标签的不确定性和噪声,以提高模型的鲁棒性和泛化能力。这包括使用弱标签推理(Weak Label Inference)、噪声过滤(Noise Filtering)、半监督学习(Semi-Supervised Learning)等技术来充分利用弱标签信息进行模型训练。

参考文档

论文: https://cdn.openai.com/papers/whisper.pdf
whisper-v3 model-card https://huggingface.co/openai/whisper-large-v3
知乎胡儿 v3介绍 https://zhuanlan.zhihu.com/p/662906303
安装参考 https://zhuanlan.zhihu.com/p/666969310
github https://github.com/openai/whisper/blob/main/model-card.md
根据官方文档安装就可以了 https://github.com/openai/whisper/blob/main/README.md
官网 https://openai.com/research/whisper文章来源地址https://www.toymoban.com/news/detail-845937.html

到了这里,关于whisper-v3模型部署环境执行的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Whisper——部署fast-whisper中文语音识别模型

    whisper:https://github.com/openai/whisper/tree/main 参考文章:Whisper OpenAI开源语音识别模型 需要其他版本的可以自己下载:https://huggingface.co/openai 原始中文语音模型: 微调后的中文语音模型: 补下一个: tokenizer.json 模型转换 float16 : int8 :

    2024年01月22日
    浏览(42)
  • Android 手机部署whisper 模型

    “Whisper” 是一个由OpenAI开发的开源深度学习模型,专门用于语音识别任务。这个模型能够将语音转换成文本,支持多种语言,并且在处理不同的口音、环境噪音以及跨语言的语音识别方面表现出色。Whisper模型的目标是提供一个高效、准确的工具,以支持自动字幕生成、会议

    2024年04月10日
    浏览(59)
  • 深度学习模型部署-番外-TVM机器学习编译

    图片来自知乎大佬的文章 机器学习编译是指:将模型从训练形式转变为部署模式 训练模式:使用训练框架定义的模型 部署模式:部署所需要的模式,包括模型每个步骤的实现代码,管理资源的控制器,与应用程序开发环境的接口。 这个行为和传统的编译很像,所以称为机器

    2024年03月18日
    浏览(40)
  • 使用Flask简单部署深度学习模型

    当客户端想要获取资源时,一般会通过浏览器发起HTTP请求。 此时,Web服务器会把来自客户端的所有请求都交给Flask程序实例。 程序实例使用Werkzeug来做路由分发(URL请求和视图函数之间的对应关系)。 根据每个URL请求,找到具体的视图函数并进行调用。在Flask程序中,路由的

    2023年04月25日
    浏览(36)
  • 深度学习模型的Android部署方法

    将python中训练的深度学习模型(图像分类、目标检测、语义分割等)部署到Android中使用。 1、下载Pytorch Android库。 在Pytorch的官网pytorch.org上找到最新版本的库。下载后,将其解压缩到项目的某个目录下。 2、配置项目gradle文件 配置项目的gradle文件,向项目添加Pytorch Android库的

    2024年02月10日
    浏览(40)
  • 无人驾驶 自动驾驶汽车 环境感知 精准定位 决策与规划 控制与执行 高精地图与车联网V2X 深度神经网络学习 深度强化学习 Apollo

    百度apollo课程 1-5 百度apollo课程 6-8 七月在线 无人驾驶系列知识入门到提高 当今,自动驾驶技术已经成为整个汽车产业的最新发展方向。应用自动驾驶技术可以全面提升汽车驾驶的安全性、舒适性,满足更高层次的市场需求等。自动驾驶技术得益于人工智能技术的应用及推广

    2024年04月27日
    浏览(43)
  • WIN11+WSL2+Docker 深度学习环境部署

    Windows系统开发偶尔会出现一些系统底层的bug导致程序无法运行,开发很难受。 Linux系统开发,娱乐软件少,不尽兴。 双系统切换太麻烦,不能同时使用,难受! 如何结合Windows和Linux,既能畅爽娱乐,又不会被底层BUG影响开发,来试试Windows的子系统WSL2吧!! 本次思路为:在

    2024年02月21日
    浏览(42)
  • linux docker部署深度学习环境(docker还是conda)

    在深度学习中,避免不了在远程服务器上进行模型的训练,如果直接在服务器裸机的基础环境跑显然是不可取的,此时搭建用于模型训练的docker环境显得尤为重要。 在深度学习中,避免不了在远程服务器上进行模型的训练,如果直接在服务器裸机的基础环境跑显然是不可取的

    2024年02月21日
    浏览(54)
  • Gradio快速搭建机器学习模型的wedui展示用户界面/深度学习网页模型部署

    官网 Gradio 是一个开源 Python 包,可让您快速为机器学习模型、API 或任何任意 Python 函数构建演示或 Web 应用程序。然后,您可以使用 Gradio 的内置共享功能在几秒钟内共享演示或 Web 应用程序的链接。无需 JavaScript、CSS 或网络托管经验! 只需几行 Python 代码就可以创建一个像上

    2024年04月23日
    浏览(39)
  • 实战whisper:本地化部署通用语音识别模型

            Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。         这里呢,我将给出我的一些代码,来帮助你尽快实现【语音转文字】的服务部署。         以下是该A

    2024年01月18日
    浏览(95)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包