使用 SageMaker 对 Whisper 模型进行微调及部署

9月前作者：马良神笔分类：Toy博客阅读(30) 违法举报

这篇具有很好参考价值的文章主要介绍了使用 SageMaker 对 Whisper 模型进行微调及部署。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

使用 SageMaker 对 Whisper 模型进行微调及部署

Whisper 作为 OpenAI 最新开源的自动语音识别（ASR）模型，采用了编码器-解码器（encoder- decoder）transformer架构，并使用了 68 万小时的从互联网收集的多语言、多任务的已标注数据进行训练。根据其论文显示，Whisper 模型在无需微调（zero-shot）的情况下，在多个数据集的测试上鲁棒性更高，错误率更低。关于 Whisper 模型的更多细节，参见其官方网站 Introducing Whisper 以及 GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision。

https://github.com/AndreMarkert/whisper-webui

使用 SageMaker 对 Whisper 模型进行微调及部署 | 亚马逊AWS官方博客文章来源地址https://www.toymoban.com/news/detail-596179.html

到了这里，关于使用 SageMaker 对 Whisper 模型进行微调及部署的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Whisper——部署fast-whisper中文语音识别模型

whisper：https://github.com/openai/whisper/tree/main 参考文章：Whisper OpenAI开源语音识别模型需要其他版本的可以自己下载：https://huggingface.co/openai 原始中文语音模型：微调后的中文语音模型：补下一个： tokenizer.json 模型转换 float16 ： int8 ：

2024年01月22日
浏览(43)
Android 手机部署whisper 模型

“Whisper” 是一个由OpenAI开发的开源深度学习模型，专门用于语音识别任务。这个模型能够将语音转换成文本，支持多种语言，并且在处理不同的口音、环境噪音以及跨语言的语音识别方面表现出色。Whisper模型的目标是提供一个高效、准确的工具，以支持自动字幕生成、会议

2024年04月10日
浏览(64)
whisper-v3模型部署环境执行

github git clone https://github.com/openai/whisper.git pip install -U openai-whisper pip install setuptools-rust 这些都没有安装但是github下载的版本是能执行成功的 pip install accelerate pip install soundfile pip install librosa pip install torchaudio requirements.txt 要进到whisper目录里面，执行脚本要和whisper/whisper目录同

2024年04月09日
浏览(45)
学习实践-Whisper语音识别模型实战（部署+运行）

OpenAI的语音识别模型Whisper，Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集，可以提高对口音、背景噪音

2024年02月06日
浏览(49)
实战whisper：本地化部署通用语音识别模型

Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。这里呢，我将给出我的一些代码，来帮助你尽快实现【语音转文字】的服务部署。以下是该A

2024年01月18日
浏览(96)
今晚 11 点，Whisper 微调冲刺直播

Whisper 微调冲刺将于 12 月 5 日至 19 日举行，我们将提供计算资源、演讲以及与 Transformers 团队的 Office Hour 活动等各种资源。这两周的时间里，我们将与全球的社区成员们一起对 Whisper 模型进行微调，用选定的语言构建最先进的语音识别系统。请加入我们共同来完成这个目标

2024年02月09日
浏览(37)
whisper部署与使用

Whisper由OpenAI发布于2022/9/21相较于ChatGPT（2022/11/30)早了两个半月。虽然影响力无法匹敌ChatGPT，但是其内在价值仍不可忽视。 Whisper的核心功能是语音识别，对应生活中可以有很多应用场景。虽然效果显著，但是其核心仅仅简单粗暴的使用了Transformer。具体细节这里不展开，可以

2024年02月13日
浏览(31)
不到百行代码，使用Whisper进行视频字幕生成。

最近在学习视频剪辑的时候，希望找一款软件进行翻译；发现大多数是调用某云的Api进行翻译。通过查询资料,打算使用Whisper进行本地视频语音的识别，然后进行字幕文件的编辑（srt），最后通过ffmpeg添加到视频中。 Whisper 是 OpenAI 构建的通用语音识别模型。它于 2

2024年03月19日
浏览(47)
whisper技术部署及简单使用

whisper是openai开源的语音转文字的技术，可以作为国内收费语音转文字相关软件的替代查看系统架构下载对应版本的ffmpeg https://www.johnvansickle.com/ffmpeg/old-releases/ 配置ffmpeg命令全局可用，可以在bin目录加个链接。比如，分别执行如下命令，即可在: /usr/bin 目录下创建 ffmpeg 和

2024年02月10日
浏览(36)
【AI工具】使用 Whisper ASR 和 Pyannote 进行说话人分类

目录前言什么是说话人二值化？什么是扬声器嵌入？扬声器嵌入的关键作用说话人分类系统的工作原理执行

2024年02月02日
浏览(34)