使用 SageMaker 对 Whisper 模型进行微调及部署

这篇具有很好参考价值的文章主要介绍了使用 SageMaker 对 Whisper 模型进行微调及部署。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

使用 SageMaker 对 Whisper 模型进行微调及部署

Whisper 作为 OpenAI 最新开源的自动语音识别(ASR)模型,采用了编码器-解码器(encoder- decoder)transformer架构,并使用了 68 万小时的从互联网收集的多语言、多任务的已标注数据进行训练。根据其论文显示,Whisper 模型在无需微调(zero-shot)的情况下,在多个数据集的测试上鲁棒性更高,错误率更低。关于 Whisper 模型的更多细节,参见其官方网站 Introducing Whisper 以及 GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision。

https://github.com/AndreMarkert/whisper-webui

使用 SageMaker 对 Whisper 模型进行微调及部署 | 亚马逊AWS官方博客文章来源地址https://www.toymoban.com/news/detail-596179.html

到了这里,关于使用 SageMaker 对 Whisper 模型进行微调及部署的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Whisper——部署fast-whisper中文语音识别模型

    whisper:https://github.com/openai/whisper/tree/main 参考文章:Whisper OpenAI开源语音识别模型 需要其他版本的可以自己下载:https://huggingface.co/openai 原始中文语音模型: 微调后的中文语音模型: 补下一个: tokenizer.json 模型转换 float16 : int8 :

    2024年01月22日
    浏览(32)
  • Android 手机部署whisper 模型

    “Whisper” 是一个由OpenAI开发的开源深度学习模型,专门用于语音识别任务。这个模型能够将语音转换成文本,支持多种语言,并且在处理不同的口音、环境噪音以及跨语言的语音识别方面表现出色。Whisper模型的目标是提供一个高效、准确的工具,以支持自动字幕生成、会议

    2024年04月10日
    浏览(29)
  • whisper-v3模型部署环境执行

    github git clone https://github.com/openai/whisper.git pip install -U openai-whisper pip install setuptools-rust 这些都没有安装 但是github下载的版本是能执行成功的 pip install accelerate pip install soundfile pip install librosa pip install torchaudio requirements.txt 要进到whisper目录里面, 执行脚本要和whisper/whisper目录同

    2024年04月09日
    浏览(33)
  • 学习实践-Whisper语音识别模型实战(部署+运行)

    OpenAI的语音识别模型Whisper,Whisper 是一个自动语音识别(ASR,Automatic Speech Recognition)系统,OpenAI 通过从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集,可以提高对口音、背景噪音

    2024年02月06日
    浏览(38)
  • 实战whisper:本地化部署通用语音识别模型

            Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。         这里呢,我将给出我的一些代码,来帮助你尽快实现【语音转文字】的服务部署。         以下是该A

    2024年01月18日
    浏览(84)
  • 今晚 11 点,Whisper 微调冲刺直播

    Whisper 微调冲刺将于 12 月 5 日至 19 日举行,我们将提供计算资源、演讲以及与 Transformers 团队的 Office Hour 活动等各种资源。 这两周的时间里,我们将与全球的社区成员们一起对 Whisper 模型进行微调,用选定的语言构建最先进的语音识别系统。请加入我们共同来完成这个目标

    2024年02月09日
    浏览(26)
  • whisper部署与使用

    Whisper由OpenAI发布于2022/9/21相较于ChatGPT(2022/11/30)早了两个半月。虽然影响力无法匹敌ChatGPT,但是其内在价值仍不可忽视。 Whisper的核心功能是语音识别,对应生活中可以有很多应用场景。虽然效果显著,但是其核心仅仅简单粗暴的使用了Transformer。具体细节这里不展开,可以

    2024年02月13日
    浏览(21)
  • 不到百行代码,使用Whisper进行视频字幕生成。

      最近在学习视频剪辑的时候,希望找一款软件进行翻译;发现大多数是调用某云的Api进行翻译。通过查询资料,打算使用Whisper进行本地视频语音的识别,然后进行字幕文件的编辑(srt),最后通过ffmpeg添加到视频中。   Whisper 是 OpenAI 构建的通用语音识别模型。它于 2

    2024年03月19日
    浏览(36)
  • whisper技术部署及简单使用

    whisper是openai开源的语音转文字的技术,可以作为国内收费语音转文字相关软件的替代 查看系统架构 下载对应版本的ffmpeg https://www.johnvansickle.com/ffmpeg/old-releases/ 配置ffmpeg命令全局可用,可以在bin目录加个链接。比如,分别执行如下命令,即可在: /usr/bin 目录下创建 ffmpeg 和

    2024年02月10日
    浏览(28)
  • 【AI工具】使用 Whisper ASR 和 Pyannote 进行说话人分类

    目录 前言 什么是说话人二值化? 什么是扬声器嵌入? 扬声器嵌入的关键作用 说话人分类系统的工作原理 执行

    2024年02月02日
    浏览(25)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包