OpenAI Whisper 语音识别 API 模型使用 | python 语音识别

1年前作者：学习溢出分类：Toy博客阅读(30)违法举报

这篇具有很好参考价值的文章主要介绍了OpenAI Whisper 语音识别 API 模型使用 | python 语音识别。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外，又推出了一个 Whisper 的语音识别模型。支持96种语言。

Python 安装 openai 库后，把需要翻译的音频目录放进去，运行程序即可生成音频对应的文字。

import openai

openai.api_key = 'your API Key'

file = open("openai.mp3", "rb")
transcription = openai.Audio.transcribe("whisper-1", file)
translation = openai.Audio.translate("whisper-1", file)

print(transcription, translation)

以上。文章来源地址https://www.toymoban.com/news/detail-605049.html

到了这里，关于OpenAI Whisper 语音识别 API 模型使用 | python 语音识别的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Whisper OpenAI开源语音识别模型
Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集，可以提高对口音、背景噪音和技术术语的识别能力。除
2024年02月16日
浏览(32)
OpenAI-whisper语音识别模型
Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。 whisper有五种模型尺寸，提供速度和准确性的平衡，其中English-only模型提供了四种选择。下面是可用模型的名称、大致内存需求
2024年02月09日
浏览(32)
基于OpenAI的Whisper构建的高效语音识别模型：faster-whisper
faster-whisper是基于OpenAI的Whisper模型的高效实现，它利用CTranslate2，一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度，还优化了内存使用效率。faster-whisper的核心优势在于其能够在保持原有模型准确度的同时，大幅提升处理速度，这使得它在处理
2024年02月02日
浏览(31)
OpenAI开源全新解码器和语音识别模型Whisper-v3
在11月7日OpenAI的首届开发者大会上，除了推出一系列重磅产品之外，还开源了两款产品，全新解码器Consistency Decoder（一致性解码器）和最新语音识别模型Whisper v3。据悉，Consistency Decoder可以替代Stable Diffusion VAE解码器。该解码器可以改善所有与Stable Diffusion 1.0+ VAE兼容的图像，
2024年02月05日
浏览(30)
OpenAI开源语音识别模型Whisper在Windows系统的安装详细过程
Python的安装很简单，点击这里进行下载。安装完成之后，输入python -V可以看到版本信息，说明已经安装成功了。如果输入python -V命令没有看到上面的这样的信息，要么是安装失败，要么是安装好之后没有自动配置环境变量，如何配置环境变量可以从网上搜索。 Python的具体安
2024年02月08日
浏览(32)
Python使用whisper实现语音识别（ASR）
目录 Whisper的安装 Whisper的基本使用识别结果转简体中文断句 Whisper是OpenAI的一个强大的语音识别库，支持离线的语音识别。在使用之前，需要先安装它的库：使用whisper，还需安装setuptools-rust：但是，whisper安装时，自带的pytorch可能有些bug，因此需要卸载重装：卸载：重装
2024年03月20日
浏览(34)
【语音识别】OpenAI whisper
目录 1. 简单介绍 2. 代码调用 Introducing Whisper https://openai.com/blog/whisper/ OpenAI 的开源自动语音识别神经网络 whisper 安装 Python 调用
2024年02月13日
浏览(32)
OpenAI 开源语音识别 Whisper
Whisper是一个通用语音识别模型。它是在各种音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。人工智能公司 OpenAI 拥有 GTP-3 语言模型，并为 GitHub Copilot 提供技术支持的，宣布开源了
2024年02月09日
浏览(49)
openai的whisper语音识别介绍
openAI发布了chatgpt，光环一时无两。但是openAI不止有这一个项目，它的其他项目也非常值得我们去研究学习。今天说说这个whisper项目 https://github.com/openai/whisper ta是关于语音识别的。它提出了一种通过大规模的弱监督来实现的语音识别的方法。弱监督是指使用不完全或不准确的
2024年02月09日
浏览(31)
语音识别开源框架 openAI-whisper
Whisper 是一种通用的语音识别模型。它是OpenAI于2022年9月份开源的在各种音频的大型数据集上训练的语音识别模型，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。 GitHub - yeyupiaoling/Whisper-Finetune: 微调Whisper语音识别模型和加速推理，支持Web部署和Andr
2024年02月17日
浏览(36)