【语音识别】OpenAI whisper

9月前作者：Encarta1993 分类：Toy博客阅读(53) 违法举报

这篇具有很好参考价值的文章主要介绍了【语音识别】OpenAI whisper。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1. 简单介绍

2. 代码调用

1. 简单介绍

Introducing Whisperhttps://openai.com/blog/whisper/

OpenAI 的开源自动语音识别神经网络 whisper

introducing whisper下载,语音,语音识别,人工智能

2. 代码调用

安装

# whisper
pip install git+https://github.com/openai/whisper.git 


# on Ubuntu or Debian
sudo apt update && sudo apt install ffmpeg


# 更多参考 https://github.com/openai/whisper

Python 调用文章来源地址https://www.toymoban.com/news/detail-636029.html

import whisper

model = whisper.load_model("base")
result = model.transcribe("audio.mp3")
print(result["text"])

到了这里，关于【语音识别】OpenAI whisper的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

openai的whisper语音识别介绍

openAI发布了chatgpt，光环一时无两。但是openAI不止有这一个项目，它的其他项目也非常值得我们去研究学习。今天说说这个whisper项目 https://github.com/openai/whisper ta是关于语音识别的。它提出了一种通过大规模的弱监督来实现的语音识别的方法。弱监督是指使用不完全或不准确的

2024年02月09日
浏览(48)
OpenAI-whisper语音识别模型

Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。 whisper有五种模型尺寸，提供速度和准确性的平衡，其中English-only模型提供了四种选择。下面是可用模型的名称、大致内存需求

2024年02月09日
浏览(60)
使用OpenAI的Whisper 模型进行语音识别

原文：https://baijiahao.baidu.com/s?id=1756232395896695428wfr=spiderfor=pc 语音识别是人工智能中的一个领域，它允许计算机理解人类语音并将其转换为文本。该技术用于 Alexa 和各种聊天机器人应用程序等设备。而我们最常见的就是语音转录，语音转录可以语音转换为文字记录或字幕。

2024年02月03日
浏览(62)
语音识别开源框架 openAI-whisper

Whisper 是一种通用的语音识别模型。它是OpenAI于2022年9月份开源的在各种音频的大型数据集上训练的语音识别模型，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。 GitHub - yeyupiaoling/Whisper-Finetune: 微调Whisper语音识别模型和加速推理，支持Web部署和Andr

2024年02月17日
浏览(64)
.Net 使用OpenAI开源语音识别模型Whisper

.Net 使用OpenAI开源语音识别模型 Whisper Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的 Whisper 神经网络，且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音辨识（Automatic Speech Recognition，ASR）模型是被训练来运行语音辨识与翻译任务的

2024年02月08日
浏览(54)
OpenAI Whisper中文语音识别效果尝试和应用（一）

近期，OpenAI发布了Whisper语音识别模型，声称其在英语语音识别方面已接近人类水平的鲁棒性和准确性。出于对自动语音识别的兴趣，本人对此进行了一些尝试，看看它对中文语音识别的效果。本内容仅供对语音识别有兴趣或者仅仅希望应用的入门朋友

2023年04月18日
浏览(46)
OpenAI开源！！Whisper语音识别实战！！【环境配置+代码实现】

目录环境配置代码实现 ****** 实现 .mp4转换为 .wav文件，识别后进行匹配并输出出现的次数 ****** 完整代码实现请私信安装 ffmpeg 打开网址 https://github.com/BtbN/FFmpeg-Builds/releases 下载如下图所示的文件下载后解压我的路径是G:ffmpeg-master-latest-win64-gpl-shared

2024年02月13日
浏览(54)
基于OpenAI的Whisper构建的高效语音识别模型：faster-whisper

faster-whisper是基于OpenAI的Whisper模型的高效实现，它利用CTranslate2，一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度，还优化了内存使用效率。faster-whisper的核心优势在于其能够在保持原有模型准确度的同时，大幅提升处理速度，这使得它在处理

2024年02月02日
浏览(61)
可以白嫖的语音识别开源项目whisper的搭建详细过程 | 如何在Linux中搭建OpenAI开源的语音识别项目Whisper

原文来自我个人的博客。服务器为GPU服务器。点击这里跳转到我使用的GPU服务器。我搭建 whisper 选用的是 NVIDIA A 100显卡，4GB显存。 Python版本要在3.8~3.11之间。输入下面命令查看使用的Python版本。为啥要安装Anaconda？为了减少不同项目使用的库的版本冲突，我们可以使用An

2024年02月09日
浏览(53)
chatGPT的耳朵！OpenAI的开源语音识别AI：Whisper ！

语音识别是通用人工智能的重要一环！可以说是AI的耳朵！它可以让机器理解人类的语音，并将其转换为文本或其他形式的输出。语音识别的应用场景非常广泛，比如智能助理、语音搜索、语音翻译、语音输入等等。然而，语音识别也面临着很多挑战，比如不同的语言、口

2024年03月14日
浏览(50)