在 Python 中使用 OpenAI 的新 Whisper API 进行语音转文本

这篇具有很好参考价值的文章主要介绍了在 Python 中使用 OpenAI 的新 Whisper API 进行语音转文本。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

您是否厌倦了手动转录数小时的录音?您想节省时间并提高工作效率吗?然后,您会很高兴听到 OpenAI 用于语音到文本转换的新 Whisper API!借助这项尖端的 AI 技术,您现在可以在 Python 程序中轻松地将音频文件转换为文本。让我们在下面探讨这是如何工作的!

创建一个新文件python-whisper-api.py并通过插入以下 python 代码行开始:

import os
import openai
openai.api_key = "[INSERT YOUR OPENAI API KEY HERE]"
audio_file = open("sample.mp3", "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)
print(transcript.text)

上面的 Python 代码是如何使用 OpenAI 的 Whisper API 来使用 Python 转录音频文件的示例。以下是每一行代码的作用的细分:

  1. import os:这会导入内置的 os 模块,它允许我们与操作系统交互并执行打开文件等任务。

  1. import openai:这将导入openai模块,该模块提供对 OpenAI 的 API 的访问。如果您尚未在本地 Python 开发环境中安装该模块,则需要使用以下命令进行安装:pip install openai

  1. openai.api_key = "[INSERT YOUR OPENAI API KEY HERE]":这会设置 OpenAI API 的 API 密钥,这是进行 API 调用所必需的。

  1. audio_file = open("sample.mp3", "rb"):这将以读取二进制模式打开音频文件“sample.mp3”并将其分配给变量audio_file。

  1. transcript = openai.Audio.transcribe("whisper-1", audio_file):这是使用openai.Audio.transcribe()转录音频文件的方法。Screenpresso:强大的 Windows 屏幕捕获工具第一个参数是要使用的模型的名称(“whisper-1”),第二个参数是我们在第 4 步中打开的音频文件。该方法返回一个对象,我们将其分配transcribe()给Transcription变量transcript。

  1. print(transcript.text):这会打印出text转录的,可通过对象的文本属性访问Transcription。

总之,此代码使用 OpenAI Whisper API 转录音频文件并打印出生成的文本转录。

让我们运行应用程序

让我们通过输入以下命令来运行 Python 应用程序:

$ python python-whisper-api.py

您需要确保已将音频文件存储在名称为 sample.mp3 的同一文件夹中。然后您将收到由 Whisper 提供的文本抄本:

在 Python 中使用 OpenAI 的新 Whisper API 进行语音转文本

结论

OpenAI 的 Whisper API 为 Python 编程中的语音到文本转换开辟了一个充满可能性的世界。通过利用这项新技术,您可以通过自动化转录过程来提高工作效率并节省时间。无论您是记者、研究人员,还是需要定期处理音频内容的人,Whisper API 都可以成为您的武器库中的宝贵工具。凭借其令人印象深刻的准确性和易用性,Whisper API 有望在未来彻底改变我们处理音频内容的方式。那为什么还要等?立即开始探索 Whisper API,发现您可以使用这项突破性技术实现的所有令人惊奇的事情。文章来源地址https://www.toymoban.com/news/detail-490337.html

到了这里,关于在 Python 中使用 OpenAI 的新 Whisper API 进行语音转文本的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 《AI上字幕》基于openAI研发的whisper模型,语音(视频)一键转文本/字幕/带时间轴/支持多语言/自带翻译《桌面版教程》

    OpenAI的chatGPT非常火爆,其实OpenAI旗下的另一个模型实力也十分强大,它就是开源免费的Whisper语音转文本模型,目前为止它是较为顶尖的语音转文本模型 当前github上也有许多出色的开发者根据此模型开发出桌面版语音转文字应用。较为出色的分别是Buzz和WhisperDesktop 支持将多种

    2023年04月19日
    浏览(36)
  • 使用openai-whisper实现语音转文字

    FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。 在官网上选择windows版本 在GitHub上可以选择最新版本,选择 ffmpeg-master-latest-win64-gpl.zip ; 如果python程序出现“

    2024年02月20日
    浏览(34)
  • .Net 使用OpenAI开源语音识别模型Whisper

    .Net 使用OpenAI开源语音识别模型 Whisper Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的 Whisper 神经网络,且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音辨识(Automatic Speech Recognition,ASR)模型是被训练来运行语音辨识与翻译任务的

    2024年02月08日
    浏览(34)
  • [python]基于faster whisper实时语音识别语音转文本

    语音识别转文本相信很多人都用过,不管是手机自带,还是腾讯视频都附带有此功能,今天简单说下: faster whisper地址: https://github.com/SYSTRAN/faster-whisper https://link.zhihu.com/?target=https%3A//github.com/SYSTRAN/faster-whisper 实现功能: 从麦克风获取声音进行实时语音识别转文本 代码仅仅

    2024年02月03日
    浏览(27)
  • OpenAI的人工智能语音识别模型Whisper详解及使用

            拥有ChatGPT语言模型的OpenAI公司,开源了 Whisper 自动语音识别系统,OpenAI 强调 Whisper 的语音识别能力已达到人类水准。         Whisper是一个通用的语音识别模型,它使用了大量的多语言和多任务的监督数据来训练,能够在英语语音识别上达到接近人类水平的鲁

    2024年02月09日
    浏览(41)
  • C#使用whisper.net实现语音识别(语音转文本)

    目录 介绍 效果 输出信息  项目 代码 下载  github地址:https://github.com/sandrohanea/whisper.net Whisper.net. Speech to text made simple using Whisper Models 模型下载地址:https://huggingface.co/sandrohanea/whisper.net/tree/main/classic whisper_init_from_file_no_state: loading model from \\\'ggml-small.bin\\\' whisper_model_load: loading

    2024年02月05日
    浏览(25)
  • openai开源的whisper在huggingface中使用例子(语音转文字中文)

    openai开源的语音转文字支持多语言在huggingface中使用例子。 目前发现多语言模型large-v2支持中文是繁体,因此需要繁体转简体。 后续编写微调训练例子 GitHub地址: https://github.com/openai/whisper

    2024年02月11日
    浏览(32)
  • 关于python环境下的语音转文本,whisper或funASR

            因为前阵子,有需求要将语音转为文本再进行下一步操作。感觉这个技术也不算是什么新需求,但是一搜,都是大厂的api,或者是什么什么软件,由于想要免费的,同时也要嵌入在代码中,所以这些都不能用。、         一筹莫展的时候,突然搜到whisper,这是个o

    2024年02月08日
    浏览(29)
  • Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

    阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAsr,但是经过中文特殊优化的Whisper就未必了。 Whisper经常被人诟病的一点是对中文语音

    2024年01月25日
    浏览(32)
  • 使用 Whisper AI 领先游戏:最佳和免费的语音到文本 AI

    Whisper AI 是一种语音识别和转录软件,它使用人工智能 (AI) 将口头语言转换为书面文本。它旨在通过消除手动转录语音内容的需要来帮助个人和企业节省时间并提高工作效率。在下文中,您将学习如何使用 Whisper AI! 该软件能够识别和转录多种语言和口音的语音,并提供标点

    2024年02月09日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包