通过Python的speech_recognition库将音频文件转为文字

这篇具有很好参考价值的文章主要介绍了通过Python的speech_recognition库将音频文件转为文字。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


前言

大家好,我是空空star,本篇给大家分享一下通过Python的speech_recognition库将音频文件转为文字。
上一篇已经介绍了相关的库speech_recognition

通过Python的speech_recognition库将音频文件转为文字

Python-语音转文字相关库介绍


一、音频准备

这里我们通过gTTS先生成一段音频,gTTS相关的介绍可以看博主之前写的博客。

通过Python的gtts库将文字转为音频

from gtts import gTTS
local = '/Users/kkstar/Downloads/video/'
text = '大家好,我是空空star,本篇给大家分享一下音频转文字,这是通过speech_recognition转换的文字。'
language = "zh-cn"
tts = gTTS(text=text, lang=language)
tts.save(local+"audio_gtts_0509.mp3")

二、音频声音

音频转文字_0509

三、格式转换

mp3转为wav。
这里不能只改后缀,需要用音频转换工具转换下。
audio_gtts_0509.mp3->audio_gtts_0509.wav

四、音频转文字

1.引入库

import speech_recognition as sr

2.定义音频路径

local = '/Users/kkstar/Downloads/video/'

3.创建一个Recognizer对象

r = sr.Recognizer()

4.打开音频文件,将音频文件读入Recognizer对象

音频文件必须是wav的格式

# 打开音频文件
with sr.AudioFile(local+'audio_gtts_0509.wav') as source:
    # 将音频文件读入Recognizer对象
    audio = r.record(source)

5.尝试使用Google Web API将语音转换为文字

try:
text = r.recognize_google(audio, language=‘zh-CN’)
print(‘转换结果:’, text)
except sr.UnknownValueError:
print(‘无法识别语音’)
except sr.RequestError as e:
print(‘无法连接到Google Web API. {0}’.format(e))

6.转换结果

转换结果: 大家好我是空空Store本篇给大家分享一下音频转文字这是通过Keep下划线recognition转换的文字
Process finished with exit code 0


总结

recognize_google: recognize_google() 是Google提供的一种语音识别API,可以识别音频文件或麦克风录制的语音,并将其转换为文本。在Python中,可以使用SpeechRecognition库中的recognize_google()方法来调用该API。文章来源地址https://www.toymoban.com/news/detail-439172.html

到了这里,关于通过Python的speech_recognition库将音频文件转为文字的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 基于深度学习的语音识别(Deep Learning-based Speech Recognition)

    随着科技的快速发展,人工智能领域取得了巨大的进步。其中,深度学习算法以其强大的自学能力,逐渐应用于各个领域,并取得了显著的成果。在语音识别领域,基于深度学习的技术也已经成为了一种主流方法,极大地推动了语音识别技术的发展。本文将从深度学习算法的

    2024年02月04日
    浏览(29)
  • python 通过opencv及face_recognition识别人脸

    效果: 使用Python的cv2库和face_recognition库来进行人脸检测和比对的 0是代表一样 认为是同一人。 代码:

    2024年02月03日
    浏览(30)
  • 通过python如何实现视频提取音频,并将音频转文本

    大致思路: (1)使用moviepy库中的VideoFileClip类读取视频文件,并将其转换为音频文件; (2)使用pydub库中的splitonsilence函数将音频文件分割成多个音频片段,以便进行语音识别; (3)使用SpeechRecognition库中的Recognizer类进行语音识别,并将识别结果写入文本文件中 注意: 将

    2024年02月05日
    浏览(51)
  • Python OCR 使用easyocr库将图片中的文章提取出来

    EasyOCR是一个开源的Python库,专注于提供易用而准确的文字识别功能。它基于深度学习技术,使用了一种端到端的方法,能够在多种语言和字体下进行稳定的识别。 希望能写一些简单的教程和案例分享给需要的人 Python 3.10.12 系统: ubuntu 22.04 接下来我分享如何使用Python的easy

    2024年02月11日
    浏览(35)
  • 【Microsoft Azure 的1024种玩法】五十五.Azure speech service之通过JavaScript快速实现文本转换为语音

    文本转语音可使用语音合成标记语言 (SSML) 将输入文本转换为类似人类的合成语音,本篇文档主要介绍了如何通过JavaScript 的语音SDK实现文本转换为语音的实践操作 【Microsoft Azure 的1024种玩法】一.一分钟快速上手搭建宝塔管理面板 【Microsoft Azure 的1024种玩法】二.基于Azure云平

    2024年02月09日
    浏览(31)
  • python:基于GeoPandas和GeoViews库将GEDI激光高程数据映射到交互式地图

    作者:CSDN @ _养乐多_ 本文将介绍 GEDI(Global Ecosystem Dynamics Investigation)激光雷达数据某数据点波形数据提取,并绘制图表,添加其他图表元素并使图表具有交互性。 在本文中,我们将探索如何打开、读取和处理GEDI数据,并利用地理信息处理库GeoPandas和地理空间数据可视化库

    2024年02月15日
    浏览(32)
  • python实现人脸识别(face_recognition)

    1、介绍 本项目是世界上最强大、简洁的人脸识别库,你可以使用Python和命令行工具提取、识别、操作人脸。 本项目的人脸识别是基于业内领先的C++开源库dlib中的深度学习模型,用Labeled Faces in the Wild人脸数据集进行测试,有高达99.38%的准确率。但对小孩和亚洲人脸的识别准

    2024年02月02日
    浏览(28)
  • Python语音合成-第三方库(gTTs/pyttsx3/speech)横评(内附使用代码)

    由于项目需要, 我需要 将文字转换为语音 , 那么第一步就要进行调研 语音合成(text to speech),简称TTS 。是将文字转化为语音的一种技术,是让计算机模拟人类的嘴巴,通过不同的音色说出想表达的内容, 是人机对话的一部分。 TTS可以通过 神经网络 的设计,把文字智能地转化

    2024年02月04日
    浏览(79)
  • 基于深度学习的手写数字识别项目GUI(Deep Learning Project – Handwritten Digit Recognition using Python)

    一步一步教你建立手写数字识别项目,需要源文件的请可直接跳转下边的链接:All project 在本文中,我们将使用MNIST数据集实现一个手写数字识别应用程序。我们将使用一种特殊类型的深度神经网络,即卷积神经网络。最后,我们将构建一个GUI,您可以在其中绘制数字并立即

    2024年02月11日
    浏览(23)
  • 口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts实践(Python3.10)

    不能否认,微软Azure在TTS(text-to-speech文字转语音)这个人工智能细分领域的影响力是统治级的,一如ChatGPT在NLP领域的随心所欲,予取予求。君不见几乎所有的抖音营销号口播均采用微软的语音合成技术,其影响力由此可见一斑,仅有的白璧微瑕之处就是价格略高,虽然国内也可

    2024年02月02日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包