使用python实现语音识别

这篇具有很好参考价值的文章主要介绍了使用python实现语音识别。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

语音识别技术,也被称为自动语音识别,目标是以电脑自动将以人类的语音内容转换为相应的文字和文字转换为语音。

一. 文本转换为语音

1.1 使用pyttsx

使用名为pyttsx的python包,可以将文本转换为语音。

安装pyttsx包

pip install pyttsx3

示例

import pyttsx3 as pyttsx  
engine \= pyttsx.init()  
engine.say("Python由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990年代初设计,作为一门叫做ABC语言的替代品。")  
engine.runAndWait()

运行之后可以播放语音。

1.2 使用SAPI

在python 中,也可以使用SAPI 来将文本转换为语音。

使用Win32com.client包,不需要另外安装。

示例

from win32com.client import Dispatch  
msg \="Python由荷兰数学和计算机科学研究学会的吉多·范罗苏姆于1990年代初设计,作为一门叫做ABC语言的替代品。"  
speaker \= Dispatch("SAPI.SpVoice")  
speaker.Speak(msg)  
del speaker

使用SpeechLib可以将文本转换为语音文件

使用SpeechLib,可以从文本文件中获取输入,再将其转换为语音文件。先使用pip安装,命令如下:

pip install comtypes

示例

from comtypes.client import CreateObject  
from comtypes.gen import SpeechLib  
infile \= 'C:\\\\Users\\\\10619\\\\Desktop\\\\fileText.txt'  
f \= open(infile, 'r')  
theText \= f.read()  
f.close()  
  
outfile \= 'demo\_audio.wav'  
engine \= CreateObject("SAPI.SpVoice")  
stream \= CreateObject("SAPI.SpFileStream")  
stream.Open(outfile,SpeechLib.SSFMCreateForWrite)  
engine.AudioOutputStream \= stream  
engine.speak(theText)  
stream.close()

运行之后,会输出demo_audio.wav语音文件,打开demo_audio.wav文件并播放。

二. 语音转换为文本

使用PocketSphinx包, PocketSphinx是一个用于语音转换文本的开源API。它是一个轻量级的语音识别引擎,尽管在桌面端也能很好的工作,它还专门为手机和移动设备做过调优。首先使用pip命令安装所需模块,命令如下:

pip install PocketSphinx  
pip install SpeechRecognition

在安装PocketSphinx 可能会报错(ERROR: Could not build wheels for pocketsphinx, which is required to install pyproject.toml-based projects)。解决方法:通过查看pip可安装文件,查看可安装的文件命令:pip debug --verbose,然后查看Compatible tags: 33下可以安装的版本。

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

然后到https://www.lfd.uci.edu/~gohlke/pythonlibs/#pocketsphinx,下载对应版本的whl文件包安装。

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

然后再安装PocketSphinx和SpeechRecognition包。

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

脚本示例

import speech\_recognition as sr  
r \= sr.Recognizer()  
audio\_file \= 'demo\_audio.wav'  
with sr.AudioFile(audio\_file) as source:  
   audio \= r.record(source)  
try:  
   print("文本内容:",r.recognize\_sphinx(audio,language\='zh-CN'))  
   #默认会识别为英文,如果要识别中文,需要下载普通话识别文件  
except Exception as e:  
   print(e)

下载普通话识别文件。

下载路径:https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

解压之后,修改文件名称,cmusphinx-zh-cn-5.2 改为 zh-CN, zh_cn.cd_cont_5000文件夹改为acoustic-model,zh_cn.dic改为pronounciation-dictionary.dict,zh_cn.lm.bin改为language-model.lm.bin。然后移动zn-CN文件夹到python3\Lib\site-packages\speech_recognition\pocketsphinx-data下。

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

运行python之后,可以查看输出的文本内容。

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

通过输出的语音转换之后的文本和原文本比较发现,语音识别的后文本还是有一定差异的。

---------------------------END---------------------------

题外话

当下这个大数据时代不掌握一门编程语言怎么跟的上脚本呢?当下最火的编程语言Python前景一片光明!如果你也想跟上时代提升自己那么请看一下.

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

感兴趣的小伙伴,赠送全套Python学习资料,包含面试题、简历资料等具体看下方。

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx
python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

二、Python必备开发工具

工具都帮大家整理好了,安装就可直接上手!python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

三、最新Python学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

四、Python视频合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

六、面试宝典

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx

python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx文章来源地址https://www.toymoban.com/news/detail-765279.html

简历模板python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx
python 语音识别,python,语音识别,自然语言处理,Python编程,Python学习,技能分享,pyttsx 若有侵权,请联系删除

到了这里,关于使用python实现语音识别的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 基于python的神经网络在图像识别和自然语言处理上的应用

    随着计算机算力的不断增长,基于机器学习(神经网络)的方法成为了自然语言处理以及计算机图像识别的新范式。在自然语言处理方面,RNN、LSTM等方法能够有效提取语言之间的前后顺序和相互关系,在机器翻译、语言生成等任务取得了非常好的效果。在图像识别、图像检测

    2023年04月27日
    浏览(33)
  • 基于语音识别的自然语言生成技术

    作者:禅与计算机程序设计艺术 1.1. 背景介绍 随着人工智能技术的快速发展,自然语言处理(NLP)领域也取得了显著的进步。在语音识别技术方面,语音识别率、识别速度等指标不断提高,使得语音技术在人们的生活中扮演越来越重要的角色。为了更好地利用这些技术,将自

    2024年02月06日
    浏览(45)
  • c++通过自然语言处理技术分析语音信号音高

            对于语音信号的音高分析,可以使用基频提取技术。基频是指一个声音周期的重复率,也就是一个声音波形中最长的周期。 通常情况下,人的声音基频范围是85Hz到255Hz。根据语音信号的基频可以推断出其音高。         C++中可以使用数字信号处理库或语音处理

    2024年02月14日
    浏览(47)
  • 1分钟了解音频、语音数据和自然语言处理的关系

    音频、语音数据和自然语言处理这三者正在不断促进人工智能技术的发展,人机交互也逐渐渗透进生活的每个角落。在各行各业包括零售业、银行、食品配送服务商)的多样互动中,我们都能通过与某种形式的AI(如聊天机器人或虚拟助手)沟通来实现某些交易活动。语言是

    2024年02月09日
    浏览(38)
  • 自然语言处理的未来:从语音助手到人工智能

    自然语言处理(NLP)是人工智能(AI)领域的一个重要分支,它涉及到计算机理解、生成和处理人类语言的能力。自从2010年左右,NLP技术在深度学习和大数据技术的推动下发生了巨大的变革,这使得许多之前只能由专业人士完成的任务现在可以由计算机自动完成。 在过去的几年里

    2024年02月21日
    浏览(70)
  • TTS合成技术中的语音合成和人工智能和自然语言生成

    TTS合成技术中的语音合成和人工智能和自然语言生成是当前人工智能技术应用中的重要领域。本文旨在介绍TTS合成技术中的语音合成、人工智能和自然语言生成的概念和技术原理,并给出实现步骤和优化建议,旨在帮助读者更好地理解这个领域的技术细节和发展趋势。 TTS合成

    2024年02月07日
    浏览(43)
  • 自然语言处理历史史诗:NLP的范式演变与Python全实现

    本文全面回顾了自然语言处理(NLP)从20世纪50年代至今的历史发展。从初创期的符号学派和随机学派,到理性主义时代的逻辑和规则范式,再到经验主义和深度学习时代的数据驱动方法,以及最近的大模型时代,NLP经历了多次技术革新和范式转换。文章不仅详细介绍了每个阶

    2024年02月09日
    浏览(37)
  • 自然语言处理入门:使用Python和NLTK进行文本预处理

    文章标题:自然语言处理入门:使用Python和NLTK进行文本预处理 简介 自然语言处理(NLP)是人工智能领域的一个重要分支,它致力于使计算机能够理解、分析和生成人类语言。本文将介绍如何使用Python编程语言和NLTK(Natural Language Toolkit)库进行文本预处理,为后续的文本分析

    2024年02月19日
    浏览(41)
  • 【自然语言处理】第3部分:识别文本中的个人身份信息

    做一个简单介绍, 酒架 年近48 ,有20多年IT工作经历,目前在一家500强做企业架构.因为工作需要,另外也因为兴趣涉猎比较广,为了自己学习建立了三个博客,分别是【全球IT瞭望】,【架构师酒馆】和【开发者开聊】,有更多的内容分享,谢谢大家收藏。 企业架构师需要

    2024年02月03日
    浏览(38)
  • 工信部颁发的人工智能证书《自然语言与语音处理设计开发工程师》证书到手啦!

    工信部颁发的人工智能证书《自然语言与语音处理设计开发工程师》证书拿到手啦! 近期正在报考的工信部颁发的人工智能证书还有: 《计算机视觉处理设计开发工程师》中级   2024年1月24日至28日-北京 《自然语言与语音处理设计开发工程师》中级 第二期   2024年2月29日-

    2024年01月16日
    浏览(148)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包