实时语音识别（Python+HTML实战）

1年前作者：瑞雪兆我心分类：Toy博客阅读(7)违法举报

这篇具有很好参考价值的文章主要介绍了实时语音识别（Python+HTML实战）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

项目下载地址：FunASR

1 安装库文件

项目提示所需要下载的库文件：pip install -U funasr 和 pip install modelscope

运行过程中，我发现还需要下载以下库文件才能正常运行：

下载：pip install websockets，pip install ffmpeg

2 运行 .py 文件

运行 FunASR-main/runtime/python/websocket/funasr_wss_server.py 文件，加载模型

注：如果提示缺少什么模型，就 pip 下载什么模型

实时语音识别（Python+HTML实战）,语音识别,python,人工智能

部署本地的情况下需要修改默认 host 值 "0.0.0.0" 为 "127.0.0.1"：

--host：是 FunASR runtime-SDK 服务部署机器的 ip，默认为本机 ip（127.0.0.1），如果 client 与服务不在同一台服务器，需要改为部署机器 ip

--port：10095 是部署的端口号

成功运行结果如下：

.cache\modelscope\hub\iic\speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch\model.pt

实时语音识别（Python+HTML实战）,语音识别,python,人工智能

.cache\modelscope\hub\iic\speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online\model.pt

实时语音识别（Python+HTML实战）,语音识别,python,人工智能

.cache\modelscope\hub\iic\speech_fsmn_vad_zh-cn-16k-common-pytorch\model.pt

实时语音识别（Python+HTML实战）,语音识别,python,人工智能

.cache\modelscope\hub\iic\punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727\model.pt

实时语音识别（Python+HTML实战）,语音识别,python,人工智能

提示如下内容，说明模型已经加载完毕：

实时语音识别（Python+HTML实战）,语音识别,python,人工智能

3 运行 .html 文件

运行 FunASR-main/runtime/html5/static/index.html 文件，加载项目主页面

第一个 asr 服务器的地址填入：

wss://127.0.0.1:10095

点击左下角的连接按钮，回到 Pycharm 运行界面提示连接成功！

实时语音识别（Python+HTML实战）,语音识别,python,人工智能

4 结果展示

实时语音识别（Python+HTML实战）,语音识别,python,人工智能

该项目支持麦克风实时录音功能，同时可以传入多种音频格式的文件（如 .wav, .pcm, .mp3 等），也支持视频输入(如 .mp4 等)，以及多文件列表 wav.scp 输入。文章来源地址https://www.toymoban.com/news/detail-844731.html

到了这里，关于实时语音识别（Python+HTML实战）的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

人工智能语音助手：如何实现智能助手的实时语音监控功能？
作者：禅与计算机程序设计艺术随着人工智能技术的快速发展，语音助手已经成为人们日常生活中不可或缺的智能助手。作为人工智能助手，实时语音监控是必不可少的。本文将介绍如何更好地实现智能助手的实时语音监控功能，为用户提供更加优质的服务。 1 基本概念解释
2024年02月08日
浏览(40)
[语音识别] 基于Python构建简易的音频录制与语音识别应用
语音识别技术的快速发展为实现更多智能化应用提供了无限可能。本文旨在介绍一个基于Python实现的简易音频录制与语音识别应用。文章简要介绍相关技术的应用，重点放在音频录制方面，而语音识别则关注于调用相关的语音识别库。本文将首先概述一些音频基础概念，然后
2024年02月12日
浏览(10)
OpenAI Whisper 语音识别 API 模型使用 | python 语音识别
OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外，又推出了一个 Whisper 的语音识别模型。支持96种语言。 Python 安装 openai 库后，把需要翻译的音频目录放进去，运行程序即可生成音频对应的文字。以上。
2024年02月16日
浏览(37)
使用python实现语音识别
语音识别技术，也被称为自动语音识别，目标是以电脑自动将以人类的语音内容转换为相应的文字和文字转换为语音。一. 文本转换为语音 1.1 使用pyttsx 使用名为pyttsx的python包，可以将文本转换为语音。安装pyttsx包示例运行之后可以播放语音。 1.2 使用SAPI 在python 中，也可
2024年02月04日
浏览(18)
python语音识别whisper
一、背景最近想提取一些视频的字幕，语音文案，研究了一波二、whisper语音识别 Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。 stable-ts在 OpenAI 的 Whisper 之上修改并添加
2024年02月05日
浏览(35)
python实现语音识别
1. 首先安装依赖库 2. 播放音频文件 3. 语音识别默认只识别英文，如果需要支持中文，需要下载中文模型包，下载地址如下： CMU Sphinx - Browse /Acoustic and Language Models at SourceForge.net 下载完解压到sphinx安装路径下： D:installAnacondaLibsite-packagesspeech_recognitionpocketsphinx-data
2024年02月11日
浏览(29)
python 语音识别
在python中训练一个语音识别系统主要需要以下几个步骤： - 语料库准备 - 数据预处理 - 特征提取 - 训练模型第一部分：语料库的准备什么是语料库？语料库长什么样？语料库由两部分组成，第一部分是语音，第二部分是玉莹的标注，通常为字符形式。本次项目中
2024年02月12日
浏览(5)
【小沐学Python】Python实现语音识别（SpeechRecognition）
https://pypi.org/project/SpeechRecognition/ https://github.com/Uberi/speech_recognition SpeechRecognition用于执行语音识别的库，支持多个引擎和 API，在线和离线。 Speech recognition engine/API 支持如下接口: 以上几个中只有 recognition_sphinx（）可与CMU Sphinx 引擎脱机工作，其他六个都需要连接互联网。另
2024年02月04日
浏览(40)
【小沐学Python】Python实现语音识别（Whisper）
https://github.com/openai/whisper Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络，且它亦支
2024年02月04日
浏览(423)
基于Python的语音识别系统
基于Python的语音识别系统的设计与实现摘要随着互联网的发展，语音文件成为了人们接触得越来越多文件。如何高效的从一段录音中提取出关键信息，提取出其中人们感兴趣的内容，直观的呈现给人门。本文以DFSMN作为声学模型，引入TensorFlowr模型，将语音识别转化为翻译任
2024年02月10日
浏览(8)