[python]基于faster whisper实时语音识别语音转文本

10月前作者：小楼先森分类：Toy博客阅读(42) 违法举报

这篇具有很好参考价值的文章主要介绍了[python]基于faster whisper实时语音识别语音转文本。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

语音识别转文本相信很多人都用过，不管是手机自带，还是腾讯视频都附带有此功能，今天简单说下：

faster whisper地址：

https://github.com/SYSTRAN/faster-whisperhttps://link.zhihu.com/?target=https%3A//github.com/SYSTRAN/faster-whisper

实现功能：

从麦克风获取声音进行实时语音识别转文本

代码仅仅用了40多行即可实现实时语音转文本功能

封装成类调用十分简单，代码如下：

fwm = FasterWhisperManager()

fwm.start()

while True:

time.sleep(0.2)

视频演示地址：

https://www.bilibili.com/video/BV1fQ4y1j7wb/

模块：

fast_whisper

pyaudio

以上文章来源地址https://www.toymoban.com/news/detail-778631.html

到了这里，关于[python]基于faster whisper实时语音识别语音转文本的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战，但实际上，Whisper的使用者完全可以针对中文的语音做一些优化的措施，换句话说，Whisper的“默认”形态可能在中文领域斗不过FunAsr，但是经过中文特殊优化的Whisper就未必了。 Whisper经常被人诟病的一点是对中文语音

2024年01月25日
浏览(45)
Whisper实现语音识别转文本

#教程主要参考开源免费离线语音识别神器whisper如何安装， OpenAI开源模型Whisper——音频转文字 Whisper是一个开源的自动语音识别系统，它在网络上收集了680,000小时的多语种和多任务监督数据进行训练，使得它可以将多种语言的音频转文字。 Whisper的好处是开源免费、支持多

2024年03月19日
浏览(48)
C#使用whisper.net实现语音识别（语音转文本）

目录介绍效果输出信息项目代码下载 github地址：https://github.com/sandrohanea/whisper.net Whisper.net. Speech to text made simple using Whisper Models 模型下载地址：https://huggingface.co/sandrohanea/whisper.net/tree/main/classic whisper_init_from_file_no_state: loading model from \\\'ggml-small.bin\\\' whisper_model_load: loading

2024年02月05日
浏览(40)
OpenAI的人工智能语音识别模型Whisper详解及使用

拥有ChatGPT语言模型的OpenAI公司，开源了 Whisper 自动语音识别系统，OpenAI 强调 Whisper 的语音识别能力已达到人类水准。 Whisper是一个通用的语音识别模型，它使用了大量的多语言和多任务的监督数据来训练，能够在英语语音识别上达到接近人类水平的鲁

2024年02月09日
浏览(62)
基于Whisper语音识别的实时视频字幕生成 (二): 在线实时字幕

Whistream（微流）是基于Whisper语音识别的的在线字幕生成工具，支持rtsp/rtmp/mp4等视频流在线语音识别 whistream将在whishow基础上引入whisper进行在线语音识别生成视频字幕 python：命令行：在线直播字幕： 605686962@qq.com coolEphemeroptera@gmail.com

2024年04月13日
浏览(51)
【Python实用API】语音转文本-whisper

（1）起因：最近在油管上下载视频，但是下载后发现两个问题，一是下载的视频无字幕；二是找了半天油管的字幕下载途径，结果发现下载的字幕的提取效果不太好。于是乎发现OpenAI发布的字幕提取开源库Whisper可解决我的问题，因此写此博文只是为了记录我学习的过程，

2024年04月13日
浏览(36)
一键智能视频语音转文本——基于PaddlePaddle语音识别与Python轻松提取视频语音并生成文案

如今进行入自媒体行业的人越来越多，短视频也逐渐成为了主流，但好多时候是想如何把视频里面的语音转成文字，比如，录制会议视频后，做会议纪要；比如，网课教程视频，想要做笔记；比如，需要提取视频中文案使用；比如，需要给视频加个字幕;这时候，只要把视频转

2024年02月08日
浏览(44)
python语音识别whisper

一、背景最近想提取一些视频的字幕，语音文案，研究了一波二、whisper语音识别 Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。 stable-ts在 OpenAI 的 Whisper 之上修改并添加

2024年02月05日
浏览(57)
OpenAI Whisper 语音识别 API 模型使用 | python 语音识别

OpenAI 除了 ChatGPT 的 GPT3.5 API 更新之外，又推出了一个 Whisper 的语音识别模型。支持96种语言。 Python 安装 openai 库后，把需要翻译的音频目录放进去，运行程序即可生成音频对应的文字。以上。

2024年02月16日
浏览(59)
【小沐学Python】Python实现语音识别（Whisper）

https://github.com/openai/whisper Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的，也是一个多任务模型，可以执行多语言语音识别、语音翻译和语言识别。 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络，且它亦支

2024年02月04日
浏览(190)