【Python】本地版 Whisper 自动转录器(附源码网址)

这篇具有很好参考价值的文章主要介绍了【Python】本地版 Whisper 自动转录器(附源码网址)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目   录

  • 一、实时自动语音转录器简介             

  • 二、开源Whisper实时转录器             

  • 三、pyinstaller 打包发布exe应用程序

  • 四、修改版源代码                             


一、实时自动语音转录器简介

实时自动语音转录器是一种能够自动将语音信号转换为文字的应用程序。它通常具有以下几个主要功能:1. 语音检测与采集实时监测麦克风或其他输入信号,检测并录制用户的语音输入。要求具有较低延迟,以进行实时转录。2. 语音识别与转录使用语音识别技术对录制的语音信号进行识别与转录,将语音转换为文本。需要选择合适的语音识别模型,如神经网络模型等。3. 自动修正分析语音识别的结果,自动检测并修正一些常见错误,如将数字“13”识别为“30”等情况。这需要制定一定的修正规则和算法。4. 格式化与输出对转录结果进行必要的格式化,如加工标点符号、大写等,然后将结果实时显示给用户或导出为文本文档等格式。5. 操作交互提供一定的交互操作,如暂停/继续转录、修改转录结果、选择语音识别模型等。可以通过图形界面实现交互,也可以通过自定义语音指令等方式实现。6. 支持多种语言理想的实时自动语音转录器应支持多种常用语言,以满足不同用户的需求。这需要准备不同语言的语音识别模型与修正规则。总体来说,实时自动语音转录器是一款功能较为复杂的应用程序。要想开发出一款实用的自动转录器,需要具备一定的语音识别与人工智能技术,并投入大量时间用于测试、修订与改进。但随着语音识别技术的不断发展,以及许多开源工具的出现,开发一款基本的自动语音转录器已经变得更加简单和可行。有一定技术基础的开发者,都可以尝试完成这样一个项目,以增进自己的技能与丰富项目经验。

二、开源Whisper实时转录器

【Python】本地版 Whisper 自动转录器(附源码网址),whisper,语音识别,人工智能,深度学习,神经网络

主界面

视频演示(播放youtube视频,实时语音转录)

三、pyinstaller 打包发布exe应用程序

【Python】本地版 Whisper 自动转录器(附源码网址),whisper,语音识别,人工智能,深度学习,神经网络

claude指导

pip install PyInstaller
pyinstaller WAT.py

打包完成,会在dist文件夹下有个WAT的文件夹,所有程序都在这里。

【Python】本地版 Whisper 自动转录器(附源码网址),whisper,语音识别,人工智能,深度学习,神经网络

记得把图标 icon.ico手动拷贝进去。 运行时,提示缺少whisper文件夹下的内容(可能是因为没有添加 PYTHONPATH 环境变量导致),检查发现WAT文件夹下没有whisper文件夹,于是找到下面路径

C:\Users\cxy\AppData\Local\Programs\Python\Python310\Lib\site-packages\whisper

【Python】本地版 Whisper 自动转录器(附源码网址),whisper,语音识别,人工智能,深度学习,神经网络

将whisper文件夹拷贝到WAT目录下。运行WAT.exe 即可。

注:设置全局变量 用于下载和读取 语音识别模型 (medium.pt)。

XDG_CACHE_HOME=V:\learn\AI\SpeechToText\WhisperAutoTranscriber-main\models

四、修改版源代码
文章来源地址https://www.toymoban.com/news/detail-594975.html

到了这里,关于【Python】本地版 Whisper 自动转录器(附源码网址)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 本地部署_语音识别工具_Whisper

    1 简介 Whisper 是 OpenAI 的语音识别系统(几乎是最先进),它是免费的开源模型,可供本地部署。 2 docker https://hub.docker.com/r/onerahmet/openai-whisper-asr-webservice 3 github https://github.com/ahmetoner/whisper-asr-webservice 4 运行 image 大小:11.5G 运行后,即可在9000端口通过swagger调用,我先用手机录

    2024年02月05日
    浏览(34)
  • Whisper JAX 语音识别本地部署 whisperX 语音识别本地部署视频教程

    https://nlpcloud.com/zh/how-to-install-and-deploy-whisper-the-best-open-source-alternative-to-google-speech-to-text.html whisper-jax最详细的安装教程 | 一个号称比whisper快70倍的语音识别项目 | 免费开源的语音识别项目 whisperX 语音识别本地部署_JoeManba的博客-CSDN博客 GitHub - sanchit-gandhi/whisper-jax: JAX implement

    2024年02月16日
    浏览(28)
  • 实战whisper:本地化部署通用语音识别模型

            Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。         这里呢,我将给出我的一些代码,来帮助你尽快实现【语音转文字】的服务部署。         以下是该A

    2024年01月18日
    浏览(88)
  • 自动语音识别模型whisper安装和初探

    whisper是OpenAI 最近发布的语音识别模型。OpenAI 通过从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whisper 进行了训练,whisper可以执行多语言语音识别、语音翻译和语言识别。 1.CMD命令窗口建立名为whisper的虚拟环境: 注意:whisper要求python版本

    2023年04月18日
    浏览(37)
  • Linux 中的机器学习:Whisper——自动语音识别系统

    Whisper 是一种自动语音识别 (ASR) 系统,使用从网络收集的 680000 小时多语言和多任务数据进行训练,Whisper 由深度学习和神经网络提供支持,是一种基于 PyTorch 构建的自然语言处理系统,这是免费的开源软件。 我们用 Ubuntu 22.04 LTS 测试了 Whisper,为避免污染您的系统,我们建议

    2024年02月07日
    浏览(32)
  • Whisper与ChatGPT联手,轻松实现音频转录文本

    目录 前言 一、Whisper简介 二、Whisper可用的模型和语言 三、开源 Whisper 本地转录 3.1、安装pytube库 3.2、下载音频MP4文件 3.3、安装 Whisper 库 四、在线 Whisper API 转录 4.1、Whisper API 接口调用 4.2、使用Prompt参数优化 4.3、其它参数介绍 4.4、转录过程翻译功能 4.5、分割音频处理大文件

    2024年02月13日
    浏览(37)
  • python语音识别whisper

    一、背景 最近想提取一些视频的字幕,语音文案,研究了一波 二、whisper语音识别 Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 stable-ts在 OpenAI 的 Whisper 之上修改并添加

    2024年02月05日
    浏览(41)
  • 【小沐学Python】Python实现语音识别(Whisper)

    https://github.com/openai/whisper Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络,且它亦支

    2024年02月04日
    浏览(41)
  • [python]基于faster whisper实时语音识别语音转文本

    语音识别转文本相信很多人都用过,不管是手机自带,还是腾讯视频都附带有此功能,今天简单说下: faster whisper地址: https://github.com/SYSTRAN/faster-whisper https://link.zhihu.com/?target=https%3A//github.com/SYSTRAN/faster-whisper 实现功能: 从麦克风获取声音进行实时语音识别转文本 代码仅仅

    2024年02月03日
    浏览(35)
  • Python使用whisper实现语音识别(ASR)

    目录 Whisper的安装 Whisper的基本使用 识别结果转简体中文 断句 Whisper是OpenAI的一个强大的语音识别库,支持离线的语音识别。在使用之前,需要先安装它的库: 使用whisper,还需安装setuptools-rust: 但是,whisper安装时,自带的pytorch可能有些bug,因此需要卸载重装: 卸载: 重装

    2024年03月20日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包