SeamlessStreaming在vrchat的同声传译

这篇具有很好参考价值的文章主要介绍了SeamlessStreaming在vrchat的同声传译。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

之前发了几个视频简单的演示了下同声传译的效果(显卡是特斯拉P40,效果比较差,功能是ok了)

Vrchat 尝试实时翻译和语音输出_哔哩哔哩_bilibili

写一下实现的思路和相关的配置(可以根据思路换其他的软件或者网站实现)

当然这一套也是可以用在其他软件,或者在vr中使用的

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能

前置环境

         本地使用的显卡是特斯拉P40,

        Ubuntu 22.04.3 LTS,

        conda管理,

        python3.9.16,

        服务器上配置了代理

        因为seamlessstreaming用到了ws,一定要https才能远程访问,因此得用openssl自签证书,然后反向代理开出去。(seamless streaming的部署不在本次笔记中描述,这里主要描述实际应用的思路和方式)

关键软件

1.voice meeter(声音转换麦克风)

2.搜狗拼音输入法(没想到吧)将外语实时翻译成中文

3.seamless streaming,需要自己搭建,或者使用其他的实时tts服务(whisper desktop+网易易魔声或者bark等,但是我看基本没有持续的websocket转换,需要自己说话点一下麦克风),或者掏钱使用微软的itranslate那种(没研究过哈)

4.(可选)变声器,我用了需要sovits模型的voice-changer

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能

5.voice changer
需要的话可以自己去b站里搜,很多教程的

输入(外语翻译中文)

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能
输入转换流程
简单来说就是vrchat->voice meeter->搜狗拼音输入法 语音输入->txt文件

重点是voice meeter的配置和vrchat的配置

vrchat的声音配置

1.vrchat声音配置
这个声音配置是在系统->声音->音量合成器

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能

2.voice meeter配置

如果要变声,使用photo版本(三个虚拟声卡),否则banana就行了,2个虚拟声卡

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能

voice meeter的配置
主要看第一个就行了

勾上A2,表示声音要输出到实体声卡,就是右边A2配置的声卡,我这里选了耳机,因为我想听到原声

勾上B1,表示voice meeter将声音转换到 voice meeter VAIO OUTPUT 这个虚拟麦克风驱动,顺带一提B2对应虚拟麦克风AUX OUTPUT,B3对应VAIO3 OUTPUT


配置调试参考

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能

        配置成功后,有音量波动就是有相应输出了

3.配置搜狗的输入

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能


这样就把声音传给搜狗了(实际可以自己去试下,本来我录制了视频,但是嘴碎想想还是打打字算了)

输出(说中文转英文,基于seamless streaming)


实现流程

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能
    关于seamless streaming的安装直接按照meta官方的readme来,然后只需要会一点点python就行

        地址是https://huggingface.co/spaces/facebook/seamless-streaming/tree/main
        项目自带readme文件

    顺带一提这个seamless streaming其实是可以把情绪也翻译过来的(但是要申请模型),替代方案bark也是可以的。

    然后是浏览器的声音配置(如果是使用vr的话,外部输入改成virtual desktop或者Oculus的那个headphone就行

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能


再展示下vocie meeter的配置

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能

voice meeter配置
到这里基本完事了,可以直接去vrchat里设置下麦克风

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能

使用VAIO3
当然,像我这样的男人,会加一点one more thing,也就是变声器的配置

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能

voice changer client的配置
当然,vrchat中的麦克风也要改

SeamlessStreaming在vrchat的同声传译,语音识别,人工智能

使用aux
效果自行体验哈!(就是声音有点痴呆)文章来源地址https://www.toymoban.com/news/detail-797430.html

到了这里,关于SeamlessStreaming在vrchat的同声传译的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • uniapp开发微信小程序实现语音识别,使用微信同声传译插件,

    第一步:在微信小程序管理后台:“设置”-》“第三方设置”-》“插件管理”中添加插件。 但是这个地方,没有搜索到插件,就到微信服务市场 搜索到以后添加到需要的小程序里面,然后返回管理中心查看,就可以看到了 第二步:在配置文件中引入插件 第三步:在需要使

    2024年02月05日
    浏览(51)
  • uniapp开发微信小程序,使用微信同声传译插件,实现语音识别输入文本

    第一步:现在微信小程序管理后台:“设置”-》“第三方设置”-》“插件管理”中添加插件。 但是这个地方,没有搜索到插件,就到微信服务市场去搜微信服务市场  搜索到以后添加到需要的小程序里面,然后返回管理中心查看,就可以看到了 第二步:在配置文件中引入插

    2024年02月09日
    浏览(70)
  • 关于小程序uniapp同声传译(语音转文字)

    1. 首先我们先在开发者工具给他添加第三方插件 然后我们在 小程序的manifest.json切换成源码视图 然后在appid同级目录添加插件 其中provider是第三方插件的appid 然后在你要进行翻译的文件里面引入    

    2024年02月15日
    浏览(54)
  • 微信小程序 -- 获取语音,并将语音转为文字(插件:微信同声传译)

     实现的功能是获取语音,并将语音转为文字,实现效果如下:                 1. 小程序后台添加插件:微信同声传译 登录小程序后台:https://mp.weixin.qq.com 11. 设置 - 第三方设置 - 添加插件 12. 输入“微信同声传译”,点击搜索,之后选择并点击添加  13. 成功添加后,

    2024年02月06日
    浏览(65)
  • 【uniapp开发小程序】实现同声传译(长按语音转文字)

    效果图:  插件: 采用小程序插件:微信同声传译。插件文档定位 具体步骤: 先登录小程序后台(项目别错了):官网传送 然后 设置 = 第三方设置 = 添加插件  在插件文档里面拿到Appid和版本号 在manifest.json切换成源码视图 然后在appid同级目录添加插件  然后就是引用插件

    2024年02月07日
    浏览(66)
  • uni-app语音转文字功能demo(同声传译)

    目录 首先去微信开发者官网申请一下同声传译的插件  微信公众平台 在文件中开始引用: 首先去微信开发者官网申请一下 同声传译 的插件   微信公众平台 后续使用的时候可以看详情里面的信息进行使用 在文件中开始引用: 注意!!在这个源码视图中开始引入插件!!

    2024年02月09日
    浏览(65)
  • 微信小程序插件之微信同声传译

    1、在小城程序后台,点击设置-第三方设置-插件管理-添加插件。 搜索微信同声传译,添加到小程序即可。 2、基于uniapp开发的小程序,在uni项目中的的manifest.json文件中,找到 mp-weixin,添加plugins   3、添加成功之后,就可以在想要文字转语音的地方使用 示例:

    2024年01月20日
    浏览(77)
  • MetaAI发布Seamless:两秒内实现跨语言同声传译

    在当今日益互联的世界中,语言差异常常成为沟通的障碍。MetaAI最新发布的语音翻译大模型Seamless,正是为打破这一障碍而生。Seamless不仅提供流畅、高效的多语言翻译功能,更在保留说话人韵律和风格方面取得突破,是AI同声传译领域的一大革命。 huggingface模型下载: https

    2024年02月04日
    浏览(55)
  • 华为云会议推出同声传译功能,不错的边说边译体验~

    在全球疫情蔓延下,各个领域的跨国在线交流需求猛增。对于这种会议往往有多语种沟通的需求,比如跨国的大型会议、峰会、展会,或者业务员与国外的客户沟通大型项目,“口译员”的角色不可或缺。 然而,国内的参会人员都要先听发言人以原文说一次,再听口译员用中

    2024年02月13日
    浏览(56)
  • 手机同声传译软件有哪些?推荐四款软件实时翻译软件

    小伙伴们有时候会在街上或者旅游景点遇到外国人吗?他们有可能向我们问路、问好玩的地方、问美食推荐等等,但如果我们因为外语水平不好,而导致语言不通,很难跟他们进行交流,这个时候应该怎么办呢?其实可以借助手机同声传译软件,更好的帮助我们与外国友人交

    2024年02月09日
    浏览(57)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包