python虚拟数字人直播间带货

这篇具有很好参考价值的文章主要介绍了python虚拟数字人直播间带货。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

本开源项目名为“数字人控制器”。意为,本项目可以充当时下流行的虚拟人、虚拟主播、数字人,等仿人形数字形象的内核部分。

​ 使用UE、C4D、DAZ、LIVE2D等三维引擎软件开发的数字形象可以与本“数字人控制器”对接,从而实现虚拟主播、数字导游、数字助手等。我们提供UE4对接的demo,但我们更鼓励用户自行实现喜欢的数字形象。

​ 当然,若不考虑外观形象的话,本“数字人控制器”其实也可以独立使用的,可以充当一个语音助理。NLP可以自由切换AIUI、ChatGPT及Yuan1.0。

目前最新版本是2.0。在新版本里我们提出一个全新的架构。在这个架构下每个人都可以把Fay控制器搭建在自己个人电脑上(未来,或许我们会提供终端),让你电脑成为你数字助理的载体。你的所有设备(手表、手机、眼镜、笔记本)随时可以与你的数字助理通讯,数字助理将通过电脑为你处理数字世界里的所有事情。(贾维斯?Her?) 

python虚拟数字人直播间带货

2023.02: 1、提供chatgpt及yuan1.0作为选择。

2023.01: 1、控制器pc内网穿透,音频输入输出设备远程直连; 2、提供android 音频输入输出工程示例代码; 3、提供python音频输入输出工程示例代码(远程PC、树莓派等可用); 4、补传1.0语音指令音乐播放模块(暂不支持远程播放); 5、重构及补充若干工具模块:websocket、多线程、缓冲器、音频流录制器等; 6、修复1.x版本的多个bug; 7、集成看板娘;

2022.12: 1、上传bin目录(用于直播互动);

2022.11: 1、更新抖音直播获取粉丝互动数据的xpath;

2022.10.27: 1、更新mac上的麦克风参数; 2、解决mac上无法重启问题; 3、上传brew安装脚本。

2022.10.17: 1、更新语音指令; 2、补充人设语法;

语音指令

  • 关闭核心 关闭 再见 你走吧
  • 静音 静音 闭嘴 我想静静
  • 取消静音 取消静音 你在哪呢? 你可以说话了
  • 播放歌曲(暂不能用需更换音乐库) 播放歌曲 播放音乐 唱首歌 放首歌 听音乐 你会唱歌吗?
  • 暂停播放 暂停播放 别唱了 我不想听了

环境

  • Python 3.8.0 +

  • Chrome 浏览器 (若不开启直播功能,可跳过)

安装

安装依赖

pip install -r requirements.txt

配置 ChromeDriver (若不开启直播功能,可跳过)

  1. Chrome 浏览器进入 chrome://settings/help 查看当前版本
  2. 下载对应版本 ChromeDriver
  3. 解压zip并拷贝至 ./bin 目录
  4. 编辑 system.conf 配置 ChromeDriver 路径

配置应用密钥

  1. 查看 AI 模块

  2. 浏览链接,注册并创建应用,将应用密钥填入 ./system.conf 中

启动

启动数字人图像控制器

python main.py

图形界面

python虚拟数字人直播间带货

人设

数字人属性,与用户交互中能做出相应的响应。

交互灵敏度

在交互中,数字人能感受用户的情感,并作出反应。最直的体现,就是语气的变化,如 开心/伤心/生气 等。

设置灵敏度,可改变用户情感对于数字人的影响程度。

接收来源

抖音

填入直播间地址,实现与直播间粉丝交互

麦克风

选择麦克风设备,实现面对面交互,成为你的伙伴

socket远程音频输入

可以接入远程音频输入,远程音频输出

商品栏

填入商品介绍,数字人将自动讲解商品。

当用户对商品有疑问时,数字人可自动跳转至对应商品并解答问题。

配合抖音接收来源,实现直播间自动带货。

AI 模块

启动前需填入应用密钥system.conf

代码模块 描述 链接
./ai_module/ali_nls.py 阿里云 实时语音识别 实时语音识别_语音转文字_实时会议记录_人工智能-阿里云
./ai_module/ms_tts_sdk.py 微软 文本转语音 基于SDK 文本转语音 – 真实 AI 语音生成器 | Microsoft Azure
./ai_module/xf_ltp.py 讯飞 情感分析 情感分析 - 自然语言处理 - 讯飞开放平台
./utils/ngrok_util.py ngrok.cc 外网穿透(可选) http://ngrok.cc
./ai_module/yuan_1_0.py 浪潮源大模型(NLP 3选1) 源1.0-超大规模预训练模型-浪潮信息
./ai_module/chatgpt.py ChatGPT(NLP 3选1) *******
./ai_module/xf_aiui.py 讯飞自然语言处理(NLP 3选1) AIUI开放平台

与远程音频输入输出设备连接(非必须,外网需要配置http://ngrok.cc ngrok tcp通道的clientid)

控制器与采用 socket(非websocket) 方式与 音频输出设备通讯

内网通讯地址: ws://127.0.0.1:10001

外网通讯地址: 通过http://ngrok.cc获取

python虚拟数字人直播间带货

消息格式: 参考 remote_audio.py

与数字形象通讯(非必须,控制器需要关闭“面板播放”)

控制器与采用 WebSocket 方式与 UE 通讯

通讯地址: ws://127.0.0.1:10002(已接通)

消息格式: 查看 WebSocket.md

python虚拟数字人直播间带货

目录结构

.
├── main.py					# 程序主入口
├── fay_booter.py			# 核心启动模块
├── config.json				# 控制器配置文件
├── system.conf				# 系统配置文件
├── ai_module
│   ├── ali_nls.py			# 阿里云 实时语音
│   ├── ms_tts_sdk.py       # 微软 文本转语音
│   ├── xf_aiui.py          # 讯飞 人机交互-自然语言处理
│   └── xf_ltp.py           # 讯飞 性感分析
├── bin                     # 可执行文件目录
├── core                    # 数字人核心
│   ├── fay_core.py         # 数字人核心模块
│   ├── recorder.py         # 录音器
│   ├── tts_voice.py        # 语音生源枚举
│   ├── viewer.py           # 抖音直播间接入模块
│   └── wsa_server.py       # WebSocket 服务端
├── gui                     # 图形界面
│   ├── flask_server.py     # Flask 服务端
│   ├── static
│   ├── templates
│   └── window.py           # 窗口模块
├── scheduler
│   └── thread_manager.py   # 调度管理器
└── utils                   # 工具模块
    ├── config_util.py      
    ├── storer.py
    └── util.py

项目下载地址:https://download.csdn.net/download/zxj19880502/87459025 文章来源地址https://www.toymoban.com/news/detail-439353.html

到了这里,关于python虚拟数字人直播间带货的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 「GPT虚拟直播」实战篇|GPT接入虚拟人实现直播间弹幕回复

    ChatGPT和元宇宙都是当前数字化领域中非常热门的技术和应用。结合两者的优势和特点,可以探索出更多的应用场景和商业模式。例如,在元宇宙中使用ChatGPT进行自然语言交互,可以为用户提供更加智能化、个性化的服务和支持;在ChatGPT中使用元宇宙进行虚拟现实体验,可以

    2024年02月06日
    浏览(55)
  • 手把手教你怎么搭建自己的AI数字人直播间?帮你24小时不间断直播卖货

    在搭建AI数字人直播间之前,您需要了解数字人技术。 数字人是一种由人工智能技术构建的虚拟人物,其外貌、行为、语言等特征与真实人物相似,可以与人进行互动。数字人可以通过语音合成、人脸识别、情感识别等技术来实现与观众的交互。数字人直播间是使用现有的技

    2024年02月05日
    浏览(200)
  • 在抖音直播间,项目被资本割韭菜

    VC们也开始直播了。 想象中高高在上、西装革履的投资人对着镜头吆喝项目直投与连麦加群,颇有些魔幻现实的影子。但如果有心,在抖音上,时常可以发现诸如创投机构、XX投资人的直播,其中不乏已然有知名度的部分主体,这一趋势,在今年正在迅速蔓延。 论及缘由,在

    2024年02月16日
    浏览(46)
  • Python抓取抖音直播间数据:技术探索与实践

    目录 一、引言 二、技术准备 三、分析抖音直播间网页结构 四、编写爬虫代码 五、处理反爬虫机制 六、数据清洗与存储 七、总结 随着互联网的快速发展,直播行业已成为当下的热门领域。抖音作为其中的佼佼者,吸引了大量的用户和主播。对于数据分析师、市场研究人员

    2024年04月15日
    浏览(51)
  • Python实践:利用APM进行得物客户端直播间压力测试

    在本篇文章中,我们将探讨如何使用Python编写代码,利用APM(Application Performance Monitoring,应用性能监控)工具来进行得物客户端直播间的压力测试。通过这种方式,我们可以评估得物客户端在高负载情况下的性能表现,并找出潜在的性能瓶颈。 压力测试是一种评估系统在各

    2024年02月07日
    浏览(40)
  • obswebsocket+douyinAPI+python,教你如何三步搭建自己的AI美女直播间,24小时的永动机

    就是在直播的时候通过弹幕进行选择不同的ai人物进行跳舞的直播间大致就是 可以看到左边是有提示,根据观众刷礼物的不同进行选择某一个AI人物进行展示,怎么通过技术手段实现呢 其实还是很简单的,基本就是python+obs直播软件进行实现,大致过程就是python连接抖音的直播

    2024年01月17日
    浏览(121)
  • UDP实现聊天直播间 chatroom

    1.memcmp() 函数 memcmp() 函数用于比较两个内存区域前 n 个字节的内容。 它接受三个参数: •const void *s1:指向第一个内存区域的指针。 •const void *s2:指向第二个内存区域的指针。 •size_t n:要比较的字节数。 返回值: memcmp() 函数返回一个整数值,表示两个内存区域内容的比

    2024年04月11日
    浏览(45)
  • 抖音直播间弹幕rpc学习

    目标url 随便找个直播间即可。 https://live.douyin.com/198986091107 接口分析 首先并没有在xhr下找到对应的接口 因为采用了websocket来传输信息。切换到ws即可看到 消息下,可以看到16进制的数据在源源不断地增加。 那么我们只要找到反序列化后的数据,再发送到本地的socket服务,就

    2023年04月22日
    浏览(79)
  • 抖音手机实景无人直播间怎么搭建?

    手机无人直播 已成为用户直播和商家直播带货的一项热门技术趋势,为消费者提供了全新的观看体验。无人直播,顾名思义,即通过无人直播软件或数字人来进行无人直播。这一技术的广泛应用,不仅为短视频渠道带来了更丰富的玩法,也为各种领域的商户提供了有效的带货

    2024年02月06日
    浏览(50)
  • 销量破亿,董洁直播间凭何出圈?

    近期,“没有五位数走不出”的董洁直播间火了…… 纵观这几年各大平台直播带货,火已不是什么新鲜事,而为何董洁的直播能火上热搜呢? 本期,千瓜将解析董洁直播,同品牌方聊聊小红书直播的那些事儿。 董洁「种草式」直播 开启小红书直播新生态 据小红书官方数据

    2024年02月06日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包