AI数字人:AI数字人制作初探及相关开源简介

这篇具有很好参考价值的文章主要介绍了AI数字人:AI数字人制作初探及相关开源简介。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

简介

数字人这名字听着稀奇又别扭,其实它最初的原型大家都听过——NPC。玩过游戏的应该都知道,也就是游戏内玩家操纵的游戏角色,可以和玩家进行交互的角色。广义上讲可以说是计算机模拟出的具有人的形态的虚拟人都叫做数字人,在平常的观感上,数字人是整合了人物形象模拟、人物声音克隆、自然语言处理、知识图谱解析等众多世界领先的人工智能技术的可视化数字虚拟人。他通过对人物形象的复制模拟,人物声音的克隆及语音合成,可随时随地与真人进行准确交互性对话。

通俗的讲所谓数字人,本质上是AI的一种进化,是通过计算机图形学技术进行虚拟制作的类人形象,没有现实世界中的身体。数字人的本体存在于计算设备中(比如电脑、手机)中,通过显示设备呈现出来,让人类能通过眼睛看见。它具备人类的外观和行为模式,数字人具有人类身体的外观形体结构,表现出来的行为模式是与人类相仿的,数字人的影像通常是呈现出某种人类的活动。

下面收集了几个开源的数字人项目,整理出来了,大家一起学习,希望对大家有所帮助。

一、SadTalker

https://github.com/OpenTalker/SadTalker

AI数字人:AI数字人制作初探及相关开源简介,AIGC 人工智能,人工智能,ai,数字人,开源,sadtalker,图片,说话

它可以通过音频驱动图像,生成真实感的3D人脸动画,使得人物可以“开口说话”。

AI数字人:AI数字人制作初探及相关开源简介,AIGC 人工智能,人工智能,ai,数字人,开源,sadtalker,图片,说话

而且,非常方便的是,可以直接集成到stable-diffusion-webui
AI数字人:AI数字人制作初探及相关开源简介,AIGC 人工智能,人工智能,ai,数字人,开源,sadtalker,图片,说话

一张图 + 音频 => 视频, 我找了2张图,一段音频,跑了2次。结果还不错,口型几乎都是吻合的。

二、Wav2Lip

https://github.com/Rudrabha/Wav2Lip

  • 将视频与任何目标语音进行口型同步
  • 适用于任何身份,声音和语言。也适用于CGI人脸和合成语音。
  • 你可以自己训练、或者使用预训练模型

原视频 + 音频 => 新视频 ,这是一个2020年启动的项目,有段时间没有更新,但是如果有需要,还是值得看看的。

三、Thin-Plate Spline Motion Model

https://github.com/yoyo-nb/Thin-Plate-Spline-Motion-Model.git

使用视频,驱动静态图片。“让任何图片开口,讲任何话”。
AI数字人:AI数字人制作初探及相关开源简介,AIGC 人工智能,人工智能,ai,数字人,开源,sadtalker,图片,说话

再看一个视频交流互动的例子
AI数字人:AI数字人制作初探及相关开源简介,AIGC 人工智能,人工智能,ai,数字人,开源,sadtalker,图片,说话

四、Real_Time_Image_Animation

https://github.com/anandpawara/Real_Time_Image_Animation

就像项目名称所说的,支持实时驱动静态图像,生成视频/视频流。没错,支持实时摄像头!
AI数字人:AI数字人制作初探及相关开源简介,AIGC 人工智能,人工智能,ai,数字人,开源,sadtalker,图片,说话

总结一下,“你可以让任何图片说任何话”,“你可以让任何人说任何话。”

五、Text2Speech

文本生成音频。已经相对比较成熟了,像讯飞,微软,很多人一直在使用他们的产品。

六、语言模型

这个就很多了,从国内到国外,太多了,有的人都说千模大战了。ChatGPT,GPT4,GPT5,文心,星火,源,盘古。有了语言模型,人物有了自己的“精神世界”,可以训练特定的人物语言风格,你可以与数字人对话交流,再使用文本生成相应的音频,然后使用音频驱动图片,产生人物表情、姿态,甚至动作,从而最终实现视频交流。比如,你可以在头条上看到的24小时数字人新闻直播:

AI数字人:AI数字人制作初探及相关开源简介,AIGC 人工智能,人工智能,ai,数字人,开源,sadtalker,图片,说话

因为这个不需要互动,基本上 信息收集 + 缓冲队列 + 画面音频驱动 就可以实现了。而想要达到实时互动的效果,比如视频聊天机器人,需要生成计算人物表情甚至动作,延迟是少不了,而且现有技术条件下,需要消耗巨大的算力,一般的公司或者个人无法承担。除非有牛X的创新的技术出现。因此,你会看到,包括不久前的character AI,拥有相当多的角色人物,但是只能响应文本内容…

其他

参考:https://www.toutiao.com/article/7242460144024732195文章来源地址https://www.toymoban.com/news/detail-630504.html

到了这里,关于AI数字人:AI数字人制作初探及相关开源简介的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AI人工智能简介和其定义

    全称:人工智能(Artificial Intelligence) 缩写:AI / ai        亦称智械、机器智能,指由人制造出来的可以表现出智能的机器。通常人工智能是指通过普通计算机程序来呈现人类智能的技术。该词也指出研究这样的智能系统是否能够实现,以及如何实现。人工智能于一般教材中

    2023年04月18日
    浏览(42)
  • 什么是AIGC(AI Generated Content, 人工智能生成内容)?

    AI生成内容(AIGC,人工智能生成内容)是一种新型的内容创作方式,它继承了专业生产内容(PGC,Professional-generated Content)和用户生成内容(UGC,User-generated Content)的优点,并充分发挥技术优势,打造了全新的数字内容生成与交互形态。随着科技的不断发展,AI写作、AI配乐

    2024年02月11日
    浏览(68)
  • 【人工智能革命】:AIGC时代的到来 | 探索AI生成内容的未来

    🎥 屿小夏 : 个人主页 🔥个人专栏 : IT杂谈 🌄 莫道桑榆晚,为霞尚满天! 人工智能(AI)的发展历程是一个充满突破和持续进步的旅程。随着时间的推移,AI 已经从简单的自动化任务处理演变到现在的高级认知和决策能力。特别是在 AIGC(AI 生成内容)领域,大型 AI 模型

    2024年02月04日
    浏览(99)
  • AIGC主题会议预告 | 人工智能时代,如何让AI帮你打工?

    科技圈和创投圈好久都没有这么兴奋了,自从AI绘画和Chat GPT的出现,让更多企业越发关注AI的各种新动向了。随着ChatGPT、GPT-4的爆火,人们纷纷将目光投向了AIGC(AI Generated Content)行业。跟紧OpenAI的步伐,百度推出文心一言,Adobe推出生成式AI Firefly,谷歌也开放了聊天式机器

    2024年02月13日
    浏览(64)
  • AI工智能讲师叶梓培训简历及提纲:AI人工智能之基于人工智能的内容生成(AIGC)简历提纲

    威信:amliy007 上海交通大学计算机专业博士毕业,高级工程师,高级程序员 主研方向:数据挖掘、机器学习、人工智能。 国内知名上市IT企业的AI技术总监、资深技术专家 一线人工智能经验(12年),大数据经验(8年),深度学习经验(5年) 在国内外期刊、会议中发表论文

    2024年02月10日
    浏览(65)
  • 数字孪生应用相关调研:智慧城市中的车联网(十余篇论文简介)

    车联网(IoV)是移动互联网和物联网相结合而产生的一个概念。车辆是传感器网络中的移动智能节点,需要对大规模数据[1]进行感知、采集、信息处理和存储。在车联网的行车安全、交通效率、信息娱乐等领域开展了大量研究,但基于[2]大数据信息处理的需求,在智慧城市背景

    2023年04月23日
    浏览(71)
  • [人工智能] 程序员超级进化ai必修课+AIGC全栈项目实战课

    课程内容: ├10_02【Java项目】基于ChatGPT的瑞吉外卖系统开发-01.ChatGPT在Java中的应用 .mp4 ├11_02【Java项目】基于ChatGPT的瑞吉外卖系统开发-02.多轮对话和编写文档 .mp4 ├12_02【Java项目】基于ChatGPT的瑞吉外卖系统开发-03.项目介绍和环境搭建 .mp4 ├13_02【Java项目】基于ChatGPT的瑞吉

    2024年02月03日
    浏览(44)
  • 如何学习和规划类似ChatGPT这种人工智能(AI)相关技术

    学习和规划类似ChatGPT这种人工智能(AI)相关技术的路径通常包括以下步骤: 学习基础知识 : 学习编程:首先,你需要学习一种编程语言,例如Python,这是大多数人工智能项目的首选语言。 数学基础:深度学习和自然语言处理等领域需要一定的数学基础,包括线性代数、微

    2024年02月19日
    浏览(54)
  • 最近很火的AIGC人工智能之AI赋能运营(巧用ChatGPT轻松上手新媒体)

    「作者主页」 :雪碧有白泡泡 「个人网站」 :雪碧的个人网站 「推荐专栏」 : ★ java一站式服务 ★ ★ React从入门到精通 ★ ★ 前端炫酷代码分享 ★ ★ 从0到英雄,vue成神之路★ ★ uniapp-从构建到提升 ★ ★ 从0到英雄,vue成神之路 ★ ★ 解决算法,一个专栏就够了 ★ ★

    2024年02月08日
    浏览(70)
  • AIGC:AI绘画-Stable-Diffusion 简介及实践

    最近随着ChatGPT的爆火,AI绘画也火得不行,这几天文心一言发布会,图片生成的梗都快被大家玩坏了,网上有不少Midjourney的使用分享,但是毕竟那个是商用网站,收费的,博主今天给大家发个福利!出一波免费使用AI绘画的教程:Stable-Diffusion本地化部署及使用!手把手教你如

    2024年02月09日
    浏览(79)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包