照片也能说话了?嘴型表情全同步,AI数字人时代要来了

这篇具有很好参考价值的文章主要介绍了照片也能说话了?嘴型表情全同步,AI数字人时代要来了。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

SadTalker是一款先进的人工智能模型,它通过从音频中学习生成3D运动系数,并使用全新的三维面部渲染器来生成头部运动,只需传入一张照片和一段音频,就能生成高质量的AI数字人视频

照片也能说话了?嘴型表情全同步,AI数字人时代要来了

工作原理

1、显式地对音频和不同类型的运动系数之间的联系进行单独建模

2、通过蒸馏系数和3D渲染的脸部,从音频中学习准确的面部表情

3、通过条件VAE设计PoseVAE来合成不同风格的头部运动

4、使用生成的三维运动系数映射到人脸渲染的无监督三维关键点空间,合成最终视频

 文章来源地址https://www.toymoban.com/news/detail-837701.html

SadTalker生成后的人物头部运动规律,面部表情自然,口型也和音频的内容保持一致(小姐姐还会眨眼睛!)

照片也能说话了?嘴型表情全同步,AI数字人时代要来了

 

最新中文版:

百度网盘:https://pan.baidu.com/s/1AMInL9l_LxfQ0g3j1TrWQA?pwd=8r4f

 

使用方法

1、上传人物图片和音频(音频可以是英文、中文、歌曲)

2、设置参数(下面会详细介绍)

3、点击“生成”按钮

照片也能说话了?嘴型表情全同步,AI数字人时代要来了

参数说明

· 姿式风格:调节头部运动风格,默认0

· 表达量表:人物表情丰富程度,默认1

· 生成中的批量大小:生成视频的速度,默认1,显卡好可以适当拉大

 

· 预处理

crop:从图片中截取头部做视频

resize:拉伸图片,人物被压缩选择此项

full:全身照做视频

extcrop:加强版crop,主要聚焦头部

extfull:加强版全身

 

· 面部渲染:两种模式可自由尝试

· GFPGAN:让面部高清化

 

在控制台可以查看当前的处理进度,程序执行完毕会输出信息The generated video is named

照片也能说话了?嘴型表情全同步,AI数字人时代要来了

生成的视频保存在SadTalker\results路径下,也可以在网页端下载

照片也能说话了?嘴型表情全同步,AI数字人时代要来了

在操作界面下方的Examples中提供了部分图片和音频,请点击“图片源”选择使用

照片也能说话了?嘴型表情全同步,AI数字人时代要来了

 

注意事项

①项目安装路径不要包含中文

②推荐使用GTX1060以上显存运行此项目

③使用过程中若不慎关闭软件后台,请重新打开,并刷新网页

 

到了这里,关于照片也能说话了?嘴型表情全同步,AI数字人时代要来了的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python让AI虚拟主播接入微软Azure语音合成并精准嘴型同步

    上一篇文字中讲了利用Python实现利用微软Azure无限免费将文本转mp3格式的音频文件并下载到本地。微软Azure TTS的优点不用多说,今天将讲如何利用Python将其接入到虚拟主播中来。 订阅专栏 ,我将免费向您提供具体的方案。 看过专栏其他文章的朋友,一定知道,我们使用的虚

    2024年02月15日
    浏览(35)
  • 川普真会说中文?连嘴型都同步,用VideoReTalking一键生成你的AI播报员

    你能想到这种画面吗?霉霉在节目中用普通话接受采访 ,特朗普在老家用中文脱口秀,蔡明老师操着一口流利的英文调侃潘长江老师 ..   这听起来似乎很魔幻,可如今全部由 VideoReTalking 实现了 你只需要传入一个视频文件和音频文件,它会生成一个新的视频,在这个视频里,

    2024年02月03日
    浏览(10)
  • 阿里最新EMO:只需要提供一张照片和一段音频,即可生成会说话唱歌的AI视频

    只要一张照片加上音频,就能让你说话唱歌,阿里做到了。 最近,阿里新上线了一款AI图片-音频-视频模型技术EMO,用户只需要提供一张照片和一段任意音频文件,EMO即可生成会说话唱歌的AI视频。以及实现无缝对接的动态小视频, 最长时间可达1分30秒左右。 阿里研究团队表

    2024年03月16日
    浏览(27)
  • 照片也能跳舞?仅需3秒,这个AI神器让你的照片变3D动画……

      上面的动画好玩么? 他原本可不是动画,而是下面这张照片一键生成的,神不神奇? 今天介绍的这个工具可以轻松实现这个效果。 这个工具叫做LeiaPix Converter,可以帮助用户轻松将普通照片转换为具有运动效果的3D图片,这对于那些想要给照片添加创新效果的朋友们来说非

    2024年02月09日
    浏览(22)
  • DreamTalk:单张图像即可生成逼真人物说话头像动画,助力AI数字人落地

    “ DreamTalk: When Expressive Talking Head Generation Meets Diffusion Probabilistic Models ” DreamTalk是一个基于扩散的音频驱动的富有表现力的说话头生成框架,可以生成不同说话风格的高质量的说话头视频。DreamTalk对各种输入表现出强大的性能,包括歌曲、多语言语音、噪声音频和域外肖像。

    2024年04月15日
    浏览(23)
  • Unity C# 之 Azure 微软SSML语音合成TTS流式获取音频数据以及表情嘴型 Animation 的简单整理

    目录 Unity C# 之 Azure 微软SSML语音合成TTS流式获取音频数据以及表情嘴型 Animation 的简单整理 一、简单介绍 二、实现原理 三、注意事项 四、实现步骤 五、关键代码 Unity 工具类,自己整理的一些游戏开发可能用到的模块,单独独立使用,方便游戏开发。 本节介绍,这里在使用

    2024年02月12日
    浏览(22)
  • AI数字人:最强声音驱动面部表情模型VideoReTalking

    目录 1 VideoReTalking论文解读 1.1 介绍 1.2 相关工作 1.2.1 视频编辑中的音频配音 1.2.2 基于音频的单图像面部动画 1.3 框架 1.3.1 语义引导重演网络 1.3.2 口型同步网络 1.3.3 身份感知增强网络 1.3.4 后期处理 1.4 训练 1.4.1 每个模块的训练 1.4.2 评估 1.5 结果 1.5.1 与最先进方法的比较 1.

    2024年02月06日
    浏览(15)
  • 八、让照片说话之SadTalk

        西安交通大学开源了人工智能SadTalker模型,通过从音频中学习生成3D运动系数,使用全新的3D面部渲染器来生成头部运动,可以实现图片+音频就能生成高质量的视频。内含多个踩坑的解决办法,值得玩一玩。 1、sadtalker安装 1.1 windows运行环境构建 Install Python 3.10.6 Install g

    2024年02月11日
    浏览(17)
  • AI VS 好莱坞?新时代电影工作流;MJ制作微信表情包的麻瓜教程;关于ControlNet的一切;AI创业真钱景 | ShowMeAI日报

    👀 日报周刊合集 | 🎡 生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 4月21日,小马智行获得广州市首个也是唯一一个远程载客测试许可,获准在广州开启全新阶段的自动驾驶出行服务(Robotaxi)。即日起,在广州南沙区803平方公里范围内,市民有机会通过手机软件

    2024年02月09日
    浏览(15)
  • AI绘画:数字时代的提示工程新兴应用

    在数字时代,人们对于信息和素材的需求日益增长。随着技术的不断发展,AI绘画正逐渐成为一种应对这种需求的新兴技术。特别是在“提示工程”这一领域中,AI绘画可以发挥出更大的作用。 AI绘画是指使用人工智能技术生成艺术作品的过程。这种技术利用了深度学习、计算

    2024年02月09日
    浏览(29)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包