AIGC:新AI时代,推动数字人进化的引擎

这篇具有很好参考价值的文章主要介绍了AIGC:新AI时代,推动数字人进化的引擎。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

摘要:CV、NLP、大模型...AI技术的加持下,让数字人内外在更加生动真实。在未来的发展中,数字人的应用场景越来越广泛,并将发挥出重要的作用,让美好照进生活。

本文分享自华为云社区《AIGC:新AI时代,推动数字人进化的引擎》,作者:华为云社区精选。

现在我们在手机视频里经常看到,几百平方米的空旷房间内没有工作人员,屏幕上的“美女主播”正在全自动直播带货;在某餐饮短视频账号中,一名主播正情绪饱满地介绍产品,此时,“他”连续直播已经超过24小时…

原来,他们都是AI数字大军,即数字人。

在今年电商行业的销售模式中,有超过50%的企业尝试新的营销手段——数字人直播带货。在直播期间,“家人们”、“上链接”、“321”等直播“黑话”他们张口就来。不仅如此,各个领域的大佬数字人出现在大众视野。不难发现,数字人分身、虚拟主播正在成为“潮流”的Style。

然而,基于越来越多的数字人进行直播的趋势,网络都在疯传:真人主播要失业了,AI要取代三亿人的工作等新闻。借此,华为开发者大会2023社区直播活动邀请到了硅基智能AI数字人事业部全国城市生态总监大成老师和华为云AI技术研发专家王朝老师,一起聊聊“AIGC浪潮下的数字人进化论”。

视频地址:当技术遇上艺术:AIGC浪潮下的数字人进化论

AIGC正在改变市场与行业

被问到“数字人主播是否会取代真人主播”时,大成老师给出了肯定的回答,他从三个方面进行的解释:

• 数字人主播可以降低整体行业的门槛,规避对主播颜值和过往履历的要求,并且可以直接生成各种风格的数字人,提高直播间的颜值和风格多样性。

• 数字人主播可以快速上手,不需要培训和熟悉产品,也能做到24小时不间断的工作,提高直播效率。

• 数字人主播不需要考虑留存和分配的问题,不会出现被竞争对手或主播带走的情况,保障企业的投资和利益。

他还补充到,数字人主播现在在外形上基本可以做到以假乱真,不过在交互层面还是处于弱交互阶段,在比较丰富的互动上和情感表达上还有提升的空间。不过,目前的技术已经足以在各种场景下得到应用和落地,已经有很多企业在使用数字人主播,如电商、教育、文旅、银行金融等,数字人赋能千行百业的时代已经到来了。

“现在AI技术更新迭代的速度非常快,数字人也在不断进化升级。对于我们而言,拥抱AI,躬身入局是最正确的选择。”大成老师谈到。

数字人,要内外兼修

从技术层面来看,数字人主要两种模式:真人驱动型和计算驱动型。前者成本较高,用于影视创作、虚拟偶像等大型活动;后者成本更低,更常见。

针对计算驱动型数字人,制作流程为:制作模型→表演捕捉→模型驱动→模型渲染及后处理。在加入了AI技术之后,模型的制作可以由一段视频去做三维重建,表演捕捉则由一系列的驱动模型去代替。“这相当于是数字人的外在。”王朝说道。

除了外在,内在也很重要。为了让数字人像人一样开口说话,需要使用TTS技术(Text-to-speech,语音合成技术)将文本转换为语音,这是第一步。要让声音听起来毫无违和感,就需要使用声音转换技术,将原说话人的声音转换为目标说话人,同时保留原说话人的风格特色。做到这一步,一个基础的数字人就构建出来了。

要让数字人更加智能,可以使用NLP和CV技术,其中NLP用于支撑内在技术,CV用于支撑外在技术。王朝表示,现在的数字人互动性较弱,但GPT等大模型的出现可以弥补这一缺陷,以及diffusion model的生成能力可以用于数字人的模型制作和后期渲染,可以增加背景的多样性,使效果更有趣。

技术加持下,如何降低创造和内容成本

如果说,虚拟数字人成为连接元宇宙的身份入口。那么大模型掀起的热潮,生成式AI技术的爆发,则是虚拟数字人的“生动力”。生成式AI正在支撑虚拟数字人的回答变得更具多样性且拟人化,驱动数字人更好地表达情绪。

生成式AI是近年来发展迅速的领域,其中Diffusion model是一种重要的生成模型。王朝讲到,Diffusion model可以看做是一个去噪的过程,通过不断去除噪声图像中的噪声,逐渐生成我们想要的图片。这个过程是通过训练一个噪声预测器来实现,通过使用加过噪声的图片和第几次加噪声这两个参数去预测噪声本身。训练后的模型可以用来自定义生成图像,通过输入文本描述或其他控制信号来改变生成图像的样式和内容。

王朝表示,Diffusion model的优势包括生成能力强、可控性强、容易训练等。由于整个生成过程需要不断去噪,所以生成速度较慢。为了解决这个问题,许多diffusion模型并不在原始空间做去噪,而是选择一个低分辨率的空间进行生成,这也导致了许多绘画模型都采用了相同的结构。

“一般来说我们自己的生成需求,多数情况直接用基础模型是无法解决的。模型应用的关键是怎么样去自定义我们的模型,或者说怎么样去提升模型的可控性。” 王朝讲到,在应用方面,可以使用DreamBooth、lora和controlnet等方法来提高模型的可控性,这些方法可以帮助我们自定义生成图像,通过输入文本描述或其他控制信号来改变生成图像的样式和内容,从而满足我们的个性化需求。

数字人应用,让美好更近一点

“朋友们,我是谢晋,上影厂的一名电影导演,今年100岁了,此刻我竟然以人工智能数字人的方式来到SHO未来·海上论坛。”在上海电影节期间,出现了一个令人惊奇的影像——已故导演谢晋通过数字人的形式跨越时空和在场的电影人见面,让在座的观众惊叹。

大成老师表示,谢晋导演数字人是通过硅基数字人和炎帝大模型的技术,根据谢晋导演生前的一些素材,进行训练复合而成的。这就是数字永生。

不仅在影视行业,数字人在各行各业都有应用,比如银行金融、知识付费、房地产、文旅和政策宣导等领域。在银行金融领域,数字人可以被用来提供一对一的理财服务,让普通用户也能享受到VIP的服务;在知识付费领域,数字人可以被用来录制短视频,节省时间并提高效率;在房地产和文旅领域,数字人可以被用来进行虚拟游览,让用户无需亲自到场就能体验到景区的风光。

此外,数字人在老年陪护领域也有应用。有些家庭因为工作或生活的原因,无法全天候照顾到老人或孩子。此时,数字人可以用来进行陪护,提供全方位的服务,如聊天、做饭、打扫卫生等。这样可以让家庭成员更加放心,同时也能让老人和孩子感受到更多的关爱和陪伴。

不难发现,数字人技术的应用范围非常广泛,可以在各个领域都发挥出重要的作用。随着技术的不断进步,数字人也将越来越逼真,应用场景也将越来越广泛。

华为云携手硅基智能,一起征途元宇宙的星辰大海

硅基智能推出的诸多数字人,这背后的内核是“DUIX 数字人智能交互平台”。它是集成了ASR、TTS、虚拟人、NLP、BOT等技术,旨在满足未来虚拟数字经济多服务场景的虚拟化服务需求。而且,DUIX交互平台与华为云平台基础能力结合,提升数字人视频生产、多模态交互能力,为客户打造银行元宇宙、虚拟主播、虚拟培训老师等创新解决方案。

截止到现在,硅基智能与华为云开展了多维度的合作。2021年8月,硅基智能成为华为云的用户,并将整体业务迁移到华为云。随后将产上架华为云云商店,通过鲲鹏认证和产品的严选认证,得到华云全球生态部、华为江苏代表处、南京人工智能创新中心等部门的大力支持。在同年的10月份,产品还完成了自营认证,并启动了数字人的严选上架。到2022年4月份,硅基智能的数字人产品已经完成联营联运的认证,同时智能语音产品也通过了电信运营商cmp认证,并启动了佛山电信试点。

为了更好地落地数字内容等相关产品和技术,在2022年9月,华为全国首个数字创意产业方向的创新中心——华为(龙岗)数字创意产业创新中心正式签约,创新中心将以数据虚拟化引擎服务、云媒体服务、云桌面和数字内容产线MetaStudio等创新技术加速场景商业落地,助推数字创意产业集群融合发展,实现生态共生共赢,完成数字创意产业集群融合发展,助推龙岗数创走廊建设。

作为华为云客户,硅基智能得到了华为云专家团队的有力技术支持,进行了云资源规划和诊断,优化了云资源调度。同时,硅基智能也积极推荐华为云服务,帮助伙伴加速了解华为云生态,提供经验分享。双方还在解决方案维度进行了联合创新,在金融、政府、广电等多个行业联合营销,为行业客户提供有竞争力的创新方案。

 

点击关注,第一时间了解华为云新鲜技术~文章来源地址https://www.toymoban.com/news/detail-558442.html

到了这里,关于AIGC:新AI时代,推动数字人进化的引擎的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AIGC重塑教育 | AI大模型时代

    ⭐ 简单说两句 ⭐ 作者: 后端小知识 , CSDN后端领域新星创作者|阿里云专家博主 CSDN 个人主页 :后端小知识 🔎 GZH : 后端小知识 🎉 欢迎关注 🔎 点赞 👍 收藏 ⭐️ 留言 📝 文章目录 引言 AI与教育工作者 教育资源不平衡 这次,狼真的来了 AI正迅猛地改变着我们的生活。

    2024年02月05日
    浏览(44)
  • AI大模型时代 | 基于AIGC的重塑教育

    这次,狼真的来了。 AI正迅猛地改变着我们的生活。 根据高盛发布的一份报告,AI有可能取代3亿个全职工作岗位,影响全球18%的工作岗位。在欧美,或许四分之一的工作可以用AI完成。另一份Statista的报告预测,仅2023年,AI就将创造230万个工作岗位,同时消除180万个工作岗位

    2024年02月05日
    浏览(32)
  • AIGC 生成式人工智能进化史——谁在布局生成式AI?大模型的生态:模型即服务(MaaS)的新生态加速形成!

    纵览生成式人工智能(Generative AI或AIGC,两种表述均可,国内更多用AIGC)进化史,从AI诞生之始,人们就试图让机器生成内容,与其对话,并诞生了最早的图灵测试标准。多年来,生成式AI的发展一直不温不火。直到去年Midjourney、Stable Diffusion等文生图应用点燃了大众的热情,

    2024年02月10日
    浏览(43)
  • 数字化时代:虚拟数字人的智能进化与生活变革

    我们需要实现对人工智能的有效监管。政府应该与科技公司合作,建立监管框架,确保人工智能的发展能够在保护人类利益的基础上进行。人工智能的快速发展带来了巨大的机遇,但同时也伴随着一些潜在的风险。如果没有适当的监管措施,人工智能可能给人类社会带来不可

    2024年02月15日
    浏览(49)
  • 低代码与数字经济:推动软件开发创新的新引擎

    随着数字经济的飞速发展,传统的软件开发方式已经难以满足快速变化的市场需求。在这一背景下,低代码开发平台应运而生,以其高效、灵活的特性,成为推动数字经济创新发展的重要力量。本文将探讨低代码与数字经济的关系,分析低代码开发平台的优势,并展望其未来

    2024年03月11日
    浏览(61)
  • AI+时代开启,算力模组成为推动AI应用落地的动力之源

    人工智能是第四次技术革命中的重要技术。近期ChatGPT不断出圈,OpenAI随即又推出了新一代大语言模型GPT-4,再次引发了全球对人工智能技术发展的关注。微软宣布正式把GPT-4模型装进Office套件,推出全新的AI功能Copliot。在国内,百度率先推出生成式对话产品“文心一言”,金

    2023年04月11日
    浏览(37)
  • 认识与探索大模型时代的RPA应用及进化(上)

    AI Agent当前仍然处于技术爬坡与实验阶段,特别是在企业领域,真正的成熟应用还处于广泛探索与原型验证阶段,离成熟还尚待时日。而同时另外一种在最近几年广受欢迎的自动化解决方案-RPA(机器人流程自动化)也在LLM时代不断升级进化。 本文将尝试结合理论与实例来梳理

    2024年01月25日
    浏览(25)
  • 使用AIGC平台和数字人,对于零售企业长期发展的价值|AI/大模型/数字人专栏

    #RRL重构零售实验室AIGC内容专栏 以下内容由RRL提问,AIGC平台生成。 随着人工智能和大数据技术的快速发展,各行各业都在积极探索应用这些技术的可能性。在零售行业,人工智能生成内容(AIGC)平台和数字人的应用正在改变着企业的经营策略和营销模式。 本文将从当前AI

    2024年02月04日
    浏览(33)
  • 张晴晴:对话数据推动AIGC——大模型底层数据探索

    “Training data is technology” . 数据即科技,OpenAI的联合创始人IlyaSutskever在与知名科技媒体The Verge访谈中提到。ChatGPT自发布以来热度席卷全球,一周前惊艳亮相的GPT-4更是让人感叹我们迎来了AI发展的历史性时刻。 然而我们也困惑,OpenAI为何不开源GPT-4?在我们看来,更多的奥秘

    2024年02月09日
    浏览(73)
  • 人工智能大模型和数据中台结合,实现“智能数据中台”的AI时代的数字化解决方案

    在当今数字化时代,企业面临着海量数据的挑战,如何高效地管理和利用这些数据成为了企业发展的关键。 数据中台是解决这一问题的重要手段,它可以 在企业内部通过数据集成、数据管理、数据分析和数据应用 等方面的工作,实现 数据的高效利用和价值最大化 。 而 人工

    2024年02月16日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包