ChatGPT研究(三)——AIGC多模态交互功能，奠定多场景商用基础-Toy模板网

这篇具有很好参考价值的文章主要介绍了ChatGPT研究(三)——AIGC多模态交互功能，奠定多场景商用基础。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

✏️写作：个人博客，InfoQ，掘金，知乎，CSDN

📧公众号：进击的Matrix

🚫特别声明：创作不易，未经授权不得转载或抄袭，如需转载可联系小编授权。

前言

最近ChatGPT，想必大家已经是耳熟能详了，一度认为ChatGPT的到来是人工智能的奇点到来，那么到底ChatGPT是什么？为什么ChatGPT为代表的人工智能技术不仅受到平民用户的喜爱，还受到资本市场追捧呢？

上篇文章《ChatGPT研究(二)——AI平民化的里程碑》中从技术角度，解读ChatGPT的AI发展和应用，本篇文章将会更多的从商业场景使用中来介绍ChatGPT的应用。

AIGC多模态交互功能持续演化，奠定多场景商用基础

AIGC：利用人工智能产生内容，提升生产力曲线

AIGC: Artificial Intelligence Generated Context，即可以利用人工智能技术自动产生内容，常见如代码生成，文本问答等

ChatGPT研究(三)——AIGC多模态交互功能，奠定多场景商用基础

ChatGPT已成为AIGC功能矩阵中的重要板块

ChatGPT是AIGC“数字内容智能编辑”功能中的重要组成部分，ChatGPT模型的出现对于文字/语音模态的AIGC应用具有重要意义

✔️ 随着深度学习技术的快速突破以及数字内容的海量增长，AIGC领域相关技术打破了预定义规则的局限性，使得快速便捷且智慧地输出多模态的数字内容成为可能。
✔️ 在技术创新以及多模态模型的持续突破下，AIGC根据功能和对象的不同，按顺序可包括三种主要实用功能: 数字内容孪生，数字内容的智能编辑、数字内容的智能创作。
这三种功能相互嵌套与结合，可以让AIGC产品具备超越人类的创作潜力。而ChatGPT正是AIGC的数字内容编辑这一大功能领域中的重要组成部分。

ChatGPT研究(三)——AIGC多模态交互功能，奠定多场景商用基础

AIGC相关技术包含了三大前沿能力

数字内容孪生能力构建现实世界-虚拟世界映射

孪生能力包括智能增强与转译技术，其中增强技术弥补内容数字化过程中的信息损失，转译技术在理解基础上对内容进行多种形式的呈现

数字编辑能力打通现实世界虚拟世界交互通道

编辑能力包括智能语义理解与属性控制，语义理解帮助实现数字内容各属性的分离解耦，属性控制则在理解基础上对属性进行精确修改、编辑与二次
生成，最终反馈于现实世界，形成孪生-反馈闭环

数字创作能力从数据理解走向数据创作

创作能力可分为基于模仿的创作与基于概念的创作，前者基于对某一类作品数据分布进行创作，而后者从海量数据中学习抽象概念，并基于概念创作出现实世界不存在的内容

ChatGPT研究(三)——AIGC多模态交互功能，奠定多场景商用基础

AIGC行业发展经历了三个主要时期

AIGC发展经历了早期萌芽、沉淀积累和2014年之后的快速发展阶段

ChatGPT研究(三)——AIGC多模态交互功能，奠定多场景商用基础

从分析式AI到生成式AI逐步演化，生成式AI赋予AIGC创新力

生成式AI起源于分析式AI，分析式AI发展过程汇总的技术积累为生成式AI的产生奠定基础

分析式AI其学习的知识局限于数据本身；生成式AI在总结归纳数据知识的基础上可生成数据中不存在的样本
最新生成式AI技术如GAN，Diffusion等，催生多款AIGC产品如:OpenAI系列、DALL·E2(Diffusion)，Starry A.I.(基于GAN)等

ChatGPT研究(三)——AIGC多模态交互功能，奠定多场景商用基础

AIGC：学习范式更新奠定基础，模型结构升级助力腾飞

人工智能技术推动AIGC行业不断发展，其中学习范式的更新赋予AI模型主动学习能力，模型结构升级提升AI模型学习，归纳与创新能力

ChatGPT研究(三)——AIGC多模态交互功能，奠定多场景商用基础

AIGC产业链涵盖了从硬件到多类终端应用的广泛领域

AIGC关联产业可分为应用层、模型层、云计算平台与计算硬件层

计算硬件层结合云计算平台为AIGC提供机器学习训练与推理算力，其中GPU与TPU为硬件核心，主要参与厂商包括英伟达(GPU)与谷歌 (TPU)；
云平台参与厂商则包含AWS，GCP，Azure以及 Coreweave;计算硬件层中云计算平台厂商分布稳定，竞争出现于模型层面与应用层面

模型层面，闭源基础模型提供商如OpenAI通过API向用户提供服务，而开源基础模型则通过在托管平台如Hugging Face、Replica公开模型权重。
模型训练其高计算力需求推动了模型层厂商与云计算厂商建立合作关系(如 OpenAI+Azure，GCP+DeepMind。模型层面闭源模型较为普遍，各厂商依靠模型建立技术壁垒。

在应用层面，MidJourney，Runway等自主研发、持有模型;而 Jasper，Github Copilot则通过调用闭源模型商提供的API或采用托管平台共享的模型。

ChatGPT研究(三)——AIGC多模态交互功能，奠定多场景商用基础