AI大模型开发架构设计(2)——AI绘画技术架构&应用实践

这篇具有很好参考价值的文章主要介绍了AI大模型开发架构设计(2)——AI绘画技术架构&应用实践。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

AI绘画技术架构&应用实践

1 AI绘画整体流程

  • 第一步:输入 Prompt 提示词:/mj 提示词
  • 第二步:文生图(Text-to-Image)构图
  • 第三步:图片渲染
  • 第四步:图片展示

AI大模型开发架构设计(2)——AI绘画技术架构&应用实践,AIGC,AIGC,AI绘画,文生图,技术架构

2 AI绘画技术架构

文生图核心算法原理
  • 把人类创造的内容用一个高维的数学向量进行表示
    • 如果内容到向量的“翻译”足够合理且能代表内容的特征,人类所有的创作内容都可以转化到空间里的向量。
  • 文生图整体可以分为三个部分:Language Model(语言模型)、Diffusion Model(扩散模型)、Decoder Model(解码模型)。

Language Model(语言模型)→Text Encoder(文本编码)

  • Language Model 是将输入的 Prompt 文本提示词转化为可以输入到 Diffusion Model 使用的表示形式,通常使用 Embedding 加上一些 Radom Noise 输入到下一层。

AI大模型开发架构设计(2)——AI绘画技术架构&应用实践,AIGC,AIGC,AI绘画,文生图,技术架构

Diffusion Model(扩散模型)→Image Information Creator

  • 它是一个时间条件 U-Net(用于图像分割的深度学习架构),它将文本表示和一些高斯噪音作为模型输入,将对应的图像添加一些高斯噪音,得到一个有点噪点的图像,在时间上重复这个过程,重复几百次后就可以获得完全嘈杂的图像。
  • 这么做的过程,记录每个步骤的图像版本,用训练的 NN 就可以将噪声较大的示例作为输入,预测输出新图像。

AI大模型开发架构设计(2)——AI绘画技术架构&应用实践,AIGC,AIGC,AI绘画,文生图,技术架构

Decode Model(扩散模型)→放大 Diffusion Model 的输出到完整图像

  • 它获得 Diffusion Model 的输出并放大到完整图像。
    • 比如:扩散模型在 64 X 64 PX 上训练,解码模型将其提高到 512 X 512 PX。

AI大模型开发架构设计(2)——AI绘画技术架构&应用实践,AIGC,AIGC,AI绘画,文生图,技术架构

训练Encoder模型

  • 在训练过程中,还有一个 Encode Model,它是 Decoder Model 的对应部分,它的目标是将输入图像转化为具有高语义意义的缩减采样表示,会消除与图像不太相关的高频视觉噪声。
  • Encoder Model 和 Diffusion Model 训练分开,采用 Encoder Model 后的图像作为 Diffusion Model 的输入,就可以在图像空间的训练比原始图像计算少64倍,大大节省了计算成本。
  • 训练模型的训练&推理是计算最贵的部分。
文生图工程架构
  • 微服务 + 云原生实时弹性计算和扩容架构

AI大模型开发架构设计(2)——AI绘画技术架构&应用实践,AIGC,AIGC,AI绘画,文生图,技术架构

3 AI绘画的应用实践

  • 多模态的支持能力:文生图 + 图生图 + 图生文

AI大模型开发架构设计(2)——AI绘画技术架构&应用实践,AIGC,AIGC,AI绘画,文生图,技术架构文章来源地址https://www.toymoban.com/news/detail-824314.html

到了这里,关于AI大模型开发架构设计(2)——AI绘画技术架构&应用实践的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 从技术创新到应用实践,百度智能云发起大模型平台应用开发挑战赛!

    大模型已经成为未来技术发展方向的重大变革,热度之下更需去虚向实,让技术走进产业场景。在这样的背景下,百度智能云于近期发起了“百度智能云千帆大模型平台应用开发挑战赛”。 在不久前的演讲中,百度创始人、董事长兼首席执行官李彦宏表示,AI 原生应用要能解

    2024年02月07日
    浏览(52)
  • AI大模型探索之路-应用篇16:GLM大模型-ChatGLM3 API开发实践

    目录 一、ChatGLM3-6B模型API调用 1. 导入相关的库 2. 加载tokenizer 3. 加载预训练模型 4. 实例化模型 5.调用模型并获取结果 二、OpenAI风格的代码调用 1. Openai api 启动 2. 使用curl命令测试返回 3. 使用Python发送POST请求测试返回 4. 采用GLM提供的chat对话方式 5. Embedding处理 三、Functio

    2024年04月23日
    浏览(45)
  • 【AI大模型应用开发】【LangFuse: LangSmith平替,生产级AI应用维护平台】0. 快速上手 - 基本功能全面介绍与实践(附代码)

    大家好,我是同学小张,日常分享AI知识和实战案例 欢迎 点赞 + 关注 👏, 持续学习 , 持续干货输出 。 +v: jasper_8017 一起交流💬,一起进步💪。 微信公众号也可搜【同学小张】 🙏 本站文章一览: 前面我们介绍了LangChain无缝衔接的LangSmith平台,可以跟踪程序运行步骤,提

    2024年03月21日
    浏览(75)
  • 低代码信创开发核心技术(三):MDA模型驱动架构及元数据系统设计

    写最后一篇文章的时候,我本人其实犹豫了半年,在想是否发布出这篇文章,因为可能会动了很多人的利益。所以这篇文章既是整个低代码信创开发的高度总结,也是最为精华的一部分,它点明了低代码中最为核心的技术。虽然你在读这篇文章的时候会有犹抱琵琶半遮面的感

    2024年02月04日
    浏览(49)
  • AI绘画与虚拟人生成实践(一):生成人像,AI绘画模型和工具的效果对比

    本篇的目的是生成一个虚拟的女生形象。先进入正题说明人像怎么生成,本篇使用到的工具和工具的介绍放在文末。 先来一波Midjourney生成的美图提升下大家学习的欲望 以上四张图使用的是相同的Prompt,如下: a beautiful chinese girl, 18 years old, detailed and big eyes, white and soft skin,

    2024年02月09日
    浏览(50)
  • AI作画技术实践第二期|用腾讯云智能图片融合优化AI绘画的效果

    上一篇文章《AI作画技术实践第一期》提到用腾讯云智能能力如何实现简易版的AI画画,发布后受到大量网友关注,也在思考还能不能做出更好的效果。最近发现AI绘画玩法在短视频平台也掀起了一波热潮,结合在网上看到有一些很优秀的AI画画模型,也想尝试在上一篇的基础

    2024年02月09日
    浏览(62)
  • 破局之作:首部开源 AIGC 软件工程应用电子书《构筑大语言模型应用:应用开发与架构设计》...

    TL;DR 版; 在线:https://aigc.phodal.com 下载 1:https://github.com/phodal/aigc/releases 下载 2:https://pan.baidu.com/s/1wGc75vVHaZwvZyHeltyt8w?pwd=phod 2023 年的上半年里,我(@phodal)和 Thoughtworks 的同事们(如:@tianweiliu、@teobler、@mutoe 等)、 开源社区的同伴们(如:卷王@CGQAQ、@genffy、 @liruifengv 等

    2024年02月15日
    浏览(49)
  • ChatGPT 技术架构设计与实践

    ▼最近直播超级多, 预约 保你有收获 今晚直播: 《 从原理到实践教你做出一个ChatGPT 》   — 1 — 今晚20点 ChatGPT 架构设计直播  ChatGPT 分布式离线训练架构包括预训练和微调,构建了 Base Model、SFT  Model、Reward Moded 和 使用 RM 强化 SFT Model。 ChatGPT 在预训练之前需要做大量的

    2024年02月04日
    浏览(37)
  • QQGC?揭秘QQ的AI绘画大模型技术

    👉腾小云导读 2022年来,AIGC概念迅速出圈并快速形成产业生态,成为继PGC、UGC之后新的数字内容创作形式。QQ影像中心提出了自研的AI画画技术方案——QQGC,本文将介绍在QQGC基础大模型训练中的实践和探索,接着往下看吧~ 👉 看目 录 点收藏,随时涨技术 1 背景     1.1 扩

    2024年02月09日
    浏览(36)
  • ChatGPT技术产品落地实践:从技术架构到实际应用

    简介 在本次分享中,想跟大家探讨ChatGPT技术产品的落地实践,从技术架构的角度出发,剖析GPT模型的核心原理、关键技术以及实际应用场景。将从以下几个方面展开讨论: 1. ChatGPT模型概述:首先,简要介绍ChatGPT(Chatbot based on Generative Pre-trained Transformer)模型的基本概念、

    2024年02月15日
    浏览(52)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包