【AI绘画】用张图直观理解Stable Diffusion

这篇具有很好参考价值的文章主要介绍了【AI绘画】用张图直观理解Stable Diffusion。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取)

【AI绘画】用张图直观理解Stable Diffusion,AI作画,stable diffusion,人工智能

作者****|Jay Alammar

翻译|杨婷、徐佳渝

最近,AI图像生成引人注目,它能够根据文字描述生成精美图像,这极大地改变了人们的图像创作方式。Stable Diffusion作为一款高性能模型,它生成的图像质量更高、运行速度更快、消耗的资源以及内存占用更小,是AI图像生成领域的里程碑。

在接触了AI图像生成以后,你可能会好奇这些模型背后的工作原理。

下面是对Stable Diffusion工作原理的概述。

【AI绘画】用张图直观理解Stable Diffusion,AI作画,stable diffusion,人工智能

Stable Diffusion用途多样,是一款多功能模型。首先它可以根据文本生成图像(text2img)。上图是从文本输入到图像生成的示例。除此之外,我们还可以使用Stable Diffusion来替换、更改图像(这时我们需要同时输入文本和图像)。

【AI绘画】用张图直观理解Stable Diffusion,AI作画,stable diffusion,人工智能

下面是Stable Diffusion的内部结构,了解内部结构可以让我们更好地理解Stable Diffusion的组成、各组成部分的交互方式、以及各种图像生成选项/参数的含义。

1
Stable Diffusion的组成

Stable Diffusion并不是一个单一模型,而是由多个部分和模型一起构成的系统。

从内部来看,首先我们可以看到一个文本理解组件,这个组件将文本信息转化为数字表示(numeric representation)以捕捉文本意图。

【AI绘画】用张图直观理解Stable Diffusion,AI作画,stable diffusion,人工智能

这部分主要对ML进行大概介绍,文章后续还会讲解更多细节。可以说这个文本理解组件(文本编码器)是一个特殊的Transformer语言模型(严格来说它是一个CLIP模型的文本编码器)。将文本输入到 Clip 文本编码器得到特征列表,对于文本中的每一个word/token 都有会得到一个向量特征。

然后将文本特征作为图像生成器的输入,图像生成器又由几部分组成。

【AI绘画】用张图直观理解Stable Diffusion,AI作画,stable diffusion,人工智能

图像生成器两步骤:

1-图像信息创建器(Image information creator)

图像信息创建器是Stable Diffusion特有的关键部分,也是其性能远超其他模型的原因。

图像信息创建器运行多个step生成图像信息。Stable Diffusion接口(interfaces)和库(libraries)的step参数一般默认为50或100。

图像信息创建器完全在图像信息空间(亦称潜在空间)上运行,这让Stable Diffusion比以前在像素空间(pixel space)上运行的扩散模型速度更快。从技术上讲,图像信息创建器由UNet神经网络和调度算法组成。

“扩散”一词描述了图像信息创建器中发生的事情。因为图像信息创建器对信息作了逐步处理,所以图像解码器(image decoder)才能随后产出高质量图像。

【AI绘画】用张图直观理解Stable Diffusion,AI作画,stable diffusion,人工智能

2-图像解码器(Image Decoder)

图像解码器根据图像信息创建器的信息绘制图像,它只用在过程结束时运行一次,以生成最终的像素图像。

【AI绘画】用张图直观理解Stable Diffusion,AI作画,stable diffusion,人工智能

这样就构成了Stable Diffusion的三个主要组成部分,每个部分都有自己的神经网络:

  • ClipText: 用于文本编码。输入: 文本。输出: 77个token embeddings向量,每个向量有768维。

  • UNet+调度程序: 在信息(潜在)空间中逐步处理信息。输入: 文本embeddings和一个初始化的多维数组(结构化的数字列表,也称为

AI绘画所有方向的学习路线思维导图

这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。如果下面这个学习路线能帮助大家将AI利用到自身工作上去,那么我的使命也就完成了:
【AI绘画】用张图直观理解Stable Diffusion,AI作画,stable diffusion,人工智能

👉stable diffusion新手0基础入门PDF👈

【AI绘画】用张图直观理解Stable Diffusion,AI作画,stable diffusion,人工智能

👉AI绘画必备工具👈

【AI绘画】用张图直观理解Stable Diffusion,AI作画,stable diffusion,人工智能

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉AI绘画基础+速成+进阶使用教程👈

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
【AI绘画】用张图直观理解Stable Diffusion,AI作画,stable diffusion,人工智能文章来源地址https://www.toymoban.com/news/detail-829915.html

👉12000+AI关键词大合集👈

这份完整版的AI绘画资料我已经打包好,戳下方蓝色字体,即可免费领取!CSDN大礼包:《全套AI绘画基础学习资源包》免费分享

到了这里,关于【AI绘画】用张图直观理解Stable Diffusion的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AI 作画《Concept Art概念艺术》| 用stable diffusion生成

    前言 “Concept Art”是一个艺术门类,即所谓“概念艺术”、“概念设计”,也称为“初步设计”。一般常见于影视或游戏设计中,服务产品最初的视觉效果,是游戏或影片的核心工作内容之一。 下面让我们使用当前很火的扩散模型stable diffusion,生成一些概念艺术作品!看看

    2024年02月11日
    浏览(65)
  • 无显卡也能AI作画 | Colab + Stable Diffusion WebUI

    事情起因是这样的,我之前写了如何在linux上用Stable Diffusion WebUI。 里边提到我迟迟没有弄webui是因为我笔记本A卡,台式机显卡带不动。所以无奈只能使用学校服务器搭一个。 当时有人说我,你自己电脑不行怎么不用colab,我当时懒得弄。 原因如下: 服务器在我们本地,不用

    2024年02月10日
    浏览(78)
  • AI 作画火了,如何用 Serverless 函数计算部署 Stable Diffusion?

    作者:寒斜 立即体验基于函数计算部署 Stable Diffusion: https://developer.aliyun.com/topic/aigc AIGC 领域目前大火, 除了 Chatgpt,在文生图领域 Stable Diffusion 大放异彩,深刻的地影响着绘画、视频制作等相关领域。利用这项技术,普通人也可以制作出令人惊叹的艺术作品。 今天我们将

    2024年02月09日
    浏览(57)
  • 【AI作画】使用Stable Diffusion的艺术二维码完全生成攻略

    文中有彩蛋 随着人工智能技术的快速发展,特别是深度学习和生成模型的突破,AI作图已经成为许多领域的主要工具和方法之一。它不仅提高了创造力和效率,还改变了我们与图像、数据和媒体的交互方式。今天请跟随阿Q的脚步,一起来使用 Stable Diffusion 创作出属于我们自己

    2024年02月13日
    浏览(94)
  • 使用Amazon SageMaker构建高质量AI作画模型Stable Diffusion

    近来,随着新一代 AI 大型聊天机器人 ChatGPT 火遍科技圈,人工智能生成内容( Artificial Intelligence Generated Content , AIGC )这一领域开始受到学术界、工业界甚至普通用户的广泛关注。 AIGC 凭借其独特的“创造力”与人类无法企及的创作生成速度掀起了一股人工智能狂潮。但是,利

    2023年04月14日
    浏览(63)
  • AI作画升级!一键帮你用Stable Diffusion 生成无限缩放效果视频

    在这一篇文章中,我们介绍了利用OpenVINO™优化和加速Stable Diffusion模型的推理,在英特尔®独立显卡上能够根据我们输入的指令(prompt),快速生成我们喜爱的AI画作。今天,我们对这一应用场景再次升级,除了能够作画,利用OpenVINO对Stable Diffusion v2模型的支持及优化,我们还

    2024年02月10日
    浏览(61)
  • AIGC-Stable Diffusion Webui-AI作画初体验

    一、项目地址 :传送门:github:stable-diffusion-webui 二、安装方式 :本地安装 or Google Colab.(下文介绍中关于安装的部分均以本地安装为例) 本地安装 : 1、git 2、python(推荐3.10.8) 3、下载git仓库代码 4、配置:python及git路径 5、启动:(windows) (第一次启动会很慢,会下载安装很多文

    2024年02月13日
    浏览(47)
  • AI作画,国风油画风随心定制~ Stable Diffusion模型使用,三步就上手

    最近, AIGC (即 AI Generated Content ,是指利用人工智能技术来生成内容)真的是火出了天际。除了被挤到服务器满负荷的 chatGPT ,另一个也颇受瞩目的领域当属 AI 作画了。利用开源的一类“扩散( diffusion )”模型,你可以随时用AI进行绘画创作。除了常见的网页版注册-输入文

    2023年04月09日
    浏览(47)
  • 【AI作画】stable diffusion webui Linux虚拟机 Centos 详细部署教程

    环境:虚拟机Centos7、6处理器、8G内存+10G交换内存、没有GPU使用CPU硬解 windows版本的可以直接使用整合包:看评论的转载链接自行下载,解压即可用 提示:这里可能source后版本是1.8.3,只需要重新yum remove git source /etc/profile 提示:注意最后修改vim 和 urlgrabber-ext-down 提示:我这里

    2024年02月11日
    浏览(50)
  • AI作画工具 stable-diffusion-webui 本地部署 多种模型 可生成NSFW

    最近,人工智能绘画非常受欢迎。在本文中,我使用了一台带有N卡的电脑,安装了stable-diffusion-webui前端并替换了默认的模型。这样就可以生成高质量的二次元图像,并且可以不受限制地生成图片(在线版通常会阻止NSFW内容的生成)。 Git:https://git-scm.com/download CUDA:https://

    2024年02月02日
    浏览(83)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包