Stable Diffusion简介

这篇具有很好参考价值的文章主要介绍了Stable Diffusion简介。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Stable Diffusion是2022年发布的深度学习文本到图像生成模型,它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词(英语)指导下产生图生图的翻译。

stable diffusion变现,AI绘画 | Stable Diffusion,stable diffusion,人工智能

根据维基百科的描述可以得知,Stable Diffusion主要用于文本生成图像的深度学习模型,也就是常说的txt2img的应用场景中:通过给定文本提示词(text prompt),该模型会输出一张匹配提示词的图片。

例如输入文本提示词:A cute cat,Stable Diffusion会输出一张带有可爱猫咪的图片(如下图)。

stable diffusion变现,AI绘画 | Stable Diffusion,stable diffusion,人工智能

Stable Diffusion是基于“潜在扩散模型”(latent diffusion model;LDM)的模型,因此下面内容将以解析LDM展开。为方便起见,由于Stable Diffusion与LDM是相同的,下文面将用Stable Diffusion的缩写SD来统称二者。

一、技术原理

Stable Diffusion 技术是 Diffusion 的改进版本,它通过引入隐向量空间来克服 Diffusion 速度上的限制。除了可用于文本生成图任务,该技术还可以应用于图像生成图像、特定角色描绘,甚至是超分辨率或上色任务。本文主要介绍了 stable diffusion 的计算思路,并对各个重要的组成模块进行了分析,着重解析了最常用的“文本生成图”任务。

下图展示了一个基本的文本生成图流程,将 Stable Diffusion 结构视为一个黑盒。当黑盒的输入是文本串“paradise(天堂)、cosmic(广阔的)、beach(海滩)”时,利用这项技术生成了符合输入要求的图像,即最右边的图中呈现了蓝天白云和一望无际的广阔海滩。

stable diffusion变现,AI绘画 | Stable Diffusion,stable diffusion,人工智能

Stable Diffusion 的核心思想是利用文本中包含的图像分布信息来逐步去噪一张纯噪声的图片,生成与文本信息匹配的图像。它是一个组合系统,包含多个模型子模块,下面将逐步拆解这个黑盒。Stable Diffusion 的主要问题是如何将人类输入的文字串转换成机器可理解的数字信息。这里使用了文本编码器(蓝色模块),它将文字转换成计算机可理解的数学表示,然后输出一系列包含输入文字信息的语义向量。这个语义向量可以作为图片生成器(粉黄组合框)的控制输入,这也是 stable diffusion 技术的核心模块。图片生成器可以分成两个子模块(粉色模块+黄色模块)来介绍。

  1. 文本编码器(蓝色模块):将文字转换成计算机可理解的数学表示,使用了 CLIP 模型,将文字串输入,输出包含文字信息的语义向量。
  2. 图片信息生成器(粉色模块):与 Diffusion 模型的区别在于,它通过一个 Unet 网络和一个采样器算法共同生成低维空间向量。在生成过程中,采样器算法控制图片生成速度,而循环标志代表了多次迭代过程。
  3. 图片解码器(黄色模块):接收图片信息生成器的低维空间向量作为输入,通过升维放大得到完整图片。这个模块只在最后阶段进行一次推理,获得生成图片的最终步骤。

在扩散过程中,图片信息生成器通过 Unet 网络和语义控制向量重复 30~50 次,去除纯噪声并注入语义信息,得到具有丰富语义信息的隐空间向量。采样器负责动态调整 Unet 去噪强度。从图 3 可以直观地看出,经过迭代去噪后的隐向量已经耦合了语义信息,解码出来是一张包含有效语义信息的图片。

stable diffusion变现,AI绘画 | Stable Diffusion,stable diffusion,人工智能

二、应用场景

Stable Diffusion是一种多功能的AI技术,可以应用于文本生成图像、图像修复、超分辨率重建、视频制作、游戏设计等领域。例如,设计师可以使用Stable Diffusion通过文字描述来生成符合描述的海报或服装图案,数字图像处理和计算机视觉领域可以使用它来修复图像中的缺陷或提高图像分辨率。此外,影视制作和游戏开发领域可以使用Stable Diffusion来生成动态图像或游戏场景和角色。

Stable Diffusion源码地址:https://github.com/CompVis/stable-diffusion

为了方便普通人使用Stable Diffusion,开源项目stable-diffusion-ui应运而生。它是一个基于Stable Diffusion模型的web应用程序接口,提供了多种功能,如txt2img、img2img、inpaint等,用户可以通过调节不同参数生成不同效果,还可以在Extras中找到优化图像质量的功能,在Settings中修改默认参数。通过这个UI界面,普通人可以方便地使用Stable Diffusion进行创作,而无需接口或命令程序的支持。

stable diffusion变现,AI绘画 | Stable Diffusion,stable diffusion,人工智能

Stable Diffusion web UI 地址:GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI

三、总结

Stable Diffusion是一个备受关注的文本到图像生成模型,具有广泛的应用前景和潜在的发展空间。该模型利用潜在扩散过程生成高质量且稳定的图像,适用于文本生成图像、图像修复、超分辨率重建等多个领域,并提供开源的预训练模型以方便用户使用。然而,由于潜在扩散过程的复杂性以及数据和计算资源的限制,Stable Diffusion仍然面临一些挑战和问题需要进一步研究和解决。

接下来,我们将介绍如何安装和使用Stable Diffusion web UI,以便您能够利用Stable Diffusion制作出您想要的图片!文章来源地址https://www.toymoban.com/news/detail-818422.html

到了这里,关于Stable Diffusion简介的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 如何在Mac、Windows和Docker上本地电脑上搭建AI人工智能绘画工具Stable Diffusion

    微信公众号:运维开发故事,作者:double冬 目前,有诸如Midjourney等人工智能绘画网站可供大家来免费使用,但是由于是免费资源肯定会在机器性能和使用次数方面有所限制,因此如果能将人工智能绘画工具部署在本地运行就会突破机器性能和使用次数等方面的限制。可能所

    2024年02月13日
    浏览(57)
  • AI绘画Stable Diffusion

    安装包来自B站大佬 秋葉aaaki 安装教程 https://www.bilibili.com/video/BV1iM4y1y7oA?vd_source=2d34fd2352ae451c4f6d4cb20707e169 链接:https://pan.baidu.com/s/188_aaYrlNOlmQd_yrC8XYQ?pwd=3h2a 提取码:3h2a 将 (可选controlnet1.1预处理器),downloads丢程序如下路径 下载包里面 (可选controlnet1.1模型) *pth丢程序如下

    2024年02月11日
    浏览(74)
  • AI 绘画Stable Diffusion 研究(七) 一文读懂 Stable Diffusion 工作原理

    大家好,我是风雨无阻。 本文适合人群: 想要了解AI绘图基本原理的朋友。 对Stable Diffusion AI绘图感兴趣的朋友。 本期内容: Stable Diffusion 能做什么 什么是扩散模型 扩散模型实现原理 Stable Diffusion 潜扩散模型 Stable Diffusion文本如何影响图片生成 Stable Diffusion Cross-attention 技术

    2024年02月13日
    浏览(62)
  • 【AI绘画】Stable Diffusion WebUI

    💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kuan 的首页,持续学习,不断总结,共同进步,活到老学到老 导航 檀越剑指大厂系列:全面总

    2024年02月08日
    浏览(75)
  • AI绘画(Stable Diffusion WBUI)

    一介绍使用的软件和大致原理 Stable Diffusion WBUI:Stable Diffusion WBUI是一种基于网络的应用程序,可以轻松地在任何现代Web浏览器中运行。它是Stable Diffusion软件的一个插件,旨在为用户提供更方便、更易于使用的界面来模拟和分析。 上面是该应用程序,通过访问http://127.0.0.1:786

    2024年02月09日
    浏览(52)
  • stable-diffusion AI 绘画

    git clone https://github.com/CompVis/stable-diffusion.git 进入stable-diffusion目录 在这里注册一个账号: Hugging Face – The AI community building the future. 并生成个token 安装CUDA NVIDIA 安装 CUDA_nvidia cuda_长满头发的程序猿的博客-CSDN博客 pip install torch -f https://download.pytorch.org/whl/torch_stable.html pip insta

    2024年02月13日
    浏览(49)
  • AI 绘画 | Stable Diffusion 图生图

    Stable Diffusion 不仅可以文生图,还可以图生图。文生图就是完全用提示词文本去生成我们想要图片,但是很多时候会有词不达意的感觉。就像我们房子装修一样,我们只是通过文字描述很难表达出准确的想要的装修效果,如果能给到一张设计图或者效果图,那么就能更加直白

    2024年02月03日
    浏览(74)
  • AI绘画:快速上手stable diffusion

    点击↑上方↑蓝色“ 编了个程 ”关注我~ 这是Yasin的第 89 篇原创文章 最近随着Chat GPT的大火,AI绘画也火了起来。尤其是midjourney(以下简称mj),能够通过文本生成AI图片,还能指定各种风格,简直是我们这种又菜又爱玩的福音。 下面是我用mj随便画的一些图: mj上手

    2023年04月22日
    浏览(64)
  • AI绘画Stable Diffusion技巧分享

    Prompt运用规则及技巧 AI绘画Stable Diffusion技巧分享资源: 1. https://publicprompts.art/(最适用于OpenArt 线上模型 https://openart.ai/) 2. https://docs.qq.com/doc/DWFdSTHJtQWRzYk9k(转自元素法典,含各类风格用词) 3. https://www.ptsearch.info/home/(实例查询) 4. http://prompttool.com/NovelAI(体验还不错)

    2024年02月02日
    浏览(48)
  • AI 绘画 | Stable Diffusion 提示词

    在Stable Diffusion中,Prompts是控制模型生成图像的关键输入参数。它们是一种文本提示,告诉模型应该生成什么样的图像。 Prompts可以是任何文本输入,包括描述图像的文本,如“一只橘色的短毛猫,坐在草地上,背景是蓝天白云”,也可以是的组合,如“鸟,森林,天空

    2024年01月21日
    浏览(54)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包