解析不同种类的StableDiffusion模型Models,再也不用担心该用什么了

这篇具有很好参考价值的文章主要介绍了解析不同种类的StableDiffusion模型Models,再也不用担心该用什么了。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Stable Diffusion是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的文图生成(text-to-image)模型。具体来说,Stable Diffusion在 LAION-5B 的一个子集上训练了一个Latent Diffusion Models,该模型专门用于文图生成。Latent Diffusion Models通过在一个潜在表示空间中迭代“去噪”数据来生成图像,然后将表示结果解码为完整的图像,让文图生成能够在消费级GPU上,在10秒级别时间生成图片,大大降低了落地门槛,也带来了文图生成领域的大火。
本文主要是解析不同种类的模型,其它内容学习请点击:

  • 安装及其问题解决参考:《Windows安装Stable Diffusion WebUI及问题解决记录》;
  • 运行使用时问题《Windows使用Stable Diffusion时遇到的各种问题整理》;
  • 模型运用及参数《Stable Diffusion 个人推荐的各种模型及设置参数、扩展应用等合集》;
  • 提示词生图咒语《AI绘图提示词/咒语/词缀/关键词使用指南(Stable Diffusion Prompt 设计师操作手册)》;
  • 不同类的模型Models说明《解析不同种类的StableDiffusion模型Models》;
  • 绘制人物动作及手脚细节《Stable Diffusion 准确绘制人物动作及手脚细节(需ControlNet扩展)》;
  • 各种风格对比及实际运用《AI绘图风格对照表/画风样稿详细研究记录及经验总结》;

解析不同种类的StableDiffusion模型Models,再也不用担心该用什么了

一、 checkpoint(主模型)

Checkpoint这个词在不同的领域有不同的含义。在深度学习中,Checkpoint是用于描述在每次训练后保存模型参数(权重)的惯例或术语。这就像在游戏中保存关卡时你可以随时通过加载保存文件回复游戏。你可以加载保存的模型权重重新开启训练甚至可以之后进行一个推理。

主模型形象一些理解的话就是画师本身,而本文中的其它模型都是调整和优化主模型的工具。

训练流程:

大意就是:

  1. 样本图片A出一张n级噪声图B和n-1噪声图C,
  2. 文本标识和噪声图B结合生成图D,
  3. 将C图与D图进行比较,
    • 如果成功就将n级噪声降一级重复上面的步骤,直到最后一级噪声图。
    • 如果失败就返回第二步重新生成图D。

是不是和我们人类的学习过程一样?词与图像之间的关系从懵懂模糊到清晰明确。

二、 Embeding(文本转换)

Embedding是指将自然语言文本(如句子或段落)转换为计算机可以理解的数值向量表示形式的过程。这种向量表示法通常称为嵌入(embedding),可以在许多自然语言处理(NLP)任务中使用,例如语言模型、情感分析、问答系统等。在Stable Diffusion中,您可以使用内置的嵌入模型或创建自定义的嵌入模型来生成嵌入。

一文读懂Embedding的概念,以及它和深度学习的关系

训练流程:

与checkpoint不同的就是失败之后去修正文本标识,通过不断训练文本标识的理解来最终达到正确出图的目的。
依赖主模型,所以如果主模型与embeding不搭,那么效果将不尽如人意,就如同你让油画家来画水墨画,虽然他画画功底很好,但不会水墨画,自然也难以达到预期效果。

三、 LoRA(劳拉)

在Stable Diffusion中,LoRA是一种用于微调大型语言模型的技术,全称为Low-Rank Adaptation of Large Language Models。

LoRA最初是为大模型提出的,并在transformer块上进行了演示,但该技术也可以应用于其他地方。在微调Stable Diffusion的情况下,LoRA可以应用于将图像表示与描述它们的提示相关联的交叉注意层。

训练流程:

四、 Hypernetwork(风格化)

在Stable Diffusion中,Hypernetwork是一种用于训练大型神经网络的技术。它是一种生成网络的网络,可以通过它来生成其他网络的权重。Hypernetwork可以用于生成描述图像的提示的交叉注意层。

训练流程:

相比LoRA,多了一些步骤,不如LoRA那么短小精悍。

出图更适合风景,而不是特定具象的物体。

五、 AVE(特定)

在Stable Diffusion中,AVE是一种用于训练大型神经网络的技术。它是一种生成网络的网络,可以通过它来生成其他网络的权重。在Stable Diffusion中,AVE可以用于生成描述图像的提示的交叉注意层。

和Hypernetwork描述一致~~

Aesthetic Embedding
Aesthetic Gradient
Variational Autoencoder

大多数都融合在了主模型中,一般不会用到。

六、 目录

五个模型对应的目录如下图:

解析不同种类的StableDiffusion模型Models,再也不用担心该用什么了
models/Stable-diffusion 该目录就是主模型文件夹。文章来源地址https://www.toymoban.com/news/detail-418095.html

到了这里,关于解析不同种类的StableDiffusion模型Models,再也不用担心该用什么了的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 使用ONE.Abp快速开发微服务,再也不用加班了

    公司采用项目制工作方式,因此在不同项目上可能存在多个团队开发独立的代码库,但通用的基础设施却是相同的,这可能导致每个项目都需要编写相同的代码,并重复造轮子。更严重的是,每个项目都有自己的用户体系,导致用户在使用不同的服务时需要重新登录,这不仅

    2024年02月05日
    浏览(45)
  • 自打有了GIPKs,DBA和开发再也不用battle了

    GIPKs特性简介 GIPKs特性的作用 玩转GIPKs GIPKs解决了历史难题 从MySQL 8.0.30开始,新引入一个叫做GPIKs的特性,其全称是 Generated Invisible Primary Keys ,简言之就是 自动生成隐含的主键列 ,更完整的说法是:启用 GIPKs 后,当新建的InnoDB表没有显式主键时,会自动创建一个不可见的主

    2024年02月16日
    浏览(88)
  • 再也不用担心变量类型错误!学会JS中如何轻松检查变量类型

    今天要分享的问题就是: 如何在JS中检查一个变量的类型? 先上结论: 如果判断的是基本数据类型或JavaScript内置对象,使用toString;如果要判断的是自定义类型,请使用instanceof。 在 ECMAScript 规范中,共定义了 7 种数据类型,分为 基本类型 和 引用类型 两大类。 基本类型

    2024年02月08日
    浏览(56)
  • 初识Linux(下).妈妈再也不用担心我Linux找不到门了

    “我会定期分享我的学习和工作经验,也欢迎大家留言和交流,让我们共同学习和进步!感谢大家的支持!” 系列文章 初识Linux(上).妈妈再也不用担心我Linux找不到门了。 初识Linux(中).妈妈再也不用担心我Linux找不到门了。 初识Linux(下).妈妈再也不用担心我Linux找不到门了。

    2024年02月05日
    浏览(79)
  • 漏洞扫描工具大全,妈妈再也不用担心我挖不到漏洞了

    Acunetix Web Vulnerability Scanner(简称AWVS)是一款知名的网络漏洞扫描工具,它通过网络爬虫测试你的网站安全,检测流行安全漏洞。 AWVS常见功能: 网站爬行

    2024年02月09日
    浏览(48)
  • 高效办公之远程电脑控制:再也不用带着厚重笔记本

    您是否遇到过以下问题: 出门在外没有带公司电脑,想查看或处理文件而不可得;每次出差都要带着厚重的笔记本电脑;甚至深夜都已经回家了,紧急工作来了,工作电脑却不在身边,而打车回到公司处理。 如果答案是yes,那么一个远程控制软件您值得拥有~ 这边推荐两款简

    2024年02月11日
    浏览(54)
  • 初识Linux(中).妈妈再也不用担心我Linux找不到门了。

    “我会定期分享我的学习和工作经验,也欢迎大家留言和交流,让我们共同学习和进步!感谢大家的支持!” 系列文章 初识Linux(上).妈妈再也不用担心我Linux找不到门了。 初识Linux(中).妈妈再也不用担心我Linux找不到门了。 初识Linux(下).妈妈再也不用担心我Linux找不到门了。

    2024年02月05日
    浏览(88)
  • Python3,自从掌握了这个方法,再也不用print进行调试了。

    小屌丝 :鱼哥,调试代码,除了Debug,还有什么其他的神器没? 小鱼 :额… 你这是要飞天吗? 小屌丝 :我很低调的好不好。 小鱼 :还说低调,那你Debug咋都不用,还说低调? 小屌丝 :我觉得Debug太慢了, 小鱼 :…被你装到了。 小屌丝 :反正我不管, 就得帮我想个神器

    2024年02月05日
    浏览(43)
  • Selenium 4.11 正式发布--再也不用手动更新chrome driver 了

    Selenium 4.11.0 正式发布了,先来看一下主要特性。 Chrome DevTools支持的版本现在是:v113、v114和v115(Firefox仍然对所有版本使用v85) 通过Selenium Manager支持Chrome For Testing(CfT) Selenium Manager现在可以在PATH或配置的路径上定位driver的二进制文件,检查潜在的不兼容性,并提供更好的

    2024年02月08日
    浏览(48)
  • Spring Boot 项目代码混淆,实战来了,再也不用担心代码泄露了!

    简单就是把代码跑一哈,然后我们的代码 .java文件 就被编译成了 .class 文件 就是针对编译生成的 jar/war 包 里面的 .class 文件 逆向还原回来,可以看到你的代码写的啥。 比较常用的反编译工具 JD-GUI ,直接把编译好的jar丢进去,大部分都能反编译看到源码: 那如果不想给别人反

    2023年04月26日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包