Stable diffusion的架构解读（本博客还是以unet架构为主）

10月前作者：小宋加油啊分类：Toy博客阅读(33) 违法举报

这篇具有很好参考价值的文章主要介绍了Stable diffusion的架构解读（本博客还是以unet架构为主）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

博客只是简单的记录一下自己学的，基于自己的一些情况，所以简单了一些只是将来忘记，用来回顾用。

论文的大体框架
Stable diffusion的架构解读（本博客还是以unet架构为主）,深度学习
stable diffusion生成的图本质上是通过prompt进行引导从噪声中生成的，text是唯一的输入
unet结构位于

unet会接受prompt特征、latent特征、和t时间步特征，最后生成新一轮的特征
Stable diffusion的架构解读（本博客还是以unet架构为主）,深度学习
可以参考知乎大佬https://zhuanlan.zhihu.com/p/639952809佳作
https://blog.csdn.net/weixin_62403633/article/details/131022283文章来源地址https://www.toymoban.com/news/detail-736055.html

到了这里，关于Stable diffusion的架构解读（本博客还是以unet架构为主）的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

一文解读：Stable Diffusion 3究竟厉害在哪里？

知乎原文：叫我Alonzo就好了最近一段时间，正当所有人都在为OpenAI发布Sora狂欢时，Stability AI更是推出了Stable Diffusion 3的技术报告。**这两项技术不约而同都采用了Diffusion Transformer的架构设计，之前我也在我的文章中进行了解读：Diffusion Transformer究竟好在哪里？感兴趣的朋友可

2024年04月16日
浏览(46)
代码解读：使用Stable Diffusion完成相似图像生成任务

Diffusion models代码解读：入门与实战前言：作为内容生产重要的一部分，生成相似图像是一项有意义的工作，例如很多内容创作分享平台单纯依赖用户贡献的图片已经不够了，最省力的方法就是利用已有的图片生成相似的图片作为补充。这篇博客详细解读基于Stable Diffusion生成

2024年04月25日
浏览(58)
强大到离谱！硬核解读Stable Diffusion（完整版）

原文链接：硬核解读Stable Diffusion（完整版） 2022年可谓是 AIGC（AI Generated Content）元年，上半年有文生图大模型 DALL-E2 和 Stable Diffusion ，下半年有OpenAI的文本对话大模型 ChatGPT 问世，这让冷却的AI又沸腾起来了，因为AIGC能让更多的人真真切切感受到AI的力量。这篇文章将介绍

2024年02月05日
浏览(50)
解读Stable Video Diffusion：详细解读视频生成任务中的数据清理技术

Diffusion Models视频生成-博客汇总前言：Stable Video Diffusion已经开源一周多了，技术报告《Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets》对数据清洗的部分描述非常详细，虽然没有开源源代码，但是博主正在尝试复现其中的操作。这篇博客先梳理一下Stable Video

2024年02月04日
浏览(83)
【Stable Diffusion】入门-03：图生图基本步骤+参数解读

当提示词不足以表达你的想法，或者你希望以一个更为简单清晰的方式传递一些要求的时候，可以给AI输入一张图片，此时图片和文字是相当的，都是作为一种信息输送给模型，让它拿来生成一张新的图片。模型可以从图片上获取更多的信息，原本的图片上记录的像素信息会

2024年03月20日
浏览(64)
万字长文解读Stable Diffusion的核心插件—ControlNet

目录一、介绍二、使用方法三、ControlNet结构 1.整体结构 2.ControlLDM 3.Timestep Embedding 4.HintBlock 5.ResBlock 6.SpatialTransformer 7.SD Encoder Block 8.SD Decoder Block 9.ControlNet Encoder Block 10.Stable Diffusion 四、训练 1.准备数据集 2.生成ControlNet模型 3.执行训练五、其它 1.损失函数 2.随机替换提示

2023年04月14日
浏览(49)
一文读懂Stable Diffusion 论文原理+代码超详细解读

Stable diffusion是一个基于Latent Diffusion Models（LDMs）实现的的文图生成（text-to-image）模型。 2022年8月，游戏设计师Jason Allen凭借AI绘画作品《太空歌剧院（Théâtre D’opéra Spatial）》获得美国科罗拉多州博览会“数字艺术/数码摄影“竞赛单元一等奖，“AI绘画”引发全球热议。得力

2024年01月19日
浏览(59)
AnimateDiff论文解读-基于Stable Diffusion文生图模型生成动画

论文：《AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning》 github: https://github.com/guoyww/animatediff/ 随着文生图模型Stable Diffusion及个性化finetune方法：DreamBooth、LoRA发展，人们可以用较低成本生成自己所需的高质量图像，这导致对于图像动画的需求越来越多

2024年02月14日
浏览(39)
stable diffusion原理解读通俗易懂，史诗级万字爆肝长文！

hello，大家好我是 Tian-Feng，今天介绍一些stable diffusion的原理，内容通俗易懂，因为我平时也玩Ai绘画嘛，所以就像写一篇文章说明它的原理，这篇文章写了真滴挺久的，如果对你有用的话，希望点个赞，谢谢。 stable diffusion作为Stability-AI开源图像生成模型，其出现也是不逊于

2024年04月28日
浏览(39)
【深度学习】Stable Diffusion

Stable Diffusion原理： https://zhuanlan.zhihu.com/p/632866251 https://zhuanlan.zhihu.com/p/613337342 源码中的模型：

2024年02月11日
浏览(48)