博客只是简单的记录一下自己学的,基于自己的一些情况,所以简单了一些只是将来忘记,用来回顾用。
论文的大体框架
stable diffusion生成的图本质上是通过prompt进行引导从噪声中生成的,text是唯一的输入
unet结构位于
文章来源:https://www.toymoban.com/news/detail-736055.html
unet会接受prompt特征、latent特征、和t时间步特征,最后生成新一轮的特征
可以参考知乎大佬https://zhuanlan.zhihu.com/p/639952809佳作
https://blog.csdn.net/weixin_62403633/article/details/131022283文章来源地址https://www.toymoban.com/news/detail-736055.html
到了这里,关于Stable diffusion的架构解读(本博客还是以unet架构为主)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!