机器学习笔记：李宏毅 stable diffusion

1年前作者：UQI-LIUWJ分类：Toy博客阅读(12)违法举报

这篇具有很好参考价值的文章主要介绍了机器学习笔记：李宏毅 stable diffusion。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1 基本框架

机器学习笔记：李宏毅 stable diffusion,机器学习,笔记,人工智能

①：文字变成向量
②：喂入噪声+文字encoder，产生中间产物
③：decoder 还原图片

2 text encoder

机器学习笔记：李宏毅 stable diffusion,机器学习,笔记,人工智能

这张图越往右下表示效果越好，可以看到text encoder尺寸越大，对后续生成图片的增益越多

3 评价图片生成好坏的标准

3.1 FID

机器学习笔记：李宏毅 stable diffusion,机器学习,笔记,人工智能

现有一个训练好的CNN 模型，可以生成真实影像和生成图像的representation
这两组表征的分布越近，效果越好
——>我们sample 一堆图片，然后生成一组同语义的图片，计算他们分布的distance

3.2 CLIP

机器学习笔记：李宏毅 stable diffusion,机器学习,笔记,人工智能

如果图片和文字是成对的，那么他们的representation越近表示生成的图片效果越好

4 decoder

机器学习笔记：李宏毅 stable diffusion,机器学习,笔记,人工智能

文章来源地址https://www.toymoban.com/news/detail-646148.html

训练一个auoto encoder
训练完把decoder拿出来用即可

5 噪声加的位置

机器学习笔记：李宏毅 stable diffusion,机器学习,笔记,人工智能

之前defusion model 中，noise是加在图片上
但现在产生的东西已经不是图片了
- ——>noise 加在中间产物上

机器学习笔记：李宏毅 stable diffusion,机器学习,笔记,人工智能

大体上和diffusion model 类似，这里就是最后多接一个decoder，将中间产物变成图片

到了这里，关于机器学习笔记：李宏毅 stable diffusion的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

人工智能实战：Stable Diffusion技术分享
背景 Stable Diffusion是计算机图形学和可视化领域中的一项重要技术。在这篇分享中，我们将深入探讨稳定扩散的原理、关键要素和实施步骤，通过了解Stable Diffusion的流程化，我们可以提升自身的设计能力和创造力，为公司和个人注入更多的价值和创意。美术制定美术风
2024年01月19日
浏览(9)
人工智能基础_机器学习003_有监督机器学习_sklearn中线性方程和正规方程的计算_使用sklearn解算八元一次方程---人工智能工作笔记0042
然后我们再来看看,如何使用sklearn,来进行正规方程的运算,当然这里首先要安装sklearn,这里如何安装sklearn就不说了,自己查一下首先我们还是来计算前面的八元一次方程的解,但是这次我们不用np.linalg.solve这个解线性方程的方式,也不用直接解正规方程的方式: 也就是上面这种
2024年02月08日
浏览(10)
人工智能基础_机器学习007_高斯分布_概率计算_最小二乘法推导_得出损失函数---人工智能工作笔记0047
这个不分也是挺难的,但是之前有详细的,解释了,之前的文章中有, 那么这里会简单提一下,然后,继续向下学习首先我们要知道高斯分布,也就是,正太分布, 这个可以预测x在多少的时候,概率最大要知道在概率分布这个,高斯分布公式中,u代表平均值,然后西格玛代表标准差,知道了
2024年02月07日
浏览(40)
神奇的人工智能之神笔马良|Stable Diffusion使用
1，月球上骑马的宇航员。 image generate by stable-diffusion model 2，下棋的狗 image generate by stable-diffusion model 3，沉迷学习的史努比 image generate by stable-diffusion model 4，鲤鱼跃出海面
2024年02月09日
浏览(11)
机器学习李宏毅学习笔记39
大模型+大资料大模型的顿悟时刻随数据量增加，模型可以从量变达到质变，从某一刻开始突然学会东西。当成为大模型时，分数会从0,0突然变成100，完成“顿悟”. 横轴表示分布中产生答案的概率（信心分数），纵轴表示答案正确的概率。可以发现小模型的信心分数跟答案
2024年02月14日
浏览(12)
机器学习李宏毅学习笔记37
ChatGPT简单原理介绍 Chatgpt以句子为输入，输出这个句子后面接的词汇的概率分布，给每一个可能的符号一个概率，根据这个分布进行sample，每次sample出来的词汇可能都是不一样的，所以答案每次也都不相同。把输出的词汇加在输入给gpt的句子后面，重复上面的过程，直到最后
2024年02月16日
浏览(7)
机器学习李宏毅学习笔记33
神经网络压缩（一）类神经网络剪枝（pruning）简化模型，用比较少的参数，但让效能差不多,这就是network compression这件事。有些情况下需要把模型用在resource constrain（资源有限）的情况下，比如说跑在智能手表上、小型无人机上等等。只有比较少的内存和计算能力，这时就
2024年02月11日
浏览(7)
人工智能AI系列 - java 版的stable diffusion 图像生成
图像生成文生图：输入提示词（仅支持英文），生成图片（仅支持英文） GPU版本 StableDiffusionGPU.java CPU版本 StableDiffusionCPU.java 图生图：根据图片及提示词（仅支持英文）生成图片 GPU版本 Img2ImgStableDiffusionGPU.java 显卡CUDA：11.7版本参考测试数据：分辨率 512*512 25步 CPU(i5处理器
2024年02月09日
浏览(15)
人工智能基础_机器学习015_BGD批量梯度下降代码演示_在批量梯度下降中使用逆时衰减---人工智能工作笔记0055
然后我们用代码来演示一下BGD批量梯度下降,首先启动jupyter notebook 然后我们新建一个文件新建文件夹,然后新建一个python文件然后我们这里用一元一次方程进行批量梯度下降. import numpy as np 导入数学计算包 X = np.random.rand(100,1) `np.random.rand(100, 1)` 是NumPy库中的一个函数，用于
2024年02月05日
浏览(14)
李宏毅《机器学习深度学习》简要笔记（一）
一、线性回归中的模型选择上图所示：五个模型，一个比一个复杂，其中所包含的function就越多，这样就有更大几率找到一个合适的参数集来更好的拟合训练集。所以，随着模型的复杂度提高，train error呈下降趋势。上图所示：右上角的表格中分别体现了在train和test中的损
2024年01月25日
浏览(6)