基于Diffusion Model的数据增强方法应用——毕业设计 其五

这篇具有很好参考价值的文章主要介绍了基于Diffusion Model的数据增强方法应用——毕业设计 其五。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1 题目简介

笔者个人的毕业设计课题如下:

简介:使用预训练的Diffusion Model图像生成模型生成图像,将这些生成的图像作为扩充训练集加入到2D目标检测器、2D图像分类器的训练过程。深度学习是数据驱动的,随着数据量的扩充,能够提高检测器、分类器的鲁棒性、准确性。
建议的baseline:
分类:ResNet
检测:YOLO

可以看到,给的题目难度还是比较轻松的;本次毕设的全过程会以周为单位采用博客的形式记录下来。

2 前言

上周的任务完成后,因为笔者个人在准备春招企业的二面,一直在忙于准备demo和其他相关的内容;所以内容只得暂缓
这周等事情暂时告一段落后,重新开始进行毕业设计的内容处理
本篇博客会记载原始ResNet34的实验,并将训练集经过数据增强后对比精度效果,来验证本次毕业实际的题目。

3 数据集

defusion model数据增强,课程设计,计算机视觉,深度学习
如图所示,用的是一个花卉分类的数据集,对于图像分类任务它将目标分成了5类

该数据集共有数据3670份,分成雏菊 蒲公英 玫瑰 向日葵 郁金香五类

需要说明的是,笔者没有找到这份数据集的名字… 只是在数据集许可证说明文档中找到了给出免费分享使用的许可证明网站
但这个数据集是笔者在大一刚接触图像分类的时候搜到的第一个数据集 电脑里一直忘了清理, 所以这次毕业设计就决定直接使用该数据集

使用该数据集的原因有二

其一 数据集本身量级大小合适,比起ImageNet这种千万量级的数据集;只有当数据集本身样本较少的情况下才能较好体现出数据增强的作用性,当然也不能太少,否则容易出现过拟合的现象。

其二 数据集的图片像素大小最好不要太低,在笔者的实验中;像著名的CIFAR数据集中32*32的像素大小,经过扩散模型后得到的数据肉眼可见的难以使用,一定要保证数据的像素大小不要太低。

defusion model数据增强,课程设计,计算机视觉,深度学习

3.1 数据集划分

当然,第一步要进行的是数据集划分
笔者这里就不贴代码了,ResNet相关的代码在网上非常多,数据集划分这一方面的也不会少;有需要的可以直接去查找
defusion model数据增强,课程设计,计算机视觉,深度学习
训练集:验证集是9:1的比例划分的

3.2 ResNet34测试

defusion model数据增强,课程设计,计算机视觉,深度学习
训练中
defusion model数据增强,课程设计,计算机视觉,深度学习
可以看到最后精度是停在90.1

4 扩散模型数据增强

接下来将对刚才已经划分过的数据集使用数据增强来做消融实验
注意 一定要对刚才划分过的数据集增强,而非重新划分

4.1 数据预处理

由于StableDiffusion对输入数据的尺寸存在要求,所以要事先进行resize操作,顺便重命名一下文件名(非必要)
关于为什么存在尺寸要求,上一篇博客里有提到
这里附上resize和重命名操作的函数 非常简单,也可以自行编写

from PIL import Image
import os

# 指定文件夹路径和新的图片尺寸,这里用的是绝对路径,可以自行修改
folder_path = "C:\\code\\stable-diffusion-main\\img\\"
new_size = (512, 512)
count=0;
# 遍历文件夹中的所有图片文件
for filename in os.listdir(folder_path):
    if filename.endswith(".jpg") or filename.endswith(".png"):
        # 打开图片并调整大小
        image_path = os.path.join(folder_path, filename)
        image = Image.open(image_path)
        image = image.resize(new_size)
        new_filename = "{:05d}".format(count) + os.path.splitext(filename)[1]
        # 生成新的文件名并保存图片
        count+=1
        new_image_path = os.path.join(folder_path, new_filename)
        image.save(new_image_path)

defusion model数据增强,课程设计,计算机视觉,深度学习
顺便可以看到雏菊的训练集个数是570个
对其他几个数据集执行上述相同操作

4.2 数据集增强

这里先做说明 分别使用0.4和0.8的图像噪声量对每张图片进行4张图片的数据增强

由于笔者没有找到StableDiffusion的图像转图像的多图片转换方法,直接在参数接口里输入/*.jpg也没有办法识别 这里就用一个比较笨的方法
for /l %x in (1, 1, 570) do python scripts/img2img.py --init-img img/daisy/%x.jpg --strength 0.4 --n_iter 5

直接控制台输入上面的命令

for /l %x in (1, 1, 570) do 是控制台的循环输入指令
相当于让控制台自己依次对每个图片执行相同的数据增强命令

defusion model数据增强,课程设计,计算机视觉,深度学习
图里虽然看不出来,不过确实是自己在运行
有些时候也会用这种笨方法啦

这里需要的时间会比较多,可以慢慢等待
defusion model数据增强,课程设计,计算机视觉,深度学习
可以看到,确实是570*4=2280个结果

对其他几个分类做相同操作

4.3 数据增强后的消融实验

4.3.1 0.4噪声强度下4张图片

defusion model数据增强,课程设计,计算机视觉,深度学习
和预想中的一样,效果相当不错
因为用的是StableDiffusion 的模型而非专门针对数据集单独去搭建和训练的模型,所以噪声强度这一点上不应该给到太高
事实上,仅仅是0.4的噪声强度生成的图像中,人为的去审视一下,就会发现已经出现小规模的图像经过扩散模型后生成的新图像已经不太准确了 比如【将本来应该是根茎的部分渲染成人】
不过就算是在这样的前提下,最终92.3的精确度也有所上升

4.3.2 0.8噪声强度下4张图片

defusion model数据增强,课程设计,计算机视觉,深度学习
91.5的精度比起0.4噪声强度时有所下降
这也是可以预见的结果,0.8的噪声强度在StableDiffusion 的模型生成中已经是一个比较大的值了,会生成很多超出原本预期的图片;在这个噪声强度下上面提到的现象更加严重
但另外一方面来讲,从理性来说;这种情况下的模型应该具有更强鲁棒性,只是在测试集上的表现效果欠佳
【在数据集上表现过于优异的模型往往缺少拟合能力导致鲁棒性较差,在实际应用中反而效果不甚出众】这个是很通识的现象了,就不再赘述

4.3.3 0.4噪声强度下8张图片

defusion model数据增强,课程设计,计算机视觉,深度学习
88.2的精度比原本的模型差了不少
其实是非常简答的情况,在一张图片生成8张图片的情况下,原本570张的雏菊,数据量已经来到4560张了
然而实际上,在0.4这个较小的噪声强度下,每8张相差甚小的图片在网络中被视为不同样本多次反复对权重产生影响
这一定会带来严重的过拟合问题
在这个消融实验中可以了解到,每张图片数据增强的数量一定要严格控制

4.3.4 0.8噪声强度下8张图片

defusion model数据增强,课程设计,计算机视觉,深度学习
这个实验是想着前面的做都做了,索性一起试一下
结果89.8的精度其实有些超出预期
不过想想也可以理解,毕竟虽然是8张数据增强,但是噪声比0.4大得多;在这样的前提下其实过拟合的问题会相对减弱不少
不过和原先的精度相比,仍然是有所下降的。

5 总结

上面所有的消融实验因为笔者个人时间问题,都是只做了3次实验选取的中位数
所以精度上可能是存在一定干扰的,后续有时间了会再重新进行
另外一方面,其实想要做的消融实验不止这几种;还会对比原始数据集在不同规模下用扩散模型做数据增强的效果
这两天有时间了会再用电脑跑一下文章来源地址https://www.toymoban.com/news/detail-820241.html

到了这里,关于基于Diffusion Model的数据增强方法应用——毕业设计 其五的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 基于双分支残差结构的低光照图像增强研究与应用实现

             在低光条件下拍摄的照片会因曝光不足而产生一系列的视觉问题,如亮度低、信息丢失、噪声和颜色失真等。为了解决上述问题,提出一个结合注意力的双分支残差低光照图像增强网络。首先,采用改进InceptionV2提取浅层特征;其次,使用残差特征提取块(RFB)

    2024年02月07日
    浏览(74)
  • 【读点论文】A Survey on Generative Diffusion Model,AIGC时代的新宠儿,从原理推导到工程应用,在视觉,自然语言,语音等领域大展拳脚

    由于深度潜在表示,深度学习在生成任务中显示出良好的潜力。 生成模型是一类可以根据某些隐含参数随机生成观测值的模型 。近年来,扩散模型以其强大的生成能力成为生成模型的一个新兴类别。如今,已经取得了巨大的成就。除了计算机视觉、语音生成、生物信息学和

    2024年02月09日
    浏览(34)
  • 吴恩达gradio课程:基于开源LLM(large language model)的聊天应用

    内容简介 Falcon 40B 是当前最好的开源语言模型之一。 使用 text-generation 库调用 Falcon 40B 的问答 API 接口。 首先仅仅在代码中与模型聊天,后续通过Gradio构建聊天界面。 Gradio 聊天界面可以保存对话历史上下文。 在聊天过程中,需要将之前对话记录与新消息一起发送给模型,才能进

    2024年02月09日
    浏览(39)
  • 用大模型增强数据分析应用

    大模型出道即巅峰,它广受欢迎并在很多领域中成为有力的工具,当然包括数据分析领域。你可能不确定如何把大模型整合到你的工作中,如帮助你用数据驱动决策。本文介绍一些思路带你在不同应用场景下使用数据分析提示词。当然不仅局限与ChatGPT,其他国内大模型也一样

    2024年01月25日
    浏览(29)
  • 基于卷积神经网络的立体视频编码质量增强方法_余伟杰

    提出的网络包含两个模块:特征提取模块和重建模块。 为了从低质量合成视点中提取局部和全局信息,特征提取模块中提出了两条信息流,分别为 局部信息提取流和全局信息提取流 。 随着网络层数的增长,提取的特征在传输的过程中可能消失,这会降低网络模型的表达能力

    2024年02月01日
    浏览(26)
  • PointNet++详解(一):数据增强方法

    如有错误,恳请指出。 下面是pointnet++项目实现的点云数据增强方法,主要包括随机旋转、随机缩放、随机丢弃、随机平移、随机扰动等等。 github项目链接:https://github.com/yanx27/Pointnet_Pointnet2_pytorch 这里贴上的是沿3个轴随机旋转 ps:在PointNet++分组采样k个邻域点时,如果符合

    2024年02月04日
    浏览(24)
  • YOLOv5数据增强方法

    YOLOv5的数据增强方法包括以下几种: 随机剪裁:随机从输入图像中剪裁出一块区域并将其作为新的输入。 随机翻转:随机将输入图像左右或上下翻转。 随机颜色变化:随机调整输入图像的对比度、亮度和饱和度。 随机加噪:在输入图像上随机添加噪声。 随机模糊:使用高

    2024年02月11日
    浏览(34)
  • 【论文阅读笔记】序列数据的数据增强方法综述

     这篇论文探讨了在深度学习模型中由于对精度的要求不断提高导致模型框架结构变得更加复杂和深层的趋势。随着模型参数量的增加,训练模型需要更多的数据,但人工标注数据的成本高昂,且由于客观原因,获取特定领域的数据可能变得困难。为了缓解数据不足的问题,

    2024年02月05日
    浏览(31)
  • diffusion model(五)stable diffusion底层原理(latent diffusion model, LDM)

    [论文地址] High-Resolution Image Synthesis with Latent Diffusion Models [github] https://github.com/compvis/latent-diffusion diffusion model(一)DDPM技术小结 (denoising diffusion probabilistic) diffusion model(二)—— DDIM技术小结 diffusion model(三)—— classifier guided diffusion model diffusion model(四)文生图diffusio

    2024年02月15日
    浏览(30)
  • 毕业设计--智能环境监测系统基于harmonyOS的移动端应用开发

    目录 第一章 绪论 1.1 引言 1.2 智能环境监测APP概述 1.3 课题设计思路 第二章 项目开发环境 2.1 鸿蒙介绍 2.1.1 鸿蒙的发展史 2.1.2 鸿蒙应用开发的意义 2.1.3 HUAWEI DevEco Studio 介绍 2.1.4 HUAWEI DevEco Studio 环境安装 2.1.5 HarmonyOS系统技术架构 2.1.6 HUAWEI dececo studio 使用 2.1.7 Harmony编程语言

    2024年02月15日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包