博主更新了几期关于深度学习在工业场景的应用文章,本次全面阐述一下深度学习方法在整个应用场景的方法和应用的局限特性:
分类:分类作为深度学习基本的研究方向,这几年的学术研究取得了重大突破。基本原理如下图
原理分析:采用图片的每个像素值,通过深度学习特征网络进行Labels标签的映射。是一种通过大量计算获取最佳特征映射结果的方法。
大数据的实践结论给出,模型是对数据有特征存储功能,采用通过大数据学习预训练模型,对数据的拟合和泛化能力有很强的适配性。
在工业场景中,分类是一个双刃剑,因为分类的数据效果很准确,但是需要收集大量的缺陷数据进行对抗学习。对数据的标注和准确的表述是非常重要的,在一些数据获取非常容易的场景可以快速的采用分类模型进行部署识别。
同样,上面分析结论是,在生产场景中,数据的分类学习是一种图片数据到标签数据的映射过程,在部署过程中数据是无法调试的,但是标签数据可以,标签数据的数量在设计过程中越少对模型的分类泛化能力越强。所以在使用分类算法是最好只用OK和NG的标签进行设计。
分类模型的局限就是,每个图片的大小根据预训练模型设计只有256*256,图片非常小,在工业场景中图片最小的都是3000*4000的图片,所以在使用分类方法的时候,首先进行图片的定位和裁剪,做到检测区域为256*256的图片大小,这样大大能提升图片的准确性和泛化能力。
目标识别和目标分割:目标检测和目标分割使用采用图片的每个像素数据映射到图片每个像素标签的过程,示例如下如所示
目标检测和目标分割同样采用深度进行训练和识别,原理和分类的方法是一样的。同样特性也是一样,也符合:模型是对数据有特征存储功能,采用通过大数据学习预训练模型,对数据的拟合和泛化能力有很强的适配性。
但是由于目标检测和分割模型是通过像素到像素的映射关系,所以需要计算和存储的特征细节更多,但是目前的模型体量都有限。工业场景在同样数据集的情况下出现分类的泛化能力要远远超过目标检测和目标分割。
但是在使用过程中,如果缺陷数据足够可以采用分割模型,对数据进行准确的描述。但是在操作过程中,建议在先使用分类的模型进行部署。收集更多数据后进行目标检测和目标分割模型的部署。
在实际应用中,预训练的图片大小都为1280*1280图片,在使用过程中也对大图进行裁剪和定位。目标检测和目标分割模型都是在最后阶段进行缺陷准确描述进行的部署,不建议在初期就采用,这样项目的交付和交期都会比较久,因为这种方式需要收集大量的数据进行学习,不便与交付和部署。
异常检测(非监督学习):异常检测是分类方法衍生出的一种,可以把它定义二分类或者一种聚类的深度学习方法,这两个表述都各表述了一部分。原理是对图片的每个像素进行特征映射,目前最优的模型是对每个像素进行复杂的深度学习特征变换,并对特征映射到每个像素上进行评分,获取异常评分的像素值,定义为缺陷像素。
这种方法是进几年研究的一个热门领域,方法是完全发挥了,模型是对数据有特征存储功能这个特性,通过深度学习复杂的特征映射关系,进行数据变换,在通过一个更大的模型学习特征的关系,并对每个像素值进行映射,拟合的方向是正常产品的像素值越来越小。在不符合正常特征像素值出现的时候,分数就异常大,从而判定为异常。
所以这种方法只学习正常产品的图片就可以判定产品上是否有缺陷。使用场景就是那种没有缺陷数据或者很难得到缺陷数据,并对产品质量要求非常苛刻的场景。
方法采用预训练的模型进行数据变换,所以图片大小最好和预训练图片一样(256*256)是最佳尺寸。
异常检测模型对数据特别敏感,所有要做好图片检测区域的定位和裁剪,还有后处理工作。在之前一篇讲解机器学习异常检测算法的中有强调过后处理的方法,链接如下:《计算机视觉度量:从特征描述到深度学习》-- 机器学习进行one-class缺陷检测算法(GMM为例)_计算机视觉度量 从特征描述到深度学习 csdn-CSDN博客文章来源:https://www.toymoban.com/news/detail-828138.html
总结:深度学习整套方法也有局限性,不是什么场景都可以采用。在使用深度学习之前要做好数据的定位和裁剪工作。在使用过程中标签的数量越少越稳定。数据在定位中越准确越稳定,裁剪过程中尽量考虑预训练模型的标准尺寸。文章来源地址https://www.toymoban.com/news/detail-828138.html
到了这里,关于《计算机视觉度量:从特征描述到深度学习》--工业视觉深度学习方法概述的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!