《计算机视觉度量:从特征描述到深度学习》--工业视觉深度学习方法概述

这篇具有很好参考价值的文章主要介绍了《计算机视觉度量:从特征描述到深度学习》--工业视觉深度学习方法概述。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

博主更新了几期关于深度学习在工业场景的应用文章,本次全面阐述一下深度学习方法在整个应用场景的方法和应用的局限特性:

分类:分类作为深度学习基本的研究方向,这几年的学术研究取得了重大突破。基本原理如下图

《计算机视觉度量:从特征描述到深度学习》--工业视觉深度学习方法概述,计算机视觉,深度学习,人工智能,机器学习

原理分析:采用图片的每个像素值,通过深度学习特征网络进行Labels标签的映射。是一种通过大量计算获取最佳特征映射结果的方法。

大数据的实践结论给出,模型是对数据有特征存储功能,采用通过大数据学习预训练模型,对数据的拟合和泛化能力有很强的适配性。

在工业场景中,分类是一个双刃剑,因为分类的数据效果很准确,但是需要收集大量的缺陷数据进行对抗学习。对数据的标注和准确的表述是非常重要的,在一些数据获取非常容易的场景可以快速的采用分类模型进行部署识别。

同样,上面分析结论是,在生产场景中,数据的分类学习是一种图片数据到标签数据的映射过程,在部署过程中数据是无法调试的,但是标签数据可以,标签数据的数量在设计过程中越少对模型的分类泛化能力越强。所以在使用分类算法是最好只用OK和NG的标签进行设计。

分类模型的局限就是,每个图片的大小根据预训练模型设计只有256*256,图片非常小,在工业场景中图片最小的都是3000*4000的图片,所以在使用分类方法的时候,首先进行图片的定位和裁剪,做到检测区域为256*256的图片大小,这样大大能提升图片的准确性和泛化能力。

目标识别和目标分割:目标检测和目标分割使用采用图片的每个像素数据映射到图片每个像素标签的过程,示例如下如所示

《计算机视觉度量:从特征描述到深度学习》--工业视觉深度学习方法概述,计算机视觉,深度学习,人工智能,机器学习

目标检测和目标分割同样采用深度进行训练和识别,原理和分类的方法是一样的。同样特性也是一样,也符合:模型是对数据有特征存储功能,采用通过大数据学习预训练模型,对数据的拟合和泛化能力有很强的适配性。

但是由于目标检测和分割模型是通过像素到像素的映射关系,所以需要计算和存储的特征细节更多,但是目前的模型体量都有限。工业场景在同样数据集的情况下出现分类的泛化能力要远远超过目标检测和目标分割。

但是在使用过程中,如果缺陷数据足够可以采用分割模型,对数据进行准确的描述。但是在操作过程中,建议在先使用分类的模型进行部署。收集更多数据后进行目标检测和目标分割模型的部署。

在实际应用中,预训练的图片大小都为1280*1280图片,在使用过程中也对大图进行裁剪和定位。目标检测和目标分割模型都是在最后阶段进行缺陷准确描述进行的部署,不建议在初期就采用,这样项目的交付和交期都会比较久,因为这种方式需要收集大量的数据进行学习,不便与交付和部署。

异常检测(非监督学习):异常检测是分类方法衍生出的一种,可以把它定义二分类或者一种聚类的深度学习方法,这两个表述都各表述了一部分。原理是对图片的每个像素进行特征映射,目前最优的模型是对每个像素进行复杂的深度学习特征变换,并对特征映射到每个像素上进行评分,获取异常评分的像素值,定义为缺陷像素。

《计算机视觉度量:从特征描述到深度学习》--工业视觉深度学习方法概述,计算机视觉,深度学习,人工智能,机器学习

这种方法是进几年研究的一个热门领域,方法是完全发挥了,模型是对数据有特征存储功能这个特性,通过深度学习复杂的特征映射关系,进行数据变换,在通过一个更大的模型学习特征的关系,并对每个像素值进行映射,拟合的方向是正常产品的像素值越来越小。在不符合正常特征像素值出现的时候,分数就异常大,从而判定为异常。

所以这种方法只学习正常产品的图片就可以判定产品上是否有缺陷。使用场景就是那种没有缺陷数据或者很难得到缺陷数据,并对产品质量要求非常苛刻的场景。

方法采用预训练的模型进行数据变换,所以图片大小最好和预训练图片一样(256*256)是最佳尺寸。

异常检测模型对数据特别敏感,所有要做好图片检测区域的定位和裁剪,还有后处理工作。在之前一篇讲解机器学习异常检测算法的中有强调过后处理的方法,链接如下:《计算机视觉度量:从特征描述到深度学习》-- 机器学习进行one-class缺陷检测算法(GMM为例)_计算机视觉度量 从特征描述到深度学习 csdn-CSDN博客

总结:深度学习整套方法也有局限性,不是什么场景都可以采用。在使用深度学习之前要做好数据的定位和裁剪工作。在使用过程中标签的数量越少越稳定。数据在定位中越准确越稳定,裁剪过程中尽量考虑预训练模型的标准尺寸。文章来源地址https://www.toymoban.com/news/detail-828138.html

到了这里,关于《计算机视觉度量:从特征描述到深度学习》--工业视觉深度学习方法概述的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【深度学习: 计算机视觉】如何改进计算机视觉数据集

    机器学习算法需要大量数据集来训练、提高性能并生成组织所需的结果。 数据集是计算机视觉应用程序和模型运行的燃料。数据越多越好。这些数据应该是高质量的,以确保人工智能项目获得最佳的结果和产出。 获取训练机器学习模型所需数据的最佳方法之一是使用开源数

    2024年02月20日
    浏览(41)
  • 深度学习与计算机视觉

    目录 1 深度学习 1.1 人工智能 1.2 机器学习 1.3 深度学习 1.3.1 深度学习发展历程 1.3.2 深度学习中的核心因素 1.3.3 深度学习模型分类 1.3.4 深度学习框架 2 计算机视觉 人工智能、机器学习、深度学习这三者的关系: 在实现人工智能的众多算法中,机器学习是发展较为快速的

    2024年02月06日
    浏览(38)
  • 计算机视觉(五)深度学习基础

    深度学习与神经网络的区别 选择合适的目标函数 Softmax层 梯度消失的直观解释 激活函数 学习步长 SGD的问题 存在马鞍面,使我们的训练卡住,于是提出下面方法: Momentum动量 Nesterov Momentum 先利用“惯性”,“走”一步。避免一开始,就被当前梯度带偏。 Adagrad 为不同的参数

    2024年02月14日
    浏览(49)
  • 深度学习|10.1 深度学习在计算机视觉的应用

    图像中的每一个像素点都是输入层的一部分。而最终最后只有一个输出点,也就是说需要通过乘上中间层/隐藏层内部的矩阵,从而实现降维。 直观上,信息越多,分析的效果应该越好,但也意味着分析的量会越来越大,考虑到分析所需要的时间和空间,往往采用卷积的方式

    2024年02月03日
    浏览(42)
  • 深度学习与计算机视觉的创新

    深度学习和计算机视觉是现代人工智能领域的两个重要分支。深度学习是一种通过多层神经网络来处理大规模数据的机器学习方法,而计算机视觉则是利用计算机程序来模仿人类视觉系统对图像进行分析和理解的技术。在过去的几年里,深度学习与计算机视觉的融合已经取得

    2024年04月09日
    浏览(44)
  • 计算机视觉(三)未有深度学习之前

    把图像划分成若干互不相交的区域。 经典的数字图像分割算法一般是基于灰度值的两个基本特征之一:不连续性和相似性。 基于阈值:基于图像灰度特征计算一个或多个灰度阈值。将灰度值与阈值比较,最后将比较结果分到合适的类别中。 大津法 基于边缘:边界线上连续的

    2024年02月15日
    浏览(45)
  • 【探索AI】三十一-计算机视觉(六)深度学习在计算机视觉中的应用

    深度学习在计算机视觉中的应用已经取得了显著的成果,并且正在逐步改变我们对图像和视频信息的处理和理解方式。下面将详细讲解深度学习在计算机视觉中的几个关键应用。 首先,我们来看图像分类。图像分类是计算机视觉的基本任务之一,它涉及到将输入的图像自动归

    2024年04月09日
    浏览(58)
  • 从计算机视觉(Computer Vision)的角度出发,从传统机器学习的特征工程、分类器设计和优化,到深度学习的CNN架构设计、训练优化、模型压缩与推理部署,详细阐述了图像识别领域最新的技术发展方向

    作者:禅与计算机程序设计艺术 在现代信息技术的快速发展过程中,图像识别技术越来越重要。早期的人工智能算法主要侧重于特征提取、分类或回归任务。近几年,随着神经网络(Neural Networks)在图像识别领域的不断突破,很多研究人员将目光投向了深度学习(Deep Learni

    2024年02月10日
    浏览(38)
  • 【学习笔记】计算机视觉深度学习网络模型

    这是本人学习计算机视觉CV领域深度学习模型的学习的一点点学习笔记,很多片子没有完成,可以作为学习的参考~

    2024年04月10日
    浏览(64)
  • PyTorch深度学习实战(5)——计算机视觉

    计算机视觉是指通过计算机系统对图像和视频进行处理和分析,利用计算机算法和方法,使计算机能够模拟和理解人类的视觉系统。通过计算机视觉技术,计算机可以从图像和视频中提取有用的信息,实现对环境的感知和理解,从而帮助人们解决各种问题和提高效率。本节中

    2024年02月15日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包