卷积神经网络的简单理解

这篇具有很好参考价值的文章主要介绍了卷积神经网络的简单理解。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


1、灵感来源

  CNN主要灵感来自于神经科学视觉系统中的视觉皮层,经研究发现大脑生物皮层的不通视觉细胞仅会对特定部分的视觉区域敏感。

2、定义

  卷积神经网络(Convolutional Neural Networks)是一种深度学习模型或类似于人工神经网络的多层感知器,常用来分析视觉图像

3、卷积神经网络结构

3.1 数据输入层(Input layer)

  该层要做的处理主要是对原始图像数据进行预处理。CNN的输入层的输入格式保留了图片本身的结构。分别对于黑白的 28×28的图片,CNN 的输入是一个 28×28 的二维神经元,对于 RGB 格式的 28×28 图片,CNN 的输入则是一个3×28×28 的三维神经元。

3.2 卷积计算层 (CONV layer)

  卷积神经网络的名字就来自于其中的卷积操作。卷积的主要目的是为了从输入图像中提取特征。

卷积的理解:用卷积核去“卷”图像,这个“卷”字可以理解为提取图像的特征。不同的卷积核在对图像分别进行卷积后可以得到不同的特征图(feature map)。

卷积的流程:
正如我们上面所说,每张图像都可以看作是像素值的矩阵,例如一个5×5的图像 ,用一个3×3(卷积核尺寸)大小的卷积核,去进行卷积。

5×5图像和3×3卷积核如下所示:
卷积神经网络的简单理解

使用3×3的卷积核对图像进行卷积示例如下,使用“卷” 也就是提取特征:
卷积神经网络的简单理解
整体滑动如下:

卷积神经网络的简单理解

特征图的大小(卷积特征)由下面三个参数控制,我们需要在卷积前确定它们:

深度(Depth):深度对应的是卷积操作所需的滤波器个数,也就是卷积核的个数。

步长(Stride):步长是我们在输入矩阵上滑动滤波矩阵的像素数。当步长为 1 时,我们每次移动滤波器一个像素的位置。当步长为 2 时,我们每次移动滤波器会跳过 2 个像素。步长越大,将会得到更小的特征图。

零填充(Zero-padding):有时,在输入矩阵的边缘使用零值进行填充,这样我们就可以对输入图像矩阵的边缘进行滤波。零填充的一大好处是可以让我们控制特征图的大小。使用零填充的也叫做泛卷积,不适用零填充的叫做严格卷积。

3.3 ReLU激励层 (ReLU layer)

激励层的作用: 卷积神经网络在卷积后需要激活,把卷积层输出结果做非线性映射就是激励层的作用。激活函数是用来加入非线性因素的,因为线性模型的表达能力不够。

如下图所示,同种颜色为同类数据。某些数据是线性可分的,也就是可以用一条直线将数据分开。
卷积神经网络的简单理解

但是有些数据不是线性可分的。例如以下数据,没有办法找到一条直线分开:
卷积神经网络的简单理解

这时候有两个办法,第一个办法,是做线性变换(linear transformation),比如将x,y变成x2,y2,这样可以画出圆形。如图所示:
卷积神经网络的简单理解

如果将坐标轴从x,y变为以x2,y2为标准,你会发现数据经过变换后是线性可分的了。大致示意图如下:

卷积神经网络的简单理解
  我们可以设计一种神经网络,通过激活函数来使得这组数据线性可分。
激活函数我们选择阀值函数(threshold function),也就是大于某个值输出1(被激活了),小于等于则输出0(没有激活)。这个函数是非线性函数。

3.4 池化层(Pooling layer)

池化层的作用:池化层夹在连续的卷积层中间, 用于压缩数据和参数的量,减小过拟合。简而言之,如果输入是图像的话,那么池化层的最主要作用就是压缩图像。下采样层也叫池化层。
总结:
1.增大网络感受野
2.抑制噪声,降低信息冗余
3.降低模型计算量,降低网络优化难度,防止网络过拟合
4.使模型对输入图像中的特征位置变化更加鲁棒

池化层的操作:最大池化、平均池化、
最大池化(Max Pooling):将输入的图像划分为若干个矩形区域,对每个子区域输出最大值。
卷积神经网络的简单理解
平均池化:平均池化取每个矩形区域中的平均值,可以提取特征图中所有特征的信息进入下一层,而不像最大池化只保留值最大的特征,所以平均池化可以更多保留些图像的背景信息。

3.5 全连接层( FC layer)

全连接层的作用:在整个卷积神经网络中起到“分类器”的作用。换句话说,就是把特征整合到一起(高度提纯特征),方便交给最后的分类器或者回归。

  因为卷积层的作用只是提取特征,但是很多物体可能都有同一类特征,比如猫、狗、鸟都有眼睛。如果只用局部特征的话不足与确定具体类别。这时就需要使用组合特征来判别了。全连接就是组合这些特征来最终确定是哪一个分类,所以全连接就是组合特征和分类器功能。

卷积神经网络的简单理解

  在卷积层之后进行了池化操作,池化层得到30个1212的特征图,通过全连接层之后,得到了1100的向量。由于全连接层是输入中的每个结点与其下一层结点都有连接,那么使用30100个1212的卷积核进行卷积操作。卷积核与输入图像大小一致,卷积操作之后整个输入图像就会变成一个数值。30个特征图进行卷积操作之后得到30个值,将此30个值进行累加求和,就把30张特征图浓缩成一个数值。此操作进行100次之后会得到100个值,即1*100的向量。全连接层会把卷积输出的二维特征图(featureMap)转化成一个一维的向量。文章来源地址https://www.toymoban.com/news/detail-449718.html

到了这里,关于卷积神经网络的简单理解的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 神经网络简单理解:机场登机

      目录 神经网络简单理解:机场登机 ​编辑 激活函数:转为非线性问题 ​编辑 激活函数ReLU 通过神经元升维(神经元数量):提升线性转化能力  通过增加隐藏层:增加非线性转化能力​编辑  模型越大,容易在机场迷失方向过拟合​编辑       提出VIP,贵宾厅,卷积神

    2024年02月12日
    浏览(36)
  • 人工智能(Pytorch)搭建模型1-卷积神经网络实现简单图像分类

    本文参加新星计划人工智能(Pytorch)赛道:https://bbs.csdn.net/topics/613989052 目录 一、Pytorch深度学习框架 二、 卷积神经网络 三、代码实战 内容: 一、Pytorch深度学习框架 PyTorch是一个开源的深度学习框架,它基于Torch进行了重新实现,主要支持GPU加速计算,同时也可以在CPU上运行

    2024年02月03日
    浏览(62)
  • 使用 PyTorch 和 OpenCV 实现简单卷积神经网络(CNN)的过程

    使用 PyTorch 和 OpenCV 实现简单卷积神经网络(CNN)的过程,如何构建一个简单的卷积神经网络模型,并通过使用预定义的滤波器对灰度图像进行卷积操作和激活函数处理,最终可视化了卷积层和激活层的输出结果。 1.图像处理: 使用 OpenCV 读取图像,并将彩色图像转换为灰度

    2024年01月17日
    浏览(48)
  • 卷积神经网络每一层输出的形状、通道数、特征图数量以及过滤器数量的理解与计算。

    参考: http://t.csdn.cn/8ApfD ‘http://t.csdn.cn/ZmEOJ 核心观点:  前一层的通道数(特征图数量),决定这一层过滤器的深度; 这一层过滤器的数量,决定这一层输出的通道数(特征图数量) 神经网络每一层输出矩阵的形状一般是4个维度[y1, y2, y3, y4] y1 通常是batch_size,就是每一圈丢

    2023年04月09日
    浏览(49)
  • 计算机视觉的应用12-卷积神经网络中图像特征提取的可视化研究,让大家理解特征提取的全过程

    大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用12-卷积神经网络中图像特征提取的可视化研究,让大家理解特征提取的全过程。 要理解卷积神经网络中图像特征提取的全过程,我们可以将其比喻为人脑对视觉信息的处理过程。就像我们看到一个物体时,大脑会通

    2024年02月10日
    浏览(44)
  • 神经网络改进:注重空间变化,权重参数调整,正则化, 熵的简单理解

    目录 神经网络改进:注重空间变化 将高纬空间映射到地位空间便于表示(供给数据) 将地位空间映射到高纬空间进行分类聚合(达到可分状态(K-means)) 神经网络改进:权重参数调整 自注意力机制(数据间关联性) 多注意力机制(加权) 正则化(增加模型参数,不要拟

    2024年02月12日
    浏览(37)
  • 神经网络实验--卷积神经网络

    本实验主要为了掌握深度学习的基本原理;能够使用TensorFlow实现卷积神经网络,完成图像识别任务。 文章目录 1. 实验目的 2. 实验内容 3. 实验过程 题目一: 题目二: 实验小结讨论题 ①掌握深度学习的基本原理; ②能够使用TensorFlow实现卷积神经网络,完成图像识别任务。

    2024年02月06日
    浏览(53)
  • 神经网络与卷积神经网络

    全连接神经网络是一种深度学习模型,也被称为多层感知机(MLP)。它由多个神经元组成的层级结构,每个神经元都与前一层的所有神经元相连,它们之间的连接权重是可训练的。每个神经元都计算输入的加权和,并通过一个非线性激活函数进行转换,然后将结果传递到下一

    2024年02月10日
    浏览(45)
  • 卷积神经网络与前馈神经网络

    常见的人工神经网络结构 人工神经网络是一类由人工神经元组成的网络,常见的神经网络结构包括: 前馈神经网络(Feedforward Neural Network,FNN):最简单的神经网络结构,由一个输入层、一个输出层和若干个隐藏层组成,信号只能从输入层流向输出层,不允许在网络中形成回

    2023年04月26日
    浏览(42)
  • 卷积神经网络 —— 图像卷积

    卷积神经网络是最具代表性的深度学习算法之一,目前已经被大范围的应用与计算机视觉等领域,并且取得了众多突破性的进展,在学习卷积神经网络之前,我们需要学习图像卷积运算。 图像卷积运算是一种图像处理算法。通过它可以实现很多不同的效果。例如,模糊图像中

    2024年02月07日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包