Faster R-CNN

10月前分类：Toy博客阅读(40) 违法举报

这篇具有很好参考价值的文章主要介绍了Faster R-CNN。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

目录

1. Fast R-CNN的不足

2. Faster R-CNN

3. RPN(Region Proposal Network)

3.1 anchor

3.2 RPN 网络

3.3 RPN 网络的损失

4. Faster R-CNN 损失

5. Faster R-CNN 训练

6. 对比

1. Fast R-CNN的不足

Fast R-CNN 的算法流程

Faster R-CNN

Fast R-CNN网络运行速度慢的最主要原因，SS生成候选框的效率较低

所以Faster R-CNN主要对生成候选框进行了优化

Faster R-CNN

2. Faster R-CNN

Faster R-CNN 的算法流程

Faster R-CNN可以看成：RPN + Fast R-CNN

其中RPN通过卷积网络生成候选框，抛弃了SS算法，这里RPN和Fast R-CNN里面提取特征的卷积层参数共享

Faster R-CNN

3. RPN(Region Proposal Network)

Faster R-CNN的重点就是RPN代替了SS算法，所以最重要的就是RPN网络的实现。后面的部分就是Fast R-CNN

生成的2k分类类别，这里的2只是前景and背景的概率，不做具体的分类

生成的4k个边界框回归器，4个参数对候选框的调整

Faster R-CNN

3.1 anchor

窗口在卷积网络输出的特征提取进行滑动，在每个滑动窗口生成9个anchor

anchor 和 PRN 都会产生候选框，两者不一样

Faster R-CNN

虽然对于VGG来说，原始的输入图像经过几层的卷积和池化，最后输出特征图的像素点，映射到原图的感受野是228。虽然这里生成的anchor比228*228大，是不影响的。论文的作者是这样解释的，通过观察物体的一部分，也可以大概估计目标的大小。

关于感受野的计算

Faster R-CNN

例如，原始输入的图片是1000*600*3，经过特征提取层，空间分辨率大概变成60*40，每个像素点生成9个，就会生成60*40*9(20k)个anchor。去除越过边界的anchor，大概剩余6k个。利用RPN网络生成的回归器对anchor进行微调，得到需要的候选框，基于RPN生成的分类器，对候选框得分进行非极大值抑制，这样最后大概还剩2000个候选框

边界框参考anchors产生固定尺寸的，分类判断产生的边界框是背景还是前景，即产生的边界框是否正确

Faster R-CNN

3.2 RPN 网络

理论上，RPN网络不仅仅只包含下面的部分，还有CNN特征提取的部分，因为CNN那块参数共享了，所以只介绍剩余的生成分类器+回归器的小网络

VGG最后特征提取的输出为512*n*n(512为channel)，通过3*3的same 卷积，输入输出维度都是VGG最后的输出channel 512。这样3*3卷积后输出的shape和VGG特征提取的shape是一致的

然后并联两个1*1卷积或者fc层实现类别的分类+边界框回归器的预测

例如，采用输入chanel为512，输出为2k个，1*1卷积核就能产生2k个类别的分类

Faster R-CNN

3.3 RPN 网络的损失

RPN 的损失，λ为平衡参数，尽量让1/N(cls) = λ * 1/N(reg)

Faster R-CNN

其中分类的损失，是多类别的交叉熵

Faster R-CNN

边界框回归器损失：

Faster R-CNN

4. Faster R-CNN 损失

就是Fast R-CNN的损失

Faster R-CNN

5. Faster R-CNN 训练

论文中采用4步的分步训练方法

Faster R-CNN

6. 对比

框架的步骤逐渐合为一体

Faster R-CNN 文章来源地址https://www.toymoban.com/news/detail-412571.html

到了这里，关于Faster R-CNN的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

探索常见经典目标检测算法：从YOLO到Faster R-CNN

目标检测是计算机视觉领域中的重要任务之一，它旨在从图像或视频中检测出目标的位置和类别。随着深度学习技术的发展，许多经典的目标检测算法相继出现，其中包括YOLO（You Only Look Once）、Faster R-CNN（Region-based Convolutional Neural Networks）等。本文将深入介绍这些常见的目标

2024年04月26日
浏览(41)
目标检测算法（R-CNN，fast R-CNN，faster R-CNN，yolo，SSD，yoloV2，yoloV3，yoloV4,yoloV5,yoloV6，yoloV7）

深度学习目前已经应用到了各个领域，应用场景大体分为三类：物体识别，目标检测，自然语言处理。目标检测可以理解为是物体识别和物体定位的综合，不仅仅要识别出物体属于哪个分类，更重要的是得到物体在图片中的具体位置。为了完成这两个任务，目标检测模型分

2024年02月02日
浏览(49)
从R-CNN到Faster-RCNN再到YOLOV5，目标检测网络发展概述

R-CNN由Ross Girshick于2014年提出，R-CNN首先通过选择性搜索算法Selective Search 从一组对象候选框中选择可能出现的对象框，然后将这些选择出来的对象框中的图像resize到某一固定尺寸的图像，并喂入到 CNN模型（经过在ImageNet数据集上训练过的CNN模型，如AlexNet)提取特征，最后将

2024年02月05日
浏览(63)
【Keras计算机视觉】Faster R-CNN神经网络实现目标检测实战（附源码和数据集超详细）

需要源码请点赞关注收藏后评论区留言私信~~~ 目标检测是计算机视觉和数字图像处理的一个热门方向，广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域，通过计算机视觉减少对人力资本的消耗，具有重要的现实意义。因此，目标检测也就成为了近年来

2024年02月08日
浏览(53)
计算机视觉的应用4-目标检测任务：利用Faster R-cnn+Resnet50+FPN模型对目标进行预测

大家好，我是微学AI，今天给大家介绍一下计算机视觉的应用4-目标检测任务，利用Faster Rcnn+Resnet50+FPN模型对目标进行预测，目标检测是计算机视觉三大任务中应用较为广泛的，Faster R-CNN 是一个著名的目标检测网络，其主要分为两个模块：Region Proposal Network (RPN) 和 Fast R-CNN。我

2024年02月05日
浏览(55)
目标检测C-RNN,Fast C-RNN,Faster C-RNN,SSD,Mask R-CNN 理论简单介绍

参考： https://zh-v2.d2l.ai/chapter_computer-vision/multiscale-object-detection.html 区域卷积神经网络 region-based CNN R-CNN首先从输入图像中选取若干（例如2000个）提议区域，并标注它们的类别和边界框（如偏移量）。用卷积神经网络对每个提议区域进行前向传播以抽取其特征。接下来，我们

2024年03月14日
浏览(83)
经典目标检测R-CNN系列(2)Fast R-CNN

Fast R-CNN是作者Ross Girshick继R-CNN后的又一力作。同样使用VGG16作为网络的backbone，与R-CNN相比训练时间快9倍，测试推理时间快213倍，准确率从62%提升至66%(Pascal VOC数据集上)。 Fast R-CNN算法流程可分为3个步骤一张图像生成1K~2K个候选区域 (使用Selective Search方法) 将图像输入网络得

2024年02月16日
浏览(39)
图像分割的简史：从CNN到掩模R-CNN

在 Athelas，我们使用卷积神经网络（

2024年02月16日
浏览(38)
【图解】Mask R-CNN 架构

Mask R-CNN 是一种自顶向下（top-down）的姿态估计模型，它是在 Faster R-CNN [44] 这个目标检测框架的基础上扩展而来的。目标检测是指从图像中检测出不同类别的物体，并且输出它们的边界框（bounding box）。 Mask R-CNN 的结构包括一个标准的基础 CNN，通常是一个 ResNet [18] ，用于从

2024年02月14日
浏览(32)
目标检测网络系列之R-CNN

2023年09月08日
浏览(40)