李沐-《动手学深度学习》--02-目标检测

这篇具有很好参考价值的文章主要介绍了李沐-《动手学深度学习》--02-目标检测。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一 、目标检测算法

1. R-CNN

a . 算法步骤

  • 使用启发式搜索算法来选择锚框(选出多个锚框大小可能不一,需要使用Rol pooling)
  • 使用预训练好的模型(去掉分类层)对每个锚框进行特征抽取(如VGG,AlexNet…)
  • 训练一个SVM来对每个类进行分类
  • 训练一个线性回归模型来预测边缘框偏移

b . Rol Pooling

​ 每个锚框的大小是不一样的大的,所以需要对锚框进行处理

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

2 . Fast R-CNN

​ R-CNN对于每个锚框都有重复的部分,所以计算的时候会有重复计算,没有共享计算.而 Fast R-CNN的改进就是不是对锚框进行特征抽取,而是直接对整个图片进行特征抽取,对对应的锚框位置直接映射到了抽取完成的图片的位置,然后再进行向前传播

3 . Faster R-CNN

4 . Mask R-CNN

5 . 总结

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

二 、 SSD (单发多框检测)

总结:

  • SSD通过单神经网络来检测模型
  • 以每个像素为中心的产生多个锚框
  • 在多个段的输出上进行多尺度的检测(下面的检测小物体,上面的段检测大的物体)

三、 YOLO(你只看一次)

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

四 、 转置卷积

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

大多的时候取得的都是图像的上采样,也不是卷积的一个逆运算,最后也是一个卷积运算

上采样:将我们的输入变大

下采样:将输入变小,输入的像素变小

1 . 填充、步幅,多通道

  • 填充:作用在了输出上,填充了多少则会去掉输出的几个高和宽
  • 步幅:作用在了输出,将会增大我们的输出
  • 如果超参数和卷积时候的参数一样的话,能将第一次卷积的结果形状变为卷积之前的形状,但是内容全变了

2 . 计算步骤

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

五 、 全连接卷积神经网络(FCN)

1 . 思想

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

六、 循环神经网络

1 . 序列模型

1)简介

实际的数据是有时序结构的,例如电影的评价随时间变化而变化

序列的数据还有更多的体现地方:

  • 音乐,语言,文本,和视频都是连续的,如果文字或者视频有时候换一下顺序会比较impressive
  • 大地震以后,可能会有几次比较小的余震
  • 人的互动是连续的,例如网上的吵架
  • 预测明天的股价要比填补昨天遗失股价更难

2) 统计的工具

处理序列数据需要统计工具和新的深度神经网络架构。

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能
**核心变为算f(x…) **

3) 马尔科夫假设

假设当前的数据点只和过去的 t 个数据点相关
李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

4 ) 潜变量模型

​ 引入潜变量来表示过去的信息 h = f(x,…) ,创建两个模型,一个是计算前一个潜变量和前一个输入计算当前潜变量,另一个模型是计算当前的潜变量和前一个输入来计算当前输出的模型
李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

2 . 文本预处理

  • 读取数据集
  • 词元化
  • 词表

3 . 语言模型

1)语言模型的目标

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

2 ) 建模

<李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

3 ) N元语法

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

4 ) 总结

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

4 . RNN模型

notion

  • **隐藏层:**输入到输出的路径上(以观测角度来理解)的隐藏的层
  • **隐变量:**变量捕获并保留了序列直到其当前时间步的历史信息, 就如当前时间步下神经网络的状态或记忆, 因此这样的隐藏变量被称为隐状态(hidden state)
  • 循环模型:在当前时间步中, 隐状态使用的定义与前一个时间步中使用的定义相同, 因此计算是循环的(recurrent)。 于是基于循环计算的隐状态神经网络被命名为 循环神经网络

1)循环神经网络

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

2 ) 困惑度perplexity

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

3 )梯度剪裁

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

5 ) 应用

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

七 、 现代循环神经网络

1.GRU(门控循环单元)

不是每个观察到的值都是同样重要的,想只记住相关的观察:

  • 能关注的机制(更新门)
  • 能遗忘的机制(重置门)

1)总体结构

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

当Z全为0时,且R全为1时,GRU退化为RNN

2. LSTM

1)独特门

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能
I F O C 四个门

2)记忆单元

a . 候选记忆单元

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

b .记忆单元

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

3 ) 隐状态

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能
因为Ct的取值范围可以时-2,所以会比较大 需要加一个激活函数

4)总结

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

3 .深度RNN

在原先的RNN的基础上多加了隐藏层,能够得到更多的信息

a )网络结构

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

4 .双向RNN

a )网络结构

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

双向RNN经常用在Encoder

5 .编码-解码器架构

a)架构

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

输入和输出都是变长的情况下,我们需要使用编码器使我们输入从变长变为固定形状的编码状态,解码器将固定形状的编码状态映射到长度可变的序列

6 . Seq2Seq

a)架构

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

前面的一个RNN经过抽取句子的特征以后,将最后一层的隐藏层参数给到Decoder里面,然后Decoder也直接从参数刚开始到最后翻译结束就完成,任意长度的原句子到任意长度的句子

b)隐藏状态如何传

将Encoder的RNN最后一层最后一个时刻的隐藏状态和Embedding放在一起然后作为Decoder的输入

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

c)BLEU(双语评价替补)

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

7 . Beam Search(束搜索)

在Seq2Seq中我们使用了贪心搜索来预测序列

a)原理

李沐-《动手学深度学习》--02-目标检测,深度学习,目标检测,人工智能

文章来源地址https://www.toymoban.com/news/detail-824082.html

到了这里,关于李沐-《动手学深度学习》--02-目标检测的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 毕业设计-基于深度学习的水面漂浮物目标检测算法系统 YOLO python 卷积神经网络 人工智能

    目录 前言 设计思路 一、课题背景与意义 二、算法理论原理 2.1 Faster RCNN 2.2 YOLOv5算法 三、检测的实现 3.1 数据集 3.2 实验环境搭建 3.3 实验及结果分析 实现效果图样例 最后        📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备

    2024年02月19日
    浏览(54)
  • 【毕业设计选题】复杂背景下的无人机(UVA)夜间目标检测系统 python 人工智能 深度学习

           📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精

    2024年01月25日
    浏览(58)
  • 毕业设计-基于深度学习的交通路面障碍物目标检测系统 YOLO python 卷积神经网络 人工智能

    目录  前言 设计思路 一、课题背景与意义 二、算法理论原理 三、检测的实现 3.1 数据集 3.2 实验及结果分析 实现效果图样例 最后        📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各

    2024年02月03日
    浏览(62)
  • 多尺度目标检测【动手学深度学习】

            在上篇博客《锚框【目标检测】》中,我们以输入图像的每个像素为中心,生成多个锚框。基本而言,这些锚框代表了图像不同区域的样本。然而如果以每个像素都生成的锚框,最后可能会得到太多需要计算的锚框。想象一个561×728的输入图像,如果以每个像素为

    2024年02月13日
    浏览(32)
  • 【动手学深度学习】--20.目标检测和边界框

    学习视频:物体检测和数据集【动手学深度学习v2】 官方笔记:目标检测和边界框 在图像分类任务中,我们假设图像中只有一个主要物体对象,我们只关注如何识别其类别。 然而,很多时候图像里有多个我们感兴趣的目标, 我们不仅想知道它们的类别,还想得到它们在图像

    2024年02月11日
    浏览(36)
  • 李沐《动手学深度学习》深度学习计算

    李沐《动手学深度学习》预备知识 张量操作及数据处理 李沐《动手学深度学习》预备知识 线性代数及微积分 李沐《动手学深度学习》线性神经网络 线性回归 李沐《动手学深度学习》线性神经网络 softmax回归 李沐《动手学深度学习》多层感知机 模型概念和代码实现 李沐《

    2024年01月22日
    浏览(58)
  • 【李沐】动手学深度学习 学习笔记

    你好! 这是【李沐】动手学深度学习v2-基于pytorch版本的学习笔记 教材 源代码 安装教程(安装pytorch不要用pip,改成conda,pip太慢了,下载不下来) 个人推荐学习学习笔记 数据操作   本节代码文件在源代码文件的chapter_preliminaries/ndarray.ipynb中 创建数组   创建数组需要:

    2024年02月16日
    浏览(51)
  • 《人工智能专栏》必读150篇 | 专栏介绍 & 专栏目录 & Python与PyTorch | 机器与深度学习 | 目标检测 | YOLOv5及改进 | YOLOv8及改进 | 关键知识点 | 工具

    各位读者们好,本专栏最近刚推出,限于个人能力有限,不免会有诸多错误,敬请私信反馈给我,接受善意的提示,后期我会改正,谢谢,感谢。 第一步 :[ 购买点击跳转 ] 第二步 : 代码函数调用关系图(全网最详尽-重要) 因文档特殊,不能在博客正确显示,请移步以下链接

    2024年02月02日
    浏览(71)
  • 李沐《动手学深度学习》多层感知机 深度学习相关概念

    李沐《动手学深度学习》预备知识 张量操作及数据处理 李沐《动手学深度学习》预备知识 线性代数及微积分 李沐《动手学深度学习》线性神经网络 线性回归 李沐《动手学深度学习》线性神经网络 softmax回归 李沐《动手学深度学习》多层感知机 模型概念和代码实现 教材:

    2024年01月20日
    浏览(46)
  • Tensor-动手学深度学习-李沐_笔记

    Tensor,又称\\\"张量\\\",其实就是n维度数组。不同维度的Tensor示意图如下:     reshape函数 可以处理总元素个数相同的任何新形状,【3,2,5】-【3,10】 -【5,6】这个流程如 下图所示:  有时需要对Tensor按照某一维度进行求和,那么实际上就是将所求和的维度 从向量降维成标量

    2024年02月11日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包