深度学习:从入门到精通课后习题解答本答案仅供参考

这篇具有很好参考价值的文章主要介绍了深度学习:从入门到精通课后习题解答本答案仅供参考。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

第一章:

1、通过本章的学习,你认为深度学习崛起的原因有哪些?

答:(1) 计算能力的发展。深度学习的起源并不晚,但是在发展初期遭遇瓶颈的最主要原因是:当时的计算资源无法支持我们实现深度学习如此庞大复杂的计算。直到我们开始使用GPU进行计算后,深度学习才终于摆脱原本计算能力的束缚,展现其强大的实力;(2) 复杂数据结构和任务的要求。深度学习处理的数据对象一般是非结构化的数据,如图像,声音,文本,甚至是它们的混杂。这样的数据越来越多的出现在新的业务场景中,如图像分类、物体检测、人脸识别、机器翻译等。传统的机器学习方法将无能为力,深度学习在处理这些问题上展现了更好的表现。

2、深度学习和机器学习的区别是什么?

答:深度学习和机器学习不能割裂开来,它们本质上都是算法或模型,通过训练数据来优化某一目标函数,从而使得模型具有预测、分类等能力。不过,它们确实具有比较多的区别点。(1) 从数据角度来看。传统的机器学习算法适合处理样本量并不大的结构化数据;深度学习算法能够处理样本量较大且非结构化的数据。(2) 从计算来看。传统的机器学习算法消耗的计算资源并不高,在CPU上也能完成,模型优化往往较快;大多数深度学习模型需要使用GPU的资源进行计算,CPU无法完成庞大的计算,优化时间通常很漫长。(3) 模型结构来看。传统的机器学习算法或者模型是处理的单一任务的。如分类,优化等等。我们可以对这些方法进行组合,而且算法的可解释性很强,背后的数学原理或统计学原理已被研究清楚;深度学习模型算法通常是一个整体,它包含了对非结构化数据的处理(特征提取和生成),利用特征完成预测或者分类任务,而这些部分之间的协调关系是优化过程中自动调整的。这就使得用户的使用体验非常好,但是可解释性变得很差,而且我们至今对深度学习的理论性质没有完整严谨的结论。

3.除了本章提到的深度学习擅长的领域,请查阅相关资料,了解深度学习还在哪些领域见长。

答:人脸识别,拍照查询,拍照翻译,自动驾驶等。

4.尝试在 Ubuntu 系统环境中安装 TensorFlow 和 Keras。 (略)5.编写一段 Python 代码用于计算两个矩阵相加。(略)6.对于本章的观点:深度学习可以看成是一种高度复杂的非线性回归,你是如何理解的? 可否举 1~2 个生活中的例子加以说明?

答:如人脸识别的一系列应用。人的面部图像数据是X,人的性别可以作为分类变量的Y1,年龄可以作为连续性变量的Y2。深度学习模型就是研究人面部图像数据X和我们关心的因变量Y1或者Y2的回归分析。高度非线性体现在,图像数据并不是像身高、体重这样的数据,可以很容易的建立传统统计学的线性回归和逻辑回归模型,他需要经过非常复杂的特征提取之后再映射到我们关心的因变量。

第二章:1.多层感知机的原理是什么?一个神经网络的基本构成有哪些?

答:(1) 在输入层和输出层之间加入了若干隐藏层,以形成能够将样本正确分类的凸域,使得神经网络对非线性情况的拟合程度大大增强。(2)神经元是神经网络的基本逻辑单元,神经网络由若干神经元构成。神经元的构成包括:输入、权重参数、偏置参数、激活函数四部分。

2.常见的激活函数有哪些?它们的优缺点是什么?

答:见下表:

激活函数

优点

缺点

Sigmoid

取值[0,1]、梯度显式 二分类表现优良

计算量大 容易出现梯度消失

Tanh

取值[-1,1]、梯度显式 二分类表现优良

计算量大 容易出现梯度消失

ReLU

梯度显式且计算简单

产生稀疏特征 神经元一旦为零,就会永久失效

3.根据反向传播算法,请推导隐含层到输出层的偏置(即 2 b )的更新,以及输入层到隐含层偏置 1 b 的更新。

答:更新值为:

更新值为:4.结合实际例子,谈谈你对几种梯度下降算法的理解。

答:(1) 从使用样本量角度来讲,GD、BGD和SGD用于计算梯度的样本量不同,用于计算梯度的样本越大,样本梯度越接近真实梯度。但是在深度学习的情境中,样本量N和参数个数p通常都很大,SGD是一种可行 (feasible) 的优化方法。(2) 从梯度改进角度来讲,动量梯度下降法考虑到了历史的梯度信息,相当于修改了梯度下降法中的”更新方向”;RMSprop方法利用梯度模长累计信息对学习率进行调整,这被称为自适应算法。自适应体现在每一步的更新步长是根据数据自动调整的;Adam方法则是前两者的结合,更新方向使用动量梯度方向,学习率则使用自适应学习率。实际当中,Adam是深度学习中最常用的优化器,但是这并不代表Adam在任何时候都是最好的选择,同学们可以自行体验这些算法的适用场景。

5.结合本章内容,谈谈你对神经网络中过拟合现象的理解。遇到过拟合,通常可以采取 哪些技术手段进行处理?

答:过拟合是神经网络训练中的常见现象,其最主要的原因是模型估计的参数远远大于输入特征的维数。事实上,给定训练集我们总可以使得神经网络变得更加复杂以提高训练集的预测表现,但是在测试集上的预测表现可能会变得很差。我们本章介绍的两个解决过拟合的方法也是从简化模型结构,降低模型参数角度来考虑的。主要包含:(1)正则化方法;(2) Dropout

第三章:

1.请在实际生活中,找到 3 种基于图像的有趣应用,并梳理出其中的 X 和Y 。 答:看图识别APP: X:物品的图像数据; Y:图片的类别人脸识别闸机: X:人脸图像数据; Y:是否与数据库信息匹配拍照翻译APP: X:图像数据; Y:对应文本

2.结合 3.3.2 节的美食图像评分案例,你还能想到哪些其他 X ?将其放在模型中,建立一个新的线性回归模型,并与书中模型的精度进行对比。

答:可以考虑引入一些结构化数据和非结构化数据一起分析,如食物的价格(连续型),口味(离散型)等等。

3.除了图像这种非结构化的 X 变量,你还遇到过哪些其他非结构化变量?请举例说明。

答:声音,文本,甚至是视频。

4.对于 3.4 节的逻辑回归模型,能否对代码提出改进意见,并实现更好的精度预测?

答:可以考虑对图像数据先进行某些预处理、卷积神经网络的卷积操作、分通道分析数据等等一些方法。

5.请思考还有哪些多分类问题可以被规范成逻辑回归并可以在 TensorFlow 的框架下实现?

答:深度学习的著名数据集:CIFAR10 (10分类问题) ;CIFAR100 (100分类问题),与之相同的图像分类问题均可以规范到这个框架下。文章来源地址https://www.toymoban.com/news/detail-724096.html

到了这里,关于深度学习:从入门到精通课后习题解答本答案仅供参考的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【机器学习】西瓜书学习心得及课后习题参考答案—第5章神经网络

    5.1神经元模型——这是神经网络中最基本的成分。 5.2感知机与多层网络——由简单的感知机循序渐进引出多层前馈神经网络。 5.3误差逆传播算法——BP算法,迄今最成功的神经网络学习算法。算法如下(公式参考西瓜书) 停止条件与缓解BP过拟合的策略有关,一种策略是“早

    2024年02月14日
    浏览(41)
  • 【机器学习】西瓜书学习心得及课后习题参考答案—第6章支持向量机

    6.1 间隔与支持向量—— w w w 是法向量,垂直与超平面 w T x + b = 0 w^Tx+b=0 w T x + b = 0 。这一节了解了支持向量机的基本型。 min ⁡ w , b 1 2 ∣ ∣ w ∣ ∣ 2 s . t .    y i ( w T x i + b ) ≥ 1 , i = 1 , 2 , . . . , m . min_{w,b} frac{1}{2}||w||^2 \\\\ s.t. y_i(w^Tx_i+b) ge 1, qquad i=1,2,...,m. w , b min ​

    2024年02月14日
    浏览(38)
  • 【学习笔记、面试准备】机器学习西瓜书要点归纳和课后习题参考答案——第3章

    目录地址 线性模型定义: 其中x是输入向量 优点:形式简单,易于建模,可解释性好。 输入预处理:连续值可以直接用,离散值若有序,可以按序赋值变连续(如“高,中,低”变为“1,0.5,0”,否则可以单热点码编码。 回归常用MSE,要偏导数为0,当输入是一维时可以算

    2024年02月08日
    浏览(43)
  • 神经网络与深度学习第四章前馈神经网络习题解答

    [习题4-1] 对于一个神经元  ,并使用梯度下降优化参数时,如果输入恒大于0,其收敛速度会比零均值化的输入更慢。 首先看一下CSDN的解释: 如果输入x恒大于0,使用sigmoid作为激活函数的神经元的输出值将会处于饱和状态,导致其梯度接近于0,这会使得梯度下降算法的收敛

    2024年02月06日
    浏览(43)
  • 微信小程序开发实战课后习题解答————第四章(作业版)

    一、填空题 1、  组件  是视图层的基本组成单元。 2、 swiper内部只可以放置   swiper-item    组件。 3、 设置text文本内容长按可选的属性是   selectable   。    4、navigator组件通过设置   open-type    属性,来区分不同的跳转功能。 5、通过image的  mode    属性来设定不同的图

    2024年02月06日
    浏览(58)
  • 微信小程序开发实战课后习题解答————第二章(作业版)

    一、填空题 1.微信小程序通过   bindtap/catchtap    方式实现单击事件。 2.微信小程序的flex布局中, flex-direction: row   属性来实现子元素的横向排列 3.微信小程序中按钮通过    button   组件来实现 4.微信小程序通过  display: flex 来实现felx布局 5.微信小程序中执行页面数据加载完

    2024年02月15日
    浏览(39)
  • 微信小程序开发实战课后习题解答————第三章(作业版)

    一、填空题 1、微信小程序中用    navigationBar      组件可以实现导航栏 2、 微信小程序中能够实现轮播效果的组件是    swiper    3、 微信小程序中实现滚动条事件的绑定方法是    bindscroll   4、 微信小程序中引入音频的组件是   InnerAudioContext   5、 微信小程序中控

    2024年02月09日
    浏览(53)
  • Linux:课后习题及其答案

    Linux服务器、嵌入式Linux系统、软件开发平台、桌面应用 开放性、多用户、多任务、良好的用户界面、设备独立性、丰富的网络功能、可靠的系统安全、良好的可移植性 内核、Shell、文件系统、应用程序 内核是操作系统的核心,具有很多最基本的功能,如虚拟内存、多任务、

    2024年02月09日
    浏览(34)
  • JavaScript 课后习题答案

    注:本书是由人民邮电出版社《JavaScript + jQuery 交互式前端开发》 1、单行注释以__    //  ___开始。  2、console.log(alert(\\\'Hello\\\')) 在控制台的输出结果是___ Undefined ___。 3、JavaScript由___ ECMAScript ___、___ DOM ___、___ BOM ___三部分组成。 4、console.log(\\\'scriptalert(123);/script\\\') 的输出结果是

    2023年04月08日
    浏览(34)
  • 《信息系统安全》课后习题答案(陈萍)

    一、填空题 1、机密性、完整性、可用性 2、主动 3、设备安全、数据安全、内容安全、行为安全 4、通信保密、信息安全、信息安全保障 5、保护、检测、响应、恢复 二、选择题 1、D 2、C 3、B 4、A 5、D 6、A 7、C 8、B 9、A 10、B 一、填空题 1、《保密系统的信息理论》,DES,RSA

    2024年02月11日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包