神经网络与深度学习（二）——性能优化

7月前作者：阿健也会编程分类：Toy博客阅读(35) 违法举报

这篇具有很好参考价值的文章主要介绍了神经网络与深度学习（二）——性能优化。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

1.常用技巧

1.1模型初始化

简单的考虑，把所有权值在[-1,1]区间内按均值或高斯分布
进行初始化。
Xavier初始化:为了使得网络中信息更好的流动，每一层输
出的方差应该尽量相等。因此需要实现下面的均匀分布:

1.2训练数据与测试数据

数据包括
训练数据
验证数据
测试数据
通常，三者比例为 70 70%,15%,15%70 或 60 60%,20%,20%60，当数据很多时，训练和验证数据可适当减少
K 折交叉验证
原始训练数据被分成 K 个不重叠的子集。然后执行 K 次模型训练和验证，每次在 K−1 个子集上进行训练，并在剩余的一个子集（在该轮中没有用于训练的子集）上进行验证。最后，通过对 K 次实验的结果取平均来估计训练和验证误差。

1.3欠拟合与过拟合

欠拟合：误差一直比较大；
过拟合：在训练数据集上误差小而在测试数据集上误差大。

1.4权重衰减（L2正则化）

为防止过拟合和权值震荡，加入新的指标函数项：
第二项约束了权值不能过大。在梯度下降时，导数容易计算：

1.5暂退（Dropout）

在整个训练过程的每一次迭代中，标准暂退法包括在计算下一层之前将当前层中的一些节点置零。

2.动量法

2.1病态曲率

1.图为损失函数轮廓。在进入以蓝色标记的山沟状区域之前随机开始。颜色实际上表示损失函数在特定点处的值有多大，红色表示最大值，蓝色表示最小值。我们想要达到最小值点，为此但需要我们穿过山沟。这个区域就是所谓的病态曲率。

神经网络与深度学习（二）——性能优化,深度学习,神经网络,人工智能

2.梯度下降沿着山沟的山脊反弹，向极小的方向移动较慢。这是因为脊的表面在W1方向上弯曲得更陡峭。

2.2动量法

1.对比
如果把原始的 SGD 想象成一个纸团在重力作用向下滚动，由于质量小受到山壁弹力的干扰大，导致来回震荡；或者在鞍点处因为质量小速度很快减为 0 00，导致无法离开这块平地。
动量方法相当于把纸团换成了铁球；不容易受到外力的干扰，轨迹更加稳定；同时因为在鞍点处因为惯性的作用，更有可能离开平地。
动量法更新公式
公式

3.自适应梯度算法

3.1AdaGrad

1.Adaptive Gradient：自适应梯度
参数自适应变化：具有较大偏导的参数相应有一个较大的学习率，而具有小偏导的参数则对应一个较小的学习率；
具体来说，每个参数的学习率会缩放各参数反比于其历史梯度平方值总和的平方根。
用于处理稀疏的梯度
2.算法 - AdaGrad
3.问题
学习率是单调递减的，训练后期学习率过小会导致训练困难，甚至提前结束；
需要设置一个全局的初始学习率。

3.2RMSProp

1.Root Mean Square Prop
RMSProp 解决 AdaGrad 方法中学习率过度衰减的问题；
RMSProp 使用指数衰减平均以丢弃遥远的历史，使其能够快速收敛；此外，RMSProp 还加入了超参数 ρ控制衰减速率。
具体来说（对比 AdaGrad 的算法描述），即修改 r 为：
处理非稳态数据
2.RMSProp 算法

3.3Adam

1. Adaptive Moment Estimation
Adam 在 RMSProp 方法的基础上更进一步：
除了加入历史梯度平方的指数衰减平均 r 外，
还保留了历史梯度的指数衰减平均 s ，相当于动量。
Adam 行为就像一个带有摩擦力的小球，在误差面上倾向于平坦的极小值。
用于解决机器学习中的大数据量，高特征纬度的优化问题。
2. Adam 算法：
文章来源地址https://www.toymoban.com/news/detail-852578.html

4.总结

训练中常用技巧包括样本选择、权重衰减、暂退等；
动量法可有效改善收敛速度，以及避免一些陷入局部极小值；
AdaGrad 及 Adam 等算法可自适应调节学习速率，加速收敛。

到了这里，关于神经网络与深度学习（二）——性能优化的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法

鱼类识别系统。使用Python作为主要编程语言开发，通过收集常见的30种鱼类（‘墨鱼’, ‘多宝鱼’, ‘带鱼’, ‘石斑鱼’, ‘秋刀鱼’, ‘章鱼’, ‘红鱼’, ‘罗非鱼’, ‘胖头鱼’, ‘草鱼’, ‘银鱼’, ‘青鱼’, ‘马头鱼’, ‘鱿鱼’, ‘鲇鱼’, ‘鲈鱼’, ‘鲍鱼’, ‘鲑

2024年02月02日
浏览(100)
90 | Python人工智能篇 —— 深度学习算法 Keras基于卷积神经网络的情感分类

情感分类是自然语言处理（NLP）领域的一个重要任务，它旨在将文本划分为积极、消极或中性等不同情感类别。深度学习技术，尤其是卷积神经网络（CNN），在情感分类任务中取得了显著的成果。Keras作为一个高级的深度学习框架，提供了便捷易用的工具来构建和训练情感分

2024年02月13日
浏览(54)
(九)人工智能应用--深度学习原理与实战--前馈神经网络实现MNST手写数字识别

目标: 识别手写体的数字，如图所示: 学习内容: 1、掌握MNIST数据集的加载和查看方法 2、熟练掌握Keras建立前馈神经网络的步骤【重点】 3、掌握模型的编译及拟合方法的使用，理解参数含义【重点】 4、掌握模型的评估方法 5、掌握模型的预测方法 6、掌握自定义图片的处理与

2024年02月13日
浏览(49)
毕业设计选题-基于深度学习的车道线检测算法识别系统人工智能机器学习卷积神经网络

目录前言课题背景和意义实现技术思路一、车道线检测方法 1.1 卷积神经网络 1.2 注意力机制二、数据集三、实验及结果分析 3.1 实验环境搭建 3.2 模型训练实现效果图样例最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学

2024年02月22日
浏览(79)
深度学习课程实验二深层神经网络搭建及优化

1、学会训练和搭建深层神经网络； 2、掌握超参数调试正则化及优化。初始化 1、导入所需要的库 2、搭建神经网络模型 3、零初始化 4、随机初始化 5、He初始化 6、总结三种不同类型的初始化正则化 1、导入所需要的库 2、使用非正则化模型 3、对模型进行L2正则化（包括正向

2024年01月24日
浏览(39)
【毕业设计】基于深度学习的道路裂缝识别算法系统 python 卷积神经网络人工智能

目录前言设计思路一、课题背景与意义二、算法理论原理 2.1 卷积神经网络 2.1 YOLOv5算法三、道路裂缝检测的实现 3.1 数据集 3.2 实验环境及参数设置 3.2 实验及结果分析实现效果图样例最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后

2024年03月24日
浏览(86)
【毕业设计选题】基于深度学习的建筑桥梁裂缝检测系统 YOLO 卷积神经网络人工智能

目录前言设计思路一、课题背景与意义二、算法理论原理 2.1 卷积神经网络 2.1 YOLOv5算法三、桥梁裂缝检测的实现 3.1 数据集 3.2 模型训练实现效果图样例最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕

2024年02月19日
浏览(75)
计算机竞赛基于人工智能的图像分类算法研究与实现 - 深度学习卷积神经网络图像分类

🔥 优质竞赛项目系列，今天要分享的是基于人工智能的图像分类技术该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！ 🧿 更多资料, 项目分享： https://gitee.com/dancheng-senior/postgraduate 传统CNN包含卷积层、全连接层等组件，并采用softmax多类别分类器和多类交叉熵损失

2024年02月11日
浏览(66)
互联网加竞赛基于人工智能的图像分类算法研究与实现 - 深度学习卷积神经网络图像分类

🔥 优质竞赛项目系列，今天要分享的是基于人工智能的图像分类技术该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！ 🧿 更多资料, 项目分享： https://gitee.com/dancheng-senior/postgraduate 传统CNN包含卷积层、全连接层等组件，并采用softmax多类别分类器和多类交叉熵损失

2024年02月02日
浏览(60)
【毕业设计选题】基于深度学习的柑橘果实目标检测系统 YOLO python 卷积神经网络人工智能

目录前言设计思路一、课题背景与意义二、算法理论原理 2.1 优化边框损失函数 2.2 目标检测三、检测的实现 3.1 数据集 3.2 实验环境搭建 3.3 实验及结果分析实现效果图样例最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业

2024年01月23日
浏览(128)