【小笔记】从算法训练现象分析可能的参数设置问题-loss分析篇-Toy模板网

这篇具有很好参考价值的文章主要介绍了【小笔记】从算法训练现象分析可能的参数设置问题-loss分析篇。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

【学而不思则罔，思而不学则殆】
9.30

首先给出一个理想的训练loss收敛图片：loss平滑的下降，并逐渐收敛到0.
平滑说明学习率设置较合适，收敛到0说明模型在参数空间中收敛到一个很理想的区域。
【小笔记】从算法训练现象分析可能的参数设置问题-loss分析篇,算法篇,笔记,算法,机器学习,深度学习

训练现象：

本质原因：
算法收敛到参数空间中某个较高的“平坦区域”，而无法逃离。
【小笔记】从算法训练现象分析可能的参数设置问题-loss分析篇,算法篇,笔记,算法,机器学习,深度学习

可能的参数原因及解决办法：

batch_size设置大了，太大的batch_size会导致更少的batch数量，当算法训练陷入鞍点或平原时，很难逃离；此时可以调小batch_size，观察loss是否会比刚才减少得更多。

训练现象
【小笔记】从算法训练现象分析可能的参数设置问题-loss分析篇,算法篇,笔记,算法,机器学习,深度学习

本质原因
算法在梯度下降时跳过了最佳的收敛点，导致loss增大

可能的参数原因及解决办法文章来源地址https://www.toymoban.com/news/detail-730099.html

学习率设置过大了，较大的学习率会加速loss下降，但是可能会导致跳过最佳收敛点，而引起震荡现象。此时可以考虑减少学习率，或者采用动态学习率，刚开始使用一个较大的学习率以加快收敛，在较平稳的地方采用较小的学习率。

到了这里，关于【小笔记】从算法训练现象分析可能的参数设置问题-loss分析篇的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

【小笔记】从算法训练现象分析可能的参数设置问题-loss分析篇