log_softmax比softmax更好？

1年前作者：能向左或向右分类：Toy博客阅读(5)违法举报

这篇具有很好参考价值的文章主要介绍了log_softmax比softmax更好？。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

多类别分类的一个trick

探讨一下在多类别分类场景，如翻译、生成、目标检测等场景下，使用log_softmax的效果优于softmax的原因。
假设词典大小为10，一个词的ID为9（即词典的最后一个词），使用交叉熵作为损失函数，我们给出两组向量：

a = [0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1]
b = [0.1, 0.1, 0.1, 0.1, 0.1, 0.05, 0.05, 0.1, 0.2, 0.1]

已知交叉熵损失函数定义如下：
$\sum^{k}_{i=0}y_ilog(p_i)$
则根据公式，可分别计算得到：

CE(softmax(a), 9) = 2.3026
CE(log_softmax(a), 9) = 2.3026

CE(softmax(b), 9)  = 2.3027
CE(log_softmax(b), 9) = 2.3033

则使用softmax操作的a,b向量在损失上相差-1e-4，而使用log_softmax在损失上相差-7e-4。
发现1：当类别概率预测错误时，CE(log_softmax(),)会加大错误类别惩罚。
这还不明显，我们现在假设

b = [0, 0, 0, 0, 0, 0.05, 0.05, 0, 0.1, 0.8]

则

CE(softmax(b), 9)  = 2.2084
CE(log_softmax(b), 9) =  1.6365

此时，对比一下softmax操作之后损失之差为9.42e-2，log_softmax损失之差为0.6661。
发现2：使用CE(softmax(),)即便预测概率分布很接近真实概率分布，在损失上下降也不是很明显(9.42e-2)，但使用CE(log_softmax(),)会有非常显著的损失下降(0.6661，约为softmax的7倍)。文章来源地址https://www.toymoban.com/news/detail-636298.html

到了这里，关于log_softmax比softmax更好？的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

人工智能 | ChatGPT 和文心一言哪个更好用？
===================================================== github：https://github.com/MichaelBeechan CSDN：https://blog.csdn.net/u011344545 ===================================================== 文心一言和ChatGPT相比都各有优与劣，根本无法完全地说哪个比哪个好，主要还是看在哪个应用领域使用。百度的文心一言是一个自
2024年01月17日
浏览(12)
人工智能伦理与城市规划的结合:如何让AI技术在城市规划中为人类创造更好的生活环境...
随着人工智能技术的不断发展，它已经成为了许多行业中的重要驱动力。在城市规划领域，人工智能技术的应用也越来越广泛。然而，在人工智能技术在城市规划中发挥更大作用之前，我们需要关注人工智能伦理问题，确保其在城市规划中为人类创造更好的生活环境。本文将
2024年02月19日
浏览(38)
人工智能与机器人|机器学习
原文链接： https://mp.weixin.qq.com/s/PB_n8woxdsWPtrmL8BbehA 机器学习下包含神经网络、深度学习等，他们之间的关系表示如图2-7所示。图2-7 关系图那么什么是机器学习、深度学习、他们的区别又是什么呢？ 2.7.1 什么是机器学习？机器学习是人工智能 (AI) 和计算机科学的一个分支，
2024年02月06日
浏览(13)
机器学习--人工智能概述
入门人工智能，了解人工智能是什么。为啥发展起来，用途是什么，是最重要也是最关键的事情。大致有以下思路。人工智能发展历程机器学习定义以及应用场景监督学习，无监督学习监督学习中的分类、回归特点知道机器学习的开发流程人工智能在现实生活中的应用
2024年01月19日
浏览(14)
人工智能与机器学习
欢迎关注博主 Mindtechnist 或加入【Linux C/C++/Python社区】一起探讨和分享Linux C/C++/Python/Shell编程、机器人技术、机器学习、机器视觉、嵌入式AI相关领域的知识和技术。专栏：《机器学习》 ☞什么是人工智能、机器学习、深度学习人工智能这个概念诞生于1956年的达特茅斯
2024年02月02日
浏览(40)
【机器学习】人工智能概述
🤵‍♂️ 个人主页：@艾派森的个人主页 ✍🏻作者简介：Python学习者 🐋 希望大家多多支持，我们一起进步！😄 如果文章对你有帮助的话，欢迎评论 💬点赞👍🏻 收藏 📂加关注+ 目录 1.人工智能概述 1.1 机器学习、人工智能与深度学习 1.2 机器学习、深度学习能做些什么
2024年02月09日
浏览(12)
【大数据&AI人工智能】机器意识能走多远：未来的人工智能哲学
机器意识能走多远：未来的人工智能哲学【摘要】意识是人类最为神奇的心理能力，也是宇宙中最为神秘的复杂现象。正因为如此，对于人工智能终极目标的实现而言，开展机器意识也就成为其绕不开的一个前沿性难题。机器意识研究不但对深化人工智能的研究有着重
2024年02月03日
浏览(12)
人工智能|机器学习——基于机器学习的舌苔检测
基于深度学习的舌苔检测毕设留档.zip资源-CSDN文库目前随着人们生活水平的不断提高，对于中医主张的理念越来越认可，对中医的需求也越来越多。在诊断中，中医通过观察人的舌头的舌质、苔质等舌象特征，了解人体内的体质信息从而对症下药。传统中医的舌诊主要依赖
2024年02月22日
浏览(37)
机器学习入门教学——人工智能、机器学习、深度学习
1、人工智能人工智能相当于人类的代理人，我们现在所接触到的人工智能基本上都是弱AI，主要作用是正确解释从外部获得的数据，并对这些数据加以学习和利用，以便灵活的实现特定目标和任务。例如：阿尔法狗、智能汽车简单来说：人工智能使机器像人类一样进行感
2024年02月09日
浏览(39)
人工智能机器人技术概述
移动机器人是一种能够在其环境中移动的自主或半自主机器人系统，通常是通过轮子或履带进行移动。这些机器人旨在在各种环境中执行各种任务，包括探索、监视、检查、运输和操作，包括室内和室外空间、危险区域甚至其他星球。移动机器人配备传感器，例如摄像头，激
2023年04月17日
浏览(13)