关于神经网络的思考

10月前作者：北边一颗小星星分类：Toy博客阅读(46) 违法举报

这篇具有很好参考价值的文章主要介绍了关于神经网络的思考。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

关于感知机

感知机（Perceptron）和神经网络（Neural Network）之间有一定的关系，可以说感知机是神经网络的一个基本组成单元。

感知机：
- 感知机是一种简单的二分类线性分类器。
- 它接受多个输入，对每个输入施加权重，然后将它们相加。这个总和会经过一个激活函数（通常是阶跃函数）得到输出。
- 如果输出超过某个阈值，它将被分类为一类，否则分类为另一类。
- 感知机可以用于解决线性可分的问题，但不能解决线性不可分的问题。

感知机有两部分，一是线性函数，二是激活函数：

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

其中线性函数如果在二维中就是一条直线f=wx+b把两种类别分开，在三维就是一个平面...

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

单个感知机能处理与或非但不能处理异或：

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

因为异或可以用与或非表示出来，故要处理异或问题可以用多层感知机：

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

神经网络：
- 神经网络是一个更加复杂的模型，由许多层次的神经元组成。
- 每个神经元接受多个输入，并为每个输入分配一个权重。然后将所有加权输入相加，通过激活函数处理得到输出。
- 神经网络可以包含多个层（输入层、隐藏层、输出层），其中隐藏层其实就是多层感知机，可以处理更加复杂的非线性关系。

关于损失函数

最小二乘法

假设是真实结果，是预测结果，最直观的想法就是去求它们之间的差值，让差值尽可能的小，即让预测结果尽可能接近真实结果。

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

但是用这个绝对值可能会不可导，故采用平方的形式衡量这种差距，“最小”即min“二乘”即二次方。

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

极大似然估计法

知道结果，由结果去反推造成结果的概率模型时的估计方法。

比如10每硬币抛出来7个正面3个反面，如果算出的概率模型有0.1:0.9、0.7:0.3和0.8:0.2，其中0.7:0.3的概率模型下发生这件事的概率为0.7^5*0.3^3，概率是最大的即“似然”，那么就“估计”这种概率模型就是真实抛硬币的概率模型。

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

如果事件只有两种情况，那么符合伯努利分布。

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

交叉熵

熵

熵是衡量一个系统不确定性的多少即信息量。

假如有一个概率系统P，那么它的熵就是对这个系统的信息量求期望。

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

KL散度

KL散度即相对熵，相对指的是两个概率系统。

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

D(P||Q)和D(Q||P)是不等价的，D(P||Q)表示以P为基准，它们信息量相差多少。

由整理的结果可见，第一项是交叉熵；第二项是P的系统熵，是定值。

引理：KL散度大于等于0，当P=Q时为0。

要让两个概率系统接近，即最小化交叉熵->损失函数。

由于P的熵是定值求梯度(即函数偏导)为0，故其实KL散度作损失函数等价于交叉熵作损失函数。

假设事件只有两种情况，交叉熵可写为：

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

可以发现，交叉熵和极大似然估计法的式子形式一样(含义不同)。

关于梯度下降

调整参数(比如权重w和偏置b)的策略是反向传播，梯度下降是反向传播的一种方法，除此之外还有牛顿法、冲量法...

正向传播就是信息在一层层的感知机下传递下去。

反向传播就是把偏差传递到各个参数上，根据参数对偏差的“贡献”大小作相应的调整多少。

（蕴含的贪心思想：优先调整那些对最后结果有重大影响的参数）

关于神经网络的思考,人工智能,神经网络,人工智能,深度学习

其中J表示由损失函数算出来的偏差，绿色部分代表该感知机因对最后结果的“贡献”大小所承担的“责任”的多少(浅绿部分是参数，深绿部分是上一层造成的偏差，回传给上一层)。

上面直观的理解图的偏差是用数值加法，实际是用向量的加法进行分配，由于偏差值是没有方向的，所以还需要找到一个确定的方向->梯度的方向就是向量的方向。准确来说是梯度的反方向，因为梯度的方向是数值增加最快的方向，其反方向才是数值减小最快的方向。文章来源地址https://www.toymoban.com/news/detail-726643.html

到了这里，关于关于神经网络的思考的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【复习】人工智能第 8 章人工神经网络及其应用

因为计算牵扯到导数，所以这章难的部分不会考太难。人工神经网络是对人脑或生物神经网络若干基本特性的抽象和模拟。深度学习是神经网络的发展。人工智能曾经历过很长一段时间的停滞不前。浩瀚的宇宙中，也许只有包含数千忆颗星球的银河系的复杂性能够与大脑相

2024年01月19日
浏览(54)
人工智能之卷积神经网络(CNN)

前言：今天我们重点探讨一下卷积神经网络(CNN)算法。 _ 20世纪60年代，Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性，继而提出了卷积神经网络CNN（Convolutional Neural Networks）。 1980年，K.Fukushima提

2024年02月20日
浏览(52)
神经网络与人工智能：未来的前沿

人工智能(Artificial Intelligence, AI)是一门研究如何让机器具有智能行为的科学。在过去的几十年里，人工智能研究主要集中在规则-基于的系统、知识-基于的系统以及黑盒模型。然而，在过去的几年里，一种新的人工智能技术已经吸引了广泛的关注：神经网络。神经网络是一种模

2024年02月21日
浏览(64)
【人工智能】— 深度神经网络、卷积神经网络（CNN）、多卷积核、全连接、池化

Pre-training + Fine-tuning Pre-training(预训练) : 监督逐层训练是多隐层网络训练的有效手段, 每次训练一层隐层结点, 训练时将上一层隐层结点的输出作为输入, 而本层隐结点的输出作为下一层隐结点的输入, 这称为”预训练”. Fine-tuning(微调) : 在预训练全部完成后, 再对整个网络进行

2024年02月10日
浏览(47)
【人工智能】深度神经网络、卷积神经网络（CNN）、多卷积核、全连接、池化

Pre-trainin

2024年02月16日
浏览(51)
人工智能：CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的知识梳理

卷积神经网络（CNN），也被称为ConvNets或Convolutional Neural Networks，是一种深度学习神经网络架构，主要用于处理和分析具有网格状结构的数据，特别是图像和视频数据。CNN 在计算机视觉任务中表现出色，因为它们能够有效地捕获和识别图像中的特征，具有平移不变性（transla

2024年02月05日
浏览(68)
人工智能卷积神经网络，CNN，梯度下降

CNN，是针对图像领域提出的神经网络。得出的结论：神经元存在局部感受区域，也称感受野细胞对角度有选择性如细胞对垂直光条响应最强细胞对运动方向有选择性 1.视觉系统是分层，分级处理的。从低到高堆叠使用卷积和池化。 2.神经系统是存在局部感受区域的。第一

2024年02月01日
浏览(57)
深入了解神经网络：构建人工智能的基石

目录引言：第一部分：神经元 - 生物的灵感第二部分：人工神经元 - 数学的力量第三部分：神经网络 - 层层堆叠第四部分：训练神经网络 - 损失函数和反向传播算法结论：神经网络是一种受到生物神经系统启发的人工智能模型，它重现了大脑中神经元之间相互连接的方式

2024年04月15日
浏览(61)
深度学习2.神经网络、机器学习、人工智能

目录深度学习、神经网络、机器学习、人工智能的关系大白话解释深度学习传统机器学习 VS 深度学习深度学习的优缺点 4种典型的深度学习算法卷积神经网络 – CNN 循环神经网络 – RNN 生成对抗网络 – GANs 深度强化学习 – RL 总结深度学习深度学习、机器学习、人工智能

2024年02月11日
浏览(69)
【人工智能Ⅰ】实验9：BP神经网络

实验9 BP神经网络一、实验目的 1：掌握BP神经网络的原理。 2：了解BP神经网络的结构，以及前向传播和反向传播的过程。 3：学会利用BP神经网络建立训练模型，并对模型进行评估。即学习如何调用Sklearn中的BP神经网络。 4：学会使用BP神经网络做预测。 5：通过截图和模型评

2024年02月02日
浏览(68)