《动手学深度学习》——2.6概率(模拟掷色子代码解析)

这篇具有很好参考价值的文章主要介绍了《动手学深度学习》——2.6概率(模拟掷色子代码解析)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

完整代码

%matplotlib inline
!pip install d2l
import torch
from torch.distributions import multinomial
from d2l import torch as d2l
fair_probs = torch.ones([6]) / 6
counts = multinomial.Multinomial(10, fair_probs).sample((500,))
cum_counts = counts.cumsum(dim=0)
estimates = cum_counts / cum_counts.sum(dim=1, keepdims=True)
d2l.set_figsize((6, 4.5))
for i in range(6):
  d2l.plt.plot(estimates[:, i].numpy(),
  label=("P(die=" + str(i + 1) + ")"))
d2l.plt.axhline(y=0.167, color='black', linestyle='dashed')
d2l.plt.gca().set_xlabel('Groups of experiments')
d2l.plt.gca().set_ylabel('Estimated probability')
d2l.plt.legend()

代码解析

fair_probs = torch.ones([6]) / 6

这段代码的作用是创建一个张量fair_probs,其中包含每个点数的理论概率。具体来说,它创建一个长度为6的张量,每个元素都是1/6。然后它通过除以6来将每个元素归一化为概率,以便它们的总和等于1。这样,我们就可以使用fair_probs来模拟掷骰子实验,并计算每个点数的理论概率。


counts = multinomial.Multinomial(10, fair_probs).sample((500,))
cum_counts = counts.cumsum(dim=0)

这段代码的作用是使用多项式分布模拟掷骰子实验,并计算每个点数出现的次数和累计次数。具体而言,它包括以下步骤:

multinomial.Multinomial(10, fair_probs)创建一个多项式分布对象,该对象可以模拟投掷10次骰子的实验,并使用fair_probs作为每个点数的概率。这里,fair_probs是一个长度为6的张量,其中每个元素都是1/6,表示每个点数的理论概率。

.sample((500,))使用该多项式分布对象进行500次实验,并返回一个形状为(500, 6)的张量,其中每个元素表示相应点数在该实验中出现的次数。

.cumsum(dim=0)计算每个点数的累计次数。具体而言,它在每个列向量上执行累加操作,返回一个形状为(500, 6)的张量,其中每个元素表示前i个实验中相应点数的累计次数。


estimates = cum_counts / cum_counts.sum(dim=1, keepdims=True)

这段代码的作用是计算每个点数出现的概率估计值。具体而言,它通过将每个点数的累计计数除以所有点数的累计计数之和来计算概率估计值。这个计算涉及到一些维度的操作:

cum_counts是一个形状为(500, 6)的张量,其中第i行表示前i个实验中每个点数出现的累计计数。

cum_counts.sum(dim=1, keepdims=True)表示对cum_counts的第1个维度求和,即对所有实验的累计计数求和。这将返回一个形状为(500, 1)的张量,其中每个元素都是所有点数的累计计数之和。

cum_counts / cum_counts.sum(dim=1, keepdims=True)表示将cum_counts中的每个元素除以相应的点数的累计计数之和。这将返回一个形状为(500, 6)的张量,其中每个元素都是相应点数的概率估计值。keepdims=True表示保持结果张量的维度数与输入张量的维度数相同。


d2l.set_figsize((6, 4.5))

这段代码的作用是设置图形的大小。具体而言,它使用set_figsize函数设置图形的宽度和高度。该函数需要一个形状为2的元组作为参数,其中第一个元素表示图形的宽度,第二个元素表示图形的高度。在这个例子中,宽度被设置为6,高度被设置为4.5。这将使得绘制出的图形具有与默认大小不同的外观,更适合于我们的显示需求。


for i in range(6):
d2l.plt.plot(estimates[:, i].numpy(),
label=("P(die=" + str(i + 1) + ")"))

这段代码使用一个for循环迭代6次,每次迭代都会绘制一个柱状图。在每次迭代中,它选择一个不同的点数(1到6),并绘制每个实验组的概率估计值。具体而言,estimates[:, i].numpy()选择所有实验组的第i个元素,并转换为NumPy数组。然后,它使用该数组绘制一个柱状图,并为该柱状图添加一个标签,该标签指示这个点数的出现概率。标签的格式为“P(die=X)”,其中X是点数。例如,“P(die=1)”表示点数为1的概率。因此,该代码段绘制了每个点数出现的概率随时间变化的曲线。


d2l.plt.axhline(y=0.167, color='black', linestyle='dashed')
d2l.plt.gca().set_xlabel('Groups of experiments')
d2l.plt.gca().set_ylabel('Estimated probability')
d2l.plt.legend()

d2l.plt.axhline(y=0.167, color='black', linestyle='dashed')添加一条水平虚线,该线表示每个点数的理论概率,即1/6。这将帮助我们比较估计值和理论值之间的差距。

d2l.plt.gca().set_xlabel('Groups of experiments')和d2l.plt.gca().set_ylabel('Estimated probability')添加x轴和y轴标签,以便我们知道这个图是关于什么的,并了解每个轴的单位。

d2l.plt.legend()添加图例,以便我们知道每个线条代表什么。每个线条代表一个点数的概率估计值,标签格式为“P(die=X)”,其中X是点数。

结果展示

《动手学深度学习》——2.6概率(模拟掷色子代码解析),动手学深度学习,深度学习,人工智能文章来源地址https://www.toymoban.com/news/detail-604039.html

到了这里,关于《动手学深度学习》——2.6概率(模拟掷色子代码解析)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 动手学深度学习(李沐)的pytorch版本(包含代码和PDF版本)

    目录 网址(特别适合自学) 说明: 代码与PDF版 传送门 界面一览:    github上一个项目将《动手学深度学习》从mxnet改为了pytorch实现。感谢大佬们的工作。    特别说明该电子版网页是通过docsify部署生成的,详细了解点击here,自己有很多文章或者想做电子版本文档的强推

    2024年02月13日
    浏览(43)
  • 《动手学深度学习》——深度学习计算

    参考资料: 5. 深度学习计算 — 动手学深度学习 2.0.0 documentation (d2l.ai) 为了实现这些复杂的网络,我们引入了神经网络块的概念。块(block)可以描述单个层、由多个层组成的组件或整个模型本身。 从编程的角度来看,块由类(class)表示。它的任何子类都必须定义一个将其

    2024年02月12日
    浏览(35)
  • 李沐《动手学深度学习》深度学习计算

    李沐《动手学深度学习》预备知识 张量操作及数据处理 李沐《动手学深度学习》预备知识 线性代数及微积分 李沐《动手学深度学习》线性神经网络 线性回归 李沐《动手学深度学习》线性神经网络 softmax回归 李沐《动手学深度学习》多层感知机 模型概念和代码实现 李沐《

    2024年01月22日
    浏览(59)
  • 动手学深度学习 - 学习环境配置

    参考: https://www.jb51.net/article/275192.htm https://blog.csdn.net/m0_54179726/article/details/130522489 miniconda3 下载完,打开安装包,按照默认提示,下一步下一步,到这里要牢记安装目录,之后配置环境变量会用到; 点击新建,分别添加以下三个路径: 安装路径Miniconda3 安装路径Miniconda3Sc

    2024年02月07日
    浏览(39)
  • 【李沐】动手学深度学习 学习笔记

    你好! 这是【李沐】动手学深度学习v2-基于pytorch版本的学习笔记 教材 源代码 安装教程(安装pytorch不要用pip,改成conda,pip太慢了,下载不下来) 个人推荐学习学习笔记 数据操作   本节代码文件在源代码文件的chapter_preliminaries/ndarray.ipynb中 创建数组   创建数组需要:

    2024年02月16日
    浏览(51)
  • 【深度强化学习】(6) PPO 模型解析,附Pytorch完整代码

    大家好,今天和各位分享一下深度强化学习中的 近端策略优化算法 (proximal policy optimization, PPO ),并借助 OpenAI 的 gym 环境完成一个小案例,完整代码可以从我的 GitHub 中获得: https://github.com/LiSir-HIT/Reinforcement-Learning/tree/main/Model PPO 算法之所以被提出,根本原因在于 Polic

    2023年04月08日
    浏览(52)
  • 【深度强化学习】(1) DQN 模型解析,附Pytorch完整代码

    大家好,今天和各位讲解一下深度强化学习中的基础模型 DQN,配合 OpenAI 的 gym 环境,训练模型完成一个小游戏,完整代码可以从我的 GitHub 中获得: https://github.com/LiSir-HIT/Reinforcement-Learning/tree/main/Model DQN(Deep Q Network) 算法由 DeepMind 团队提出,是深度神经网络和 Q-Learning 算

    2023年04月08日
    浏览(42)
  • 【深度强化学习】(8) iPPO 模型解析,附Pytorch完整代码

    大家好,今天和各位分享一下多智能体深度强化学习算法 ippo,并基于 gym 环境完成一个小案例。完整代码可以从我的 GitHub 中获得:https://github.com/LiSir-HIT/Reinforcement-Learning/tree/main/Model 多智能体的情形相比于单智能体更加复杂,因为 每个智能体在和环境交互的同时也在和其他

    2024年02月03日
    浏览(54)
  • 李沐《动手学深度学习》多层感知机 深度学习相关概念

    李沐《动手学深度学习》预备知识 张量操作及数据处理 李沐《动手学深度学习》预备知识 线性代数及微积分 李沐《动手学深度学习》线性神经网络 线性回归 李沐《动手学深度学习》线性神经网络 softmax回归 李沐《动手学深度学习》多层感知机 模型概念和代码实现 教材:

    2024年01月20日
    浏览(46)
  • 《动手学深度学习》优化算法学习&习题

    小批量随机梯度下降,通过平均梯度来减小方差 基础 泄露平均法:用来取代梯度的计算 β beta β 这个参数控制了取多久时间的平均值 上述推理构成了”加速”梯度方法的基础,例如具有动量的梯度。 在优化问题条件不佳的情况下(例如,有些方向的进展比其他方向慢得多

    2024年02月13日
    浏览(34)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包