《动手学深度学习》——2.6概率(模拟掷色子代码解析)

这篇具有很好参考价值的文章主要介绍了《动手学深度学习》——2.6概率(模拟掷色子代码解析)。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

完整代码

%matplotlib inline
!pip install d2l
import torch
from torch.distributions import multinomial
from d2l import torch as d2l
fair_probs = torch.ones([6]) / 6
counts = multinomial.Multinomial(10, fair_probs).sample((500,))
cum_counts = counts.cumsum(dim=0)
estimates = cum_counts / cum_counts.sum(dim=1, keepdims=True)
d2l.set_figsize((6, 4.5))
for i in range(6):
  d2l.plt.plot(estimates[:, i].numpy(),
  label=("P(die=" + str(i + 1) + ")"))
d2l.plt.axhline(y=0.167, color='black', linestyle='dashed')
d2l.plt.gca().set_xlabel('Groups of experiments')
d2l.plt.gca().set_ylabel('Estimated probability')
d2l.plt.legend()

代码解析

fair_probs = torch.ones([6]) / 6

这段代码的作用是创建一个张量fair_probs，其中包含每个点数的理论概率。具体来说，它创建一个长度为6的张量，每个元素都是1/6。然后它通过除以6来将每个元素归一化为概率，以便它们的总和等于1。这样，我们就可以使用fair_probs来模拟掷骰子实验，并计算每个点数的理论概率。

counts = multinomial.Multinomial(10, fair_probs).sample((500,))
cum_counts = counts.cumsum(dim=0)

这段代码的作用是使用多项式分布模拟掷骰子实验，并计算每个点数出现的次数和累计次数。具体而言，它包括以下步骤：

multinomial.Multinomial(10, fair_probs)创建一个多项式分布对象，该对象可以模拟投掷10次骰子的实验，并使用fair_probs作为每个点数的概率。这里，fair_probs是一个长度为6的张量，其中每个元素都是1/6，表示每个点数的理论概率。

.sample((500,))使用该多项式分布对象进行500次实验，并返回一个形状为(500, 6)的张量，其中每个元素表示相应点数在该实验中出现的次数。

.cumsum(dim=0)计算每个点数的累计次数。具体而言，它在每个列向量上执行累加操作，返回一个形状为(500, 6)的张量，其中每个元素表示前i个实验中相应点数的累计次数。

estimates = cum_counts / cum_counts.sum(dim=1, keepdims=True)

这段代码的作用是计算每个点数出现的概率估计值。具体而言，它通过将每个点数的累计计数除以所有点数的累计计数之和来计算概率估计值。这个计算涉及到一些维度的操作：

cum_counts是一个形状为(500, 6)的张量，其中第i行表示前i个实验中每个点数出现的累计计数。

cum_counts.sum(dim=1, keepdims=True)表示对cum_counts的第1个维度求和，即对所有实验的累计计数求和。这将返回一个形状为(500, 1)的张量，其中每个元素都是所有点数的累计计数之和。

cum_counts / cum_counts.sum(dim=1, keepdims=True)表示将cum_counts中的每个元素除以相应的点数的累计计数之和。这将返回一个形状为(500, 6)的张量，其中每个元素都是相应点数的概率估计值。keepdims=True表示保持结果张量的维度数与输入张量的维度数相同。

d2l.set_figsize((6, 4.5))

这段代码的作用是设置图形的大小。具体而言，它使用set_figsize函数设置图形的宽度和高度。该函数需要一个形状为2的元组作为参数，其中第一个元素表示图形的宽度，第二个元素表示图形的高度。在这个例子中，宽度被设置为6，高度被设置为4.5。这将使得绘制出的图形具有与默认大小不同的外观，更适合于我们的显示需求。

for i in range(6):
d2l.plt.plot(estimates[:, i].numpy(),
label=("P(die=" + str(i + 1) + ")"))

这段代码使用一个for循环迭代6次，每次迭代都会绘制一个柱状图。在每次迭代中，它选择一个不同的点数（1到6），并绘制每个实验组的概率估计值。具体而言，estimates[:, i].numpy()选择所有实验组的第i个元素，并转换为NumPy数组。然后，它使用该数组绘制一个柱状图，并为该柱状图添加一个标签，该标签指示这个点数的出现概率。标签的格式为“P(die=X)”，其中X是点数。例如，“P(die=1)”表示点数为1的概率。因此，该代码段绘制了每个点数出现的概率随时间变化的曲线。

d2l.plt.axhline(y=0.167, color='black', linestyle='dashed')
d2l.plt.gca().set_xlabel('Groups of experiments')
d2l.plt.gca().set_ylabel('Estimated probability')
d2l.plt.legend()