NLP知识点 - perplexity 困惑度-Toy模板网

这篇具有很好参考价值的文章主要介绍了NLP知识点 - perplexity 困惑度。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

困惑度（Perplexity，缩写为PPL）是衡量语言模型好坏的一个常用指标。

语言模型（language model）是用来预测句子中的next word的概率分布（probability distribution），并计算一个句子的概率。一个好的语言模型，应该给well-written 的句子更高的生成概率，阅读这些句子不应该让人感到困惑。

困惑度的定义：

$perplexity(W)=P(w_1w_2...w_n)^{-\frac{1}{N}}$
在语言模型在测试集 $W=\{w_1, w_2, ..., w_N\}$ 上的困惑度，是测试集的逆概率，然后用单词数量进行归一化。

核心思想是，句子的概率越大，其困惑度越小，说明语言模型越好。

假设我们的语言模型，词表只有[“a”, “the”, “red”, “fox”, “dog”, “.”] 六个词。

下面计算“a red fox.”这句话 $W$ 的概率。

$P(W)=P(w_1w_2...w_n)$
所以：
$P(a\ red\ fox.)=P(a)*P(red|a)*P(fox|a\ red)*P(.|a \ red\ fox)$

假设：
句子中首字的概率如下：
$P(w_1=a)=0.4$
$P(w_1=the)=0.3$
$P(w_1=red)=0.15$
$P(w_1=fox)=0.08$
$P(w_1=dog)=0.07$
$P(w_1=.)=0$

所以 $P (a) = 0.4$

所以 $P (re d ∣ a) = 0.27$

所以 $P(a\ red\ fox.)=P(a)*P(red|a)*P(fox|a\ red)*P(.|a \ red\ fox)=0.4*0.27*0.55*0.79=0.0469$

此时，可以看到生成的这句话的概率为0.0469。我们是否可以直接比较这句话的概率与当前语言模型生成的其他句子的概率，来判定生成句子的好坏呢？答案是否定的，因为句子的最终概率是单词概率连乘得到的，所以随着句子长度的增加，概率会越来越小。所以我们想要找一个不受句子长度影响的衡量方式。

考虑到句子的概率是连乘得到的，所以这个问题可以通过计算几何平均来解决。此时，我们将利用句子中单词的数量 $n$ 来对句子概率进行归一化：
$P_{norm}(W)=\sqrt [n] {P(W)}$

此时，a red fox. 这句话的归一化概率为
$P_{norm}(a\ red\ fox.)=\sqrt [4] {P(a\ red\ fox.)}=P(a\ red\ fox.)^{1/4}=0.465$

现在，所有的概率都被归一化了，可以比较不同长度句子的概率了。

进一步地，困惑度这个概念被提出来，他是归一化概率的倒数。即：

$\frac{1}{P_{norm}(W)}=\frac{1}{P(W)^\frac{1}{n}}={\frac{1}{P(w)}^{\frac{1}{n}}}$

因为是概率的倒数，所以困惑度越低，句子概率越高，语言模型就越好。文章来源地址https://www.toymoban.com/news/detail-758907.html

到了这里，关于NLP知识点 - perplexity 困惑度的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

NLP知识点 - perplexity 困惑度