python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导

这篇具有很好参考价值的文章主要介绍了python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

假设你跟朋友通过打赌投篮来打赌一万块。你们找到一个篮球框,然后约定轮流投篮,谁先投进谁赢。假设你投进的概率是 p,也就是投不进的概率是 1-p,你对手投进的概率是 q,投不进的概率是 1-q,如果由你先投,那么你取胜的概率是多少。

在上面问题中我们把事情进行了理想化假设。也就是你和对手的准度不会变,不管你们投了 10 次还是 100 次,你们状态都保持一致,投入的概率永远不变。这个问题涉及到概率论中一个大类问题,那就是成功率为 p 的情况下,我们需要执行多少次试验才能获得第一次成功。要解决这个问题,我们首先需要了解几何不等式:

假设 |r| < 1,那么有:
python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
假设你在第 n 次投篮时,你投进获得了胜利,我们看基于 n 如何推导出取胜的规律来。如果 n=1,这意味着你第一次投就成功,对应的概率就是 p,如果 n=2,那意味着你投第一次不中概率为 1-p,然后对手投第一次同样不中,概率为 1-q,然后你投第二次结果中了,概率为 p,此时对应的概率就是(1-p)(1-q)p,如果我们这里用字符 r 替代(1-p)(1-q),那么对应概率就简化为 rp,如果 n=3,那说明你前两次不中,概率就是(1-p) ^ 2,对方前两次也不中,概率为(1-q) ^ 2,然后你第三次中了,于是概率就是(1-p) ^ 2 * (1-q) ^ 2 * p ,由于我们使用 r 代替(1-p)(1-q),因此(1-p) ^ 2 * (1-q) ^ 2 就可以简化为 r ^ 2,于是概率就是 r ^2 * p,由此我们就能推而广之,那就是当你在第 n 次投篮时成功对应的概率就是 r ^( n-1) * p。

由此我们就能推断,你在竞争中获胜的概率,那就是头一次就赢的概率加上投两次就赢的概率…,加上投 n 次就赢的概率,于是有:

python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
注意这里的 r 是替代(1-p)(1-1)。于是我们用前面提供的公式就可以把上面式子简化为:

∑ n = 0 ∞ r n p = p ∑ n = 0 ∞ r n = p 1 − r \sum_{n=0}^{\infin}r^{n}p=p\sum_{n=0}^{\infin}r^{n} =\frac{p}{1-r} n=0rnp=pn=0rn=1rppython 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
事实上我们可以推导出上面的结论而不需要前面的几何级数公式。是想你第一次投篮就赢的概率是 p,如果你第一次不进,那么你要赢得比赛就需要对手第一次也不能进,此时你赢得概率没有变,就如同第一轮比赛没有发生过一样。如果使用 x 表示你赢的概率,那么 x 就等于你第一次投进的概率,加上你第一次不进,对方也第一次不进,然后乘以你赢的概率,也就是 x = p+(1-p)*(1-q)*x,如果我们把 x 解出来,那么就要 x = p / (1-r),可以看到我们第二种推导逻辑要比第一种简单和巧妙的多。

下面我们来点高级货,搞点微积分玩玩,这里的推导在后面的章节中会有大用处。有过高数学习经验的同学或许都了解过一个概念叫分部积分,要计算一个复杂的积分,我们需要把积分内的变量做各种代换才能计算出结果,我们看个例子,假设要计算如下积分,也就是公式(1):
python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
我们需要做如下替换:
python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
然后使用微分计算就有:python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
根据分部积分规则:
python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
把上面步骤结合起来就有也就是公式(2):

python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
由于:

python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
由此公式(2)就转换为下面的公式(3):

python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
同理我们再次实现分部积分处理公式(3)右边部分的积分,先做如下替换:
python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
于是根据微分计算规则就有:

python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
由此公式(3)就转换为下面的公式(4):
python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
由于:

python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
把上面推导代入公式(4),我们得到下面的公式(5):

python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
这里注意到根据公式 1:

python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能

公式(5)就可以化简为下面的公式(6):

python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能

我们把变量 I 从公式(6)中解出来就有:
python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
这样我们就解开了公式(1),于是就有如下公式(7):

python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导,大语言模型,数学,概率论,语言模型,概率论,人工智能
至此我们解决了一个复杂微积分的计算问题,在这里我们也能体会到为何很少有人能在数学上有所积累,其实不在于它有多复杂而在于其过程的繁琐,在上面一系列步骤的引出中,只要有一步你没搞懂,那么后面推导就搞不懂,另外按下葫芦浮起瓢,你看到步骤 5,6 就会忘了步骤 3,4,因此需要我们反复琢磨才能把所有逻辑搞懂。当然付出肯定会有回报,有好的数学基础才能掌握复杂的大语言模型算法,或许爬山金字塔顶端并非路程有多难走,而是我们没有那个耐心持续走下去。

更多精彩内容请在 B 站搜索 coding 迪斯尼。文章来源地址https://www.toymoban.com/news/detail-818181.html

到了这里,关于python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 概率论中的Hidden Markov Model

    Hidden Markov Model(HMM)是一种概率模型,用于描述一系列随机过程中的隐藏状态。它在许多领域得到了广泛应用,例如语音识别、自然语言处理、计算机视觉、生物信息学等。在这篇文章中,我们将深入探讨HMM的核心概念、算法原理、具体操作步骤以及数学模型公式。 1.1.1 隐藏状

    2024年04月14日
    浏览(53)
  • Python概率论

    概率论是数学的一个分支,它研究随机事件的概率和统计规律。在Python中,有很多强大的概率统计库可以帮助我们进行概率计算和数据分析,比如NumPy、SciPy和Pandas等库。下面我将为您介绍一些基本的概率概念以及如何在Python中实现它们。 在概率论中,我们通常会用以下的符

    2024年02月05日
    浏览(34)
  • 应用概率论与模糊系统:机器学习模型的精确预测

    作者:禅与计算机程序设计艺术 随着科技的进步,计算机技术已经从单纯的计算工具逐渐转向能够操控自身及周围环境的工具。然而,作为一个具有复杂性和多维性的数据集合,如何从数据中提取有效信息、做出决策以及处理异常值,仍然是一个棘手的问题。现实世界中各种

    2024年02月07日
    浏览(27)
  • 【数据处理】Python:实现求联合分布的函数 | 求边缘分布函数 | 概率论 | Joint distribution | Marginal distribution

          猛戳订阅!  👉 《一起玩蛇》🐍 💭 写在前面: 本章我们将通过 Python 手动实现联合分布函数和边缘分布函数,部署的测试代码放到文后了,运行所需环境 python version = 3.6,numpy = 1.15,nltk = 3.4,tqdm = 4.24.0,scikit-learn = 0.22。 0x00 实现求联合分布的函数(Joint distri

    2024年02月04日
    浏览(38)
  • 概率论在激光雷达的目标检测和跟踪中的应用

    概率论在激光雷达的目标检测和跟踪中发挥着重要的作用,通过建立概率模型和应用贝叶斯推断,可以处理激光雷达数据的不确定性,并提供准确的目标检测和跟踪结果。概率模型是激光雷达目标检测和跟踪的基础。激光雷达可以提供目标的位置、速度和形状等信息,但由于

    2024年01月19日
    浏览(34)
  • 【数据处理】Python:实现求条件分布函数 | 求平均值方差和协方差 | 求函数函数期望值的函数 | 概率论

         猛戳订阅!  👉 《一起玩蛇》🐍 💭 写在前面: 本章我们将通过 Python 手动实现条件分布函数的计算,实现求平均值,方差和协方差函数,实现求函数期望值的函数。部署的测试代码放到文后了,运行所需环境 python version = 3.6,numpy = 1.15,nltk = 3.4,tqdm = 4.24.0,sci

    2024年02月05日
    浏览(42)
  • 【算法小记】——机器学习中的概率论和线性代数,附线性回归matlab例程

    内容包含笔者个人理解,如果错误欢迎评论私信告诉我 线性回归matlab部分参考了up主DR_CAN博士的课程 在回归拟合数据时,根据拟合对象,可以把分类问题视为一种简答的逻辑回归。在逻辑回归中算法不去拟合一段数据而是判断输入的数据是哪一个种类。有很多算法既可以实现

    2024年01月24日
    浏览(36)
  • python数据分析-概率论与数理统计基础

    大家好,今天我们用python语言去实现概率论与数理统计的一些基础计算等。常用第三方SciPy库、NumPy库来实现概率论和数理统计的计算。 SciPy是一个基于Python的开源库,是一组专门解决科学计算中各种基本问题的模块的集合,经常与NumPy、StatsModels、SymPy这些库一起使用。SciPy的

    2024年02月07日
    浏览(51)
  • 概率论中的 50 个具有挑战性的问题 [第 6 部分]:Chuck-a-Luck

            我最近对与概率有关的问题产生了兴趣。我偶然读到了弗雷德里克·莫斯特勒(Frederick Mosteller)的《概率论中的五十个具有挑战性的问题与解决方案》)一书。我认为创建一个系列来讨论这些可能作为面试问题出现的迷人问题会很有趣。每篇文章只有 1 个问题,使

    2024年02月04日
    浏览(41)
  • <6>【深度学习 × PyTorch】概率论知识大汇总 | 实现模拟骰子的概率图像 | 互斥事件、随机变量 | 联合概率、条件概率、贝叶斯定理 | 附:Markdown 不等于符号、无穷符号

      人的一生中会有很多理想。短的叫念头,长的叫志向,坏的叫野心,好的叫愿望。理想就是希望,希望是生命的原动力!   🎯作者主页: 追光者♂🔥          🌸个人简介:   💖[1] 计算机专业硕士研究生💖   🌟[2] 2022年度博客之星人工智能领域TOP4🌟   🏅[3] 阿里

    2024年02月10日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包