双人矩阵博弈中的纳什均衡

这篇具有很好参考价值的文章主要介绍了双人矩阵博弈中的纳什均衡。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

双人矩阵博弈

双人零和矩阵博弈中的线性规划

线性规划

线性规划举例 -- 猜硬币

猜硬币纳什均衡代码 


双人矩阵博弈

  1. 对于双人矩阵博弈,可建立一个由包含各个联合行为对回报的元素所构成的矩阵。由此,玩家i(i=1,2)的回报函数Ri可表示为一个矩阵。
  2. 如果两个玩家完全竞争,则该双人矩阵博弈称为零和博弈。在这种情况下,R1 =-R2。在期望回报上,零和博弈只有唯一的纳什均衡。这意味着,尽管在零和博弈中每个玩家可能具有多种纳什均衡策略,但在这些纳什均衡策略下,期望回报值V均相同。
  3. 一般和矩阵博弈是指各种类型的矩阵博弈。在一般和矩阵博弈中,纳什均衡不再唯一,可能具有多个纳什均衡。
  4. 在双人矩阵博弈中,定义玩家 i 行为集Ai(i =1,2)的所有概率分布集合为,由此,Vi可为(因为Ri要靠执行对应的动作才能获得,因此两边乘上对应策略的概率,便是当前情况下的Vi)
  5. 双人矩阵博弈的纳什均衡是指对于两个玩家的策略对,具有,式中,-i是指玩家i以外的其他玩家;PD(Ai)为玩家i的行为集Ai的所有概率分布集合。这个公式的含义是,固定除i以外的其他玩家的策略,玩家i采取最优策略的V值,比采取其他策略的V值要大。
  6. 假定每个玩家在游戏中只有两种行为,则双人-双行为的一般和矩阵博弈可以定义如下:,式中,,其中,式中,-l和-f分别表示除行l之外的其他行和除列f之外的其他列。

双人零和矩阵博弈中的线性规划

线性规划

  1. 求解双人零和矩阵博弈中的纳什均衡等价于寻找下列方程的最小解,是指玩家 i 的行为的概率分布,表示除玩家i以外的其他玩家的所有行为,根据上式,每个玩家都试图在与对手对抗的最坏情况下得到最大化回报。为求解上式,可采用线性规划方法。

  2. 假设给定一个2x2的零和矩阵博弈如下:

    2×2矩阵博弈均衡图解,矩阵,人工智能

    式中,R1为玩家1的回报矩阵,R2为玩家2的回报矩阵。
  3. 定义pj(j=1,2)为玩家1第j个行为的概率分布,而qj为玩家2第j个行为的概率分布。
  4. 由此,玩家1的线性规划问题可表示为寻找(p1,p2)以使得V1最大化,且满足:

    2×2矩阵博弈均衡图解,矩阵,人工智能

     玩家2的线性规划问题可表示为寻找(p1,p2)以使得V2最大化,且满足:

    2×2矩阵博弈均衡图解,矩阵,人工智能

     为解决上述线性规划问题,可采用单纯形法来寻找几何最优点。

线性规划举例 -- 猜硬币

  • 猜硬币游戏中,玩家1的回报矩阵如下:

2×2矩阵博弈均衡图解,矩阵,人工智能

  • 由于 p2=1-p1,则玩家1的线性规划问题为:寻找p1使得V1最大化,且满足

2×2矩阵博弈均衡图解,矩阵,人工智能文章来源地址https://www.toymoban.com/news/detail-662634.html

  •  根据上述线性约束画图,如下:2×2矩阵博弈均衡图解,矩阵,人工智能
  •  其中横轴为V1,纵轴为p1;图中灰色区域为V1区域(V1<=那两条线上的V1值);当p1=0.5时,V1最大,为0;则寻找到p1=0.5使得V1最大,那p2=1-0.5=0.5,那玩家1的纳什均衡为:(0.5,0.5)
  • 对玩家2做同样操作,也能得到,玩家2的纳什均衡也为(0.5,0.5)

猜硬币纳什均衡代码 

import numpy as np
def Nash_LP_Point(R:list):
    x = np.arange(0, 1.1, 0.1)
    line1 = {}
    line2 = {}
    point = []
    for i in x:
        i = round(i, 2)
        j = round(R[0][0] * i + R[1][0] * (1 - i), 2)
        line1[i] = j
    for i in x:
        i = round(i, 2)
        j = round(R[0][1] * i + R[1][1] * (1 - i), 2)
        line2[i] = j
    # print(line1)
    # print(line2)
    # print(f'line1两个端点:0:{line1[0]},1:{line1[1]}')
    # print(f'line2两个端点:0:{line2[0]},1:{line2[1]}')
    for i1 in x:
        for i2 in x:
            i1 = round(i1, 2)
            i2 = round(i2, 2)
            if i1 == i2:
                if line1[i1] == line2[i2]:
                    # print(f'交点:{i1, line1[i1]}')
                    point.append((i1, line1[i1]))
                    break

    e_point = {'10': line1[0], '11': line1[1], '20': line2[0], '21': line2[1]}
    e_point_sort = sorted(e_point.items(), key=lambda x: x[1], reverse=False)
    # print(e_point_sort)
    if e_point_sort[0][1] >= e_point_sort[1][1]:
        a = int(e_point_sort[0][0]) % 10
        b = e_point_sort[0][1]
        point.append((a, b))
    else:
        a = int(e_point_sort[1][0]) % 10
        b = e_point_sort[1][1]
        point.append((a, b))
    #print(point)
    point = sorted(point, key=lambda x: x[1], reverse=True)
    print(point[0])

R1=[[1,-1],[-1,1]]
Nash_LP_Point(R1)
R2=[[-1,1],[1,-1]]
Nash_LP_Point(R2)
R3=[[1,2],[-1,1]]
Nash_LP_Point(R3)

到了这里,关于双人矩阵博弈中的纳什均衡的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 博弈论-策略式博弈矩阵、扩展式博弈树 习题 [HBU]

    目录 前言: 题目与求解 11.请将“田忌赛马”的博弈过程用策略式(博弈矩阵)和扩展式(博弈树)分别进行表示,并用文字分别详细表述。 34.两个朋友在一起划拳喝酒,每个人有4个纯策略:杠子、老虎、鸡和虫子。 输赢规则是:杠子降老虎,老虎降鸡,鸡降虫子,虫子降

    2024年02月03日
    浏览(37)
  • 人工智能中的线性代数与矩阵论学习秘诀之著名教材

    线性代数是大学数学中非常核心的基础课程,教材繁多,国内外有许多经典的教材。 国内比较有名且使用较为广泛的线性代数中文教材见书籍 8。 书籍 8 线性代数中文教材推荐: (a) 简明线性代数 (丘维声); (b) 线性代数 (居于马); (c) 线性代数 (李尚志); (d) 线性代数 (李炯生 等

    2024年01月20日
    浏览(34)
  • 详解矩阵博弈

    通俗来说,矩阵博弈即为 可以描述为矩阵的博弈 。 当在一场博弈中,有两个玩家,每个玩家有两种可能的动作。在两个玩家同时做出动作后,可以获得相应的收益。将所获得的收益记录在回报矩阵中,就得到了矩阵博弈的表格形式。并且将 只有两个玩家的矩阵博弈称为双人

    2024年02月12日
    浏览(18)
  • AI人工智能中的数学基础原理与Python实战: 矩阵本质及其运算

    人工智能(AI)和机器学习(ML)已经成为当今最热门的技术领域之一,它们在各个行业的应用也越来越广泛。然而,在深入了解这些领域之前,我们需要了解一些基本的数学原理和算法。这篇文章将涵盖矩阵的本质以及如何在Python中进行矩阵运算。 矩阵是计算机科学和数学中的一

    2024年04月09日
    浏览(50)
  • Ribbon 负载均衡策略 —— 图解、源码级解析

    🍊 Java学习:社区快速通道 🍊 深入浅出RocketMQ设计思想:深入浅出RocketMQ设计思想 🍊 绝对不一样的职场干货:大厂最佳实践经验指南 📆 最近更新:2023年6月4日 🍊 点赞 👍 收藏 ⭐留言 📝 都是我最大的动力! 通过本文你可以学习到: 常见的7种负载均衡策略思想 自旋锁

    2024年02月07日
    浏览(30)
  • 【人话版】WEB3黑暗森林中的隐私博弈

    【注】:1)本系列文章为纯纯的个人思考,和任何职务/机构/商业完全无关。2)面向对网络、IT动态有兴趣的朋友,漫谈风格说人话,尽量避免晦涩技术。3)行文必有不成熟不周全之处,会不定期修改细节词句。4)一家之言,所以此版本暂不开放转载。 系列文章 1:【人话

    2024年01月23日
    浏览(23)
  • 《人工智能算法图解》书籍分享(包邮送书)

    人工智能算法是一种能够模拟人类智能行为的计算机算法。它通过分析和处理大量的数据,利用机器学习、深度学习和自然语言处理等技术,实现自主学习、推理和决策的能力。 人工智能算法的发展经历了多个阶段和重要的里程碑。以下是人工智能算法发展的主要阶段和关键

    2024年02月10日
    浏览(35)
  • 人工智能里程碑ChatGPT之最全详解图解

    2022年11月30日,美国硅谷的初创公司OpenAI推出了名为ChatGPT的AI聊天机器人,已经拥有超过一百万的用户,受到热烈的讨论,短短几天就火爆全网。它既能完成包括写代码,查BUG,翻译文献,写小说,写商业文案,写游戏策划,作诗等一系列常见文字输出型任务,也可以在和用

    2023年04月08日
    浏览(35)
  • 激励机制中的经济学和博弈论模型(2)

    总体而言,分类如下: 博弈论激励:非合作游戏、stackelberg游戏、联盟游戏 拍卖激励:盲拍、前向、倒向、双拍、组合拍卖 合同理论 匹配理论 博弈论 博弈论可以为多参与者交互决策建模,其中一个参与方的决定会潜在影响另一个参与方的。在FL的背景下,参与方可以市MO和

    2023年04月18日
    浏览(28)
  • 图解人工智能知识架构(从系统角度告诉你人工智能到底学些啥)

    很多人都想学习人工智能,但是却不知道该学些啥?从宏观的视角搞清楚人工智能到底需要学习哪些领域的知识是至关重要的。这就好比要去逛一座大的商场,非常需要一份商场的楼层导览图,它能够告诉你各个楼层商户的分布;又好比去一个风景区游玩,非常需要一份景区

    2024年02月04日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包