ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

第九章 矩阵博弈

2021-11-08 11:02:18  阅读:180  来源: 互联网

标签:博弈 策略 第九章 参与 矩阵 2.1 收益


1. 知识储备

1.1 零和博弈(zero-sum game)

  • 零和博弈(zero-sum game),又称零和游戏,与非零和博弈相对,是博弈论的一个概念,属非合作博弈。
  • 它是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作的可能。

1.2 矩阵博弈

  • 两人零和博弈描述了两人严格竞争情形。矩阵博弈(matrix games)是伴随有限策略集的两人零和博弈。
  • 最小最大值定理(minimax theorem), 表明每个矩阵博弈都有混合策略纳什均衡。

在这里插入图片描述

2. 正文【矩阵博弈】

在本章中,我们仅讨论有限策略集的两人零和博弈。假设 S 1 = { s 11 , s 12 , … , s 1 m } , S 2 = { s 21 , s 22 , ⋅ ⋅ ⋅ , s 2 n } S_1=\{s_{11},s_{12}, …, s_{1m}\} ,S_2=\{s_{21}, s_{22},···,s_{2n}\} S1​={s11​,s12​,…,s1m​},S2​={s21​,s22​,⋅⋅⋅,s2n​}。

在不至于混淆的情形下,我们从现在起使用符号 S 1 = 1 , 2 , ⋅ ⋅ ⋅ , m , S 2 = 1 , 2 , ⋅ ⋅ ⋅ , n S_1= {1, 2, ···,m}, S_2={1, 2, ···, n} S1​=1,2,⋅⋅⋅,m,S2​=1,2,⋅⋅⋅,n [注意,不要将这里的n与本书其他地方的n(代表参与博弈的人数)相混淆]。

由于一个参与人的收益正好是另外一人收益的相反数,这些博弈可用含有 m 行和 n 列的矩阵A表示,其中 a i j = u 1 ( i , j ) , ∀ i ∈ S 1 , ∀ j ∈ S 2 a_{ij}=u_1 (i, j), \forall i \in S_1,\forall j \in S_2 aij​=u1​(i,j),∀i∈S1​,∀j∈S2​. 这个数是当参与人1 (行参与人)选择策略 i i i 且参与人2 (列参与人)选择策略 j j j 时的收益,此时参与人 2的收益为 − a i j -a_{ij} −aij​;。因此,这样的博弈也称为矩阵博弈。

2.1 矩阵博弈案例

2.1.1 硬币问题

硬币问题,参与人各抛一枚硬币,然后进行配对,配对成功(同为正或同为反)参与人 1 得一块钱,反之,参与人 2 得一块钱
在这里插入图片描述

2.1.2 石头剪刀布问题

在这里插入图片描述

2.1.3 产品预测问题

在这里插入图片描述

2.1.4 零和博弈的问题

收益之和为常数的一个博弈

  • 零和博弈的一个直接推广就是收益之和为 常数的博弈: < 1 , 2 , S i , S 2 , u 1 , u 2 > <{ 1, 2} ,S_i , S_2 , u_1 , u_2> <1,2,Si​,S2​,u1​,u2​> 使得 u 1 ( s 1 , s 2 ) + u 2 ( s 1 , s 2 ) = C u_1 (s_1, s_2 )+u_2(s_1, s_2 )=C u1​(s1​,s2​)+u2​(s1​,s2​)=C, 其中 C 是一个已知常数。
  • 给定任何一个收益之和为常数的博弈,我们都可以通过简单变换(比如,将每个参与人的每个收益减去该常数),把它变为一个零和博弈, 从而将其作为零和博弈进行分析。

2.2 矩阵博弈中的纯策略

2.2.1 介绍

在这里插入图片描述
类似地,当列参与入选择纯策略 j j j 时,他保证他的收益等于
在这里插入图片描述
也就是说,列参与人保证自己的损失不大与
在这里插入图片描述
于是,列参与人的最优策略是使得这个损失最小:
在这里插入图片描述
这称为最小最大化(mirunaximization)列参与人的这种策略称为他的安全策略(secu­rity strategy)。

2.2.2 相关定义


在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2.3 求解纯策略的值

在这里插入图片描述
在这里插入图片描述

参考

《博弈论与机制设计》中国人民大学出版社,经济科学译丛

标签:博弈,策略,第九章,参与,矩阵,2.1,收益
来源: https://blog.csdn.net/qq_40926887/article/details/121201702

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有