博弈论在经济与生活中的应用
《非零和博弈》- 托马斯·谢林,理论与实践相结合的博弈论在谈判中的应用 #生活技巧# #谈判技巧# #谈判策略书籍#
问题1, 共享单车的模式赚钱并不快,几百亿的资金投入,到底要多少年能回本?为什么明明投入已经超过了预期回报,各路资金还是疯狂进入这个行业呢?
问题2,历史上两个国家即将交战,经常出现一个国家选择和解让步方式收场,偶尔和谈失败导致战争。这种现象有什么规律吗?怎么解释这种现象。
1,拍卖陷阱
现在银行拍卖20元纸币:
这20元是真币,但是并没有收藏价值1元起拍,每次加价至少1元出价最高的朋友会获得这20元出价最高和出价次高的朋友都需要按照你的出价付款我们一起来看这个问题,假设出价最高的人(甲)给的钱是x元, 出价次高的人(乙)给的钱是y元,即x>y。让我们来一起来关注这样几个时刻:
当x+y<20, 银行亏钱,甲赚钱,乙亏钱当x+y =20,银行不赚不亏,甲赚钱,乙亏钱当x+y>20, 且x<=20, 银行赚钱,甲赚钱,乙亏钱当x+y>20, 且x>20, 银行赚钱,甲亏钱,乙亏钱根据上面几个时刻的分析,我们可以很清楚的看到,当只要有至少2个人参与游戏,银行赚钱的可能性最大。当两个人参与游戏时候,出价次高的人不论什么情况都是亏钱的,但是亏钱的多少,还是可以控制的。
比如,当x=3, y=2时候,甲赚17,乙亏2。但是乙把自己的价格提到x+1=4元,如果甲不变,乙就可以赚16元,甲亏3元, 所以乙会选择提高报价。而同样,甲为了不亏钱,也会提高报价,这样就形成了甲乙的报价逐渐递增的现象。当x=20,y =19时候,对甲来说,不赚不亏,但是对乙来说,如果把报价提高到21,就能从亏19元转变到亏1元,所以乙会提高报价,如此以来,甲乙就会从最开始的让自己赚钱的想法,变为让自己少亏钱的目的,从而不断加大报价,最终银行赚的盆满钵满。
x13...1113...192123...y—2...1012...182022...最高价者盈利+1+17...+9+7...+1-1-3...次高价者盈利—-2...-10-12...-18-20-22...如上表,次高出价者一旦加入游戏,只有不断加钱让自己称为最高出价者,才有可能反亏为为赢,反多亏钱到少亏,所以这两个游戏者都不会停下加钱,都期望让对方停止加钱,其实他们心里明白,自己已经不可能再赚到钱了。
回到开头的问题1,共享单车也好,各种融资企业也好,也会遇到这样的问题,他们明明知道这条路已经走不通了,但是为什么还要坚持下来,因为他们希望把其它的行业竞争者挤走,他们还可以享受这个蛋糕,从而减少自己的亏损。
2,简单的游戏,围棋或者象棋的输赢
A,B两个人做游戏,他们都有2个选择,上路或者下路,规定输赢如下,如果A,B两人都足够聪明,这个游戏的结果就是和棋。
A先选B后B选上路B选下路A选上路A胜B胜A选下路A胜和棋分析如下:
当A走上路时候,B决定了游戏的胜负,B会选择对自己有利的,所以B胜。
当A走下路时候,B为了不输,会选择走下路,最终和棋。
所以,对先做决策的A来说,选择走下路,最终和棋的结果是对他最有利的,所以他会选择走下路。A改变策略,A就会输,B改变策略,B就会输,所以游戏的最终走向就是和棋。双方都没有改变自己策略的动力,那么这个和棋的点,就成为一种平衡状态。这就是纳什均衡。
策梅洛定理:对于一个两人的完全信息游戏,一定存在一个策略,要么先手一定获胜,要么后手一定获胜,要么双方一定平局。
象棋或者围棋理论上也可以确定先手或者后手的输赢,但是实际没人能够算出来谁赢,主要是因为他们的状态太多了。比如围棋,19*19=361个点位,每个点位有黑棋,白棋,不放3中状态,一共有3**361种状态。假设每盘围棋平均150步,每步有250个状态, 250**150 ≈ 10**360,超级计算机每秒计算10**18,用超级计算机机计算需要10**342s=秒才能找到那个最优策略,但是宇宙从形成到现在138亿年,也只有10**17秒。所以没有任何一个计算机,能够把一个围棋的所有情况算准,我们也就不知道围棋的套路是什么。
纳什定理:只要参与博弈的几方策略都是有限的,那么就一定存在一种平衡状态,大家都会采用这种平衡策略,而没有单方面改变策略的动力。这种平衡状态就叫做纳什均衡。
策梅洛定理是纳什均衡定理的一个推论。
3,交通拥堵现象的纳什均衡思考
马路上经常出现交通拥挤的现象,每个司机就会这样考虑,如果其它车都按规矩走,我加塞,对我是有利的。如果其他车不按规矩走都加塞,我加塞,对我也是有利的,要不然我就过不去了。所以,就导致了不管别人是不是加塞,我都应该加塞,对我是有利的,就形成了一个囚徒困境。
怎么解决这个问题呢?惩罚加塞的人或者奖励那些遵守规矩的人。
我们的道德和法律就可以形成这种约束,谴责破坏规矩的人,对于严重违法的人,用法律去制裁他。我们要知道,一旦你做出了对自己有利,但对其他人不利的行为,造成了整个社会,偏向了那种不好的纳什均衡,你必将会受到惩罚,你的代价会变大,这样整个个人的最优解就变成了社会的最优解。所以纳什均衡不一定是社会最优解,但是我们可以通过一种变换,把它转变为社会最优解。
4,胆小鬼博弈
1959年,罗素提出这样一个问题:两个人在一条车道上相对着开车,每个人都可以随时打方向盘驶出车道,最先驶出车道的人就会被对方嘲笑为胆小鬼,而一直在车道上狂飙的人就称为英雄。
这个问题的历史背景就是,1959年冷战期间,美国和苏联两个国家通过军事竞赛进行对抗。这个例子可以比喻美国和苏联,如果双方都不示弱,他们就会同归于尽了。
把这个问题数学化,通过博弈论来分析。A ,B 是这两辆车,示弱表示转向,不转向就是死磕。用数字表示不同选择的代价,-10表示A,B同归于尽,代价最大。当A,B一个死磕,一个示弱,分别用3,1代表各自的代价。
如下,当A死磕时候,B会选择对自己有利的方向,所以B会示弱,此时A收益3;当A示弱时候,不管B的作何选择,A的收益最好为2。所以A会选择死磕,这是一个纳什均衡点。同理,B做分析时候,也会选择死磕对自己最有利。所以这也是一个纳什均衡点。这个问题已经存在两个纳什均衡点。
双方都想让局势对自己更有利的方向发展,这个问题的关键点就是假如有一方选择死磕到底了,另外一方肯定会示弱,而不会选择同归于尽。所以如果希望对方让步,就应该表现自己的强硬态度。比如,你一上车,就把汽车方向盘给丢掉,给对方看到你的态度。这也是前面问题2现象的考虑了。
混合策略纳什均衡:
每一个人采用的策略,都必须让其他人无论采用什么策略,期望收益都相同。纳什均衡点,包括纯策略纳什均衡和混合策略纳什均衡,绝大多数情况下都是奇数个。胆小鬼博弈中,至少还有一个混合策略纳什均衡。在双方做决策的时候,只能先猜测对方做决策的概率,那么A示弱的概率x, B 示弱的概率y。
E(A) =(11-12*y)* x + 13*y -10,B调整y, 让E(A)与x无关,所以 y=11/12
E (B) = (11-12*x) * y +13*x -1,A调整x, 让E(B)与y无关,所以 x=11/12
所以A,B示弱的概率都是11/12, 死磕的概率都是1/12。如果A,B在不知道对方是示弱或者死磕的情况下达到的纯纳什均衡点外,还可以选择以11/12的概率去示弱,以1/12的概率去死磕,这样对自己是有利的。
当交战的两国双方都选择了1/12的概率死磕时候,事件发生的概率是1/144,这种情况下,两国发生战争。所以历史上经常看到一个国家 死磕,一个国家示弱,偶尔会都选择死磕,爆发战争。这就是混合策略纳什均衡的问题。
李永乐老师:生活中的博弈论 【中科院科学公开课S02EP29】_哔哩哔哩_bilibili
网址:博弈论在经济与生活中的应用 https://www.yuejiaxmz.com/news/view/712729
相关内容
[正版]图解博弈论 社会生活中的高级思维及生存策略 济学经典理论博弈论与生活宏微观经济学基础学金融学书籍理财知识社会管理怎么样博弈论
图解博弈论:社会生活中的高级思维及生存策略
博弈论+机器学习=?
博弈论:每个人都能成为决策高手【《人民日报》、新华社推荐的浙江大学教授蒋文华经典作品,零基础、无压力的博弈论入门书,传授与国人社会生活紧密相连的游戏规则!】【全本
厚黑学与博弈论:看透人性,智慧做事
[正版]博弈论的诡计 人际沟通书籍 日常生活中的博弈策略自我提升处理人际关系策略人际交往心理学 做人做事变通思维学博弈怎么样
基于博弈论视角的校园碳减排策略探究——以兰州大学榆中校区为例
在带存储功能的智能微电网系统中,如何通过MATLAB模拟来验证贝叶斯博弈理论在需求侧管理策略中的应用,并实现储能优化?
生活中的经济学⑩——关于家庭决策