黑客24小时在线接单的网站

黑客24小时在线接单的网站

囚徒的困境pdf(囚徒的困境博弈中两个囚徒之所以会处于困境)

本文目录一览:

《囚徒的困境冯·诺依曼、博弈论和原子弹之谜》epub下载在线阅读,求百度网盘云资源

《囚徒的困境》([美] 威廉·庞德斯通)电子书网盘下载免费在线阅读

资源链接:

链接:

提取码: nn7b

书名:囚徒的困境

作者:[美] 威廉·庞德斯通

译者:吴鹤龄

豆瓣评分:7.1

出版社:中信出版社

出版年份:2015-12

页数:368

内容简介:

《囚徒的困境》用简明易懂的方式阐明了博弈论,是一部真正具有独创性的作品,体现在它以丰富的史料,开阔的视野和合乎逻辑的分析,以生动和直率的方式向读者讲述了冷战的历史,核时代的策略游戏和冯·诺伊曼的生平。揭露了战后令人毛骨悚然的一些政府间的尔虞我诈,是一本关于博弈论及其在冷战和核军备竞赛中的作用的出色的社会历史教科书。

本书的视角十分广阔。作者围绕冯•诺伊曼的生平和博弈论这两条主线,实际上向读者展现了二战以后、冷战初期国际政治舞台上的矛盾和冲突,并试图分析其根源。这部书让我们比较详细地了解了美国以至整个西方在战后围绕要不要发展原子武器,围绕关于“先发制人的战争”所展开的大辩论,比较详细地了解了20世纪60年代初震动全世界的古巴导弹危机的经过和内幕。

作者简介:

威廉姆·庞德斯通(William Poundstone),曾在麻省理工学院学习物理学,定居于洛杉矶。他为世界各地的报刊、杂志以及美国电视台撰稿。迄今为止,庞德斯通已出版10部著作,包括关于信息论和物理学的《循环的宇宙》、揭示科学中的悖论的《推理的迷宫》,以及畅销书《巨大的秘密》、《终极》等,其中有两部获普利策奖提名。最近的一部著作是《运气公式:在赌场和华尔街制胜的科学下注方法秘闻》(2005年)。个人主页

吴鹤龄,毕业于北京工业学院(现北京理工大学)自动控制系计算机专业,后留校任教直至退休。近期主要著作有:《ACM图驱奖——计算机发展史的缩影》,《IEEE计算机先驱奖——计算机科学与技术的发明史》,《好玩的教学:娱乐数学经典名题》,《七巧板、九连环与华容道:中国古典智;力游戏三绝》等。

囚徒困境

博弈游戏中,最著名的例子就是囚徒困境,它以不同的形式存在了数千年。囚徒困境的具体内容如下:

假设警方逮捕了两名嫌疑犯,控告他们犯了某种罪,比如偷了一颗价值连城的钻石,而警察仍未能寻找回钻石。警察分开囚禁嫌疑犯,不让他们相互串通。警察分别告诉他们,如果一方说出钻石的藏匿地,则可以认罪求情减轻罪行,只需在监狱服刑六个月。不坦诚交代的一方将承担所有罪行判刑十年。如果双方都认罪,两人皆判刑两年。但是两个囚犯都清楚,如果他们双方都保持沉默,也就是说谁也都不认罪,而警察也没找到钻石,那么他们将双双获释。任何一方在自己作出选择之前(一旦作出了选择就是不可撤销的),都无从得知另一方的选择。

兰德研究者向参与试验的人们提出问题——你会怎么做?你会选择与另一个囚犯合作,也就是说保持沉默,并且希望自己的犯罪同伙也同样保持沉默,从而双双逍遥法外?还是你会选择认罪——按照兰德数学家的说法是背叛——心想人不为己天诛地灭,所以我最好作出最有利于自己的选择?

背叛和合作都有其理由。支持背叛的人认为选择是同时进行的,而且你的选择无法影响另一方的选择,所以你最好明哲保身,尽量为自己争取所能得到的任何利益,有时候还有可能免刑。这是霍布斯世界的霍布斯选择。

但是设想一下,如果囚犯双方选择合作,那会是什么样的情形呢?这样一来,他不仅获得自由,还可以拥有钻石。当然,问题就在于你怎么知道另外一方会不会先为自己打算,作出有利于自己的选择,然后让你在铁栏后面服刑十年呢?这需要极大的信任,而信任的回报对双方来说都是极其有利的。

囚徒的困境 指的具体问题是什么

囚徒的困境

两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。警察告诉他们:如果两人都坦白,各判8年;如果两人都抵赖,各判1年(因为证据不足);如果一人坦白,另一人抵赖,坦白的无罪释放,抵赖的判10年。试分析两人的战略。

解下表给出了囚徒困境的战略式表述:

这里,每个囚徒都有两种战略:坦白或抵赖。表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字是第二个囚徒的支付。

我们可以看到:(坦白,坦白)是一个占优战略均衡,就是说,不论对方如何选择,个人的最优选择是坦白。比如说,如果B抵赖,A坦白的话被放出来,而抵赖的话判1年,所以坦白比抵赖好;如果B坦白,A坦白的话判8年,抵赖的话判10年,所以坦白还是比抵赖好。这样,不论B如何选择,坦白都是A的最佳选择,即是A的占优战略。同样的,坦白也是B的占优战略。

这样,这个案例的结果就是每个人都选择坦白,各判8年。

囚徒的困境反映了一个很深刻的问题,就是个人的理性与集体理性的矛盾。如果两个人都选择抵赖,各判1年,显然比都坦白好(对犯人而言,而非对社会而言),但这作不到,因为它不满足个人的理性要求,每个人都追求效用最大,这将与集体效用最大产生矛盾

  • 评论列表:
  •  ドーナツ1
     发布于 2023-02-09 08:44:05  回复该评论
  • 双获释。任何一方在自己作出选择之前(一旦作出了选择就是不可撤销的),都无从得知另一方的选择。 兰德研究者向参与试验的人们提出问题——你会怎么做?你会选择与另一个囚犯合作,也就是说
  •  澄萌九龄
     发布于 2023-02-09 14:00:39  回复该评论
  • 将承担所有罪行判刑十年。如果双方都认罪,两人皆判刑两年。但是两个囚犯都清楚,如果他们双方都保持沉默,也就是说谁也都不认罪,而警察也没找到钻石,那么他们将双双获释。任何一方在自己作出选择之前(一旦作出了选择就是不可撤销的),都无从得知另一方的

发表评论:

Powered By

Copyright Your WebSite.Some Rights Reserved.