囚徒的困境 话说有一天,一位富翁在家中被杀,财 物被盗。警方在此案的侦破过程中,抓到两 个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并 从他们的住处搜出被害人家中丢失的财物。 但是,他们矢口否认曾杀过人,辩称是先发 现富翁被杀,然后只是顺手牵羊偷了点儿东 西。于是警方将两人隔离,分别关在不同的 房间进行审讯。由地方检察官分别和每个人 单独谈话。检察官说,“由于你们的偷盗罪 已有确凿的证据,所以可以判你们一年刑 期。但是,我可以和你做个交易。如果你单 独坦白杀人的罪行,我只判你三个月的监 禁,但你的同伙要被判十年刑。如果你拒不 坦白,而被同伙检举,那么你就将被判十年 刑,他只判三个月的监禁。但是,如果你们 两人都坦白交代,那么,你们都要被判5年 刑。”斯卡尔菲丝和那库尔斯该怎么办呢? 他们面临着两难的选择一一坦白或抵赖。显 然最好的策略是双方都抵赖,结果是大家都 只被判一年。但是由于两人处于隔离的情况 下无法串供。所以,按照亚当·斯密的理论
囚徒的困境 话说有一天,一位富翁在家中被杀,财 物被盗。警方在此案的侦破过程中,抓到两 个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并 从他们的住处搜出被害人家中丢失的财物。 但是,他们矢口否认曾杀过人,辩称是先发 现富翁被杀,然后只是顺手牵羊偷了点儿东 西。于是警方将两人隔离,分别关在不同的 房间进行审讯。由地方检察官分别和每个人 单独谈话。检察官说,“由于你们的偷盗罪 已有确凿的证据,所以可以判你们一年刑 期。但是,我可以和你做个交易。如果你单 独坦白杀人的罪行,我只判你三个月的监 禁,但你的同伙要被判十年刑。如果你拒不 坦白,而被同伙检举,那么你就将被判十年 刑,他只判三个月的监禁。但是,如果你们 两人都坦白交代,那么,你们都要被判 5 年 刑。”斯卡尔菲丝和那库尔斯该怎么办呢? 他们面临着两难的选择——坦白或抵赖。显 然最好的策略是双方都抵赖,结果是大家都 只被判一年。但是由于两人处于隔离的情况 下无法串供。所以,按照亚当·斯密的理论
每一个人都是从利己的目的出发,他们选择 坦白交代是最佳策略。因为坦白交代可以期 望得到很短的监禁-一——3个月,但前提是 同伙抵赖,显然要比自己抵赖要坐10年牢 好。这种策略是损人利己的策略。不仅如此, 坦白还有更多的好处。如果对方坦白了而自 己抵赖了,那自己就得坐10年牢。太不划 算了!因此,在这种情况下还是应该选择坦 白交代,即使两人同时坦白,至多也只判5 年,总比被判10年好吧。所以,两人合理 的选择是坦白,原本对双方都有利的策略 (抵赖)和结局(被判1年刑)就不会出现。这 样两人都选择坦白的策略以及因此被判5年 的结局被称为“纳什均衡”,也叫非合作均 衡。因为,每一方在选择策略时都没有“共 谋”(串供),他们只是选择对自己最有利的 策略,而不考虑社会福利或任何其他对手的 利益。也就是说,这种策略组合由所有局中 人(也称当事人、参与者)的最佳策略组合构 成。没有人会主动改变自己的策略以便使自 口获得更大利益。“囚徒的两难选择”有着 广泛而深刻的意义。个人理性与集体理性的
每一个人都是从利己的目的出发,他们选择 坦白交代是最佳策略。因为坦白交代可以期 望得到很短的监禁———3 个月,但前提是 同伙抵赖,显然要比自己抵赖要坐 10 年牢 好。这种策略是损人利己的策略。不仅如此, 坦白还有更多的好处。如果对方坦白了而自 己抵赖了,那自己就得坐 10 年牢。太不划 算了!因此,在这种情况下还是应该选择坦 白交代,即使两人同时坦白,至多也只判 5 年,总比被判 10 年好吧。所以,两人合理 的选择是坦白,原本对双方都有利的策略 (抵赖)和结局(被判 1 年刑)就不会出现。这 样两人都选择坦白的策略以及因此被判 5 年 的结局被称为“纳什均衡”,也叫非合作均 衡。因为,每一方在选择策略时都没有“共 谋”(串供),他们只是选择对自己最有利的 策略,而不考虑社会福利或任何其他对手的 利益。也就是说,这种策略组合由所有局中 人(也称当事人、参与者)的最佳策略组合构 成。没有人会主动改变自己的策略以便使自 己获得更大利益。“囚徒的两难选择”有着 广泛而深刻的意义。个人理性与集体理性的
冲突,各人追求利己行为而导致的最终结局 是一个“纳什均衡”,也是对所有人都不利 的结局。他们两人都是在坦白与抵赖策略上 首先想到自己,这样他们必然要服长的刑 期。只有当他们都首先替对方着想时,或者 相互合谋(串供)时,才可以得到最短时间的 监禁的结果
冲突,各人追求利己行为而导致的最终结局 是一个“纳什均衡”,也是对所有人都不利 的结局。他们两人都是在坦白与抵赖策略上 首先想到自己,这样他们必然要服长的刑 期。只有当他们都首先替对方着想时,或者 相互合谋(串供)时,才可以得到最短时间的 监禁的结果