第3卷第4期 智能系统学报 Vol 3 Ng 4 2008年8月 CAA I Transactions on Intelligent Systems Aug 2008 量子博弈:新方法与新策略 王龙2,王靖2,武斌2 (1.北京大学工学院,北京100871;2北京大学机器感知与智能教育部重点实验室,北京100871) 摘要:论述了量子博弈的研究现状和最新进展.首先介绍了量子博弈中的一些基本概念和主要模型,即量子翻硬币 模型、Eisert量子博弈模型和量子Monty Hall模型:然后以这些模型为基础,讨论了当前量子博弈研究中的热点问题:多 人量子博弈状态纠缠、进化稳定策略和平衡态退相干性等:最后,对量子博弈的未来发展方向做了一些展望 关键词:博弈:量子博弈;量子信息;策略;平衡态 中图分类号:TP18文献标识码:A文章编号:1673-4785(2008)040294-11 Quan tum games:new methodologies and strategies WANG Long2,WANG Jing'2,WU Bin' (1 Center or Systems and Control,College of Engineering.Peking University,Beijing 100871,China;2 Key Laborapry ofMachine Perception (Ministry of Education),Peking University,Beijing 100871,China) Abstract:The current status of quantum games,including recent developments,is presented in this paper First, some basic concepts and models in quantum games are introduced,including the penny flpping model,the Eisert model and the Monty Hall model On the basis of these models,some current key problems in quantum games are discussed,including those involving multip layer games,state entanglement evolutionarily stable strategies,Nash equilibrium,decoherence,etc Finally,some future research directions in quantum games are pointed out Keywords:games quantum games quantum infomation;strategy,equilibrium 博弈论,又称对策论,是研究具有斗争或竞争博弈论的语言重新组织,故可认为量子博弈在量子 性现象的理论和方法.它既是现代数学的一个分支, 力学发展的初期就已经存在了.但“量子博弈这一 也是经济学的一个重要研究领域.博弈思想由来已概念被明确提出来是近20年的事.1999年,Esrt 久,但现代博弈论一般认为起源于数学家Von Neu~ 等人和Meyer分别对囚徒困境2和翻硬币问题I3进 mann和经济学家Morgenstem合著的《博弈理论和 行了量子化处理,成功地解决了经典博弈论所不能 经济行为》此后,经过许多学者的努力,特别是 解决的问题.此后,量子博弈作为独立的研究方向受 Nash在非合作博弈理论中的贡献,博弈论日渐成为 到了越来越多的关注,并被广泛应用于经济学4)、 重要的理论分析工具, 生物学7201、信息科学2121等诸多领域, 量子博弈是以量子信息论为工具研究博弈论的 经典博弈中有基于概率论的混合策略的概念, 一门交叉学科.由于大量的量子力学试验都可以用 而量子力学则是物理学家发明的一种基于概率论的 认识世界的方法,是量子世界强有力的描述工具.爱 收稿日期:200805-29 基金项目:因家自然科学基金资助项目(60674050,60528007). 因斯坦称量子力学是科学中真正的巫术.当物理学 通信作者:王龙.Email:longwang@pku edu cn 1994-2008 China Academic Journal Electronie Publishing House.All rights reserved.http://www.cnki.net
第 3卷第 4期 智 能 系 统 学 报 Vol. 3 №. 4 2008年 8月 CAA I Transactions on Intelligent System s Aug. 2008 量子博弈 :新方法与新策略 王 龙 1, 2 ,王 靖 1, 2 ,武 斌 1, 2 (1. 北京大学 工学院 ,北京 100871; 2. 北京大学 机器感知与智能教育部重点实验室 ,北京 100871) 摘 要 :论述了量子博弈的研究现状和最新进展. 首先介绍了量子博弈中的一些基本概念和主要模型 ,即量子翻硬币 模型、Eisert量子博弈模型和量子 Monty Hall模型;然后以这些模型为基础 ,讨论了当前量子博弈研究中的热点问题 :多 人量子博弈、状态纠缠、进化稳定策略和平衡态、退相干性等;最后 ,对量子博弈的未来发展方向做了一些展望. 关键词 :博弈 ;量子博弈 ;量子信息 ;策略 ;平衡态 中图分类号 : TP18 文献标识码 : A 文章编号 : 167324785 (2008) 0420294211 Quantum games : new methodologies and strategies WANG Long 1, 2 , WANG Jing 1, 2 , WU Bin 1, 2 (1. Center for System s and Control, College of Engineering, Peking University, Beijing 100871, China; 2. Key Laboratory ofMachine Percep tion (M inistry of Education) , Peking University, Beijing 100871, China) Abstract: The current status of quantum games, including recent developments, is p resented in this paper. First, some basic concep ts and models in quantum games are introduced, including the penny flipp ing model, the Eisert model and the Monty Hall model. On the basis of these models, some current key p roblem s in quantum games are discussed, including those involving multip layer games, state entanglement, evolutionarily stable strategies, Nash equilibrium, decoherence, etc. Finally, some future research directions in quantum games are pointed out. Keywords: games; quantum games; quantum information; strategy; equilibrium 收稿日期 : 2008205229. 基金项目 :国家自然科学基金资助项目 (60674050, 60528007). 通信作者 :王 龙. E2mail: longwang@pku. edu. cn. 博弈论 ,又称对策论 , 是研究具有斗争或竞争 性现象的理论和方法. 它既是现代数学的一个分支 , 也是经济学的一个重要研究领域. 博弈思想由来已 久 ,但现代博弈论一般认为起源于数学家 Von Neu2 mann和经济学家 Morgenstern合著的《博弈理论和 经济行为 》 [ 1 ] . 此后 ,经过许多学者的努力 ,特别是 Nash在非合作博弈理论中的贡献 ,博弈论日渐成为 重要的理论分析工具. 量子博弈是以量子信息论为工具研究博弈论的 一门交叉学科. 由于大量的量子力学试验都可以用 博弈论的语言重新组织 ,故可认为量子博弈在量子 力学发展的初期就已经存在了. 但“量子博弈 ”这一 概念被明确提出来是近 20年的事. 1999年 , Eisert 等人和 Meyer分别对囚徒困境 [ 2 ]和翻硬币问题 [ 3 ]进 行了量子化处理 ,成功地解决了经典博弈论所不能 解决的问题. 此后 ,量子博弈作为独立的研究方向受 到了越来越多的关注 ,并被广泛应用于经济学 [ 4243 ]、 生物学 [ 17220 ]、信息科学 [ 21223 ]等诸多领域. 经典博弈中有基于概率论的混合策略的概念 , 而量子力学则是物理学家发明的一种基于概率论的 认识世界的方法 ,是量子世界强有力的描述工具. 爱 因斯坦称量子力学是科学中真正的巫术. 当物理学
第4期 王龙等:量子博弈:新方法与新策略 ·295· 家将这个“巫术应用于博弈论时,发现它对于博弈 另一人背叛卿一人对警察抵赖,另一人坦白),合 的描述要优于经典博弈.这种优越性主要基于量子 作的判5年,背叛的释放:如果双方都背叛即都对 化博弈扩大了原经典博弈的策略集以及纠缠态的引 警察坦白),则各判4年.这个博弈的收益矩阵为 入.策略集的扩大使得寻找满足条件的策略更加容 C D 易实现;而纠缠态的引入从一定程度修正了“个体 C-2-5 都是理性的”这一基本经典假设,互相纠缠的状态 D0-4 成为博弈个体之间相互“关照程度的度量,正如人 在大多数文献中,为了讨论方便,不失一般性,将收 群中的亲友之间进行博弈时,会把对方的收益部分 益矩阵中的每一项加5,使收益矩阵成为非负矩阵: 当作自己收益一样21.事实上,博弈论作为研究理 C D 性策略主体如何解决冲突的理论,本身就蕴含着经 C30 典描述所无法满足的复杂性,如博弈个体的声誉,博 D51 弈个体之间的网络结构等对博弈结果的影响2).而 进一步地,称{,,…为纯策略集,其中的 在量子信息论框架下产生的量子博弈论,由于存在 每个元素称为纯策略.用表示个体使用纯策略号 量子态的相干叠加和纠缠,往往能够解决一些经典 的概率,称(p,,A)为一个混合策略.混合策 博弈论所不能解决的难题,如经典的囚徒困境博奔 略集可以表示为 在量子博弈的框架下就能摆脱困境.同时,量子力学 对现实世界的描述语言和相关概念,也为博弈论提 S=p=a,A,n)eR:n≥0A= 供了新的研究课题,如量子纠缠态对博弈结果的若A1ice选择混合策略q。,Bob选择混合策略q%,则 影响21,量子噪声对博奔的影响2s)等.量子博奔 Alice的收益可以表示为q.AqA 还为量子计算提供了良好的实现平台21,对量子计 A lice的占优策略q,是指对于Bob的任意策略 算机的研究起了巨大的推动作用 选择q.,Alice其他非q的策略选择获得的收益都 1预备知识 不会大于占优策略q的所得,即 11博弈论 qAqg≥qAqs,廿q,qb∈S 现对二人策略博弈进行定义:设有2个个体 类似地,可以定义Bob的占优策略, (p layer)Alice和Bob,且2个体有公共的备选策略 Nash均衡(Nash equilibrium),是指在博弈中其 集合f,,,s.当Alice选择策略s,Bob选择 他个体的策略给定时,任何个体都不能单方面改变 策略s时,Alicef的收益是a,一般地,设博弈是公平 自己的策略来增加自己收益的情形.即如果qAq≤ 的,即当Bob选择策略s,Alice:选择策略y时,Bob qAq,廿q∈S,则q∈S被称为Nash均衡.对于囚 的收益也是a:另一方面,设博弈个体是理性的,即 徒困境来说,双方互相背叛是一个Nash均衡.但如 个体总以达到自我利益最大化为目的.nX矩阵 果双方互相合作,则他们可以获得的收益之和最大 A=(a,称为收益矩阵(payoff matrix), 因此,在囚徒困境博弈中,对整体有利的策略并不是 一个经典的例子就是囚徒困境(prisoner'sdr 理性个体最终选择的策略.2个囚徒也因此陷入“为 lemma)博弈:2个嫌疑犯作案后被警察抓住,进行隔 大家考虑和为自己考虑的困境中 离审讯.警方的政策是坦白从宽,抗拒从严”策略 当博弈双方的策略组合是(q。,6时,如果增加 C表示与同伴合作,即对警察抵赖;策略D表示背 任一个体的收益就必须以降低另一个体的收益为代 叛同伴,即对警察坦白.如果2人互相合作即都对 价,则称(qa,s)是一个Paeo最优.在囚徒困境博 警察抵赖),则因证据不足各判2年:如果一人合作 弈中,双方都合作是一个Paeo最优 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
家将这个“巫术 ”应用于博弈论时 ,发现它对于博弈 的描述要优于经典博弈. 这种优越性主要基于量子 化博弈扩大了原经典博弈的策略集以及纠缠态的引 入. 策略集的扩大使得寻找满足条件的策略更加容 易实现 ;而纠缠态的引入从一定程度修正了“个体 都是理性的 ”这一基本经典假设 ,互相纠缠的状态 成为博弈个体之间相互“关照 ”程度的度量 ,正如人 群中的亲友之间进行博弈时 ,会把对方的收益部分 当作自己收益一样 [ 24 ] . 事实上 ,博弈论作为研究理 性策略主体如何解决冲突的理论 ,本身就蕴含着经 典描述所无法满足的复杂性 ,如博弈个体的声誉 ,博 弈个体之间的网络结构等对博弈结果的影响 [ 24 ] . 而 在量子信息论框架下产生的量子博弈论 ,由于存在 量子态的相干叠加和纠缠 ,往往能够解决一些经典 博弈论所不能解决的难题 ,如经典的囚徒困境博弈 在量子博弈的框架下就能摆脱困境. 同时 ,量子力学 对现实世界的描述语言和相关概念 ,也为博弈论提 供了新的研究课题 ,如量子“纠缠态 ”对博弈结果的 影响 [ 25 ] ,量子噪声对博弈的影响 [ 26227 ]等. 量子博弈 还为量子计算提供了良好的实现平台 [ 28 ] ,对量子计 算机的研究起了巨大的推动作用. 1 预备知识 1. 1 博弈论 现对二人 n策略博弈进行定义 :设有 2个个体 (p layer) A lice和 Bob, 且 2个体有公共的备选策略 集合 { s1 , s2 , …, sn }. 当 A lice选择策略 si , Bob选择 策略 sj时 , A lice的收益是 aij . 一般地 ,设博弈是公平 的 ,即当 Bob选择策略 si , A lice选择策略 sj 时 , Bob 的收益也是 aij;另一方面 ,设博弈个体是理性的 ,即 个体总以达到自我利益最大化为目的. n ×n矩阵 A = ( aij )称为收益矩阵 (payoff matrix). 一个经典的例子就是囚徒困境 ( p risoner’s di2 lemma)博弈 : 2个嫌疑犯作案后被警察抓住 ,进行隔 离审讯. 警方的政策是“坦白从宽 ,抗拒从严 ”. 策略 C表示与同伴合作 ,即对警察抵赖;策略 D 表示背 叛同伴 ,即对警察坦白. 如果 2人互相合作 (即都对 警察抵赖 ) ,则因证据不足各判 2年;如果一人合作 另一人背叛 (即一人对警察抵赖 ,另一人坦白 ) ,合 作的判 5年 ,背叛的释放;如果双方都背叛 (即都对 警察坦白 ) ,则各判 4年. 这个博弈的收益矩阵为 C D C - 2 - 5 D 0 - 4 在大多数文献中 ,为了讨论方便 ,不失一般性 ,将收 益矩阵中的每一项加 5,使收益矩阵成为非负矩阵 : C D C 3 0 D 5 1 进一步地 ,称 { s1 , s2 , …, sn }为纯策略集 ,其中的 每个元素称为纯策略. 用 pi 表示个体使用纯策略 si 的概率 ,称 ( p1 , p2 , …, pn )为一个混合策略. 混合策 略集可以表示为 S = { p = (p1 , p2 , …, pn ) ∈R n : pi ≥0, ∑ n i =1 pi = 1}. 若 A lice选择混合策略 qa , Bob选择混合策略 qb ,则 A lice的收益可以表示为 qaAq T b . A lice的占优策略 qa ,是指对于 Bob的任意策略 选择 q′b , A lice其他非 qa 的策略选择获得的收益都 不会大于占优策略 qa 的所得 ,即 qaA q′ T b ≥ q′aA q′ T b , Π q′a , q′b ∈ S. 类似地 ,可以定义 Bob的占优策略. Nash均衡 (Nash equilibrium) ,是指在博弈中其 他个体的策略给定时 ,任何个体都不能单方面改变 自己的策略来增加自己收益的情形. 即如果 qAq T e ≤ qeA q T e , Π q∈S,则 qe ∈S 被称为 Nash均衡. 对于囚 徒困境来说 ,双方互相背叛是一个 Nash均衡. 但如 果双方互相合作 ,则他们可以获得的收益之和最大. 因此 ,在囚徒困境博弈中 ,对整体有利的策略并不是 理性个体最终选择的策略. 2个囚徒也因此陷入“为 大家考虑 ”和“为自己考虑 ”的困境中. 当博弈双方的策略组合是 ( qa , qb )时 ,如果增加 任一个体的收益就必须以降低另一个体的收益为代 价 ,则称 ( qa , qb )是一个 Pareto最优. 在囚徒困境博 弈中 ,双方都合作是一个 Pareto最优. 第 4期 王 龙 ,等 :量子博弈 :新方法与新策略 · 592 ·
·296· 智能系统学报 第3卷 12量子力学 量子力学的奇妙特性之一,是量子博弈优于经典博 121量子力学的基本假设 弈的一个重要原因 量子力学有2套相互等价的描述方法:状态空间 13量子信息论 法和密度算子法.这里的叙述采用密度算子法2) 比特是经典信息论的基本概念.类似地,量子信 假设1任意孤立的物理系统与称之为这个系 息和量子计算是建立在量子比特(quantum biti或qu 统的状态空间相关联,它是一个Hilbert?空间.系统 biV的基础上.经典比特有2个确定状态0和1,量子 由作用在状态空间上的密度算子完全描述,密度算 比特有2个可能状态0)和|1),其中“|·)称为Di 子P是一个半正定、迹为1的线性算子.如果量子系 ac符号,在量子力学中表示状态这种用Dirac符号 统以概率p处于状态P,则系统的密度算子为 表示的方法就是上面提到的状态空间法人.一般地,量 ∑nP. 子比特的状态中)落在以10)和1)作为标准正交基 假设2封闭量子系统的演化由一个西变换来 所张成的复数域上的二维内积空间的单位球面上.即 描述,即系统在时刻4的状态P和在时刻5的状态 I中)=aI0〉+BI1),a,B∈C,aG+F=1事实上,1中) P由一个仅依赖于时间和飞的酉算子U联系, (仲就是一个密度算子,表示量子比特以概率1处于 P'=UPUT 状态中),其中(仲表示中的对偶向量 式中:U表示U的伴随算子 经典计算机线路由连线和逻辑门构成,其中逻 假设3量子测量是由一组测量算子Mm描 辑门负责处理信息,把信息从一种形式转化为另一 述,这些算子作用在所测量的状态空间上,指标m 种形式.类似地,可以定义单量子比特门按照量子 指实验中可能出现的测量结果.如果量子系统在测 力学的假设2,单量子比特门作为状态之间变换的 量前的最后状态是P,则得到结果m的概率由 惟一限制是酉性,因此全体二维酉矩阵组成了所有 p(m)=tr(MM p) 的单量子比特门.如同经典比特门中有一些简单而 给出,其中r(·)是线性代数中的迹函数,且测量 重要的成员,如与非门、或非门,单量子比特门也有 后系统的状态为 “些重要的成员,它们可以作为一般单量子比特门 M.PMI 酉变换)分解的基本元素,如: tr(MIMP) 测量算子满足完备性方程: Hadamard门:H ∑MM。=1 「01 假设4复合物理系统的状态空间为各子物理 系统状态空间的张量积,如果有系统1到n其中系 auli-Y门:ox月,o 统i处于状态P,则复合物理系统的状态是P,回 P2⊙…⊙Pn 「1 01 此外,对于开放的物理系统,系统演化不再遵守 Paul-Z门:0z0 酉变换法则,但仍可用Kraus算子来描述系统的演 有了以上的准备知识,就可以二人双策略公平 化,即用一组满足完备性方程的算子来描述系统的 博弈为例来介绍量子博弈及其相关概念 演化 14量子博弈 122纠缠态 设S是一个单量子比特门的子集,Alice和Bob 如果一个复合物理系统的某个状态的密度矩阵 的策略都取自S类似于经典博弈,量子博弈中也有 不能表示成各个子系统的密度矩阵的张量积的线性 Nash均衡、A lice的占优策略和Pareto最优的概念. 和形式,则称这个复合系统处于纠缠态.量子纠缠是 这些概念与经典博弈中的直观意义是相同的,例如 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
1. 2 量子力学 1. 2. 1 量子力学的基本假设 量子力学有 2套相互等价的描述方法:状态空间 法和密度算子法. 这里的叙述采用密度算子法 [29 ] . 假设 1 任意孤立的物理系统与称之为这个系 统的状态空间相关联 ,它是一个 H ilbert空间. 系统 由作用在状态空间上的密度算子完全描述 ,密度算 子ρ是一个半正定、迹为 1的线性算子. 如果量子系 统以概率 pi 处于状态 ρi , 则系统的密度算子为 ∑i piρi . 假设 2 封闭量子系统的演化由一个酉变换来 描述 ,即系统在时刻 t1 的状态 ρ和在时刻 t2 的状态 ρ′由一个仅依赖于时间 t1 和 t2 的酉算子 U 联系 , ρ′= UρU , 式中 : U 表示 U 的伴随算子. 假设 3 量子测量是由一组测量算子 {Mm }描 述 ,这些算子作用在所测量的状态空间上 , 指标 m 指实验中可能出现的测量结果. 如果量子系统在测 量前的最后状态是 ρ,则得到结果 m 的概率由 p (m ) = tr(M mMmρ) 给出 ,其中 tr ( ·)是线性代数中的迹函数 ,且测量 后系统的状态为 MmρM m tr(M mMmρ) . 测量算子满足完备性方程 : ∑m M mMm = I. 假设 4 复合物理系统的状态空间为各子物理 系统状态空间的张量积 ,如果有系统 1到 n,其中系 统 i处于状态 ρi , 则复合物理系统的状态是 ρ1 á ρ2 á …á ρn . 此外 ,对于开放的物理系统 ,系统演化不再遵守 酉变换法则 ,但仍可用 Kraus算子来描述系统的演 化 ,即用一组满足完备性方程的算子来描述系统的 演化. 1. 2. 2 纠缠态 如果一个复合物理系统的某个状态的密度矩阵 不能表示成各个子系统的密度矩阵的张量积的线性 和形式 ,则称这个复合系统处于纠缠态. 量子纠缠是 量子力学的奇妙特性之一 ,是量子博弈优于经典博 弈的一个重要原因. 1. 3 量子信息论 比特是经典信息论的基本概念. 类似地,量子信 息和量子计算是建立在量子比特 ( quantum bit或 qu2 bit)的基础上. 经典比特有 2个确定状态 0和 1,量子 比特有 2个可能状态 |0〉和 | 1〉,其中“| ·〉”称为 D i2 rac符号 ,在量子力学中表示状态 (这种用 D irac符号 表示的方法就是上面提到的状态空间法 ). 一般地,量 子比特的状态 |ψ〉落在以 | 0〉和 | 1〉作为标准正交基 所张成的复数域上的二维内积空间的单位球面上. 即 |ψ〉=α|0〉+β|1〉,α,β∈C,αα +ββ = 1. 事实上, |ψ〉 〈ψ|就是一个密度算子,表示量子比特以概率 1处于 状态 |ψ〉,其中〈ψ|表示 |ψ〉的对偶向量. 经典计算机线路由连线和逻辑门构成 ,其中逻 辑门负责处理信息 ,把信息从一种形式转化为另一 种形式. 类似地 ,可以定义单量子比特门. 按照量子 力学的假设 2,单量子比特门作为状态之间变换的 惟一限制是酉性 ,因此全体二维酉矩阵组成了所有 的单量子比特门. 如同经典比特门中有一些简单而 重要的成员 ,如与非门、或非门 ,单量子比特门也有 一些重要的成员 ,它们可以作为一般单量子比特门 (酉变换 )分解的基本元素 ,如 : Hadamard门 : H = 1 2 1 1 1 - 1 , Pauli—X 门 :σX = 0 1 1 0 , Pauli—Y门 :σY = 0 - i i 0 , Pauli—Z 门 :σZ = 1 0 0 - 1 . 有了以上的准备知识 ,就可以二人双策略公平 博弈为例来介绍量子博弈及其相关概念. 1. 4 量子博弈 设 S是一个单量子比特门的子集 , A lice和 Bob 的策略都取自 S. 类似于经典博弈 ,量子博弈中也有 Nash均衡、A lice的占优策略和 Pareto最优的概念. 这些概念与经典博弈中的直观意义是相同的 ,例如 · 692 · 智 能 系 统 学 报 第 3卷
第4期 王龙等:量子博弈:新方法与新策略 ·297 ∈S称为A licef的占优策略,是指对于任意Bob的 为P。=I0〉(01经玩家Q作用之后的密度算子为 策略选择sg,A lice其他非的策略选择获得的收 P,=UPU,其中U是酉算子U的共轭转置,并且 益都不大于占优策略的所得,即:P4(s,s)≥ 满足UU=1玩家P作用之后,硬币的密度算子为 P(s,),s,∈S P2=pFP,Ft+(1-pNPN最后,硬币的密度算 廿s4,sB∈S,如果 子为P=UP2U=P.因此,不管玩家P以多大概 P4(s,)≥P4(,) 率翻硬币,使用策略U的玩家Q会以概率1赢, Pa(,)≥Pa(M,sB) 事实上,经典博弈论中的策略是量子策略的一 则量子策略(s,)∈SS称为一个Nash均衡,其 个子集0),因此,量子策略相对于经典策略具有一 中P4(s,,Pa(,)分别表示Alice选用,Bob 定的优越性 选用s时,A lice和Bob的收益 22 Eisert量子博弈 2量子博弈的主要模型 Eisert量子博弈P是把量子力学的概念引入经 典的囚徒困境而产生的一个全新的博弈模型.在经 21量子翻硬币博弈 典的囚徒困境博弈中,理性假设必然导致策略主体 最简单的赌博形式就是翻硬币.在量子翻硬币 双方都选择不合作,从而互相背叛成为一个Nash均 博弈中B,假设有2个玩家P和Q,其中P使用的 衡.对任何理性博弈者来说,背叛就是最优选择.但 是经典策略,即翻硬币和不翻硬币,而Q使用量子 是如果双方都选择背叛,2个人的收益和比双方都 策略.游戏规则如下:首先由P准备一枚硬币,硬币 合作的收益和要小.这个困境深刻地反映了个人理 正面是头像,反面是字.P把这枚硬币放到一个盒子 性和集体理性之间的矛盾.在量子博弈意义下,囚徒 里,确保硬币头像一面向上,然后把盒子盖上(P和 困境有了一个新的Nash均衡.如果博弈双方都采用 Q只能把手伸到盒子里进行操作,但看不到盒子里 量子策略,那么他们可以逃出以上困境 硬币的状态人.接下来由Q进行操作,然后是P操 Eisert量子博弈模型包括以下3点: 作,最后Q再进行一次操作之后,把盒子打开.如果 1)2个量子比特的源,每个个体的状态对应一 硬币的头像一面仍然向上的话Q赢,否则P赢 个比特: 定义一个二维向量空间来表示硬币的状态,这 2)一个物理工具集对应于经典博弈的策略 个空间的2个基为10)和11).状态10),1)分别表 集),这些工具可以使策略主体在策略意义下控制 示以概率1硬币头像面向上,以概率1硬币头像面 自己的比特; 向下.定义二维矩阵来表示玩家的策略.对于玩家 3)一个物理测量设备,这个设备可以通过这2 P,经典策略翻F)和不翻N)分别表示为 个比特的状态来确定策略主体的收益 01 「10 F N 假设每个策略主体都知道以上3点要素.定义 L 1 0 比特|C)和D)表示经典策略C和D的状态.在静 玩家P以概率p使用策略F,以概率1-p使用 态博弈中,每个策略主体只进行一次动作卿使用 策略N,则P的混合策略可用矩阵表示为 一次策略人.那么这个博弈的初始策略组合可以写 1-p 成ICC)、ICD)、IDC)、IDD). 1- Eisert量子博弈的过程如图1所示.首先,令2 而玩家Q使用的量子策略为Hadamard算子: 个策略主体的策略都是|C〉,即该博弈的状态为 1CC).通过量子门使得状态ICC)纠缠在一起形成 初始状态1中。)=jCC),即2个策略主体的初始状 使用密度算子法21,定义硬币初始的密度算子 态通过量子信息的通道对对方的决策产生影响,形 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
sA ∈S称为 A lice的占优策略 ,是指对于任意 Bob的 策略选择 s′B , A lice其他非 sA 的策略选择获得的收 益都不大于占优策略的所得 , 即 : PA ( sA , s′B ) ≥ PA (sA′, sB′) , Π sA′, sB′∈S. Π s′A , s′B ∈S,如果 PA (sA , sB ) ≥ PA (sA′, sB ) , PB (sA , sB ) ≥ PB (sA , s′B ). 则量子策略 (sA , sB ) ∈S ×S称为一个 Nash均衡 ,其 中 PA (sA , sB ) , PB (sA , sB )分别表示 A lice选用 sA , Bob 选用 sB 时 , A lice和 Bob的收益. 2 量子博弈的主要模型 2. 1 量子翻硬币博弈 最简单的赌博形式就是翻硬币. 在量子翻硬币 博弈中 [ 3 ] ,假设有 2个玩家 P和 Q,其中 P使用的 是经典策略 ,即翻硬币和不翻硬币 ,而 Q 使用量子 策略. 游戏规则如下 :首先由 P准备一枚硬币 ,硬币 正面是头像 ,反面是字. P把这枚硬币放到一个盒子 里 ,确保硬币头像一面向上 ,然后把盒子盖上 ( P和 Q只能把手伸到盒子里进行操作 ,但看不到盒子里 硬币的状态 ). 接下来由 Q 进行操作 ,然后是 P操 作 ,最后 Q再进行一次操作之后 ,把盒子打开. 如果 硬币的头像一面仍然向上的话 Q赢 ,否则 P赢. 定义一个二维向量空间来表示硬币的状态 ,这 个空间的 2个基为 | 0〉和 | 1〉. 状态 | 0〉, | 1〉分别表 示以概率 1硬币头像面向上 ,以概率 1硬币头像面 向下. 定义二维矩阵来表示玩家的策略. 对于玩家 P,经典策略翻 ( F )和不翻 (N )分别表示为 F: 0 1 1 0 N : 1 0 0 1 玩家 P以概率 p使用策略 F,以概率 1 - p使用 策略 N ,则 P的混合策略可用矩阵表示为 1 - p p p 1 - p . 而玩家 Q使用的量子策略为 Hadamard算子 : U : 1 2 1 1 1 - 1 . 使用密度算子法 [ 29 ] ,定义硬币初始的密度算子 为 ρ0 = | 0〉〈0 |. 经玩家 Q 作用之后的密度算子为 ρ1 =Uρ0U ,其中 U 是酉算子 U 的共轭转置 ,并且 满足 UU = I. 玩家 P作用之后 ,硬币的密度算子为 ρ2 = pFρ1 F + ( 1 - p) Nρ1N . 最后 ,硬币的密度算 子为 ρ3 = Uρ2U =ρ0 . 因此 ,不管玩家 P以多大概 率翻硬币 ,使用策略 U 的玩家 Q会以概率 1赢. 事实上 ,经典博弈论中的策略是量子策略的一 个子集 [ 30 ] ,因此 ,量子策略相对于经典策略具有一 定的优越性. 2. 2 Eisert量子博弈 Eisert量子博弈 [ 2 ]是把量子力学的概念引入经 典的囚徒困境而产生的一个全新的博弈模型. 在经 典的囚徒困境博弈中 ,理性假设必然导致策略主体 双方都选择不合作 ,从而互相背叛成为一个 Nash均 衡. 对任何理性博弈者来说 ,背叛就是最优选择. 但 是如果双方都选择背叛 , 2个人的收益和比双方都 合作的收益和要小. 这个困境深刻地反映了个人理 性和集体理性之间的矛盾. 在量子博弈意义下 ,囚徒 困境有了一个新的 Nash均衡. 如果博弈双方都采用 量子策略 ,那么他们可以逃出以上困境. Eisert [ 2 ]量子博弈模型包括以下 3点 : 1) 2个量子比特的源 ,每个个体的状态对应一 个比特; 2) 一个物理工具集 (对应于经典博弈的策略 集 ) ,这些工具可以使策略主体在策略意义下控制 自己的比特; 3) 一个物理测量设备 ,这个设备可以通过这 2 个比特的状态来确定策略主体的收益. 假设每个策略主体都知道以上 3点要素. 定义 比特 |C〉和 |D 〉表示经典策略 C和 D 的状态. 在静 态博弈中 ,每个策略主体只进行一次动作 (即使用 一次策略 ). 那么这个博弈的初始策略组合可以写 成 |CC〉、|CD 〉、|DC〉、|DD 〉. Eisert量子博弈的过程如图 1所示. 首先 ,令 2 个策略主体的策略都是 | C 〉, 即该博弈的状态为 |CC〉. 通过量子门 J ^使得状态 |CC〉纠缠在一起形成 初始状态 |ψ0 〉= J ^ |CC〉,即 2个策略主体的初始状 态通过量子信息的通道对对方的决策产生影响 ,形 第 4期 王 龙 ,等 :量子博弈 :新方法与新策略 · 792 ·
·298· 智能系统学报 第3卷 成被影响后的纠缠状态.2个策略主体A和B的策 3)策略空间为一般的酉矩阵.在这种情况下, 略分别为酉算子,和心.当A和B进行一次博奔 对于任意给定的收益不大于Paeo最优时的收 之后,状态成为心,⊙心。1cc),然后通过量子门 益),策略主体可以通过调整各自的量子策略达到 来解纠缠,得到最终状态: 一个Nash均衡,使得在这个Nash均衡下,2个策略 1中,》=⊙心ncc以】 主体的收益都为预先给定的收益 上述讨论只考虑了策略酉矩阵对收益的影响, 并没有考虑初始状态的纠缠所产生的影响.考虑初 始策略组合|CC经过酉算子纠缠在一起形成纠缠 态Ψ。〉=UCC的情形B1.定义的形式为 图1Eit量子博弈模型 f=exp(i D⊙D2,Y∈I0,r2] Fig I Eisert model of quantm game 式中:Y是该量子博弈中状态纠缠程度的度量.若 使用经典囚徒困境的收益矩阵 可以定 Y=0,说明该博弈中的2个策略主体没有纠缠,进行 博弈时完全不受对方的影响.这种情况下的量子博 义策略主体A的期望收益为 弈等价于使用混合策略的经典博弈.若Y≠0此时 =Pcc pPDD Ppc sPcD 的2个策略主体都不是完全理性,或者不是自私的 式中:P。'=|(ooI中,〉,它表示最终状态是1o0) 主体,他们在选择策略时还会考虑对方的因素,所以 的概率.策略空间为不同的形式时,可以得到不同的 博弈结果B 就会出现纠缠的现象, 1)策略空间为具有一个参数的2阶酉矩阵: 纠缠程度也是影响量子博弈的一个重要因素, cos(0/2) sin( 3 以收益矩阵为 的囚徒困境为例: -sin(02)cos02力 5 式中:0∈0,π1在这种情况下,互相背叛仍然是惟 1)当0≤y≤arcsin1/5时,D⊙D,即双方背 一的Nash均衡,但不是Pareto最优.即在这种最优 叛,仍是惟一的Nash均衡; 策略组合下,任何一个策略主体都不能以减少对方 2)当arcsin1/5<Y<arcsin2/5时,D⊙Q和 收益为代价来增加自己的收益.此时,量子博弈和经 典博弈没有区别; Q⊙D都是Nash均衡.此时Q仍然为UO,π2) 2)策略空间为具有2个参数的2阶西矩阵 3)当arcsin2/5≤Y≤r2时,Q⊙Q是惟一的 心,) e cos(02) sin(0/2) Nash均衡,并且是Paeo最优.此时囚徒困境被解决 sin(0/2) ecos(02 23其他量子博弈模型 式中:0∈0,π1,φ∈[0,π/21 量子翻硬币博弈和Eisert量子博弈是两类非常 在这种情况下,存在一个量子策略 重要的量子博弈模型.基于这2种基本模型,其他一 Q=00,r2) 0 些博弈的量子模型相继产生.例如,性别之战(battle L0. of sexes game)模型s1,猎鹿博弈(stag hunt game) 使得均衡Q,Q)是一个新的Nash均衡,并且是 模型、少数者博奔(m inority gae)模型m】、伪 一个Paeo最优.因此,困境在量子策略下消失了; 感应(pseudo telepathy game)模型I39-o1、Monty Hall 特别地,当策略集被限制在心(红,0),心(0, 博弈模型【12以及其他博奔模型3).其中量子 Monty Hallt博弈模型是比较典型的量子博弈模型 0)时,量子博奔还原为经典博弈,且(红,0) 所谓Monty Hall问题,就是在一个名为Monty 心0,0)分别表示背叛与合作,记为D和C 的大厅中,主人Alice和客人Bob进行一次博弈.主 1994-2008 China Academie Journal Electronic Publishing House.All rights reserved.http://www.cnki.ne
成被影响后的纠缠状态. 2个策略主体 A 和 B 的策 略分别为酉算子 U ^ A 和 U ^ B . 当 A 和 B 进行一次博弈 之后 ,状态成为 U ^ A á U ^ B J ^ | CC〉,然后通过量子门 J ^ 来解纠缠 ,得到最终状态 : |ψf 〉= J ^ U ^ A á U ^ B J ^ | CC〉. 图 1 Eisert量子博弈模型 Fig. 1 Eisert model of quantum game 使用经典囚徒困境的收益矩阵 r s t p ,可以定 义策略主体 A的期望收益为 $A = rPCC + pPDD + tPD C + sPCD , 式中 : Pσσ′= 〈| σσ′|ψf 〉| 2 ,它表示最终状态是 |σσ′〉 的概率. 策略空间为不同的形式时 ,可以得到不同的 博弈结果 [ 31 ] . 1)策略空间为具有一个参数的 2阶酉矩阵 : U ^ (θ) = co s(θ/2) sin (θ/2) - sin (θ/2) cos(θ/2) , 式中 :θ∈[ 0,π]. 在这种情况下 ,互相背叛仍然是惟 一的 Nash均衡 ,但不是 Pareto最优. 即在这种最优 策略组合下 ,任何一个策略主体都不能以减少对方 收益为代价来增加自己的收益. 此时 ,量子博弈和经 典博弈没有区别; 2)策略空间为具有 2个参数的 2阶酉矩阵 U ^ (θ, <) = e i< cos(θ/2) sin (θ/2) - sin (θ/2) e - i< cos(θ/2) , 式中 :θ∈[ 0,π], <∈[ 0,π/2 ]. 在这种情况下 ,存在一个量子策略 : Q ^ = U ^ (0,π/2) = i 0 0 - i , 使得均衡 (Q ^ , Q ^ )是一个新的 Nash均衡 ,并且是 一个 Pareto最优. 因此,困境在量子策略下消失了; 特别地 , 当策略集被限制在 { U ^ (π, 0 ) , U ^ ( 0, 0) }时 , 量子博弈还原为经典博弈 , 且 U ^ (π, 0 ) , U ^ (0, 0)分别表示背叛与合作 ,记为D ^和 C ^ . 3)策略空间为一般的酉矩阵. 在这种情况下 , 对于任意给定的收益 (不大于 Pareto最优时的收 益 ) ,策略主体可以通过调整各自的量子策略达到 一个 Nash均衡 ,使得在这个 Nash均衡下 , 2个策略 主体的收益都为预先给定的收益. 上述讨论只考虑了策略酉矩阵对收益的影响 , 并没有考虑初始状态的纠缠所产生的影响. 考虑初 始策略组合 |CC〉经过酉算子 J ^纠缠在一起形成纠缠 态 |Ψ0 〉=U ^ |CC〉的情形 [ 2, 28 ] . 定义 J ^的形式为 J ^ = exp{ γi D ^ á D ^ /2},γ∈ [ 0,π/2 ], 式中 :γ是该量子博弈中状态纠缠程度的度量. 若 γ= 0,说明该博弈中的 2个策略主体没有纠缠 ,进行 博弈时完全不受对方的影响. 这种情况下的量子博 弈等价于使用混合策略的经典博弈. 若 γ≠0,此时 的 2个策略主体都不是完全理性 ,或者不是自私的 主体 ,他们在选择策略时还会考虑对方的因素 ,所以 就会出现纠缠的现象. 纠缠程度也是影响量子博弈的一个重要因素. 以收益矩阵为 3 0 5 1 的囚徒困境为例 : 1)当 0≤γ≤arcsin 1 /5时 , D ^ á D ^ ,即双方背 叛 ,仍是惟一的 Nash均衡 ; 2)当 arcsin 1 /5 <γ < arcsin 2 /5时, D ^ á Q ^和 Q ^ á D ^都是 Nash均衡. 此时Q ^仍然为U ^ (0,π/2); 3)当 arcsin 2 /5≤γ≤π/2时, Q ^ á Q ^是惟一的 Nash均衡,并且是 Pareto最优.此时囚徒困境被解决. 2. 3 其他量子博弈模型 量子翻硬币博弈和 Eisert量子博弈是两类非常 重要的量子博弈模型. 基于这 2种基本模型 ,其他一 些博弈的量子模型相继产生. 例如 ,性别之战 ( battle of sexes game)模型 [ 32235 ]、猎鹿博弈 ( stag hunt game) 模型 [ 36 ]、少数者博弈 (m inority game)模型 [ 37238 ]、伪 感应 ( p seudo telepathy game)模型 [ 39240 ]、Monty Hall 博弈模型 [ 41242 ]以及其他博弈模型 [ 43259 ] . 其中量子 Monty Hall博弈模型是比较典型的量子博弈模型. 所谓 Monty Hall问题 ,就是在一个名为 Monty 的大厅中 ,主人 A lice和客人 Bob进行一次博弈. 主 · 892 · 智 能 系 统 学 报 第 3卷
第4期 王龙等:量子博弈:新方法与新策略 ·299· 人Alice秘密地选择大厅里3扇门中的一个,并在其 并且m=(j+1+1)(mod3),n=(i+)(mod3).Bob 后放一件礼物.客人Bob随机地站在任意一个门 的跳变算子可以表示为 前.然后Alice打开除了Bob所站的门以外的任意 S=买I,Ⅱ)(1+卫10外 一扇没有礼物的门,告知Bob,那扇她打开的门后没 可以看出在|中,〉=|0ba)的情况下,当初始状 有礼物.此时Bob面临着2个选择:坚持他原来的选 态为纯态卿没有纠缠)时,对于1中,〉=10〉回 择或选择另一扇A lice未打开的门」 这个博弈初看起来似乎无论Bob最终如何选 方1o>++2yo5o)+D+12且A- 择,他都以相同的概率获得礼物.可事实并非如此 I.Alice使用的是一个经典的混合策略:等概率地选 从表1可以看出,Bob最好改变他初始的选择,这样 择任何一扇门,则得到和经典Monty Hall问题无异 更有可能赢得礼物.因此,博弈的公平性就成了问 的结果:Bob总可以选择改变主意来增加他获得礼 题.为了使博弈公平化,即当Bob在最后无论选取 物的可能.然而,当初态选择到最大纠缠状态时, 哪一个策略,他都以1/2的概率赢得礼物,可以引入 中,)=10)©(100〉+111)+122),如果取 量子策略来解决这个问题】 3 方 1 1 表1AIre和Bob可能选择的几种情况 2 2 Table 1 Possible choices of Alice and Bob 3-i /7 奖品所在门 2 4/ 45 博弈步骤 1 3 1 2 .1.ii 3+i万5+i A lice打开的门 2或3322或33 2 4N2 8 8 Bob起初的选择 111 1 1 1 Bob最后的选择 选择另一扇门坚持自己原来的选择 则可以证明,不论B,B如何在它们所在的策略集中 Bob的结果 输赢 赢 赢输输 取值,结果都是Bob将以12的概率赢得礼物,这样 Monty Halll问题就得到了解决 首先,建立模型.定义初始状态为|中,〉= 3量子博弈的近期研究热点 |oba〉,其中oa,b∈H,H是三维的H ilbert空间.a 表示礼物所在的那扇门的状态,b表示Bob将选择 31多人量子博弈 的门的状态,o表示Alice将打开的门的状态,系统 基于Eisert量子博弈模型,Benjam in等人I6o建 立了多人量子博弈模型.该模型如下: 的末态为中,》=BO(1⊙B⊙AI中,),A,B是酉变 对于N个策略主体进行2种策略选择的博弈 换,它们分别代表Alice放礼物和Bob起初选择门 这2个作用,0代表开门.B只能取2个算子的凸组 纠维算子介-e]其中Y∈I0n1当 合,代表Bob在博弈最后一步时的策略集是由经典 Y一时.即初始状态处于最大纠缠态时,为 的混合策略组成的,其中一个为单位算子,代表保持 原来选择:另一个为选择改变,称为跳变算子,其中 跳变算子的求法是很简单的,只要满足是一个西变 换,且限制在经典策略集时与经典模型相容即可.类 式中:i-[06-[9} 似地,可以对O进行计算,于是得到下面的结果: 6,⊙0,⊙…⊙0y 6=I*Ink1+∑1m前( N个 基于Benjam in的多人量子博弈模型,Du研究 式中:当≠≠k时1e|=1,其他情况下|e|=0, 了3人囚徒困境问题6),发现在适当的均衡下,该 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
人 A lice秘密地选择大厅里 3扇门中的一个 ,并在其 后放一件礼物. 客人 Bob随机地站在任意一个门 前. 然后 A lice打开除了 Bob所站的门以外的任意 一扇没有礼物的门 ,告知 Bob,那扇她打开的门后没 有礼物. 此时 Bob面临着 2个选择 :坚持他原来的选 择或选择另一扇 A lice未打开的门. 这个博弈初看起来似乎无论 Bob最终如何选 择 ,他都以相同的概率获得礼物. 可事实并非如此. 从表 1可以看出 ,Bob最好改变他初始的选择 ,这样 更有可能赢得礼物. 因此 ,博弈的公平性就成了问 题. 为了使博弈公平化 ,即当 Bob在最后无论选取 哪一个策略 ,他都以 1 /2的概率赢得礼物 ,可以引入 量子策略来解决这个问题. 表 1 Alice和 Bob可能选择的几种情况 Table 1 Possible cho ices of Alice and Bob 博弈步骤 奖品所在门 1 2 3 1 2 3 A lice打开的门 2或 3 3 2 2或 3 3 2 Bob起初的选择 1 1 1 1 1 1 Bob最后的选择 选择另一扇门 坚持自己原来的选择 Bob的结果 输 赢 赢 赢 输 输 首先 , 建 立 模 型. 定 义 初 始 状 态 为 |ψi 〉= | oba〉,其中 o, a, b∈H, H是三维的 H ilbert空间. a 表示礼物所在的那扇门的状态 , b表示 Bob将选择 的门的状态 , o表示 A lice将打开的门的状态 ,系统 的末态为 |ψf 〉=B ^′O ^ ( Iá B ^ á A ^ ) |ψi 〉, A ^ , B ^是酉变 换 ,它们分别代表 A lice放礼物和 Bob起初选择门 这 2个作用 , O ^代表开门. B ^′只能取 2个算子的凸组 合 ,代表 Bob在博弈最后一步时的策略集是由经典 的混合策略组成的 ,其中一个为单位算子 ,代表保持 原来选择;另一个为选择改变 ,称为跳变算子. 其中 跳变算子的求法是很简单的 ,只要满足是一个酉变 换 ,且限制在经典策略集时与经典模型相容即可. 类 似地 ,可以对O ^进行计算 ,于是得到下面的结果 : O ^ = ∑ijk l |εijk ‖n jk〉〈ljk | + ∑ jl |m jj〉〈ljj | , 式中 :当 i≠j≠k时 |εijk | = 1,其他情况下 |εijk | = 0, 并且 m = ( j + l + 1) (mod3) , n = ( i + l) (mod3). Bob 的跳变算子可以表示为 S ^ = ∑ijk l |εijl‖ijk〉〈ijk | + ∑ij | iij〉〈iij |. 可以看出在 |ψi 〉= | 0ba〉的情况下 ,当初始状 态为纯态 (即没有纠缠 ) 时 , 对于 |ψi 〉= | 0〉á 1 3 ( | 0〉+ | 1〉+ | 2〉) á 1 3 ( | 0〉+ | 1〉+ | 2〉)且 A ^ = I, A lice使用的是一个经典的混合策略 :等概率地选 择任何一扇门 ,则得到和经典 Monty Hall问题无异 的结果 : Bob总可以选择改变主意来增加他获得礼 物的可能. 然而 ,当初态选择到最大纠缠状态时 , |ψi 〉= | 0〉á 1 3 ( | 00〉+ | 11〉+ | 22〉) ,如果取 A ^ = 1 2 1 2 1 2 - 1 2 3 - i 7 4 2 1 + i 7 4 2 - 1 - i 7 4 2 - 3 + i 7 8 5 + i 7 8 , 则可以证明 ,不论B ^′, B ^如何在它们所在的策略集中 取值 ,结果都是 Bob将以 1 /2的概率赢得礼物 ,这样 Monty Hall问题就得到了解决. 3 量子博弈的近期研究热点 3. 1 多人量子博弈 基于 Eisert量子博弈模型 , Benjam in等人 [ 60 ]建 立了多人量子博弈模型. 该模型如下 : 对于 N 个策略主体进行 2种策略选择的博弈 , 纠缠算子 J ^ = exp i γ 2 σ^á N x , 其中 γ∈[ 0,π/2 ]. 当 γ= π 2 时 ,即初始状态处于最大纠缠态时 , J ^为 J ^ = 1 2 ( I ^á N + iσ^á N x ) , 式 中 : I ^ = 1 0 0 1 , σ^ x = 0 1 1 0 , σ^á N x = σ^ x á σ^ x á …á σ^ x N个 . 基于 Benjam in的多人量子博弈模型 , Du研究 了 3人囚徒困境问题 [ 61 ] ,发现在适当的均衡下 ,该 第 4期 王 龙 ,等 :量子博弈 :新方法与新策略 · 992 ·
·300· 智能系统学报 第3卷 博弈的困境可以消除.同时,Du还发现初始状态的 (ock~scissorpaper)模型为例,说明量子策略可以使 纠缠可以增加策略主体的收益.Chen建立了一个N 原本在经典博弈中不稳定的混合Nash均衡变得稳 人M种策略的量子博弈模型162!,并且发现当初始 定1.此外,ba还揭示了纠缠对量子博奔中的进 状态发生纠缠时,该博弈可能没有Nash均衡存在. 化稳定策略起着决定作用,纠缠的取值可以决定一 Zhou研究了连续变量策略的多人量子博弈模 个策略是否是进化稳定策略[4) 型[],指出在N人量子博弈中,初始状态的纠缠也 3.4退相干性(Decoherence) 可以使合作涌现.可以看出,多人量子博弈的研究 量子系统中的退相干过程是由于系统与周围环 是该领域的一个热点【,61,646) 境的内在联系产生的.当系统与周围环境或测量仪 3.2状态纠缠 器相互作用时,退相干现象就会发生,从而导致在实 从大量的研究工作中,可以看出初态的纠缠在 际系统中无相干性的状态.退相干性的研究在量子 解决量子博弈问题中起到了关键作用.纠缠把经典 信息领域具有重要意义, 世界里看似不相关的各个量综合在一起考虑.所以, 考虑两人Eisert博弈的退相干模型Is](N人博 研究一个量子博弈模型,通常都要讨论该模型中初 弈的退相干模型见]).带有退相干过程的量子信 始状态的纠缠对模型性质的影响.Eisert和Du2】 息流如图2所示 分别研究了初始状态的纠缠在Eisert量子博弈模型 中的重要作用,指出纠缠因子的取值会影响量子博 弈所表现出来的性质.之后,Du又进一步研究了纠 缠态对量子博奔性质的影响21.特别地,对于囚徒 可 困境模型,随着纠缠程度的增大,博弈的“经典特 decohcrence decohcrence channel channel 征转化为量子特征】 3.3进化稳定策略和平衡态 图2带有退相干过程的Eisert模型 设种群中有2种策略:原始策略和突变策略.原 Fig 2 Eisert model with decoherence 始策略称为进化稳定策略(evolutionarily stable strat- 初始状态用密度算子P。=丨中〉(中|= egy,ESS)6,是指如果当种群中所有成员都采用这 cC)(CC来表示.随后的过程按照图2所示的 种策略时,在自然选择的作用下,充分小的突变策略 信息流流向来进行。 将不能侵犯这个种群.ESS和Nash均衡是博弈论中 2个非常重要的概念.自然地,在量子博弈论中,有 )退相干,p=∑M.PM: 关它们的研究也是一个热点方向0,81 2)采用策略,A。=U4⊙UB)P。U,⊙UB)t: bal首次研究了量子博弈中的进化稳定策 3)退相干,B=∑M,M 略],并发现在对称双矩阵囚徒困境中,一组使用 量子策略的突变可能非常容易地入侵一个使用经典 4解纠缠,巴=, 式中:M.表示退相干因子.它的表示形式由选择的 ESS策略的种群.但是当量子策略的初态未发生纠 缠或当纠缠的优势未能得到充分体现时,这组突变 信道来决定,并且满足 ∑MM,=1.可以选择去 不能入侵使用经典ESS策略的种群.随后,gbal又 极化信道、相衰减信道、振幅衰减信道等 发现当博弈的形式从经典变为“量子之后,原来 在去极化信道中,Kaus算子mo=1-pl Nash均衡的稳定性也随之改变).那么,量子博弈 m1=Wp/30x,m2=p/30,m3=Np/30z,其中 对混合Nash均衡有没有影响呢?文献[72给出了 ox,o,0z是Pauli阵,且0≤p≤l此时M.司Mg= 一个肯定的回答.bal以量子“石头剪刀布” m,⊙m 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
博弈的困境可以消除. 同时 , Du还发现初始状态的 纠缠可以增加策略主体的收益. Chen建立了一个 N 人 M 种策略的量子博弈模型 [ 62 ] ,并且发现当初始 状态发生纠缠时 ,该博弈可能没有 Nash均衡存在. Zhou研究了 连续变量 策 略 的 多 人 量 子 博 弈 模 型 [ 63 ] ,指出在 N 人量子博弈中 ,初始状态的纠缠也 可以使合作涌现. 可以看出 ,多人量子博弈的研究 是该领域的一个热点 [ 44, 61, 64266 ] . 3. 2 状态纠缠 从大量的研究工作中 ,可以看出初态的纠缠在 解决量子博弈问题中起到了关键作用. 纠缠把经典 世界里看似不相关的各个量综合在一起考虑. 所以 , 研究一个量子博弈模型 ,通常都要讨论该模型中初 始状态的纠缠对模型性质的影响. Eisert [ 31 ]和 Du [ 28 ] 分别研究了初始状态的纠缠在 Eisert量子博弈模型 中的重要作用 ,指出纠缠因子的取值会影响量子博 弈所表现出来的性质. 之后 , Du又进一步研究了纠 缠态对量子博弈性质的影响 [ 25 ] . 特别地 ,对于囚徒 困境模型 ,随着纠缠程度的增大 ,博弈的“经典 ”特 征转化为“量子 ”特征. 3. 3 进化稳定策略和平衡态 设种群中有 2种策略 :原始策略和突变策略. 原 始策略称为进化稳定策略 ( evolutionarily stable strat2 egy, ESS) [ 67 ] ,是指如果当种群中所有成员都采用这 种策略时 ,在自然选择的作用下 ,充分小的突变策略 将不能侵犯这个种群. ESS和 Nash均衡是博弈论中 2个非常重要的概念. 自然地 ,在量子博弈论中 ,有 关它们的研究也是一个热点方向 [ 30, 68269 ] . Iqbal首次研究了量子博弈中的进化稳定策 略 [ 70 ] ,并发现在对称双矩阵囚徒困境中 ,一组使用 量子策略的突变可能非常容易地入侵一个使用经典 ESS策略的种群. 但是当量子策略的初态未发生纠 缠或当纠缠的优势未能得到充分体现时 ,这组突变 不能入侵使用经典 ESS策略的种群. 随后 , Iqbal又 发现当博弈的形式从“经典 ”变为“量子 ”之后 ,原来 Nash均衡的稳定性也随之改变 [ 71 ] . 那么 ,量子博弈 对混合 Nash均衡有没有影响呢 ? 文献 [ 72 ]给出了 一个肯定的回答. Iqbal以量子“石头 —剪刀 —布 ” ( rock2scissor2paper)模型为例 ,说明量子策略可以使 原本在经典博弈中不稳定的混合 Nash均衡变得稳 定 [ 73 ] . 此外 , Iqbal还揭示了纠缠对量子博弈中的进 化稳定策略起着决定作用 ,纠缠的取值可以决定一 个策略是否是进化稳定策略 [ 74 ] . 3. 4 退相干性 (Decoherence) 量子系统中的退相干过程是由于系统与周围环 境的内在联系产生的. 当系统与周围环境或测量仪 器相互作用时 ,退相干现象就会发生 ,从而导致在实 际系统中无相干性的状态. 退相干性的研究在量子 信息领域具有重要意义. 考虑两人 Eisert博弈的退相干模型 [ 75 ] (N 人博 弈的退相干模型见 [ 76 ] ). 带有退相干过程的量子信 息流如图 2所示. 图 2 带有退相干过程的 Eisert模型 Fig. 2 Eisert model with decoherence 初始 状 态 用 密 度 算 子 ρ0 = | φ〉〈φ | = J ^ |CC〉〈CC |J ^来表示. 随后的过程按照图 2所示的 信息流流向来进行. 1) 退相干 , ρ1 = ∑u M uρ0M u ; 2) 采用策略 ,ρ0 = (UA á UB )ρ0 (UA á UB ) ; 3) 退相干 , ρ3 = ∑u M uρ2M u ; 4) 解纠缠 ,ρ4 = J ^ρ3 J ^ . 式中 :M u 表示退相干因子. 它的表示形式由选择的 信道来决定 ,并且满足 ∑u M uM u = 1 . 可以选择去 极化信道、相衰减信道、振幅衰减信道等. 在去极化信道中 , Kraus算子 m0 = 1 - p I, m1 = p /3σX , m2 = p /3σY , m3 = p /3σZ , 其中 σX ,σY ,σZ 是 Pauli阵 ,且 0≤p≤1. 此时 M u ≡M ij = m i á m j . · 003 · 智 能 系 统 学 报 第 3卷
第4期 王龙等:量子博弈:新方法与新策略 ·301 在相衰减信道中,Kaus算子mo=1-pL 子博弈可以与量子控制相结合,使得退相干作用被 a】8} 受控量子系统所控制,保证量子博弈的预期结果.另 外,还可以考虑量子博弈策略集为无穷维Hilbert空 在振幅衰减信道中,Kraus算子: 间时,相应的Nash均衡问题.这方面的工作在经典 博弈论中己比较完善.但量子博弈与经典博弈有着 本质区别,这一方向的研究可以加深对量子博弈内 上述3种信道中出现的参数p表示加入退相干 在机理的认识.不仅如此,量子博弈还有助于量子计 过程的概率 算机的研究,为量子计算机的实现搭建良好的理论 如果采用经典囚徒困境中的收益矩阵,可以得 平台.同时,量子博弈在量子生物、量子市场、量子计 到Alice的收益为 算等许多领域都得到了成功的应用.综上所述,量子 =Pcc pPDD Poc sPcD, 博弈开拓了博弈论的疆界,并且成功地应用于许多 式中:P,=tr(P|i)j).通过画图分析可知,随着 相关领域.最重要的是,量子博弈的研究将促进不同 概率p的增加,原来的Nash均衡不会改变,只是Ak 学科的交叉和融合,为解决经典博弈问题开辟新的 ice的收益会减小 思路 除此之外,有关量子博弈的复制动力学及 参考文献: 熵m-1、噪声对量子博弈的影响601量子博奔的 实现1等方面的研究也是量子博弈中很有意义 [1 VON NEUMANN J,MORGENSTERN O.The theory of games and econom ic behavior [M ]3rd ed Princepon: 的研究方向 Princeton University Press,1953. 4结论与展望 [2 EISERT J,W LKENS M,LEW ENSTEN M.Quantum games and quantum strategies[J ]Phys Rev Lett,1999, 较之经典的演化博弈而言,量子博弈在非演化 83:3077-3080 情形下,在不加入任何新的机制(如Nowak提出的 [3 MEYER D.Quantum strategies[J].Phys Rev Lett,1999. 亲缘互惠、间接互惠等)的条件下,可以促进双方的 82:1052-1055 收益,使得博弈双方摆脱困境.然而,并非人人都理 [4]PDTROW SKI E W.Quantum market games EB/OL ] 解和掌握量子力学,博弈双方的策略选择酉算子这 [2001-04-02 http://arxiv org/abs/quant-ph/0104006 一基本假设还没有被大部分生物学家和社会学家所 接受.因此有必要讨论经典演化博弈促进合作的机 [5]PDTROW SKI E W,LADKOW SKI S Quantum market 制与量子博弈相关量之间的联系或对应关系,进而 games[J].Physica A,2002,312:208-216 发掘量子博弈更深层次的生物学与社会学意义.另 [6]PDTROW SKI E W,LADKOW SKI S Quantum english 外,当前量子博弈的研究主要集中在对封闭量子系 auctions[J]Physica A,2003,318:505-515. 统的研究中.但事实上,封闭量子系统只是真实量子 [7WA ITE S Quantum investing [M]London:Texere Pub- lishing,2002 系统的理想化模型.真实量子系统总与一个或多个 [8]SADKOW SKI J Giffen paradoxes in quantum market 量子系统相互作用,因此是开放的.这样的量子系统 games[J].Physica A,2003,324:234-240 会受到退相干的作用,使得系统塌缩,从而使量子系 [9]PDTROW SKI E W.Fixed point theorem for smple quan- 统变为经典系统,量子博弈的特性也就随之消失了· tum strategies in quantum market games [J]Physica A, 因此考虑退相干作用对量子博弈的影响是一个有意 2003,324:196-200 义的研究方向.特别地,为了达到预期的博弈结果, [10 ]GOLDENBERGL,VA DMAN L,W IESNER S Quantum 系统之间的相互作用是需要调节和控制的,因此量 gambling[J].Phys Rev Lett,1999,82:3356-3359 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
在相衰减信道中 , Kraus算子 m0 = 1 - p I, m1 = p 1 0 0 0 , m2 = p 0 0 0 1 . 在振幅衰减信道中 , Kraus算子 : m0 = 1 2 0 1 - p , m1 = 0 p 0 0 . 上述 3种信道中出现的参数 p表示加入退相干 过程的概率. 如果采用经典囚徒困境中的收益矩阵 ,可以得 到 A lice的收益为 $A = rPCC + pPDD + tPD C + sPCD , 式中 : Pij = tr(ρ4 | i〉〈j | ). 通过画图分析可知 ,随着 概率 p的增加 ,原来的 Nash均衡不会改变 ,只是 A l2 ice的收益会减小. 除此之外 , 有关量子 博弈的复 制动力 学及 熵 [ 77279 ]、噪声对量子博弈的影响 [ 26227, 80 ]、量子博弈的 实现 [ 81283 ]等方面的研究也是量子博弈中很有意义 的研究方向. 4 结论与展望 较之经典的演化博弈而言 ,量子博弈在非演化 情形下 ,在不加入任何新的机制 (如 Nowak提出的 亲缘互惠、间接互惠等 )的条件下 ,可以促进双方的 收益 ,使得博弈双方摆脱困境. 然而 ,并非人人都理 解和掌握量子力学 ,博弈双方的策略选择酉算子这 一基本假设还没有被大部分生物学家和社会学家所 接受. 因此有必要讨论经典演化博弈促进合作的机 制与量子博弈相关量之间的联系或对应关系 ,进而 发掘量子博弈更深层次的生物学与社会学意义. 另 外 ,当前量子博弈的研究主要集中在对封闭量子系 统的研究中. 但事实上 ,封闭量子系统只是真实量子 系统的理想化模型. 真实量子系统总与一个或多个 量子系统相互作用 ,因此是开放的. 这样的量子系统 会受到退相干的作用 ,使得系统塌缩 ,从而使量子系 统变为经典系统 ,量子博弈的特性也就随之消失了. 因此考虑退相干作用对量子博弈的影响是一个有意 义的研究方向. 特别地 ,为了达到预期的博弈结果 , 系统之间的相互作用是需要调节和控制的 ,因此量 子博弈可以与量子控制相结合 ,使得退相干作用被 受控量子系统所控制 ,保证量子博弈的预期结果. 另 外 ,还可以考虑量子博弈策略集为无穷维 H ilbert空 间时 ,相应的 Nash均衡问题. 这方面的工作在经典 博弈论中已比较完善. 但量子博弈与经典博弈有着 本质区别 ,这一方向的研究可以加深对量子博弈内 在机理的认识. 不仅如此 ,量子博弈还有助于量子计 算机的研究 ,为量子计算机的实现搭建良好的理论 平台. 同时 ,量子博弈在量子生物、量子市场、量子计 算等许多领域都得到了成功的应用. 综上所述 ,量子 博弈开拓了博弈论的疆界 ,并且成功地应用于许多 相关领域. 最重要的是 ,量子博弈的研究将促进不同 学科的交叉和融合 ,为解决经典博弈问题开辟新的 思路. 参考文献 : [ 1 ] VON NEUMANN J, MORGENSTERN O. The theory of games and econom ic behavior [ M ]. 3 rd ed. Princeton: Princeton University Press, 1953. [ 2 ] EISERT J, W ILKENS M, LEW ENSTEIN M. Quantum games and quantum strategies[ J ]. Phys Rev Lett, 1999, 83: 307723080. [ 3 ]MEYER D. Quantum strategies[J ]. Phys Rev Lett, 1999, 82: 105221055. [ 4 ] P IOTROW SKI E W. Quantum market games [ EB /OL ]. [ 2001204202 ]. http: / / arxiv. org/ abs/ quant2ph /0104006 v1. [ 5 ] P IOTROW SKI E W , LADKOW SKI S. Quantum market games[J ]. Physica A, 2002, 312: 2082216. [ 6 ] P IOTROW SKI E W , LADKOW SKI S. Quantum english auctions[J ]. Physica A, 2003, 318: 5052515. [ 7 ]WA ITE S. Quantum investing[M ]. London: Texere Pub2 lishing, 2002. [ 8 ] SLADKOW SKI J. Giffen paradoxes in quantum market games[J ]. Physica A, 2003, 324: 2342240. [ 9 ] P IOTROW SKI E W. Fixed point theorem for simp le quan2 tum strategies in quantum market games [J ]. Physica A, 2003, 324: 1962200. [ 10 ] GOLDENBERG L, VA IDMAN L, W IESNER S. Quantum gambling[J ]. Phys Rev Lett, 1999, 82: 335623359. 第 4期 王 龙 ,等 :量子博弈 :新方法与新策略 · 103 ·
·302· 智能系统学报 第3卷 [11]ZHANG S Y,LIC F,WAN LL,et al Optical realization [J]Science,.2006,314:1560-1563 of quantum gambling machine EB /OL ][2000-01-06 ] [25 ]DU J F,LIH,XU X D,SHIM J,ZHOU X Y,HAN R htp://arxiv org/abs/quantph/0001008 D.Entanglement playing a dom inating ole in quantum [12 ]HWANG W Y,AHN D,HWANG S W.Quantum gam- games [J]Phys LettA,2001,289:9-15. bling using wo nonorthogonal states [J ]Phys Rev A, [26]ZDEM R S K,SH MAMURA J,MOTO N.Quantum ad- 2001,64:064302 vantage does not survive in the presence of a corrupt [13]HWANGW Y,MATSUMOTO K Quantum gambling u- source:optmal strategies in smultaneous move games sing three nonorthogonal states [J ]Phys Rev A,2002, [J].Phys Lett A,2004,325:204-211 66:052311 [27]DU J F,XU XD,LIH Playing prisoner's dilemma with [14 ]W IITE F M C Quantum 2player gambling and correlated quantum rules [J].Fluctuation and Noise Letters,2002, payoff EB /OL ][2002-06-16]htp://arxiv org/abs/ 2(4):389-2903 quantph?papemum =0207085. [28]DU J,LIH,XU X,SHIM,WU J,ZHOU X,HAN R [15 SEGRE G Law of excluded quantum gambling strategies Expermental realizaton of quantum games on a quantum EB /OL ]2001-04-17].http://arxiv org/abs/quant- computer [J ]Phys Rev Lett,2002,88:137792 ph/0104080v [29 ]N IELSEN M A,CHUANG IL Quantum computation and [16]PDTROW SKIEW,LADKOW SKIS Quantum computer. quantum inomation [M ]Cambridge:Cambridge Univer an appliance for playing market games EB/OL ][2003- sity Press,2000,45-68 0505]htp://arxiv org/abs/quantph/0305017 [30 ]LEE C,JOHNSON N E Efficiency and fomalisn of quan- [17]PATEL A.Testing quantum dynam ics in genetic infma- tum games [J]Phys RevA,2003,25:022311. tion processing [J]Joumal of Genetics,2001,80(1): [31]EISERT J,W LKENSM.Quantum games [J].Joumal of 39-43 Modem0 ptics.2000,47:2543-2556 [18]G MCHER PW.Decisons,decisions,decisions choo- [32 ]MAR NATIO L,WEBER T A Quantum approach to stat sing a biological science of choice [J].Neuron,2002,36 ic games of complete infomation [J]Phys LettA,2000, (2):323-332 272(5-6):291-303 [19]G MCHER PW.Decisions,uncertainty,and the brain- [33 ]NAWAZ A,TOOR A H Worst-case payoffs in quantum the science of neuroeconom ics M].Camnbridge:MIr battle of sexes game EB/OL ][2001-11-20 ]htp:// Press,2003 arxiv org/PS cache/quantph/pdf/0110/0110096v2 pdf [20 ]COLLUM G Systems of bgical systems neuroscience and [34 ]DU J F,XU X D,LIH,ZHOU X Y,HAN R D.Nash e- quantum bgic [J ]Foundations of Science,2002,7(1- quilibrium in the quantum battle of sexes game[EB/OL ] 2):49-72 [2000-10-12 ]http://arxiv org/abs/quant-ph/0010050 [21 KEYL M.Fundamentals of quantum infomation theory [35 ]DU J F,LIH,XU X D,SHIM J,ZHOU X Y,HAN X [J ]Physics Reports,2002,369(5):431-548 Y.Remark on quantum battle of the sexes game EB/ [22 ]DEUTSCH D.Quantum theory of probability and decisions OL ][2001-03-02 ]htp://arxiv org/abs/quantph/ [C]//Poceedings of the Royal Society of London A, 0103004 [S1],1999:3129-3137. [36]10YOTA N.Quantization of the stag hunt game and the [23 HORODECKI R,HORODECKI M,HORODECKI P Nash equilibrium EB/OL ]2003-07-04].htp://arxiv Quantum inomation isomophisn:beyond the dilemma of org/PS_cache/quantph/pdf/0307/0306929vl.pdf scylla of ontobgy and charybdis of instrumentalis EB/ [37]CHEN Q,WANG Y,LU J T,WANG K L Nplayer OL ]2003-05-05 ]http://arxiv org/abs/quantph/ quantum minority game[J]PhysLettA,2004,327:98- 0305024 102 [24 ]NOWAKM A.Five rules for the evolution of cooperation [38 FL IINEY A P,GREENTREE A D.Coalitions in the 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
[ 11 ] ZHANG S Y,L IC F, WAN L L, et al. Op tical realization of quantum gambling machine [ EB /OL ]. [ 2000201206 ]. http: / / arxiv. org/ abs/quant2ph /0001008. [ 12 ] HWANG W Y, AHN D, HWANG S W. Quantum gam2 bling using two nonorthogonal states [ J ]. Phys Rev A, 2001, 64: 064302. [ 13 ] HWANGW Y, MATSUMOTO K. Quantum gambling u2 sing three nonorthogonal states[ J ]. Phys Rev A, 2002, 66: 052311. [ 14 ]W ITTE F M C. Quantum 22p layer gambling and correlated pay2off [ EB /OL ]. [ 2002206216 ]. http: / / arxiv. org/ abs/ quant2ph? papernum = 0207085. [ 15 ] SEGRE G. Law of excluded quantum gambling strategies [ EB /OL ]. [ 2001204217 ]. http: / / arxiv. org/ abs/quant2 ph /0104080v1. [ 16 ] P IOTROW SKI EW , LADKOW SKI S. Quantum computer: an app liance for p laying market games [ EB /OL ]. [ 20032 05205 ]. http: / / arxiv. org/ abs/quant2ph /0305017. [ 17 ] PATEL A. Testing quantum dynam ics in genetic informa2 tion p rocessing [J ]. Journal of Genetics, 2001, 80 (1) : 39243. [ 18 ]GL IMCHER P W. Decisions, decisions, decisions: choo2 sing a biological science of choice [J ]. Neuron, 2002, 36 (2) : 3232332. [ 19 ]GL IMCHER PW. Decisions, uncertainty, and the brain— the science of neuroeconomics [ M ]. Cambridge: M IT Press, 2003. [ 20 ]COLLUM G. Systems of logical system s: neuroscience and quantum logic [J ]. Foundations of Science, 2002, 7 ( 12 2) : 49272. [ 21 ] KEYL M. Fundamentals of quantum information theory [J ]. Physics Reports, 2002, 369 (5) : 4312548. [ 22 ]DEUTSCH D. Quantum theory of p robability and decisions [ C ] / /Proceedings of the Royal Society of London A, [ S. l. ], 1999: 312923137. [ 23 ] HORODECKI R, HORODECKI M, HORODECKI P. Quantum information isomorphism: beyond the dilemma of scylla of ontology and charybdis of instrumentalism [ EB / OL ]. [ 2003205205 ]. http: / / arxiv. org/ abs/quant2ph / 0305024. [ 24 ]NOWAKM A. Five rules for the evolution of cooperation [J ]. Science, 2006, 314: 156021563. [ 25 ]DU J F, L I H, XU X D, SH IM J, ZHOU X Y, HAN R D. Entanglement p laying a dominating role in quantum games [J ]. Phys Lett A, 2001, 289: 9215. [ 26 ] ZDEM IR S K, SH IMAMURA J, IMOTO N. Quantum ad2 vantage does not survive in the p resence of a corrup t source: op timal strategies in simultaneous move games [J ]. Phys Lett A, 2004, 325: 2042211. [ 27 ] DU J F, XU X D, L IH. Playing p risoner’s dilemma with quantum rules [J ]. Fluctuation and Noise Letters, 2002, 2 (4) : 38922 903. [ 28 ]DU J, L I H, XU X, SH IM, WU J, ZHOU X, HAN R. Experimental realization of quantum games on a quantum computer [J ]. Phys Rev Lett, 2002, 88: 137792. [ 29 ]N IELSEN M A, CHUANG IL. Quantum computation and quantum information [M ]. Cambridge: Cambridge Univer2 sity Press, 2000, 45268. [ 30 ]LEE C, JOHNSON N F. Efficiency and formalism of quan2 tum games [J ]. Phys Rev A, 2003, 25: 022311. [ 31 ]EISERT J, W ILKENSM. Quantum games [J ]. Journal of Modern Op tics, 2000, 47: 254322556. [ 32 ]MAR INATTO L, W EBER T. A Quantum app roach to stat2 ic games of comp lete information [J ]. PhysLettA, 2000, 272 (526) : 2912303. [ 33 ]NAWAZ A, TOOR A H. Worst2case payoffs in quantum battle of sexes game [ EB /OL ]. [ 2001211220 ]. http: / / arxiv. org/PS_cache /quant2ph /pdf/0110 /0110096v2. pdf. [ 34 ]DU J F, XU X D, L IH, ZHOU X Y, HAN R D. Nash e2 quilibrium in the quantum battle of sexes game [ EB /OL ]. [ 2000210212 ]. http: / / arxiv. org/ abs/quant2ph /0010050. [ 35 ]DU J F, L I H, XU X D, SH IM J, ZHOU X Y, HAN X Y. Remark on quantum battle of the sexes game [ EB / OL ]. [ 2001203202 ]. http: / / arxiv. org/ abs/quant2ph / 0103004. [ 36 ] TOYOTA N. Quantization of the stag hunt game and the Nash equilibrium [ EB /OL ]. [ 2003207204 ]. http: / / arxiv. org/PS_cache /quant2ph /pdf/0307 /0306929v1. pdf. [ 37 ] CHEN Q, WANG Y, L IU J T, WANG K L. N2p layer quantum minority game[J ]. Phys Lett A, 2004, 327: 982 102. [ 38 ] FL ITNEY A P, GREENTREE A D. Coalitions in the · 203 · 智 能 系 统 学 报 第 3卷
第4期 王龙等:量子博弈:新方法与新策略 ·303· quantm minority game:classical cheats and quantum bul- [J]Phys LettA,2005,240:77-86 Iies[J1 Phys Lett A,2007,362:132-137. [53 ]RAVON T,VA DMAN L The three-box paradox revisited [39]CABELLO A.Twoplayer quantum pseudotelepathy based EB/OL [2006-08-06 ]htp://arxiv org/abs/quant- on recent all-versus-nothing violations of bcal realis [J]. ph/0606025v2 Phys Rev A,2006,72:022302 [54 ]MA KOW SKIM,PDTROW SKI E W.Quantum cat's di- [40 ]TAFL DV CH A,HEHNER E C R Programm ing telepa- lemma:an example of intransitivity in a quantm game thy:mplementing quantum non-bcality games[EB/OL ] [J]PhysLettA,2006,355:250-254 2007-07-11 http://arxiv org/abs/quant-ph/0697. [55 DBAL A,TOOR A H Backwards-induction outcome in a 1527v1. quantum game[J ]Phys Rev A,2002,65:052328 [41 ]FL IINEYA P,ABBOTTD.Quantum version of the monty [56 ]LIC F,ZHANG Y S,HUANG Y F,GUO GC Quantum hall problem [J ]Phys Rev A,2002,65:062318 strategies of quantum measurements J ]Phys Lett A, [42]D'AR ANO GM,GLL L D,KEYM,WERNER R F, 2001,279:257-260 KUMMERER B,MAASSEN H The quantum monty hall [57]PIETAR NEN A.Quantum bgic and quantum theory in a problem [J].Quant Inf and Comput,2002,2:355-366 game-theoretic perspective [J]Open Systems and r [43 DBAL A,TOOR A H Quantum repeated games [J ] mation Dynam ics,2002,9:273-290. Phys LettA,2002,300:541-546 [58 ]LIY,QN G,ZHOU X Y,DU J E.The application of [44 DBAL A,TOOR A H.Quantum cooperative games[J asmmetric entangled states in quantum games[J].Phys Phys LettA,2002,293:103-108 LetA,2006,355:447-451. [45 STOHL ER M,F ISCHBACH E Non-transitive quantum [59 ]AHMED E,ELETTREBYM F,HEGAZIA S On quan- games[EB /OL ][2003-07-09 ]htp://arxiv org/abs/ tum team games[J ]Inter J Theo Phys,2006,45(5): quant-ph/0306971. 907-913. [46]HUBERMAN B A,HOGG T Quantum solution of coordi- [60 ]BENJAM N S C,HA YDEN P M.Multiplayer quantum nation problems EB /OL ][2003-06-17].htp://arxiv games[J].Phys Rev A,2001,64:030301. org/abs/quantph?papemum =0306112 [61]DU J F,LIH,XU X D,ZHOU X Y,HAN R D.Entan- [471DEM R S K,SH MAMURA J,MOR IKOSHI F,MOTO glement enhanced multiplayer quantum games[J]Phys N.Dynam ics of a discoordination game with classical and LettA,2002,302:229-233 quantum correlations[J].Phys Lett A,2004,333:218- [62 ]CHEN B,MA Y J,LONG GL.Quantum game with re- 231 stricted matrix strategies EB/OL ][2004-05-28 ]ht [48 FL IINEY A P.ABBOTT D.Quantum Duels and Truels p://arxiv org/abs/quantph//0301062 v2 EB /OL ][2003-05-12 ]http://arxiv org/abs/quant- [63 ]ZHOU J,MA L,LI Y Multip layer Quantum games with ph/0305058vl continuous-variable strategies [J Phys Lett A,2005, [49 ]FL IINEY A P,ABBOTT D.Quantum models of parron- 339:10-17. do's games[J]Physica A,2003,324:152-156 [64]HAN Y J,ZHANG Y S,GO G C W state and Green- [50 WANGX B,KW EKL C,OH C H Quantum roulette:an bergerHome-Zeilinger state in quantum three-person pris- extended quantum strategy [J].Phys Lett A,2004,277: oner's dilemma [J].PhysLett A,2002,295:61-64 44-46 [65MA YJ,LONG GL,DENG F G,LIF,ZHANG SX [51 CABELLO A,CALSAM IG A J.Quantum entanglement. Cooperative three-and fourplayer quantum games [J]. indistinguishability,and the absentm inded driver's prob- Phys LettA,2002,301:117-124 lem [J].Phys Lett A,2005,336:441-447 [66 ]BULUTA IM,FUJ WARA S,HASEGAWA S Quantum [52 ]QN G,CHEN X,SUN M,ZHOU X,DU J.Appropriate games in ion traps [J ]Phys Lett A,2006,358:100- quantization of asymmetric games with continuous strategies 104 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
quantum minority game: classical cheats and quantum bul2 lies[J ]. Phys Lett A, 2007, 362: 1322137. [ 39 ]CABELLO A. Two2p layer quantum p seudotelepathy based on recent all2versus2nothing violations of local realism [J ]. Phys Rev A, 2006, 72: 022302. [ 40 ] TAFL IOV ICH A, HEHNER E C R. Programming telepa2 thy: imp lementing quantum non2locality games[ EB /OL ]. [ 2007207211 ]. http: / / arxiv. org/ abs/quant2ph /0697. 1527v1. [ 41 ] FL ITNEYA P, ABBOTTD. Quantum version of the monty hall p roblem [J ]. Phys Rev A, 2002, 65: 062318. [ 42 ] D’AR IANO GM, GILL L D, KEY M, W ERNER R F, KUMMERER B, MAASSEN H. The quantum monty hall p roblem [J ]. Quant Inf and Comput, 2002, 2: 3552366. [ 43 ] IQBAL A, TOOR A H. Quantum repeated games[ J ]. Phys Lett A, 2002, 300: 5412546. [ 44 ] IQBAL A, TOOR A H. Quantum cooperative games[J ]. Phys Lett A, 2002, 293: 1032108. [ 45 ] STOHLER M, F ISCHBACH E. Non2transitive quantum games[ EB /OL ]. [ 2003207209 ]. http: / /arxiv. org/ abs/ quant2ph /0306971. [ 46 ]HUBERMAN B A, HOGG T. Quantum solution of coordi2 nation p roblems [ EB /OL ]. [ 2003206217 ]. http: / /arxiv. org/ abs/quant2ph? papernum = 0306112. [ 47 ]ZDEM IR S K, SH IMAMURA J, MOR IKOSH I F, IMOTO N. Dynam ics of a discoordination game with classical and quantum correlations[J ]. Phys Lett A, 2004, 333: 2182 231. [ 48 ] FL ITNEY A P, ABBOTT D. Quantum Duels and Truels [ EB /OL ]. [ 2003205212 ]. http: / / arxiv. org/ abs/quant2 ph /0305058v1. [ 49 ] FL ITNEY A P, ABBOTT D. Quantum models of parron2 do’s games[J ]. Physica A, 2003, 324: 1522156. [ 50 ]WANG X B, KW EK L C, OH C H. Quantum roulette: an extended quantum strategy [J ]. Phys Lett A, 2004, 277: 44246. [ 51 ] CABELLO A, CALSAM IGL IA J. Quantum entanglement, indistinguishability, and the absent2m inded driver’s p rob2 lem [J ]. Phys Lett A, 2005, 336: 4412447. [ 52 ]Q IN G, CHEN X, SUN M, ZHOU X, DU J. App rop riate quantization of asymmetric gameswith continuous strategies [J ]. Phys Lett A, 2005, 240: 77286. [ 53 ]RAVON T, VA IDMAN L. The three2box paradox revisited [ EB /OL ]. [ 2006208206 ]. http: / / arxiv. org/ abs/ quant2 ph /0606025v2. [ 54 ]MAKOW SKIM, P IOTROW SKI E W. Quantum cat’s di2 lemma: an examp le of intransitivity in a quantum game [J ]. Phys Lett A, 2006, 355: 2502254. [ 55 ] IQBAL A, TOOR A H. Backwards2induction outcome in a quantum game[J ]. Phys Rev A, 2002, 65: 052328. [ 56 ]L I C F, ZHANG Y S, HUANG Y F, GUO G C. Quantum strategies of quantum measurements [ J ]. Phys Lett A, 2001, 279: 2572260. [ 57 ] P IETAR INEN A. Quantum logic and quantum theory in a game2theoretic perspective [ J ]. Open System s and Infor2 mation Dynam ics, 2002, 9: 2732290. [ 58 ]L I Y, Q IN G, ZHOU X Y, DU J F. The app lication of asymmetric entangled states in quantum games[ J ]. Phys Lett A, 2006, 355: 4472451. [ 59 ]AHMED E, ELETTREBYM F, HEGAZI A S. On quan2 tum team games[ J ]. Inter J Theo Phys, 2006, 45 ( 5) : 9072913. [ 60 ]BENJAM IN S C, HAYDEN P M. Multi2p layer quantum games[J ]. Phys Rev A, 2001, 64: 030301. [ 61 ]DU J F, L I H, XU X D, ZHOU X Y, HAN R D. Entan2 glement enhanced multip layer quantum games[ J ]. Phys Lett A, 2002, 302: 2292233. [ 62 ]CHEN B, MA Y J, LONG G L. Quantum game with re2 stricted matrix strategies [ EB /OL ]. [ 2004205228 ]. ht2 tp: / / arxiv. org/ abs/quant2ph / /0301062 v2. [ 63 ] ZHOU J, MA L, L I Y. Multip layer Quantum games with continuous2variable strategies [ J ]. Phys Lett A, 2005, 339: 10217. [ 64 ]HAN Y J, ZHANG Y S, GUO G C. W state and Green2 berger2Horne2Zeilinger state in quantum three2person p ris2 oner’s dilemma [J ]. Phys Lett A, 2002, 295: 61264. [ 65 ]MA Y J, LONG G L, DENG F G, L I F, ZHANG S X. Cooperative three2 and four2p layer quantum games [ J ]. Phys Lett A, 2002, 301: 1172124. [ 66 ]BULUTA IM, FUJ IWARA S, HASEGAWA S. Quantum games in ion trap s [ J ]. Phys Lett A, 2006, 358: 1002 104. 第 4期 王 龙 ,等 :量子博弈 :新方法与新策略 · 303 ·