第7卷第3期 智能系统学报 Vol.7 No.3 2012年6月 CAAI Transactions on Intelligent Systems Jun.2012 D0I:10.3969/j.i8sn.1673-4785.201112014 网络出版t地址:htp://www.cnki.net/kcma/detail/23.1538.TP.20120529.1446.001.html 概率联系数化的原理及其在概率推理中的应用 赵森烽1,赵克勤2,3 (1.浙江工业大学之江学院理学系,浙江杭州310024;2.诸暨市联系数学研究所,浙江诸暨311811;3.浙江大学 非传统安全与和平发展研究中心,浙江杭州310058) 摘要:为创建一种新的概率理论使概率推理更为客观,借助简单随机试验探讨随机性的本质,说明了事件的随机 性是2个事物相互联系的一种属性.具有随机性的事件称为随机事件,随机事件A与A成对存在,但可以分为主事 件和伴随事件,由此导出主概率和伴随概率,它们分别对应于主事件的大数概率和即或概率.用联系数表示这2个 概率,该联系数称为联系概率(复概率),联系概率中的i是主事件和伴随事件相互转换的纽带,并且对产生的负概率 作了解释,举例说明了联系概率在概率推理中的应用. 关键词:概率推理;随机事件;联系数;主事件;伴随事件;联系概率(复概率);负概率 中图分类号:TP18文献标志码:A文章编号:16734785(2012)030200-06 The principle of a connection number in probability and its application in probabilistic reasoning ZHAO Sengfeng',ZHAO Keqin2.3 (1.Department of Science,Zhijiang College of Zhejiang University of Technology,Hangzhou 310024,China;2.Zhuji Institute of Con- nection Mathematics,Zhuji 311811,China;3.Center for Non-Traditional Security and Peaceful Development Studies,Zhejiang Uni- versity,Hangzhou 310058,China) Abstract:For more objective probabilistic reasoning,a new probability theory was created in this paper.Through exploring the nature of randomness of some simple randomized trials,it can be known that the randomness of events has two interlinked attributes.The two random events A and A always exist in a pair,and these random events can be divided into main events and adjoining events.Their respective probabilities are main probability (large number probability)and adjoining probability (sudden probability).A connection number was used to describe them.The probability of the connection number was called connection probability (complex probability).The i in the connec- tion probability is a key parameter for the transformation of main events and adjoining events in the random experi- ment.The meaning of negative probability was explained,the application of connection probability in probabilistic reasoning was also illustrated in this paper. Keywords:probabilistic reasoning;random events;connection number;main events;adjoining events;connection probability (complex probability);negative probability 不确定性是人工智能面临的挑战之一山.目前 联系数是其中的基本数学工具.文献「14]最早指出集 处理不确定性的成熟的数学理论是概率论,而概率 对分析与概率论的联系和区别,主要区别在于:概率 是概率论的基石21. 论侧重于从“不确定性可以在一定条件下(例如让随 集对分析(set pair analysis,SPA)是一种新的处 机试验次数n→∞)加以确定”这一角度来描述和分 理不确定性的系统数学理论,已得到广泛应用3), 析随机不确定性,而SPA同时从“不确定性可以在一 定条件下加以确定”以及“不确定性的本质是不确定 收稿日期:2011-12-19.网络出版日期:201205-29. 基金项目:国家社会科学基金重点资助项目(08ASH006):教育部哲 的,必须加以客观承认”这2个方面来描述和分析不 学社会科学研究重大课题攻关项目(08JZ①0021-D). 确定性.文献[5]又指出经典概率统计理论中的概率 通信作者:赵克勤.E-mail:zizhaok@sohu.com
第3期 赵森烽,等:概率联系数化的原理及其在概率推理中的应用 ·201· 仅与联系数中的同一度等价.文献[15]指出了概率联 验中不发生而发生A的可能性大小1-P(A)称为A 系数化的可行性和必要性,可行性是指概率P是一个 的即时或然概率,简称即或概率 在[0,1]取值的实数,因而可以联系数化成P+(1 显然,定义2中关于随机事件A的即或概率其实 P)i;另一方面,把概率P联系数化成联系数P+(1- 就是随机事件A的大数概率,这一点后面还要提到, P)也是必要的,因为概率是从宏观层次上对随机不 1.2概率的联系数表示 确定性的数学描述,所以显示出随机不确定性的确定 根据文献[13],随机事件A在某次随机试验中 性;但在微观层次上,随机不确定性其本质是不确定 发生的可能性大小P(A)与不发生的可能性大小 的,因此,当需要同时从宏观与微观2个层次上考虑 1-P(A)可以联系数化为 随机不确定性的程度、作用和影响时,把概率P联系 P.(A)=P(A)+[1-P(A)]i 数化成P+(1-P)i就显得完全必要.此外文献[15] 式中:P.(A)表示联系数意义下事件A在某次随机试 还指出,把概率用联系数的形式表示在理论和实践上 验中发生的可能性大小P(A)(A的大数概率)与不发 都有重要的意义. 生的可能性大小1-P(A)(A的即或概率)的联系和 本文在上述工作的基础上进一步用实验阐明概 (也称联系概率),其原理和定义将在下文阐述, 率联系数化的原理,定义随机试验中具有随机性的 事件为随机事件,借助实验说明事件的随机性来自 2随机性的来源与随机事件 事物与事物的联系,随机事件因此成对存在.但可以 2.1实验 根据某种准则(例如关注程度、出现的先后、参考事 设一盒子里仅装有a个白球(a≥1),令事件A 件的设定等)分为主事件和伴随事件,由此又导出 是“任抽一个球是白球”,显然A是必然事件,即 主概率和伴随概率,它们分别对应于主事件发生的 P(A)=1.现在向盒子中放入b个黑球(b≥1),这时 大数概率(随机试验中次数频率稳定性的概率)和 的事件A就从必然事件变为随机事件,相应的 主事件的即或概率(随机试验中主事件不发生但伴 P(A)=1变为P(A)<1. 随事件发生的概率).用联系数表示主事件的大数 从以上实验中得到以下结论 概率和主事件的即或概率,称此联系数为联系概率 1)基于现象的结论.事件A的随机性来自于盒 (复概率),联系概率(复概率)中的i是主事件和伴 子中加人了另一种颜色的球,因为实验表明:当盒子 随事件在随机试验过程中相互转换的纽带,最后用 中只有白球时,事件A“任抽一个球是白球”是必然 实例说明联系概率(复概率)在概率推理中的应用. 事件;但当盒子中加入黑球后,事件A就成为了随 机事件,这说明事件A的随机性来自于黑球, 1 概率的联系数表示 2)对现象进行抽象后的结论.事件的随机性来 联系数是集对分析中给出的一个概念,其基本 自2个事物的联系,是事物联系的一种属性.因为实 形式1是 验表明:当盒子中只有一种颜色的球时,事件A“任 u a bi, 抽一个球是白球”是必然事件;但当盒子中加人另 式中:a,b∈[0,1],a+b=1,i∈[-1,1]. 一种颜色的球后,事件A就成为了随机事件,这说 1.1大数概率与即或概率 明事件A的随机性来自于2个事物间的联系, 1.1.1大数概率 结论2)可以较为规范地表述为:事件A的随机 定义1设A表示随机事件,则A在某次随机试 性源自于随机试验中2个互不相容事件A与A的一 验中发生的可能性大小称为概率,用P(A)表示,0≤ 种联系.由此得到了一个新的随机事件定义, P(A)≤1.基于概率论中的大数定律可知,P(A)是A 2.2随机事件 在随机试验次数n趋于无穷大时A出现的频率:(k 2.2.1随机事件的定义 定义3具有随机性的事件称为随机事件, 为A出现的频数)的近似值,本文把这种基于大数定 已有的概率统计文献把随机事件定义为可能出 律的概率称为随机事件A的大数概率,简称概率, 现或可能不出现的事件2,16,这是人们对于事件的 1.1.2即或概率 随机性停留在现象表面的一种认识这种认识虽然 定义2若随机事件A在某次随机试验中发生 具有客观性,但容易引导人们把注意力集中于一个 的概率为P(A),0≤P(A)≤1,则A在某次随机试 事件上,而忽视了与这一事件密切相关的另一事件
·202. 智能系统学报 第7卷 进而忽视这2个事件的相互关系.事实上,正是由于 2个不同事物的同时存在,并由这2个事物引发的2 Pb=Pa)e,则有P() 个互不相容事件的相互关系导致了随机性.当然,在 a+bi=P(A)+P(A)i.这里i的定义域与第1节中 忽视了事件的随机性的来源以后,也就无需对这2 的定义域有所不同,原因在下文解释 个随机事件出现与否的影响因素进行分析. 定义6基于事件的联系概率,把随机试验中 由定义3易得出以下推论, 主事件A的概率P(A)和伴随事件的概率P(A)写成 推论随机事件必具有随机性, 联系数P(A)+P(A)i,称此联系数为随机事件A与 证明用反证法,设随机事件没有随机性,但这 A的联系概率(复概率),记为 与定义2相矛盾,所以随机事件必具有随机性, .(A)( 2.2.2随机事件成对存在定理 定理任一随机试验中的随机事件成对存在, 定义7基于概率的联系概率(复概率).把随 证明设事件A是某一随机试验中的随机事 机事件A的大数概率P(A)与A的即或概率P(A)和 件,根据定义1和前述推论可知,该随机事件A必具 (:e[片',小)的乘积联系起来的代数和称 有随机性.再根据实验显示的事件随机性的产生原理 为联系概率(复概率) 可知,随机性是2个事件的一种关系,因此在随机试 在同一问题中,基于事件的联系概率(复概率) 验中的随机事件A与随机事件A成对存在,证毕 和基于概率的联系概率(复概率),其实是同一联系 这里需要注意的是,上述定理指的是随机事件 概率的2种不同表述,说明如下, 的存在状态,并非指随机事件的表现状态.事实上, 例1设盒子中有2个白球,3个黑球,令事件 当2个随机事件是互不相容事件时,就存在的意义 A为“任抽一球是白球”,事件A为“任抽一球是黑 上成对存在,否则不称其为随机事件:但在表现意义 球”,把A看作主事件,则A是A的伴随事件,A与A 上则互不相容,一个出现时,另一个就不出现. 是互不相容事件,A∩A=⑦.从基本事件空间这个 由于随机事件成对存在,为研究方便起见,再给 角度看,P(A)=2/5,P(A)=3/5,任抽一个球的结 出定义4. 果或是A发生或是A发生;从事件角度看,P(A)= 定义4在随机试验中,根据问题的要求被首 2/5,P(A)=3/5,所以P(A)+P(A)i=2/5+ 先关注的事件称为主事件(也称第一关注事件或正 (3/5)i;从概率的角度看,因为P(A)=2/5,所以 事件);与主事件互不相容的另一事件称为该主事 1-P(A)=3/5,同样有P(A)+P(A)i=2/5+ 件的伴随事件(也称第二关注事件或负事件),统称 (3/5)i. 伴随事件 在上述联系概率(复概率)中,i代表不确定性, 根据定义4可知,在2个互为成对的随机事件 A与A中,主事件A是首先关注的事件,伴随事件则 定义在[分,上,根据不同情况取不同 与主事件有关也就是说,用A表示主事件时,A就 的值.这是因为就随机试验的结果看,P。(A)= 是A的伴随事件;反之,用A表示主事件时,A就是 P(A)+P(A)i有-1(伴随事件发生)与1(主事件 A的伴随事件 发生)2个值,解方程P.(A)=P(A)+P(A)i=-1 由于随机事件A与A成对存在,又因互不相容 而在某次随机试验中只能随机出现其中之一,所以 得i=份:解方程P()=P)+P代)i 在本文中,用P(A,A)表示A或A出现的概率,并约 1得i=1,由此才能刻画出每一次随机试验的实际 定(A,A)中A为主事件,A表示A的伴随事件,由此 结果.例如在任抽一球是白球时,这时联系概率 导出联系概率的概念 P.(A)=P(A)+P(A)i=2/5+(3/5)i=1, 3联系概率(复概率) 解得这时i=1,当实际抽到的球是黑球时,站在主事 件A的角度看,其相应的联系概率P.(A)=P(A)+ 定义5基于联系数形式的联系概率(复概 P(A)i=2/5+(3/5)i=-1,解得这时i=-7/3.如 率),用联系数a+bi形式表示的随机事件A的概 果以A作为主事件,把A看成A的伴随事件,则相 率称为联系概率(复概率)· 应的联系概率(复概率)为P。(A)=P(A)+ 若用P。(A)表示联系概率(复概率),令a= P(A)i=3/5+(2/5)i.这时如果任抽一球是黑球
第3期 赵森烽,等:概率联系数化的原理及其在概率推理中的应用 ·203· 则有 P(HE)=P(EL H)P(H) (1) P.(A)=P(A)+P(A)i=3/5+(2/5)i=1, P(E) 解得i=1;如果任抽一球是白球,则有P.(A)= 式中:P(E)是前提E的概率,P(H)是H的先验概 P(A)+P(A)i=3/5+(2/5)i=-1,解得i=-4. 率,P(E1H)是H成立时E出现的条件概率. 可见在同一问题中选择不同的事件作为主事 若一个证据E支持多个假设H1,H2,…,H,即 件,把与之不相容的另一事件作为该主事件的伴随 If E Then H,i=l,2,…,n, 事件,它们的联系概率表达式不同,i的取值也随之 则有贝叶斯公式得 不同,这是容易理解的.但由此又引出了一个新概 P(H:I E)= (H)P(E1H),i=1,2,…,m, 念一负概率,为此给出以下定义. ∑P(H)P(EIH) 定义8随机试验中,设事件A为主事件,而实 际试验结果出现事件A,A∩A=⑦,则称出现随机事 (2) 件A的概率P(A)为相对于主事件A的负概率. 若有多个证据E1,E2,…,Em和多个结论H1,H2, 由定义8可见,所谓主事件A的负概率并非是 …,H,并且每个证据都以一定程度支持结论,则 P(A)的负值,也就是P(A)≠-P(A).有关负概率 P(H:IEE2…Em)= 的性质及其运算规侧将另文讨论。 P(E)P(E2).P(E)P( 另外注意的是,联系概率(复概率)的2种记法 ∑P(E,IH)P(E,IH)…P(E.IH)P(H) P(A,A)与P.(A)是等同的,只是P(A,A)从形式上 (3) 表明了成对的2个随机事件,而P.(A)则省略了对 伴随事件A在形式上的直接表达. 因此,只要已知H:的先验概率P(H)及H:成 立时证据E1,E2,…,Em出现的条件概率 4联系概率(复概率)在不确定性推 P(EH),P(E2H),.P(E) 理中的应用 就可利用式(3)计算出在出现E,E2,…,Em情况下 H的条件概率P(HIE,E2…Em). 文献[17]介绍的基于概率的不确定推理方法 例2设H,、H2、H3为3个结论,E是支持这些 如下 结论的证据,且已知 设有如下产生式规则: P(H1)=0.3,P(H2)=0.4,P(H3)=0.5, If E Then H, P(E1H)=0.5,P(E|H2)=0.3, 则证据(或前提条件)E不确定性的概率为P(E),基 P(E1H3)=0.4. 于概率的不确定性推理的目的是,求出在证据E下结 求P(HIE)、P(H2IE)和P(H3IE)的值. 论H发生的概率P(HIE),这时采用式(1)计算, 根据式(2)可得 P(H)×P(EIH) P(HE)=P(xP(EI )+P(x P(E)+P(P( 0.15 0.15 0.15+0.12+0.2=0.47 =0.32 (4) 同理可得 事件丑,且H与丑是互不相容事件,所以 P(H2IE)=0.26,P(H3IE)=0.43. P(丑)=1-P(H);因此,以H作为主事件,丑.为 计算结果表明,由于证据E的出现,H,成立的可能 伴随事件,则以H作为主事件的联系概率为P(H, 性稍有增加,而H2、H成立的可能性却有不同程度 H丑)=P(H)+[1-P(H)]i,也就是有 的下降 P(H1)=0.3+0.7i, 以上是文献[17]中的计算结果,下面按本文给 P.(H2)=0.4+0.6i,P.(H3)=0.5+0.5i 出的概率联系数化的角度进行计算分析 由于0.7>0.3,0.6>0.4,0.5=0.5,所以在计算i 1)由于P(H)≠1(k=1,2,3),所以H是随机 的取值后,P.(H)有可能比P(H)大,也有可能比 事件,根据随机事件的成对存在定理,可知存在随机 P(H)小.这一情况包含了前面式(2)所得到的“由
·204 智能系统学报 第7卷 于证据E的出现,H,成立的可能性稍有增加,而 形式,得 H2、H成立的可能性却有不同程度的下降”这个结 P.(E1H1)=0.5+0.5i, 果;但由于没有考虑证据E的作用,所以计算结果 P.(E1H2)=0.3+0.7i, 过于粗糙,为此进入第2)步. P.(E1H3)=0.4+0.6i 2)先把P(E1H)改写成联系概率P.(E1H)的 再根据式(2)得 P(H)×P(EIH) P(HIE)=P(x P(E )+P(H x P(E)+P()x P() (0.3+0.7i)(0.5+0.5) (0.3+0.7i)(0.5+0.5)+(0.4+0.6i)(0.3+0.7i)+(0.5+0.5)(0.4+0.6)= 0.15+0.5i+0.352 0.47+1.46i+1.07 根据集对分析,如果不计不确定性的层次性,可令 个概念之后,这种不确定性分析就具体表现在对 i=子,于是上面的计算结果简化为 的分析上.但如何结合一个具体的问题展开有关 0.15+0.5i+0.3520.15+0.85i 的分析,包括的物理意义、构成与分解、取值规律、 0.47+1.46i+1.072=0.47+2.53i 层次特性、以及对推理结果的影响主要来自1次不 由于以上计算结果中的分母是由3个归一化的 确定性还是2次不确定性等,则要具体和深入研究 联系数相加而成,多出了因归一化而产生的3-1= 不言而喻,联系概率的提出和应用,为在不确定性推 2个,其原因可看如下数值例子: 理中开展证据不确定性和结论不确定性的分析提供 P(A)=0.2,P(B)=0.3,P(A)+P(B)=0.5, 了一个平台. 把P(A)联系数化为联系概率,则得P.(A)=0.2+ 0.8i,同理有P。(B)=0.3+0.7i,按普通加法运算 5结束语 法则有 本文引进大数概率和即或概率的概念,借助实 P.(A)+P.(B)= 验揭示了事件的随机性源自于事物(事件)与事物 (0.2+0.8)+(0.3+0.7i)=0.5+1.5i, (事件)的关系,给出了随机事件成对存在定理和联 由于把P(A)+P(B)=0.5联系数化得0.5+0.5i, 系概率(复概率)的概念(之所以也称联系概率为复 所以要从0.5+1.5i中减去2-1=1个.为此在 概率,是因为集对分析联系数a+bi在形式上与复 0.47+2.53i中减去2个i,得计算结果为 数一样),并且指出了负概率的意义(以主事件A为 0.15+0.85i 参考事件时出现事件A的可能性大小).所有这些 0.47+0.53i =0.32+0.68. (5) 新的概念,为概率论的理论和应用创新开辟了新途 将式(5)与式(4)对照,看出只要把式(4)的 径,也为人工智能不确定性推理提供了新思路.至于 0.32联系数化为0.32+0.68i就是式(5).同理有 在已知P(A)情况下如何通过i的分析和联系概率 P(H21E)=0.26+0.74i, (复概率)的计算,预测和调控随机试验中A与A的 P(H3IE)=0.43+0.57i. 转换,将在另文进行研究 因此可以作如下分析。 1)由于0.68>0.32,0.74>0.26,0.57> 参考文献: 0.43,所以H1、H2、H3成立的不确定性大于成立的 [1]李德毅.不确定性人工智能[M].北京:国防工业出版 可能性. 社,2005:1400. 2)计算过程显示出,计及证据E后的结论H,、 [2]王梓坤,概率论基础及其应用[M].北京:科学出版社, H2、H,中含有2次不确定性,因为在计算结果中含 1979:218-219. 有2.这与直观相符,因为证据E本身具有不确定 [3]赵克勤.集对分析及其初步应用[M].杭州:浙江科技出 版社,2000:4464. 性,结论H1、H2、H在不计及证据E时已具有不确 [4]赵克勤,宣爱理.集对论一一种新的不确定性理论方 定性(1次不确定性),在证据E下的结论H、H2、H3 法与应用[J小.系统工程,1996,14(1):18-23, 当然就更具有不确定性(2次不确定性). ZHAO Keqin,XUAN Aili.Set pair theory-a new theory 基于概率的不确定性推理分析的难点在于其中 method of non-define and its applications[J].Systems En- 的证据不确定性和结论不确定性,有了联系概率这 gineering,1996,14(1):18-23
第3期 赵森烽,等:概率联系数化的原理及其在概率推理中的应用 ·205 [5]赵克勤.集对分析的不确定性理论在AI中的应用J]. [14]赵克勤.试论集对分析与概率论的关系[C]/数学及其 智能系统学报,2006,1(2):16-25. 应用文集长沙:湖南科技出版社,1995:253 ZHAO Keqin.The application of uncertainty systems theory [15]赵克勤.二元联系数A+B的理论基础与基本算法及在 of set pair analysis(SPA)in the artificial intelligence[J]. 人工智能中的应用[J].智能系统学报,2008,3(6): CAAI Transactions on Intelligent Systems,2006,1(2): 476-486. 16-25. ZHAO Kegin.The theoretical basis and basic algorithm of [6]王文圣,金菊良,丁晶,等.水资源系统评价新方法一 binary connection A Bi and its application in AI[J]. 集对评价法[J].中国科学E辑:技术科学,2009,39 CAAI Transactions on Intelligent Systems,2008,3(6): (9):1529-1534. 476-486. WANG Wensheng,JIN Juliang,DING Jing,et al.A new [16]赵秀恒,米立民.概率论与数理统计[M].北京:高等教 approach to water resources system assessment-set pair a- 育出版社,2008:1-28. nalysis method[J].Science in China,Series E:Technolog- [17]蔡自兴,徐光佑.人工智能及其应用[M].北京:清华大 ical Sciences,2009,39(9):1529-1534. 学出版社,2010:114-116. [7]ZHOU Ze'nan.Decision support system based on set pair 作者简介: analysis and its application [J].Engineering Sciences, 赵森烽,男,193年生,主要研究方向 2007,5(3):7681. 为信息与计算、集对分析(联系数学)等。 [8]GAO Feng,CHEN Yingwu.A project risk ranking approach based on set pair analysis[J].Engineering Sciences,2006. 4(3):89-93. [9]沈定珠.体育用联系数学[M].深圳:中国教育文化出版 社,2007:1-191. [10]王文圣,李跃清,金菊良,等.水文水资源集对分析 赵克勤,男,1950年生,研究员,浙 [M].北京:科学出版社,2010:1-183. 江大学非传统安全与和平发展中心集 [11]米虹,赵克勤.非传统安全集对分析[M].北京:知识产 对分析研究所所长,中国人工智能学会 权出版杜,2010:1-218 理事、人工智能基础专业委员会副主 [12]刘保相.粗糙集对分析决策模型与应用[M].北京:科 任、集对分析联系数学专业筹备委员会 学出版社,2010:1-185. 主任.主要研究方向为联系数学,1989 [13]郭瑞林.作物育种同异理论与方法[M].北京:中国农 年提出集对分析(联系数学),出版《集对分析及其初步应 业科学技术出版社,2011:1-294. 用》专著1部,发表学术论文90余篇