第13卷第1期 智能系统学报 Vol.13 No.I 2018年2月 CAAI Transactions on Intelligent Systems Feb.2018 D0:10.11992/tis.201711032 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20180118.1409.002.html 机制主义人工智能理论 一种通用的人工智能理论 钟义信 (北京邮电大学计算机学院,北京100876) 摘要:现行人工智能研究取得了许多进展,但存在“深度上浅层化、广度上碎片化和体系上封闭化”的重要缺陷。这 不是改进算法或者提高硬件性能所能解决的问题,而是要在科学观方法论上寻找根源。本文依据“科学观→方法 论一→研究模型→研究途径一→基本概念→基本原理”这个顶天立地的研究纲领,总结了信息科学的科学观,提炼了信息 生态方法论:在新的科学观和方法论指导下构筑了体现智能生长全过程的研究模型,发现了智能生长的共性机制,确 立了机制主义研究途径,进而澄清和匡正了信息(特别是语义信息)、感知、知识、认知、基础意识、情感、理智、综合 决策等一系列基础概念,总结了实现信息-知识一智能转换的一组基本原理,创建了机制主义人工智能理论。而且 证明了:长期三分而立的结构主义(人工神经网络)、功能主义(专家系统)、行为主义(感知动作系统)三大人工智能理 论可在机制主义人工智能理论框架内实现和谐统一:机制主义是生成基础意识、情感、理智三位一体高等人工智能的 科学途径;机制主义人工智能理论是通用型的人工智能理论。 关键词:信息生态方法论:智能生长机制:机制主义研究途径:通用型人工智能理论 中图分类号:TP18文献标志码:A文章编号:1673-4785(2018)01-0002-17 中文引用格式:钟义信.机制主义人工智能理论一一种通用的人工智能理论J.智能系统学报,2018,13(1):2-18. 英文引用格式:ZHONG Yixin.Mechanism-based artificial intelligence theory:a universal theory of artifical intelligence J.CAAl transactions on intelligent systems,2018,13(1):2-18. Mechanism-based artificial intelligence theory:a universal theory of artifical intelligence ZHONG Yixin (School of Computer Science,Beijing University of Posts and Telecommunications,Beijing 100876,China) Abstract:While artificial intelligence(AI)research has made a great deal of progress,this field also faces severe draw- backs,including being shallow in depth,piece-like in width,and isolation among the pieces.These drawbacks cannot be overcome by optimizing algorithm design and improving hardware performance.The real causes of Al's serious prob- lems arise from its scientific view and improperly employed methodology.Following the general guidelines for scientif- ic research architecture,ie.,"scientific view and methodology on the top,concepts and principles at the bottom,and the model and approach in between,"in this paper,we summarize the scientific view of AI and define the methodology of information ecology.In accordance with the methodology above,information research cannot stop at the information level,but must continue to the product levels-the knowledge and intelligence levels.Based on this understanding,we design a subject-object interaction model for AI research,propose a mechanism approach to Al,identify and re-build the concepts and principles underlying the entirety of information science,and establish a mechanism-based Al theory.In- terestingly,we found that the three AI schools of thought that have operated in isolation from each other for decades- structuralism-based AI(the artificial neural network),functionalism-based AI(the expert system),and behaviorism- based Al(the sensor-motor system)-become harmonious components within the mechanism-based AI theory.Moreover, we also prove that the mechanism-based AI approach is also appropriate for the advanced AI work that unifies the primary consciousness,emotion,and intellect.We thus conclude that the mechanism-based AI theory provides a gener- al theory of artificial intelligence. Keywords:methodology of information ecology;mechanism of intelligence growth;mechanism approach;general the- ory of artificial intelligence 收稿日期:2017-11-28.网络出版日期:2018-01-18. 经典物质科学的研究形成了一套完整的科学观 基金项目:国家自然科学基金项目(60873001,60575034,60496327, 和方法论,即以“物质”为基本研究对象的机械唯物 69982001,69171023,68872014). 通信作者:钟义信.E-mail:yx@bupt.edu.cn 科学观和以“分而治之”为特征的机械还原方法论
DOI: 10.11992/tis.201711032 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20180118.1409.002.html 机制主义人工智能理论—— 一种通用的人工智能理论 钟义信 (北京邮电大学 计算机学院,北京 100876) 摘 要:现行人工智能研究取得了许多进展,但存在“深度上浅层化、广度上碎片化和体系上封闭化”的重要缺陷。这 不是改进算法或者提高硬件性能所能解决的问题,而是要在科学观方法论上寻找根源。本文依据“科学观→方法 论→研究模型→研究途径→基本概念→基本原理”这个顶天立地的研究纲领,总结了信息科学的科学观,提炼了信息 生态方法论;在新的科学观和方法论指导下构筑了体现智能生长全过程的研究模型,发现了智能生长的共性机制,确 立了机制主义研究途径,进而澄清和匡正了信息(特别是语义信息)、感知、知识、认知、基础意识、情感、理智、综合 决策等一系列基础概念,总结了实现信息-知识-智能转换的一组基本原理,创建了机制主义人工智能理论。而且 证明了:长期三分而立的结构主义 (人工神经网络)、功能主义 (专家系统)、行为主义 (感知动作系统) 三大人工智能理 论可在机制主义人工智能理论框架内实现和谐统一;机制主义是生成基础意识、情感、理智三位一体高等人工智能的 科学途径;机制主义人工智能理论是通用型的人工智能理论。 关键词:信息生态方法论;智能生长机制;机制主义研究途径;通用型人工智能理论 中图分类号:TP18 文献标志码:A 文章编号:1673−4785(2018)01−0002−17 中文引用格式:钟义信. 机制主义人工智能理论——一种通用的人工智能理论[J]. 智能系统学报, 2018, 13(1): 2–18. 英文引用格式:ZHONG Yixin. Mechanism-based artificial intelligence theory: a universal theory of artifical intelligence[J]. CAAI transactions on intelligent systems, 2018, 13(1): 2–18. Mechanism-based artificial intelligence theory: a universal theory of artifical intelligence ZHONG Yixin (School of Computer Science, Beijing University of Posts and Telecommunications, Beijing 100876, China) Abstract: While artificial intelligence (AI) research has made a great deal of progress, this field also faces severe drawbacks, including being shallow in depth, piece-like in width, and isolation among the pieces. These drawbacks cannot be overcome by optimizing algorithm design and improving hardware performance. The real causes of AI’s serious problems arise from its scientific view and improperly employed methodology. Following the general guidelines for scientific research architecture, i.e., “scientific view and methodology on the top, concepts and principles at the bottom, and the model and approach in between, ” in this paper, we summarize the scientific view of AI and define the methodology of information ecology. In accordance with the methodology above, information research cannot stop at the information level, but must continue to the product levels-the knowledge and intelligence levels. Based on this understanding, we design a subject-object interaction model for AI research, propose a mechanism approach to AI, identify and re-build the concepts and principles underlying the entirety of information science, and establish a mechanism-based AI theory. Interestingly, we found that the three AI schools of thought that have operated in isolation from each other for decadesstructuralism-based AI (the artificial neural network), functionalism-based AI (the expert system), and behaviorismbased AI (the sensor-motor system)-become harmonious components within the mechanism-based AI theory. Moreover, we also prove that the mechanism-based AI approach is also appropriate for the advanced AI work that unifies the primary consciousness, emotion, and intellect. We thus conclude that the mechanism-based AI theory provides a general theory of artificial intelligence. Keywords: methodology of information ecology; mechanism of intelligence growth; mechanism approach; general theory of artificial intelligence 经典物质科学的研究形成了一套完整的科学观 和方法论,即以“物质”为基本研究对象的机械唯物 科学观和以“分而治之”为特征的机械还原方法论。 收稿日期:2017−11−28. 网络出版日期:2018−01−18. 基金项目:国家自然科学基金项目 (60873001, 60575034, 60496327, 69982001, 69171023, 68872014). 通信作者:钟义信. E-mail:zyx@bupt.edu.cn. 第 13 卷第 1 期 智 能 系 统 学 报 Vol.13 No.1 2018 年 2 月 CAAI Transactions on Intelligent Systems Feb. 2018
第1期 钟义信:机制主义人工智能理论 一种通用的人工智能理论 3 在整个近代科学研究历程中,这种科学观和方法论 1通用人工智能理论的创新研究思路 获得了极其普遍的成功应用,使近代科学的研究领 域越分越细致、研究越来越深入,促成了近代科学 面对一个熟悉而具体的研究课题,人们通常可 的大发展与大繁荣。 以采取轻车熟路,依规而行”的惯常做法。但是,面 20世纪中叶以来,信息科学(智能科学是它的 对一项创新性极强的研究课题,这种做法就不再可 核心、前沿和制高点)在世界范围内迅猛崛起,成为 行了。在这种情况下,人们必须研究和发展一套正 信息时代的标志性学科川。 确清晰而且系统完整的创新研究纲领。 信息对象与物质对象既有联系又有原则性的不 鉴于当前人工智能研究存在的主要问题是: 同,因此信息科学应当遵循信息科学的科学观和方 1)在研究广度上碎片化;2)在研究深度上浅层化: 法论进行研究。但是由于意识通常落后于存在,方 3)在研究体系上封闭化。所有这些问题共同的根 法论通常落后于实际研究的需要,而且研究信息科 源是“分而治之”机械还原方法论,后者是机械唯物 学的人员都是在机械唯物科学观和机械还原方法论 科学观在宏观研究方法上的反映。因此,人工智能 熏陶下成长起来的,因此,面对人工智能这类开放 理论的创新研究无法回避科学观和方法论的问题, 的复杂信息系统研究的时候,人们自然就按照“分而 需要采取表1所示的“顶天立地“的研究纲领。 治之的方法论思想来处理:把复杂的智能系统分解 表1研究纲领 为“结构、功能、行为”3个侧面,展开结构模拟(人工 Table 1 The research programs 神经网络)-刀、功能模拟(物理符号系统)1和行为 模拟(感知动作系统)82的研究,形成了人工智能 名称 地位 解释 研究的三大途径和流派。 科学观 顶层 科学研究的天际源头 经过数十年的研究与发展,人工智能研究的 方法论 顶层 科学研究的云端龙头 3种途径各自都取得了不少意义重大的进展,产生 研究模型 中层 科学研究的全局蓝图 了一批阶段性的重要成果。但是与此同时,人工智 研究途径 中层 科学研究的宏观导向 能的研究也面临着十分严峻的挑战:虽然3种研究 基本概念 底层 理论大厦的基本支柱 途径的目标都是探讨智能的人工实现,然而,它们 之间却互不认可%,2122,坚持各自为战,未能形成研 基本原理 底层 大厦支柱的相互关联 究的合力,妨碍了人工智能统一理论和通用方法的 理论体系 结果(成果) 基础理论的整体大厦 形成:而且,三者都严重忽视了智能的重要基础- 1.1 在顶层,创新“科学观和方法论”:把握通用人 信息、意识和情感的研究。可见,人工智能的研究虽 工智能理论研究的源头和龙头 然取得了不少耀眼的成果,但整体上并未真正成熟。 智能(无论是人类智能还是人工智能)是一个 面对这种情况,一批有识之士积极推动人工智 极其深刻的研究对象,触及人类思维能力的深层奥 能研究的改革,试图建立人工智能的统一理论。其 秘;人的大脑是一类堪称“小宇宙的系统,很少有能 中最有代表性的是Russell、Norvig和Nilsson等人 的工作。Russell和Norvig2于1995年出版了篇幅 够与之比肩的复杂对象。这样一种十分深刻异常复 超过1000页的长篇巨著Artificial intelligence:a 杂的研究,必须从科学观和方法论这个研究的源头 modern approach,Nilsson2也在1998年出版了新 和驾驭全局的龙头展开深入研究。只有高屋建瓴, 著Artificial intelligence:a new synthesis。前者试图 才能势如破竹,而且一览无余。 提出新的研究途径(modern approach)来实现3种 另一方面,人工智能研究之所以形成“三方割 人工智能理论的统一,后者希望利用新的集成方法 据”的碎片化、浅层化和封闭化的格局,根本的原因 (new synthesis)来建立人工智能的统一理论。遗憾 也正是因为人们遵循了“分而治之”所体现的机械唯 的是,他们只是把3种人工智能的研究成果直接地 物科学观和机械还原方法论。因此,为了有效变革 “拼接”在Agent的身上,而没有找到实现统一的理 人工智能理论研究的现状,就必须从反思人工智能 论路径。 研究的“科学观和方法论”这个科学研究的“源头”和 因此,创建“结构-功能-行为”和谐融通、“意识 “龙头”做起,才有成功的可能。 情感-理智”三位一体的通用人工智能理论,是一个 1.2在中层,创新“研究模型和研究途径”:洞察通 尚未完成而又必须完成的重大研究任务。这是一个 用人工智能的全局和进路 内涵深刻、意义深远,需要从源头出发而且贯通全 正确的科学观可以启迪正确的方法论,有了正 程的巨大的创新研究任务。 确的科学观和方法论的导引,就可以确保研究工作
在整个近代科学研究历程中,这种科学观和方法论 获得了极其普遍的成功应用,使近代科学的研究领 域越分越细致、研究越来越深入,促成了近代科学 的大发展与大繁荣。 20 世纪中叶以来,信息科学 (智能科学是它的 核心、前沿和制高点) 在世界范围内迅猛崛起,成为 信息时代的标志性学科[1]。 信息对象与物质对象既有联系又有原则性的不 同,因此信息科学应当遵循信息科学的科学观和方 法论进行研究。但是由于意识通常落后于存在,方 法论通常落后于实际研究的需要,而且研究信息科 学的人员都是在机械唯物科学观和机械还原方法论 熏陶下成长起来的,因此,面对人工智能这类开放 的复杂信息系统研究的时候,人们自然就按照“分而 治之”的方法论思想来处理:把复杂的智能系统分解 为“结构、功能、行为”3 个侧面,展开结构模拟 (人工 神经网络) [2-7] 、功能模拟 (物理符号系统) [8-17]和行为 模拟 (感知动作系统) [18-20]的研究,形成了人工智能 研究的三大途径和流派。 经过数十年的研究与发展,人工智能研究的 3 种途径各自都取得了不少意义重大的进展,产生 了一批阶段性的重要成果。但是与此同时,人工智 能的研究也面临着十分严峻的挑战:虽然 3 种研究 途径的目标都是探讨智能的人工实现,然而,它们 之间却互不认可[18, 21-22] ,坚持各自为战,未能形成研 究的合力,妨碍了人工智能统一理论和通用方法的 形成;而且,三者都严重忽视了智能的重要基础—— 信息、意识和情感的研究。可见,人工智能的研究虽 然取得了不少耀眼的成果,但整体上并未真正成熟。 面对这种情况,一批有识之士积极推动人工智 能研究的改革,试图建立人工智能的统一理论。其 中最有代表性的是 Russell 、Norvig 和 Nilsson 等人 的工作。Russell 和 Norvig[23]于 1995 年出版了篇幅 超过 1 000 页的长篇巨著 Artificial intelligence: a modern approach,Nilsson[24]也在 1998 年出版了新 著 Artificial intelligence: a new synthesis。前者试图 提出新的研究途径 (modern approach) 来实现 3 种 人工智能理论的统一,后者希望利用新的集成方法 (new synthesis) 来建立人工智能的统一理论。遗憾 的是,他们只是把 3 种人工智能的研究成果直接地 “拼接”在 Agent 的身上,而没有找到实现统一的理 论路径。 因此,创建“结构–功能–行为”和谐融通、“意识– 情感–理智”三位一体的通用人工智能理论,是一个 尚未完成而又必须完成的重大研究任务。这是一个 内涵深刻、意义深远,需要从源头出发而且贯通全 程的巨大的创新研究任务。 1 通用人工智能理论的创新研究思路 面对一个熟悉而具体的研究课题,人们通常可 以采取“轻车熟路,依规而行”的惯常做法。但是,面 对一项创新性极强的研究课题,这种做法就不再可 行了。在这种情况下,人们必须研究和发展一套正 确清晰而且系统完整的创新研究纲领。 鉴于当前人工智能研究存在的主要问题是: 1) 在研究广度上碎片化; 2) 在研究深度上浅层化; 3) 在研究体系上封闭化。所有这些问题共同的根 源是“分而治之”机械还原方法论,后者是机械唯物 科学观在宏观研究方法上的反映。因此,人工智能 理论的创新研究无法回避科学观和方法论的问题, 需要采取表 1 所示的“顶天立地”的研究纲领。 表 1 研究纲领 Table 1 The research programs 名称 地位 解释 科学观 顶层 科学研究的天际源头 方法论 顶层 科学研究的云端龙头 研究模型 中层 科学研究的全局蓝图 研究途径 中层 科学研究的宏观导向 基本概念 底层 理论大厦的基本支柱 基本原理 底层 大厦支柱的相互关联 理论体系 结果 (成果) 基础理论的整体大厦 1.1 在顶层,创新“科学观和方法论”:把握通用人 工智能理论研究的源头和龙头 智能 (无论是人类智能还是人工智能) 是一个 极其深刻的研究对象,触及人类思维能力的深层奥 秘;人的大脑是一类堪称“小宇宙”的系统,很少有能 够与之比肩的复杂对象。这样一种十分深刻异常复 杂的研究,必须从科学观和方法论这个研究的源头 和驾驭全局的龙头展开深入研究。只有高屋建瓴, 才能势如破竹,而且一览无余[25]。 另一方面,人工智能研究之所以形成“三方割 据”的碎片化、浅层化和封闭化的格局,根本的原因 也正是因为人们遵循了“分而治之”所体现的机械唯 物科学观和机械还原方法论。因此,为了有效变革 人工智能理论研究的现状,就必须从反思人工智能 研究的“科学观和方法论”这个科学研究的“源头”和 “龙头”做起,才有成功的可能。 1.2 在中层,创新“研究模型和研究途径”:洞察通 用人工智能的全局和进路 正确的科学观可以启迪正确的方法论,有了正 确的科学观和方法论的导引,就可以确保研究工作 第 1 期 钟义信:机制主义人工智能理论——一种通用的人工智能理论 ·3·
智能系统学报 第13卷 的大方向不会发生重大偏差。但是,要想真正获得 2顶层研究:创新科学观和方法论 创新研究的重要成果,还必须认真考问:原有人工 智能研究所采用的基本模型和基本路径是否合理, 科学观要回答的基本问题是:科学研究的对象 是否需要做出必要而充分的变革? 是什么?这种研究对象的宏观性质是什么?在此基 这是因为,“研究模型”就是“总体蓝图”,代表了 础上,方法论要回答的基本问题是:按照科学观的 研究者对于研究对象性质和各种关系的全面认识, 宏观理解,研究这类对象的宏观思路和原则方法是 而“研究路径”则是研究工作的“总体方向和路线”, 什么?可见,科学研究的科学观和方法论确实是科 表达了研究者对于解决问题所要采取的方法路径的 学研究的源头和驾驭科学研究全局的龙头。 理解。因此,研究模型与研究途径的正确与否,将 显然,不同的研究对象需要运用不同的科学观 在很大程度上决定研究工作是否真的能够获得意义 来理解,因而也需要运用不同的方法论来处置。 重大的结果。 迄今,主要存在两类不同(虽然互有联系)的研 我们看到,现有人工智能理论研究的研究模型 究对象:物质对象和信息对象。与此相应,也存在 基本局限于脑模型,研究途径主要围绕大脑的物质 两种不同的科学观和方法论:经典物质科学的科学 结构和功能展开,从而忽视了源头信息的理解和利 观和方法论,信息科学的科学观和方法论。 用,导致诸多盲区和误解。智能的生成是一个复杂 经典物质科学的科学观认为:它所研究的具体 的生态演化过程2,必须在信息生态方法论指导下 对象是有限时空中的物质,这种物质对象是客观的 构建人工智能研究的研究模型,选择科学合理的研 存在,不因主观意志而改变。经典物质科学的方法 究途径,避免“一叶障目,不见泰山的局限。 论认为:对于复杂的物质对象,可以通过“分而治之” 13在底层,创新“基本概念和基本原理”:重构人 的方法来研究。这就是机械还原方法论。 工智能理论的基础和体系 智能,是(生物,特别是人类)主体认识环境(认 同其他领域的研究一样,人工智能理论的研究 识世界)与改造环境(改造世界)的过程中所表现出 必须落实到“基本概念和基本原理”上面。因此,在 来的高级能力。这个过程的宏观表现是:首先,环 把握了正确的科学观和方法论,又廓清了研究对象 境中的客体信息作用于主体:然后,主体凭借自己 的基本模型和基本路径之后,进一步的研究事项就 的目的与知识产生智能行为反作用于客体。这种作 是要认真叩问:原有人工智能研究所建立的基本概 用与反作用的过程也许要进行多个回合,如图1的 念和基本原理是否准确和完备,是否需要进行重大 的革新和重建? 模型所示。 不难预料,在新的科学观和方法论的导引之 主体(目的.知识)】 下,研究的基本模型发生了显著的变化,而且研究 的路径也发生了重大的改变,那么,人工智能理论 客体信息 智能行为 研究的原有概念体系和原理体系肯定不能适应新的 需要。因此,深化和重构人工智能理论研究所必需 客体环境 的基本概念就成为不可避免的工作,相应的基本原 理也因而必须重新探讨和建构。事实上,现有人工 图1智能的抽象模型 智能理论的信息、知识、智能等基础概念都存在严 Fig.1 Abstract model of intelligence 重的表面性和局限性山2;不仅如此,基础意识、情 根据图1所表示的抽象模型,人们就可以更具 感、理智及其综合决策等基础概念和人工智能系统 体地说:智能,乃是主体在与环境客体相互作用的 各个分系统之间相互转换的原理基本没有得到应有 过程中,为了成功应对自己所面临的生存与发展的 的关注7。 挑战而对客体信息进行深度加工演化从而生成智能 总之,从研究的源头(科学观和方法论)出发, 行为的能力。因此,智能是在主体目的和知识的制 到研究的全局展开(研究模型和研究路径),再到研 约下由客体信息激发生长起来的,是信息生态演进 究结果的扎实落地(基本概念和基本原理),进行全 过程的高级产物26-27”。 方位的反思、突破、发现和创新,逐层递进,重新构 有鉴于此,现代信息科学的科学观认为:它的 筑“通用人工智能”的基本理论。这就是本文的研究 研究对象是信息,信息对象也是一类存在,能够在 纲领。 主体与客体相互作用的过程中逐渐生长演化成为有 本文将循着这个纲领,叙述通用人工智能理论 用的智能(表现为智能策略和智能行为)。于是,现 研究所取得的重要进展。 代信息科学的方法论认为:信息(智能是信息的高
的大方向不会发生重大偏差。但是,要想真正获得 创新研究的重要成果,还必须认真考问:原有人工 智能研究所采用的基本模型和基本路径是否合理, 是否需要做出必要而充分的变革? 这是因为,“研究模型”就是“总体蓝图”,代表了 研究者对于研究对象性质和各种关系的全面认识, 而“研究路径”则是研究工作的“总体方向和路线”, 表达了研究者对于解决问题所要采取的方法路径的 理解。因此,研究模型与研究途径的正确与否,将 在很大程度上决定研究工作是否真的能够获得意义 重大的结果。 我们看到,现有人工智能理论研究的研究模型 基本局限于脑模型,研究途径主要围绕大脑的物质 结构和功能展开,从而忽视了源头信息的理解和利 用,导致诸多盲区和误解。智能的生成是一个复杂 的生态演化过程[26] ,必须在信息生态方法论指导下 构建人工智能研究的研究模型,选择科学合理的研 究途径,避免“一叶障目,不见泰山”的局限。 1.3 在底层,创新“基本概念和基本原理”:重构人 工智能理论的基础和体系 同其他领域的研究一样,人工智能理论的研究 必须落实到“基本概念和基本原理”上面。因此,在 把握了正确的科学观和方法论,又廓清了研究对象 的基本模型和基本路径之后,进一步的研究事项就 是要认真叩问:原有人工智能研究所建立的基本概 念和基本原理是否准确和完备,是否需要进行重大 的革新和重建? 不难预料,在新的科学观和方法论的导引之 下,研究的基本模型发生了显著的变化,而且研究 的路径也发生了重大的改变,那么,人工智能理论 研究的原有概念体系和原理体系肯定不能适应新的 需要。因此,深化和重构人工智能理论研究所必需 的基本概念就成为不可避免的工作,相应的基本原 理也因而必须重新探讨和建构。事实上,现有人工 智能理论的信息、知识、智能等基础概念都存在严 重的表面性和局限性[1, 25] ;不仅如此,基础意识、情 感、理智及其综合决策等基础概念和人工智能系统 各个分系统之间相互转换的原理基本没有得到应有 的关注[27]。 总之,从研究的源头 (科学观和方法论) 出发, 到研究的全局展开 (研究模型和研究路径),再到研 究结果的扎实落地 (基本概念和基本原理),进行全 方位的反思、突破、发现和创新,逐层递进,重新构 筑“通用人工智能”的基本理论。这就是本文的研究 纲领。 本文将循着这个纲领,叙述通用人工智能理论 研究所取得的重要进展。 2 顶层研究:创新科学观和方法论 科学观要回答的基本问题是:科学研究的对象 是什么?这种研究对象的宏观性质是什么?在此基 础上,方法论要回答的基本问题是:按照科学观的 宏观理解,研究这类对象的宏观思路和原则方法是 什么?可见,科学研究的科学观和方法论确实是科 学研究的源头和驾驭科学研究全局的龙头。 显然,不同的研究对象需要运用不同的科学观 来理解,因而也需要运用不同的方法论来处置。 迄今,主要存在两类不同 (虽然互有联系) 的研 究对象:物质对象和信息对象。与此相应,也存在 两种不同的科学观和方法论:经典物质科学的科学 观和方法论,信息科学的科学观和方法论。 经典物质科学的科学观认为:它所研究的具体 对象是有限时空中的物质,这种物质对象是客观的 存在,不因主观意志而改变。经典物质科学的方法 论认为:对于复杂的物质对象,可以通过“分而治之” 的方法来研究。这就是机械还原方法论。 智能,是 (生物,特别是人类) 主体认识环境 (认 识世界) 与改造环境 (改造世界) 的过程中所表现出 来的高级能力。这个过程的宏观表现是:首先,环 境中的客体信息作用于主体;然后,主体凭借自己 的目的与知识产生智能行为反作用于客体。这种作 用与反作用的过程也许要进行多个回合,如图 1 的 模型所示。 主体(目的,知识) 客体信息 智能行为 客体/环境 图 1 智能的抽象模型 Fig. 1 Abstract model of intelligence 根据图 1 所表示的抽象模型,人们就可以更具 体地说:智能,乃是主体在与环境客体相互作用的 过程中,为了成功应对自己所面临的生存与发展的 挑战而对客体信息进行深度加工演化从而生成智能 行为的能力。因此,智能是在主体目的和知识的制 约下由客体信息激发生长起来的,是信息生态演进 过程的高级产物[26-27]。 有鉴于此,现代信息科学的科学观认为:它的 研究对象是信息,信息对象也是一类存在,能够在 主体与客体相互作用的过程中逐渐生长演化成为有 用的智能 (表现为智能策略和智能行为)。于是,现 代信息科学的方法论认为:信息 (智能是信息的高 ·4· 智 能 系 统 学 报 第 13 卷
第1期 钟义信:机制主义人工智能理论 ·种通用的人工智能理论 ·5· 级产物)研究,需要特别关注它的生长演化过程,研 的过程中对客体信息进行复杂加工所生成的高级产 究各个生长环节之间的相互关系、信息生长系统与 物(体现为智能策略和智能行为)。于是,就可以得到图1 环境之间的相互关系,以保障信息能够生长成为智 所示的智能宏观研究模型。 能。我们把这个科学研究方法论命名为“信息生态 任何客体都会呈现自己的“状态及其变化方 方法论”。 式”。按照后面5.1节的定义1,这便是图1模型中 表2给出了两种科学观和方法论的简明对照。 的“客体信息”。所谓“主体与客体的相互作用”是 表2两类科学的科学观与方法论对比 指:一方面,客体信息作用于主体;另一方面,主体 Table 2 Comparison of the scientific view and methodo- 会据此生成智能行为反作用于客体。这是两者相互 logy between the two kinds of science 作用的一个基本回合。需要强调的是,主体反作用 项目 经典物质科学 现代信息科学 于客体的行为不能随心所欲,而必须具有足够的智 科学观 机械唯物科学观 辩证唯物科学观 能水平:一方面,这种行为应当能够实现主体所追 主要特点1 与主体互相独立 与主体密切互动 求的目的,否则就算失败;另一方面,这种行为又应 主要特点2 封闭性 当遵循客观规律而不破坏环境,否则,主体自身的 开放性 生存发展就会面临风险。这就是说,智能行为必须 主要特点3 相对确定 生态演化 是能够保证“主客双赢”的行为。 方法论 机械还原方法论 信息生态方法论 那么,当受到环境中客体信息作用(刺激)的时 主要特征 分而治之 互动生长 候,人类主体应当怎样做才能生成足以实现“主客双 赢”的智能行为呢? 从表2的对比可以看出,两类科学观和方法论 这显然是一个十分复杂的过程。但是,无论这 的作用存在很大的差异:如果遵循机械还原方法论 个过程怎样复杂,图1的宏观模型还是给出了清晰 来进行研究,信息学科必然被分解为若干分支(碎 的启示:主体收到的是“客体信息”,而它要生成的是 片),产生若干分支的理论,而且由于各个碎片之间 “智能行为”,因此,这必定是一个由“客体信息”到 互相独立和封闭,必然丢失各个分支之间的相互联 “智能行为的转换。 系,因而也必然丢失整个学科的总体联系和规律: 问题于是就变为:主体应当怎样做才能完成这 而信息生态方法论则关注各个分支之间相互关系的 个转换?图1的模型也给出了另一个启发:主体具 研究,关注学科系统与其环境相互关系的研究,于 有明确的目的,也具有相应的知识,因此,这个复杂 是就可以恢复学科原有的总体面貌,进而可以揭示 过程一定是“在主体目的的牵引下,在主体知识的支 学科的总体规律。 持下,把客体信息转换为智能行为的过程”。 迄今人工智能理论遵循的是“机械唯物科学观” 如果把这个复杂的转换过程具体地展开,就可 和“机械还原方法论”;本文人工智能理论研究所遵 以得到图2所示的智能生成模型。 循的是“辩证唯物科学观”和“信息生态方法论”。 这个结果,是研究对象的历史性转变(由物质 情感生成 对象转变为信息对象)所使然。由此导致了经典物 基础意识 综合决策 理智生成 智能 质科学时代向信息科学时代的转变,或者更简练地 策略 说,导致了工业时代向信息时代的转变。这是一个 知识 KG 认知 综合知识库 划时代的伟大转变。 效果检验 tt 3中层研究:创新研究模型和路径 感知选择 感知 客体 策略执行 信息 信息 千周 按照机械还原方法论的精神,迄今的人工智能 研究模型通常都是某种孤立的人类大脑模型:或者 问题环境 是大脑的新皮层结构模型(人工神经网络),或者是 大脑的逻辑思维功能模型(专家系统)。这是造成人 图2智能生成:人工智能系统的通用模型 Fig.2 Intelligence generation:a general model of artificial 工智能理论浅层化、碎片化和封闭化的重要原因。 intelligence system 3.1信息生态:通用人工智能理论的研究模型 注意,图2的“综合知识库”存储了主体的目的 按照信息生态方法论的精神,智能是认识主体 G和知识K(这是任何主体都必须具备的属性)。可 (典型的代表是人类主体)在与其环境客体相互作用 以看出,图2其实就是图1的深化:不仅表现了“客
级产物) 研究,需要特别关注它的生长演化过程,研 究各个生长环节之间的相互关系、信息生长系统与 环境之间的相互关系,以保障信息能够生长成为智 能。我们把这个科学研究方法论命名为“信息生态 方法论”。 表 2 给出了两种科学观和方法论的简明对照。 表 2 两类科学的科学观与方法论对比 Table 2 Comparison of the scientific view and methodology between the two kinds of science 项目 经典物质科学 现代信息科学 科学观 机械唯物科学观 辩证唯物科学观 主要特点 1 与主体互相独立 与主体密切互动 主要特点 2 封闭性 开放性 主要特点 3 相对确定 生态演化 方法论 机械还原方法论 信息生态方法论 主要特征 分而治之 互动生长 从表 2 的对比可以看出,两类科学观和方法论 的作用存在很大的差异:如果遵循机械还原方法论 来进行研究,信息学科必然被分解为若干分支 (碎 片),产生若干分支的理论,而且由于各个碎片之间 互相独立和封闭,必然丢失各个分支之间的相互联 系,因而也必然丢失整个学科的总体联系和规律; 而信息生态方法论则关注各个分支之间相互关系的 研究,关注学科系统与其环境相互关系的研究,于 是就可以恢复学科原有的总体面貌,进而可以揭示 学科的总体规律。 迄今人工智能理论遵循的是“机械唯物科学观” 和“机械还原方法论”;本文人工智能理论研究所遵 循的是“辩证唯物科学观”和“信息生态方法论”。 这个结果,是研究对象的历史性转变 (由物质 对象转变为信息对象) 所使然。由此导致了经典物 质科学时代向信息科学时代的转变,或者更简练地 说,导致了工业时代向信息时代的转变。这是一个 划时代的伟大转变。 3 中层研究:创新研究模型和路径 按照机械还原方法论的精神,迄今的人工智能 研究模型通常都是某种孤立的人类大脑模型:或者 是大脑的新皮层结构模型 (人工神经网络),或者是 大脑的逻辑思维功能模型 (专家系统)。这是造成人 工智能理论浅层化、碎片化和封闭化的重要原因。 3.1 信息生态:通用人工智能理论的研究模型 按照信息生态方法论的精神,智能是认识主体 (典型的代表是人类主体) 在与其环境客体相互作用 的过程中对客体信息进行复杂加工所生成的高级产 物 (体现为智能策略和智能行为)。于是,就可以得到图 1 所示的智能宏观研究模型。 任何客体都会呈现自己的“状态及其变化方 式”。按照后面 5.1 节的定义 1,这便是图 1 模型中 的“客体信息”。所谓“主体与客体的相互作用”是 指:一方面,客体信息作用于主体;另一方面,主体 会据此生成智能行为反作用于客体。这是两者相互 作用的一个基本回合。需要强调的是,主体反作用 于客体的行为不能随心所欲,而必须具有足够的智 能水平:一方面,这种行为应当能够实现主体所追 求的目的,否则就算失败;另一方面,这种行为又应 当遵循客观规律而不破坏环境,否则,主体自身的 生存发展就会面临风险。这就是说,智能行为必须 是能够保证“主客双赢”的行为。 那么,当受到环境中客体信息作用 (刺激) 的时 候,人类主体应当怎样做才能生成足以实现“主客双 赢”的智能行为呢? 这显然是一个十分复杂的过程。但是,无论这 个过程怎样复杂,图 1 的宏观模型还是给出了清晰 的启示:主体收到的是“客体信息”,而它要生成的是 “智能行为”,因此,这必定是一个由“客体信息”到 “智能行为”的转换。 问题于是就变为:主体应当怎样做才能完成这 个转换?图 1 的模型也给出了另一个启发:主体具 有明确的目的,也具有相应的知识,因此,这个复杂 过程一定是“在主体目的的牵引下,在主体知识的支 持下,把客体信息转换为智能行为的过程”。 如果把这个复杂的转换过程具体地展开,就可 以得到图 2 所示的智能生成模型。 基础意识 情感生成 理智生成 综合决策 智能 策略 认知 综合知识库 效果检验 知识 K G Y N 策略执行 感知选择 问题/环境 智能 行为 客体 信息 感知 信息 图 2 智能生成:人工智能系统的通用模型 Fig. 2 Intelligence generation: a general model of artificial intelligence system 注意,图 2 的“综合知识库”存储了主体的目的 G 和知识 K(这是任何主体都必须具备的属性)。可 以看出,图 2 其实就是图 1 的深化:不仅表现了“客 第 1 期 钟义信:机制主义人工智能理论——一种通用的人工智能理论 ·5·
6 智能系统学报 第13卷 体信息”对主体施加的作用和“智能行为”对客体施 显然,假如不是采取了“机制主义”的研究路径, 加的反作用:而且把主体生成智能行为这个复杂过 而是运用结构主义(神经网络)、功能主义(专家系 程都表现出来了。熟悉脑科学和认知科学的研究者 统)或者行为主义(感知动作系统)的研究路径,那 都可以做出判断:无论对人工智能还是对人类智 么,式(1)、(2)所表达的“智能系统共有的基本规律” 能,图2的模型都是科学合理的。 就会被阉割和丢失,这正是现有人工智能研究所遭 不能不指出的是,由于受到“分而治之”方法论 遇的情形。可见,正确的研究路径将揭示研究对象 的影响,现有人工智能理论的研究模型只把图2的 的深层规律;不恰当的研究路径将阉割和丢失研究 理智生成”和“综合知识库”部分地分割出来研究, 对象的深层规律。这就是研究路径的重要意义。 而对模型中的感知选择、认知、基础意识、情感生 现行人工智能理论的研究模型或者是“大脑的 成、综合决策、策略执行这样一系列极其关键单元 结构”,或者是“大脑的功能”,它的研究路径或者是 的作用原理和相互关系都未有涉足。可见,现有人 “结构主义(模拟脑的结构),或者是功能主义(模拟 工智能理论的研究模型多么局限! 脑的功能),或者是行为主义(模拟智能系统的行 那么,面对图2所示的研究模型,应当采取怎 为)”,尚未实现统一。本文所述的人工智能理论的 样的研究路径才能走向成功? 研究模型则是“主客相互作用过程的信息生态演进 3.2机制主义:通用人工智能理论的研究路径 系统”,它的研究路径是“以信息-知识-智能转换为 一个富有启发意义的例子是:飞机的设计并不 标志的机制主义”。这是人工智能由局部研究发展 是刻板地模仿飞鸟的具体结构,而是抓住了支持整 到全局研究、由分散研究发展到统一研究所发生的 个飞翔活动的“空气动力学原理”。同样,人工智能 重要突破和转变。 系统的研究也不应当刻意地模仿人脑的具体结构, 4底层研究:创新基础概念与原理 而应当抓住支撑整个智能活动的智能生长机制”。 有鉴于此,通用人工智能理论研究独树一帜采 如上所见,站在“辩证唯物科学观”这个信息科 取了“机制主义”的研究路径,即着眼于“主体生成智 学研究的源头,抓住“信息生态方法论”这个信息科 能的共性机制”,这是因为:与智能系统的结构、功 学研究的龙头,可以构建起通用人工智能理论的研 能、行为相比,生成智能的共性机制才是最本质的 究模型(总体蓝图),并沿着“信息→知识→智能的转 东西,而且是主宰智能系统全局的东西:而结构和 换”这个机制主义的研究路径,就成功地揭示了人工 功能则都是为机制服务的东西。这个共性的工作机 智能理论的根本规律“信息转换与智能创生”。 制可以表示为:针对给定的问题、目标和领域知识 按照“信息生态”这个方法论思想,信息领域的 执行式(1)的复杂转换(对照图2): 研究任务,远远不是仅仅研究信息现象本身,而应 客体信息→感知信息→知识→智能策略→智能行为 的 当研究信息的整体生态过程,即信息转换为知识并 图2表明,式(1)的每一个转换都对应着一类 进而转换为智能策略和智能行为的完整过程。那 工作单元:“感知与选择”单元把客体信息转换成为 么,上述“信息转换与智能创生”基本规律,就是管控 感知信息;“认知”单元把感知信息转换成为知识; 整个信息领域的普适定律! “基础意识-情感生成-理智生成-综合决策”单元在 本节之所以要讨论基础概念和基本原理,目的 目的牵引下、在相关知识支持下把感知信息分别转 就是使“信息转换与智能创生定律”能够落地生根。 换成为各种层次和侧面的智能策略成分(包括基础 为此,以下将对照图2的模型逐一展开讨论。由于 意识、情感、理智和最终综合形成的智能策略);“执 篇幅的缘故,以下的讨论基本上是结论性的,详细 行”单元则把智能策略转换成为智能行为。其中各 的内容可以参阅文献[1,25-28]。 个工作单元的基本概念和工作原理将在第5节分别 4.1 感知(语义信息生成):第一类信息转换原理 阐述。 如前所述,信息是智能生长的激励源泉,但是 式(1)可以更简洁地表示为式(2)的转换系列: 迄今信息概念局限于“通信信息”。后者仅仅是智能 信息→知识→智能 (2) 研究所需要的信息概念的表面(形式)层次。既然 转换系列式(1)、(2)可以称为“信息转换与智能 信息这个源头概念已经被浅层化了,就导致现有人 创生”原理,即通过一定的信息转换实现智能策略和 工智能理论不会有深刻的理解能力。因此,我们必 智能行为的创生。“信息转换与智能创生原理”乃是 须重新审视信息的概念。 一切智能系统共有的核心工作机制,是一切智能系 4.11信息的概念和表示 统共有的基本规律。 通信信息的概念:信息是用来为通信接收者消
体信息”对主体施加的作用和“智能行为”对客体施 加的反作用;而且把主体生成智能行为这个复杂过 程都表现出来了。熟悉脑科学和认知科学的研究者 都可以做出判断:无论对人工智能还是对人类智 能,图 2 的模型都是科学合理的。 不能不指出的是,由于受到“分而治之”方法论 的影响,现有人工智能理论的研究模型只把图 2 的 “理智生成”和“综合知识库”部分地分割出来研究, 而对模型中的感知选择、认知、基础意识、情感生 成、综合决策、策略执行这样一系列极其关键单元 的作用原理和相互关系都未有涉足。可见,现有人 工智能理论的研究模型多么局限! 那么,面对图 2 所示的研究模型,应当采取怎 样的研究路径才能走向成功? 3.2 机制主义:通用人工智能理论的研究路径 一个富有启发意义的例子是:飞机的设计并不 是刻板地模仿飞鸟的具体结构,而是抓住了支持整 个飞翔活动的“空气动力学原理”。同样,人工智能 系统的研究也不应当刻意地模仿人脑的具体结构, 而应当抓住支撑整个智能活动的“智能生长机制”。 有鉴于此,通用人工智能理论研究独树一帜采 取了“机制主义”的研究路径,即着眼于“主体生成智 能的共性机制”,这是因为:与智能系统的结构、功 能、行为相比,生成智能的共性机制才是最本质的 东西,而且是主宰智能系统全局的东西;而结构和 功能则都是为机制服务的东西。这个共性的工作机 制可以表示为:针对给定的问题、目标和领域知识, 执行式 (1) 的复杂转换 (对照图 2): 客体信息 →感知信息 →知识 →智能策略 → 智能行为 (1) 图 2 表明,式 (1) 的每一个转换都对应着一类 工作单元:“感知与选择”单元把客体信息转换成为 感知信息;“认知”单元把感知信息转换成为知识; “基础意识–情感生成–理智生成–综合决策”单元在 目的牵引下、在相关知识支持下把感知信息分别转 换成为各种层次和侧面的智能策略成分 (包括基础 意识、情感、理智和最终综合形成的智能策略);“执 行”单元则把智能策略转换成为智能行为。其中各 个工作单元的基本概念和工作原理将在第 5 节分别 阐述。 式 (1) 可以更简洁地表示为式 (2) 的转换系列: 信息 → 知识 → 智能 (2) 转换系列式 (1)、(2) 可以称为“信息转换与智能 创生”原理,即通过一定的信息转换实现智能策略和 智能行为的创生。“信息转换与智能创生原理”乃是 一切智能系统共有的核心工作机制,是一切智能系 统共有的基本规律。 显然,假如不是采取了“机制主义”的研究路径, 而是运用结构主义 (神经网络)、功能主义 (专家系 统) 或者行为主义 (感知动作系统) 的研究路径,那 么,式 (1)、(2) 所表达的“智能系统共有的基本规律” 就会被阉割和丢失,这正是现有人工智能研究所遭 遇的情形。可见,正确的研究路径将揭示研究对象 的深层规律;不恰当的研究路径将阉割和丢失研究 对象的深层规律。这就是研究路径的重要意义。 现行人工智能理论的研究模型或者是“大脑的 结构”,或者是“大脑的功能”,它的研究路径或者是 “结构主义 (模拟脑的结构),或者是功能主义 (模拟 脑的功能),或者是行为主义 (模拟智能系统的行 为)”,尚未实现统一。本文所述的人工智能理论的 研究模型则是“主客相互作用过程的信息生态演进 系统”,它的研究路径是“以信息–知识–智能转换为 标志的机制主义”。这是人工智能由局部研究发展 到全局研究、由分散研究发展到统一研究所发生的 重要突破和转变。 4 底层研究:创新基础概念与原理 如上所见,站在“辩证唯物科学观”这个信息科 学研究的源头,抓住“信息生态方法论”这个信息科 学研究的龙头,可以构建起通用人工智能理论的研 究模型 (总体蓝图),并沿着“信息→知识→智能的转 换”这个机制主义的研究路径,就成功地揭示了人工 智能理论的根本规律“信息转换与智能创生”。 按照“信息生态”这个方法论思想,信息领域的 研究任务,远远不是仅仅研究信息现象本身,而应 当研究信息的整体生态过程,即信息转换为知识并 进而转换为智能策略和智能行为的完整过程。那 么,上述“信息转换与智能创生”基本规律,就是管控 整个信息领域的普适定律! 本节之所以要讨论基础概念和基本原理,目的 就是使“信息转换与智能创生定律”能够落地生根。 为此,以下将对照图 2 的模型逐一展开讨论。由于 篇幅的缘故,以下的讨论基本上是结论性的,详细 的内容可以参阅文献[1, 25-28]。 4.1 感知 (语义信息生成):第一类信息转换原理 如前所述,信息是智能生长的激励源泉,但是 迄今信息概念局限于“通信信息”。后者仅仅是智能 研究所需要的信息概念的表面 (形式) 层次。既然 信息这个源头概念已经被浅层化了,就导致现有人 工智能理论不会有深刻的理解能力。因此,我们必 须重新审视信息的概念。 4.1.1 信息的概念和表示 通信信息的概念:信息是用来为通信接收者消 ·6· 智 能 系 统 学 报 第 13 卷
第1期 钟义信:机制主义人工智能理论 一一种通用的人工智能理论 7· 除“关于发送端所发信号波形”的随机不确定性的东 感知信息不仅与客体的性质和状况有关,而且 西。这里只有波形的形式因素,没有内容因素,也 与认识主体的目的和知识状况有关。因此,感知信 没有价值因素。因此,这种信息概念适用于通信工 息也称为“认识论信息”,代表了主体对于客体的主 程,不足以支持智能理论的研究。 观认识。也正因为感知信息不仅与客体的因素有关 对照图2的模型可以看到,实际存在两种互相 而且与主体的因素有关,因此感知信息要比客体信 联系又互不相同的信息概念:客体呈现的“客体信 息的内涵丰富得多复杂得多。 息”和主体所感知的“感知信息”。它们的基本定义 为了进一步理解感知信息的概念,需要考察 如下。 图3的感知信息生成机理。 定义1客体信息。客体信息是指客体所呈现 的关于其自身的“状态及其变化方式”。 内容 语义信息 定义1表明,事物X的客体信息可以用它呈现 映射-命名 的状态及其变化方式来表示。例如,假设X是有限 状态的事物,即x1,x2,,xn,n是有限正整数;又设 回忆 语法信息 形式 效用 语用信息 状态变化的方式是随机的方式,即每个状态发生的 概率为P,P2,P这就是随机型的客体信息特征, 感觉(存在性检验) 知觉(目的性检验) 这类信息可以记为{x1,,xnP1,P2,Pn}。一般 的客体信息也可以记为{x1,x2,x;C1,C2,,Cm}。 其中,c1,c2,,Cn是各个状态发生的肯定度。 客体环境 客体信息只与客体自身的性质和状况有关,而 图3感知信息的生成机理 与主体的性质及主观意志无关。因此,客体信息又 Fig.3 Generation mechanism of perceived information 被称为“本体论信息”。客体信息是一切其他信息的 图3显示:1)通过主体的感觉器官(技术上就 源泉,其他信息都是客体信息通过相关转换所产生 是传感系统)可以直接把客体呈现的客体信息转换 的结果。 为语法信息;2)通过主体的回忆和检验(技术上是 定义2感知信息。感知信息是指主体从客体 检索和计算)可以由语法信息生成语用信息;3)通 信息所感知的客体状态及其变化方式的形式(称为 过对“语法信息与语用信息两者的联合体”的抽象化 语法信息)、内容(语义信息)和效用(语用信息)。 处理(技术上是映射与命名)就可以生成语义信息, 主体具有感觉能力和知觉能力。因此,主体对 三者共同构成感知信息。关于感知信息生成机理更 客体信息感知的结果就会产生“语法信息(形式)、语 详细的分析,还可以参见4.1.2节。 义信息(内容)、语用信息(效用)的三位一体”。如 现有人工智能理论沿用的“通信信息”概念只相 果X是有限()状态的事物,那么主体从X的客体 当于语法信息的概念,因此现行的人工智能理论只 信息得到的感知信息就要表示为一个矩阵: 关注了信息的形式而没有关注信息的内容和价值, 致使现有人工智能理论研究在起点(感知信息)上 X1 X2 C2 就存在了致命性缺陷,导致理解能力的丧失。 X= Cn (3) 4.1.2语义信息理论 L412 由客体信息转换为感知信息的原理称为第一类 式中:c,c,cn是各个状态的肯定度,它们是语法 信息转换原理。对照图3感知信息的生成机理, 信息的表征参量;4,1,1n是各个状态的逻辑真实 可以构造第一类信息转换原理的模型,如图4表示。 度,它们是语义信息的表征参量;,,山是各个 在图4的模型中,知识库代表了主体的记忆系 状态的效用度,它们是语用信息的表征参量。基于 统,它包含了主体的目标G、主体已经拥有的语法 式(3)的矩阵描述,可以建立语法信息、语义信息、 信息与语用信息的偶对集合{x,二}以及主体的逻辑 语用信息以及整个感知信息的数值度量方法,详细 处理能力(包括检索、运算、抽象化等)。模型表明, 的情形可以参见文献]。 客体信息向感知信息的转换是在主体操作下完成 更有创新意义且更为科学的客体信息和感知信 的。具体的转换过程包括3个步骤(可以对照图4 息表示方法,是汪培庄教授创建和发展起来的因素 和图3): 空间理论29。当然,文献1]的信息表示方法和文献 1)生成相应的语法信息:客体信息(即图4中 [29]的信息表示方法之间是相通的,但是后者具有 的本体论信息)S通过传感系统的感觉功能转换为 更多的优越性。 语法信息X,这在数学上就是映射
除“关于发送端所发信号波形”的随机不确定性的东 西。这里只有波形的形式因素,没有内容因素,也 没有价值因素。因此,这种信息概念适用于通信工 程,不足以支持智能理论的研究。 对照图 2 的模型可以看到,实际存在两种互相 联系又互不相同的信息概念:客体呈现的“客体信 息”和主体所感知的“感知信息”。它们的基本定义 如下。 定义 1 客体信息。客体信息是指客体所呈现 的关于其自身的“状态及其变化方式”。 ··· ··· ··· ··· ··· ··· ··· 定义 1 表明,事物 X 的客体信息可以用它呈现 的状态及其变化方式来表示。例如,假设 X 是有限 状态的事物,即 x1 , x2 , , xn,n 是有限正整数;又设 状态变化的方式是随机的方式,即每个状态发生的 概率为 p1 , p2 , , pn , 这就是随机型的客体信息特征, 这类信息可以记为{x1 , x2 , , xn;p1 , p2 , , pn}。一般 的客体信息也可以记为{x1 , x2 , , xn;c1 , c2 , ,cn}。 其中,c1 , c2 , ,cn 是各个状态发生的肯定度。 客体信息只与客体自身的性质和状况有关,而 与主体的性质及主观意志无关。因此,客体信息又 被称为“本体论信息”。客体信息是一切其他信息的 源泉,其他信息都是客体信息通过相关转换所产生 的结果。 定义 2 感知信息。感知信息是指主体从客体 信息所感知的客体状态及其变化方式的形式 (称为 语法信息)、内容 (语义信息) 和效用 (语用信息)。 主体具有感觉能力和知觉能力。因此,主体对 客体信息感知的结果就会产生“语法信息 (形式)、语 义信息 (内容)、语用信息 (效用) 的三位一体”。如 果 X 是有限 (n) 状态的事物,那么主体从 X 的客体 信息得到的感知信息就要表示为一个矩阵: X = x1 x2 ··· xn c1 c2 ··· cn t1 t2 ··· tn u1 u2 ··· un (3) ··· ··· ··· 式中:c1 , c2 , , cn 是各个状态的肯定度,它们是语法 信息的表征参量;t1 , t2 , , tn 是各个状态的逻辑真实 度,它们是语义信息的表征参量;u1 , u2 , , un 是各个 状态的效用度,它们是语用信息的表征参量。基于 式 (3) 的矩阵描述,可以建立语法信息、语义信息、 语用信息以及整个感知信息的数值度量方法,详细 的情形可以参见文献[1]。 更有创新意义且更为科学的客体信息和感知信 息表示方法,是汪培庄教授创建和发展起来的因素 空间理论[29]。当然,文献[1]的信息表示方法和文献 [29]的信息表示方法之间是相通的,但是后者具有 更多的优越性。 感知信息不仅与客体的性质和状况有关,而且 与认识主体的目的和知识状况有关。因此,感知信 息也称为“认识论信息”,代表了主体对于客体的主 观认识。也正因为感知信息不仅与客体的因素有关 而且与主体的因素有关,因此感知信息要比客体信 息的内涵丰富得多复杂得多。 为了进一步理解感知信息的概念,需要考察 图 3 的感知信息生成机理。 内容 语义信息 映射−命名 回忆 语法信息 形式 效用 语用信息 感觉(存在性检验) 知觉(目的性检验) 主体 客体/环境 图 3 感知信息的生成机理 Fig. 3 Generation mechanism of perceived information 图 3 显示:1) 通过主体的感觉器官 (技术上就 是传感系统) 可以直接把客体呈现的客体信息转换 为语法信息; 2) 通过主体的回忆和检验 (技术上是 检索和计算) 可以由语法信息生成语用信息;3) 通 过对“语法信息与语用信息两者的联合体”的抽象化 处理 (技术上是映射与命名) 就可以生成语义信息, 三者共同构成感知信息。关于感知信息生成机理更 详细的分析,还可以参见 4.1.2 节。 现有人工智能理论沿用的“通信信息”概念只相 当于语法信息的概念,因此现行的人工智能理论只 关注了信息的形式而没有关注信息的内容和价值, 致使现有人工智能理论研究在起点 (感知信息) 上 就存在了致命性缺陷,导致理解能力的丧失。 4.1.2 语义信息理论 由客体信息转换为感知信息的原理称为第一类 信息转换原理[1]。对照图 3 感知信息的生成机理, 可以构造第一类信息转换原理的模型,如图 4 表示。 在图 4 的模型中,知识库代表了主体的记忆系 统,它包含了主体的目标 G、主体已经拥有的语法 信息与语用信息的偶对集合{xn , zn}以及主体的逻辑 处理能力 (包括检索、运算、抽象化等)。模型表明, 客体信息向感知信息的转换是在主体操作下完成 的。具体的转换过程包括 3 个步骤 (可以对照图 4 和图 3): 1) 生成相应的语法信息:客体信息 (即图 4 中 的本体论信息)S 通过传感系统的感觉功能转换为 语法信息 X,这在数学上就是映射。 第 1 期 钟义信:机制主义人工智能理论——一种通用的人工智能理论 ·7·
智能系统学报 第13卷 本体论信息S 传感 。X语法信息 理(映射与命名)才能得到。 初看上去,式(4)似乎很抽象。其实,人们时刻 演绎 Y语义信息 都在熟练地运用这个方法,只是因为太熟练而不经 检索-计 Z语用信息 意了。例如,“水杯的语义信息(内容)Y是什么? 实际就是给“具有水杯的语法信息(水杯的形 知识库:G(化,2),逻辑 态)X和语用信息(水杯的效用)Z的那种事物”所取 图4第一信息转换原理:客体信息→感知信息 的名字。“给某某取名”,就是“将它映射并命名”。 Fig.4 The first information conversion principle:object 读者不难由此而及其余。 information-perceived information 历史上曾有很多关于语法信息、语义信息、语 2)生成相应的语用信息:分两种情况处理,即 用信息的讨论,却从来没有阐明它们之间的关系, 检索和计算。检索:以语法信息X为检索子,在知 以至造成诸多混乱。本文总结的关系式(4)之所以 识库内对{x,}进行检索,如能在其中找到与检索 十分重要,就在于,只有阐明了关系式(4),才能真正 子匹配的语法信息项xm,则相应的:n就是X的语用 理解,为什么人们最关心的是语义信息,为什么只 信息Z。计算:如果无法在知识库内找到匹配项,说 有语义信息能够代表语法信息和语用信息,从而也 明S是一个新事物。这时就要采用新的方法:把语 能代表整个感知信息。 法信息矢量X与主体的目标矢量G进行相关性计 本节讨论的结果,不但阐明了语法信息、语义 算,所得到的相关性结果就是相应的语用信息Z。 信息、语用信息的准确含义以及它们之间的相互关 3)生成相应的语义信息:将偶对(X,Z)映射到 系,而且还可以用来澄清几个重要而又常常被混淆 语义信息空间并给映射的结果命名,就得到了相应 的概念。 的语义信息Y。这个操作也可通过图5来理解。 1)传感与感知 值得注意的是,信息的感知包含了“感”和“知” 语义信息空间 两个互有联系又互不相同的概念。所谓“感”,是指 感受是否有某种客体信息的存在(即存在性检验), 如果确实存在某种客体信息,那么,“感的结果可以 得到这个客体信息的形态(语法信息),但得不到这 语法信息X 个信息的内容(语义信息)和价值(语用信息),参见 图3与图4。所谓“知”,是指在“感的基础上,通过 图5由(语法信息,语用信息)到语义信息 Fig.5 From(syntactic information,pragmatic informa- 把它所产生的语法信息与主体目的进行相关考察 tion)to semantic information (即目的性检验),从而知道这个信息具有什么效用 这样就完成了由客体信息S到感知信息(X,Y, (语用信息),进而将这个语用信息与语法信息的偶 )的转换。不难看出,第1类信息转换原理的全部 对映射到语义信息空间并予以命名,才能得到相应 信息转换过程,不但可以在人类主体系统内轻松实 的语义信息。全面获得了语法信息、语义信息和语 现(见图3),而且也可以在机器系统内方便实现(见图4)。 用信息,才实现了“感知”。 第1类信息转换原理揭示了1个重要的关系, 可见,“感知”的概念比“感”的概念要复杂得 这就是语法信息、语义信息、语用信息三者之间所 多。现在受到普遍关注和广泛应用的传感器只具有 存在的相互关系(对照图4和图5): “感”的功能,没有“知”的功能。人们把传感器理解 Y=A(X,Z) (4) 为完整的“感知”单元,这是一个非常普遍而严重的 式中1是“映射与命名”算子。式(4)表明,语义信 误解! 息Y是语法信息X和语用信息Z两者的联合(X, 2)数据与信息 Z)映射到语义信息空间(和命名)的结果。 参照图3与图4可以看出,一切传感系统(或 式(4)关系的合理性:语法信息表达的是事物 者人的感觉系统)输出的是只有形态因素而没有内 的形态,很具体,因此可以被直接感受到;语用信息 容和价值因素的语法信息,数据就属于语法信息。 表达的是事物对主体目标而言的效用,也很具体, 换一种说法,数据和其他各种传感器产生的信号一 因此可以通过回想或检验得到:而语义信息是抽象 样,都是信息的载体;而语法信息也正是以自己的 的,既不能直接感受到也不能直接体验到,只能通 形态作为载荷信息的载体。因此,数据与语法信息 过对语法信息和语用信息的联合体进行抽象化处 是同一概念的不同名称
X 语法信息 Y 语义信息 Z 语用信息 演绎 传感 X X 检索−计算 Z 本体论信息S 知识库:G (X,Z),逻辑 图 4 第一信息转换原理:客体信息→感知信息 Fig. 4 The first information conversion principle: object information→perceived information 2) 生成相应的语用信息:分两种情况处理,即 检索和计算。检索:以语法信息 X 为检索子,在知 识库内对{xn , zn}进行检索,如能在其中找到与检索 子匹配的语法信息项 xn,则相应的 zn 就是 X 的语用 信息 Z。计算:如果无法在知识库内找到匹配项,说 明 S 是一个新事物。这时就要采用新的方法:把语 法信息矢量 X 与主体的目标矢量 G 进行相关性计 算,所得到的相关性结果就是相应的语用信息 Z。 3) 生成相应的语义信息:将偶对 (X, Z) 映射到 语义信息空间并给映射的结果命名,就得到了相应 的语义信息 Y。这个操作也可通过图 5 来理解。 Z X 语用信息 语义信息空间 Y 语法信息 z y x 图 5 由 (语法信息,语用信息) 到语义信息 Fig. 5 From (syntactic information, pragmatic information) to semantic information 这样就完成了由客体信息 S 到感知信息 (X, Y, Z) 的转换。不难看出,第 1 类信息转换原理的全部 信息转换过程,不但可以在人类主体系统内轻松实 现 (见图 3),而且也可以在机器系统内方便实现 (见图 4)。 第 1 类信息转换原理揭示了 1 个重要的关系, 这就是语法信息、语义信息、语用信息三者之间所 存在的相互关系 (对照图 4 和图 5): Y = λ(X, Z) (4) 式中 λ 是“映射与命名”算子。式 (4) 表明,语义信 息 Y 是语法信息 X 和语用信息 Z 两者的联合 (X, Z) 映射到语义信息空间 (和命名) 的结果。 式 (4) 关系的合理性:语法信息表达的是事物 的形态,很具体,因此可以被直接感受到;语用信息 表达的是事物对主体目标而言的效用,也很具体, 因此可以通过回想或检验得到;而语义信息是抽象 的,既不能直接感受到也不能直接体验到,只能通 过对语法信息和语用信息的联合体进行抽象化处 理 (映射与命名) 才能得到。 初看上去,式 (4) 似乎很抽象。其实,人们时刻 都在熟练地运用这个方法,只是因为太熟练而不经 意了。例如,“水杯”的语义信息 (内容)Y 是什么? 实际就是给“具有水杯的语法信息 (水杯的形 态)X 和语用信息 (水杯的效用)Z 的那种事物”所取 的名字。“给某某取名”,就是“将它映射并命名”。 读者不难由此而及其余。 历史上曾有很多关于语法信息、语义信息、语 用信息的讨论,却从来没有阐明它们之间的关系, 以至造成诸多混乱。本文总结的关系式 (4) 之所以 十分重要,就在于,只有阐明了关系式 (4),才能真正 理解,为什么人们最关心的是语义信息,为什么只 有语义信息能够代表语法信息和语用信息,从而也 能代表整个感知信息。 本节讨论的结果,不但阐明了语法信息、语义 信息、语用信息的准确含义以及它们之间的相互关 系,而且还可以用来澄清几个重要而又常常被混淆 的概念。 1) 传感与感知 值得注意的是,信息的感知包含了“感”和“知” 两个互有联系又互不相同的概念。所谓“感”,是指 感受是否有某种客体信息的存在 (即存在性检验), 如果确实存在某种客体信息,那么,“感”的结果可以 得到这个客体信息的形态 (语法信息),但得不到这 个信息的内容 (语义信息) 和价值 (语用信息),参见 图 3 与图 4。所谓“知”,是指在“感”的基础上,通过 把它所产生的语法信息与主体目的进行相关考察 (即目的性检验),从而知道这个信息具有什么效用 (语用信息),进而将这个语用信息与语法信息的偶 对映射到语义信息空间并予以命名,才能得到相应 的语义信息。全面获得了语法信息、语义信息和语 用信息,才实现了“感知”。 可见,“感知”的概念比“感”的概念要复杂得 多。现在受到普遍关注和广泛应用的传感器只具有 “感”的功能,没有“知”的功能。人们把传感器理解 为完整的“感知”单元,这是一个非常普遍而严重的 误解! 2) 数据与信息 参照图 3 与图 4 可以看出,一切传感系统 (或 者人的感觉系统) 输出的是只有形态因素而没有内 容和价值因素的语法信息,数据就属于语法信息。 换一种说法,数据和其他各种传感器产生的信号一 样,都是信息的载体;而语法信息也正是以自己的 形态作为载荷信息的载体。因此,数据与语法信息 是同一概念的不同名称。 ·8· 智 能 系 统 学 报 第 13 卷
第1期 钟义信:机制主义人工智能理论 一种通用的人工智能理论 年9市 那么,数据、信号、语法信息它们所载荷的“信 4.2认知(知识生成):第二类信息转换原理 息”又是什么呢?严格地说,这里所说的信息其实不 对照图2的模型可以知道,“感知单元”获得的 是别的,正是“语义信息”。正如4.1.2节所阐明的, 是感知信息,相当于人类认识过程中的“感性认 “语义信息”可以代表语法信息和语用信息,当然也 识”。为了成功应对系统的外来刺激,仅有感性认识 就代表了语法信息、语用信息和语义信息。因此, 是远远不够的.必须设法把“感性认识”提升为“理性 只有“语义信息”才有资格简称为“信息”;而语法信 认识”,即“知识”。因此,感知单元之后应当有认知 息和语用信息都不能拥有这样的简称。可见,人们 单元,它的作用就是完成“感知信息→知识”的转换, 所说的“从数据中提炼信息”实际上说的应当是“从 即第二类信息转换原理。 语法信息中提炼语义信息”。于是,数据只是信息的 目前,人们对“认知”存在许多不同的理解。本 载体。这些概念就在信息科学概念体系中得到了很 文的理解是:“感知”是获得感性认识的认识过程, 好的厘清。 “认知”是获得理性认识的认识过程,“决策”是获得 进一步的问题是,怎么才能“从数据中提炼信 求解问题的智能策略的过程。为此,这里给出本文 息”?在数据科学中,这个问题似乎仍在探索之中。 的“认知”定义。 但是,既然“从数据中提炼信息”更准确地说就是“从 定义3认知。认知是感知(语义)信息转换为 语法信息中提炼语义信息”,那么,在信息科学理论 知识的过程,“获得知识”是认知过程的目的。 体系中(如图3~5),这个问题已经得到非常清晰的 那么,作为认知完成的标志,知识的定义又是 解答。 什么? 由此可见,用信息科学的理论体系准确厘清“数 定义4知识。主体关于某类事物的知识,是 据和“信息”这类术语的真实含义之后,不但可以消 指主体从该类事物的大量感知信息中提炼出来的关 除术语含义上的混乱,而且可以准确而清晰地找到 于“该类事物共有的状态及其变化规律的形式、内 解决问题的有效方法。 涵和价值”的认识。 4.1.3信息选择 知识与感知信息具有天然联系,它们都是认识 对照图2,信息选择的作用是,根据系统的目 论范畴的概念,是主体对客体信息的感知和认知。 标G,针对作用于系统输入端的客体信息S(或由它 但知识与感知信息又有原则的不同:感知信息是对 映射得到的语法信息),计算S相对于G的语用 某个事物的状态及其变化方式的形式、内容和效用 信息Z,并依据语用信息的大小做出决定:凡是与目 的无关的客体信息都予以舍弃,只需关心与目的有 的感知,知识是对某类事物运动状态及其变化规律 关的新鲜信息。这相当于认知科学的“注意”功能。 的形式、内涵和价值的认知。“变化方式”是具体的 这是智能系统的第一道关口:智能门户,根据 个别的,“变化规律”是抽象的普遍的。所以,感知信 系统目标对客体信息做出取舍。假如没有这道智能 息属于浅表的“现象”层次,知识则属于深刻的“本 门户,智能系统就可能被汹涌澎湃、排山倒海而来 质”层次。 的信息所淹没,变得手足无措自顾不暇,丧失信息 根据上述知识与认知的定义,“感知信息→知 处理的能力。因此,“信息选择”的作用极其重要。 识”的转换其实就是要完成“由现象到本质”的转 在当代“大数据(big data)"的信息环境下,这个 换。这就清楚地表明,完成“感知信息→知识”转换 “智能取舍”的作用具有特别重大的意义。这是因 的方法,通常是归纳型算法。第二类信息转换原 为,按照学术界的定义,所谓“大数据”是指那些具有 理:由感知信息到知识的转换,见图6。 巨大的规模(volume)、庞杂的种类(variety)、极高 图6的输人是“语义信息”,代表了主体对“问 的速度(velocity)而又具有潜在价值(value)的数 题的感性认识,是第一类信息转换的产物;输出是 据”,它的总体标志则是“现有信息技术的能力无法 “知识”,代表了“认知(第二类信息转换)”所得到的 处理的数据”。然而,通过智能系统的“选择”和“舍 结果。模型表明,“综合知识库”是认知系统的核心, 弃”功能,就可以直接把现有信息技术无法处理的 它要包含信息的表示、知识的表示、认知的目的、归 “大数据转变为可以轻松处理的“小数据”。“有舍 纳型的逻辑方法(包括归纳、类比、联想、分类、聚 才有得”,如果不懂得舍弃,大数据就会因为系统无 类、抽象化等)。没有这样的综合知识库,认知的任 法处理而无所收获。这是普通的辩证法。与“云计 务就难以完成。图6中的预处理是为了使用归纳型 算”和“云存储”方法相比,在系统输入端口的“智能 算法所要采取的一些预备步骤,后处理则是为了规 取舍”可以节约巨量的储算资源! 范“知识的表示”所需要的一些处理
那么,数据、信号、语法信息它们所载荷的“信 息”又是什么呢?严格地说,这里所说的信息其实不 是别的,正是“语义信息”。正如 4.1.2 节所阐明的, “语义信息”可以代表语法信息和语用信息,当然也 就代表了语法信息、语用信息和语义信息。因此, 只有“语义信息”才有资格简称为“信息”;而语法信 息和语用信息都不能拥有这样的简称。可见,人们 所说的“从数据中提炼信息”实际上说的应当是“从 语法信息中提炼语义信息”。于是,数据只是信息的 载体。这些概念就在信息科学概念体系中得到了很 好的厘清。 进一步的问题是,怎么才能“从数据中提炼信 息”?在数据科学中,这个问题似乎仍在探索之中。 但是,既然“从数据中提炼信息”更准确地说就是“从 语法信息中提炼语义信息”,那么,在信息科学理论 体系中 (如图 3~5),这个问题已经得到非常清晰的 解答。 由此可见,用信息科学的理论体系准确厘清“数 据”和“信息”这类术语的真实含义之后,不但可以消 除术语含义上的混乱,而且可以准确而清晰地找到 解决问题的有效方法。 4.1.3 信息选择 对照图 2,信息选择的作用是,根据系统的目 标 G,针对作用于系统输入端的客体信息 S(或由它 映射得到的语法信息 X),计算 S 相对于 G 的语用 信息 Z,并依据语用信息的大小做出决定:凡是与目 的无关的客体信息都予以舍弃,只需关心与目的有 关的新鲜信息。这相当于认知科学的“注意”功能。 这是智能系统的第一道关口:智能门户,根据 系统目标对客体信息做出取舍。假如没有这道智能 门户,智能系统就可能被汹涌澎湃、排山倒海而来 的信息所淹没,变得手足无措自顾不暇,丧失信息 处理的能力。因此,“信息选择”的作用极其重要。 在当代“大数据 (big data)”的信息环境下,这个 “智能取舍”的作用具有特别重大的意义。这是因 为,按照学术界的定义,所谓“大数据”是指那些具有 “巨大的规模 (volume)、庞杂的种类 (variety)、极高 的速度 ( velocity) 而又具有潜在价值 (value) 的数 据”,它的总体标志则是“现有信息技术的能力无法 处理的数据”。然而,通过智能系统的“选择”和“舍 弃”功能,就可以直接把现有信息技术无法处理的 “大数据”转变为可以轻松处理的“小数据”。“有舍 才有得”,如果不懂得舍弃,大数据就会因为系统无 法处理而无所收获。这是普通的辩证法。与“云计 算”和“云存储”方法相比,在系统输入端口的“智能 取舍”可以节约巨量的储算资源! 4.2 认知 (知识生成):第二类信息转换原理 对照图 2 的模型可以知道,“感知单元”获得的 是感知信息,相当于人类认识过程中的“感性认 识”。为了成功应对系统的外来刺激,仅有感性认识 是远远不够的,必须设法把“感性认识”提升为“理性 认识”,即“知识”。因此,感知单元之后应当有认知 单元,它的作用就是完成“感知信息→知识”的转换, 即第二类信息转换原理。 目前,人们对“认知”存在许多不同的理解。本 文的理解是:“感知”是获得感性认识的认识过程, “认知”是获得理性认识的认识过程,“决策”是获得 求解问题的智能策略的过程。为此,这里给出本文 的“认知”定义。 定义 3 认知。认知是感知 (语义) 信息转换为 知识的过程,“获得知识”是认知过程的目的。 那么,作为认知完成的标志,知识的定义又是 什么? 定义 4 知识。主体关于某类事物的知识,是 指主体从该类事物的大量感知信息中提炼出来的关 于“该类事物共有的状态及其变化规律的形式、内 涵和价值”的认识。 知识与感知信息具有天然联系,它们都是认识 论范畴的概念,是主体对客体信息的感知和认知。 但知识与感知信息又有原则的不同:感知信息是对 某个事物的状态及其变化方式的形式、内容和效用 的感知,知识是对某类事物运动状态及其变化规律 的形式、内涵和价值的认知。“变化方式”是具体的 个别的,“变化规律”是抽象的普遍的。所以,感知信 息属于浅表的“现象”层次,知识则属于深刻的“本 质”层次。 根据上述知识与认知的定义,“感知信息→知 识”的转换其实就是要完成“由现象到本质”的转 换。这就清楚地表明,完成“感知信息→知识”转换 的方法,通常是归纳型算法。第二类信息转换原 理:由感知信息到知识的转换,见图 6。 图 6 的输入是“语义信息”,代表了主体对“问 题”的感性认识,是第一类信息转换的产物;输出是 “知识”,代表了“认知 (第二类信息转换)”所得到的 结果。模型表明,“综合知识库”是认知系统的核心, 它要包含信息的表示、知识的表示、认知的目的、归 纳型的逻辑方法 (包括归纳、类比、联想、分类、聚 类、抽象化等)。没有这样的综合知识库,认知的任 务就难以完成。图 6 中的预处理是为了使用归纳型 算法所要采取的一些预备步骤,后处理则是为了规 范“知识的表示”所需要的一些处理。 第 1 期 钟义信:机制主义人工智能理论——一种通用的人工智能理论 ·9·
·10- 智能系统学报 第13卷 语义信息 知识 预处理 归纳型算法 后处理 演绎过程不足以生成智能策略,就可以返回去要求 归纳新的知识,以支持更好的演绎。 认识论 欠成熟的 成熟的 超成熟的 信息 经验知识 规范知识 综合知识库 归纳学 验证提炼 自然沉淀常识知识 图6第二类信息转换原理模型示意图 Fig.6 A schematic diagram of second type of information conversion principles 本能知识 图7是“由语义信息转换为知识”的一个具体例 图8知识的内生态规律 子,即由钢笔、毛笔、铅笔这类具体的事物名称(语 Fig.8 The internal ecological law of knowledge 义信息)归纳出“笔”这个抽象概念(知识)的过程。 从中可以看出,语义信息(由相应的语法信息和语 认识论信息 归纳H 知识 (演绎)智能(策略 用信息映射命名所确定)是生成知识(概念是知识 的“原子”)的基础和前提:通过分别对具体事物(钢 图9知识的外部生态规律模型 笔、毛笔、铅笔)的语义信息的共性形态特征和共性 Fig.9 Model of external ecological law of knowledge 功能(效用)特征的提取,就归纳出抽象概念(笔)的 同信息的表示方法类似,也可以用因素空间理 共性形态特征和共性功能(价值)特征,从而抽象出 论有效地表示知识29。 了“笔的概念(知识的一个原子)。 4.3决策(智能创生):第三类信息转换原理 笔 对照图2的模型可知,智能系统最为核心也是 最复杂的任务是:针对主体所选定的具体问题(语 共性形态特征集 共性功能特征集 义信息代表了主体对于“问题的感性认识),在相关 知识支持下,在目标牵引下,创生解决问题达到目 标的智能策略。之所以这样说,是因为:智能策略 钢笔 毛笔 铅笔 是系统解决问题的“智能水平”的最集中体现,而 生成智能策略的过程也是最为复杂的过程,包括基 形态特 功能特 形态特 功能特 形态待 功能特 征集1 征集1 征集2 征集2 征集3 征集3 础意识的生成、情感的生成、理智的生成以及综合 图7由语义信息转换为知识的例子 决策。 Fig.7 An example of conversion from semantic informa- 其中所说的“理智”,大体上相当于现行人工智 tion to knowledge 能术语中的“智能”;不过,真正的智能应是基础意 读者不难由此举一反三,分析更多“由语义信息 识(基础智能)、情感(感性智能)和理智(理性智 归纳知识”的实际案例。所有的案例都会表明,如果 能)的综合表现,因此,为了与“基础意识”和“情感” 没有语义信息这个前提,获得知识就会成为无源之 的名称形成和谐默契的关系,这里就把过去习惯上 水。知识还具有两个特别有用的性质,这就是知识 称为“智能”的这个术语专门规范为“理性智能”,简 的内生态规律和知识的外生态规律。 称“理智”。 1)知识的内生态规律 另外,这里把智能生成称为“智能创生”,这是因 在先天的本能知识支持下,后天的经验知识才 为,由语义信息生成智能策略并非一般简单的逻辑 可以从语义信息(它是感知信息/认识论信息的代 演绎过程,其间存在许多不确定性:实际获得的语 表)归纳出来,它是“欠成熟”的知识,可通过修正和 法信息和语用信息的非完善性,由此导致语义信息 提炼而生长成为“成熟”的规范知识,两者又可通过 的不精准性以及知识的不充分性,预设目标的欠合 自然凝练生长成为“过成熟”的常识知识。本能知 理性等。因此,由语义信息生成智能策略的过程带 识、常识知识、经验知识、规范知识的概念易由图8 有难以避免的误差性,需要通过不断学习来优化, 获知。 其间也包含着“涌现”的复杂机制,是创造性生成,故 2)知识的外生态规律 日“创生”。 图9给出了知识的外生态规律模型,即由语义 如前所说,信息生态过程“源于信息,长于知 信息通过归纳生长成为知识,后者通过演绎可以生 识,成于智能”。因此,“智能创生”是人工智能理论 长成为智能策略;图中的虚线联系表示,如果通过 的“集大成者”也是最精彩最复杂的环节,而且也是
预处理 归纳型算法 后处理 语义信息 知识 综合知识库 图 6 第二类信息转换原理模型示意图 Fig. 6 A schematic diagram of second type of information conversion principles 图 7 是“由语义信息转换为知识”的一个具体例 子,即由钢笔、毛笔、铅笔这类具体的事物名称 (语 义信息) 归纳出“笔”这个抽象概念 (知识) 的过程。 从中可以看出,语义信息 (由相应的语法信息和语 用信息映射命名所确定) 是生成知识 (概念是知识 的“原子”) 的基础和前提:通过分别对具体事物 (钢 笔、毛笔、铅笔) 的语义信息的共性形态特征和共性 功能 (效用) 特征的提取,就归纳出抽象概念 (笔) 的 共性形态特征和共性功能 (价值) 特征,从而抽象出 了“笔”的概念 (知识的一个原子)。 笔 共性形态特征集 共性功能特征集 钢笔 毛笔 铅笔 形态特 征集1 功能特 征集1 形态特 征集2 功能特 征集2 形态特 征集3 功能特 征集3 图 7 由语义信息转换为知识的例子 Fig. 7 An example of conversion from semantic information to knowledge 读者不难由此举一反三,分析更多“由语义信息 归纳知识”的实际案例。所有的案例都会表明,如果 没有语义信息这个前提,获得知识就会成为无源之 水。知识还具有两个特别有用的性质,这就是知识 的内生态规律和知识的外生态规律。 1) 知识的内生态规律 在先天的本能知识支持下,后天的经验知识才 可以从语义信息 (它是感知信息/认识论信息的代 表) 归纳出来,它是“欠成熟”的知识,可通过修正和 提炼而生长成为“成熟”的规范知识,两者又可通过 自然凝练生长成为“过成熟”的常识知识。本能知 识、常识知识、经验知识、规范知识的概念易由图 8 获知。 2) 知识的外生态规律 图 9 给出了知识的外生态规律模型,即由语义 信息通过归纳生长成为知识,后者通过演绎可以生 长成为智能策略;图中的虚线联系表示,如果通过 演绎过程不足以生成智能策略,就可以返回去要求 归纳新的知识,以支持更好的演绎。 认识论 信息 欠成熟的 经验知识 成熟的 规范知识 超成熟的 常识知识 归纳学习 验证提炼 自然沉淀 本能知识 图 8 知识的内生态规律 Fig. 8 The internal ecological law of knowledge 认识论信息 归纳 知识 演绎 智能(策略) 图 9 知识的外部生态规律模型 Fig. 9 Model of external ecological law of knowledge 同信息的表示方法类似,也可以用因素空间理 论有效地表示知识[29]。 4.3 决策 (智能创生):第三类信息转换原理 对照图 2 的模型可知,智能系统最为核心也是 最复杂的任务是:针对主体所选定的具体问题 (语 义信息代表了主体对于“问题”的感性认识),在相关 知识支持下,在目标牵引下,创生解决问题达到目 标的智能策略。之所以这样说,是因为:智能策略 是系统解决问题的“智能水平”的最集中体现,而 生成智能策略的过程也是最为复杂的过程,包括基 础意识的生成、情感的生成、理智的生成以及综合 决策。 其中所说的“理智”,大体上相当于现行人工智 能术语中的“智能”;不过,真正的智能应是基础意 识 (基础智能)、情感 (感性智能) 和理智 (理性智 能) 的综合表现,因此,为了与“基础意识”和“情感” 的名称形成和谐默契的关系,这里就把过去习惯上 称为“智能”的这个术语专门规范为“理性智能”,简 称“理智”。 另外,这里把智能生成称为“智能创生”,这是因 为,由语义信息生成智能策略并非一般简单的逻辑 演绎过程,其间存在许多不确定性:实际获得的语 法信息和语用信息的非完善性,由此导致语义信息 的不精准性以及知识的不充分性,预设目标的欠合 理性等。因此,由语义信息生成智能策略的过程带 有难以避免的误差性,需要通过不断学习来优化, 其间也包含着“涌现”的复杂机制,是创造性生成,故 曰“创生”。 如前所说,信息生态过程“源于信息,长于知 识,成于智能”。因此,“智能创生”是人工智能理论 的“集大成者”也是最精彩最复杂的环节,而且也是 ·10· 智 能 系 统 学 报 第 13 卷
第1期 钟义信:机制主义人工智能理论 一种通用的人工智能理论 ·11· 现行人工智能理论局限性最为突出的部分。 但它把意识的基础部分定义得明确而具体,不但给 在展开具体的讨论之前,也有必要先明确意 出了基础意识的概念内涵,而且揭示了基础意识的 识、情感、理智等几个相关的基本概念。 生成机理,即由“代表主体对问题的感性认识的语义 注意到,智能是人类意识活动的表现:试想,如 信息Iem、本能知识和常识知识组成的知识体系 果一个人连意识能力都没有,怎么可能创生智能 K。以及主体目标G组成的联合空间”到基础意识反 呢?换言之,意识是智能生长的前提;另一方面,智 应Rn的复杂映射Ca: 能又是意识的高级表现形态。同样,人类的情感也 Ca:(Iem×KaXG)→R。 (5) 是智能的一种表现,也要以意识为前提。因此,为 需要注意,正如语义信息Im要由“语法信息和 了研究智能的生成机理,意识和情感两者都是不可 语用信息的联合”表示一样,这里生成的基础意识反 回避的概念。 应R。也要由“基础意识反应的形态和效果的联合” 以往的人工智能理论研究忽视和回避了意识和 来表示,这样才能把基础意识反应R的含义明确表 情感的要素,这是它的“片面性与失真性”的突出表 达出来。 现,是重大的失误。为了回到智能研究的正确轨 定义8情感。情感是指主体在本能知识、常 道,我们必须正视意识和情感的研究以及意识、情 识知识和经验知识支持下,在目标引导下,对外来 感、理智集成融通的研究。 的和内部的刺激信息所产生的觉察、理解并做出合 定义5意识(哲学范畴的含义)。意识,是人 乎本能知识、常识知识和经验知识及合乎目标的反 的头脑对于客观物质世界的反映,是感觉、思维等 应能力。 各种心理过程的总和。存在决定意识,意识又反作 可以看出,情感与基础意识之间存在密切联 用于存在。 系,它们都是主体对客体信息所做出的觉察、理解 哲学范畴的意识概念几乎是说:意识是物质以 和反应。但是,情感比基础意识利用了更多的知识 外的全部精神现象,非常宽泛,非常笼统,非常难以 (经验知识),情感只有在基础意识的基础之上才能 精准描述和模拟。因此,需要聚焦更具体更基础的 发生,两者之间直接相通。因此,情感生成的机制 意识定义。 也可以表示为由“代表主体对问题的感性认识的语 定义6意识(临床医学的含义)。一个人的意 义信息Im、本能知识、常识知识和经验知识三者的 识主要指他对周围环境、自身状况、周围环境事物 知识集合K。以及主体目标G组成的联合空间到 之间的关系以及自身与环境之间相互关系的觉察、 情感反应R。的复杂映射: 理解与反应的能力。 C6:(Isem X K XG)→R。 (6) 显然,与哲学范畴的意识概念相比,医学范畴 同样,系统所生成的情感反应R,也要由“情感 的意识概念就具体明确多了,不但比较容易理解和 反应R,的形态和情感反应R。的效果的联合”来 把握,而且容易检验和测试。不过,医学意义上的 表示,只有这样才能把情感反应R的含义明确表达 意识概念过于局限,而且几乎是一种纯粹现象学层 出来。 面的定义,没有涉及意识的生成机制。因此,需要 定义9理智。理智是指主体在本能知识、常 建立一种更合理更有用的意识定义一基础意识的 识知识、经验知识和规范知识支持下,在目标的引 定义。 导下,对外来的刺激信息所产生的觉察、理解并做 定义7基础意识(智能科学的含义)。基础意 出合乎本能知识、常识知识、经验知识和规范知识 识是指主体在本能知识和常识知识支持下,在主体 及合乎目标的反应能力。 目标引导下,对来自外部环境和自身内部的刺激信 同样可以看出,理智与基础意识之间存在密切 息所产生的觉察、理解并做出合乎本能知识和常识 的联系,它们都是主体对客体信息所做出的觉察、 知识及合乎目标的反应能力。 理解和反应。但是,理智比基础意识利用了更多的 概言之,意识是指在一定的知识支持下和在目 知识(经验知识和规范知识),理智只有在基础意识 标牵引下对来自外部和内部的刺激信息所产生的觉 的基础之上才能发生,且两者之间直接相通。于是 察、理解和反应能力。由此可以确信:意识是智能 也有 的基础,智能则是意识的高级形态。 Ce:(Isem X KXG)→R (7) 基础意识的定义规定:支持基础意识的知识范 式中:K。表示本能知识、常识知识、经验知识和规范 畴是本能知识和常识知识。虽然这样定义的“基础 知识四者的集合;R。表示理智反应;Isem为语义信 意识”没有覆盖全部的(宽泛而笼统的)意识概念, 息,G为目的。这里生成的理智反应R同样也要由
现行人工智能理论局限性最为突出的部分。 在展开具体的讨论之前,也有必要先明确意 识、情感、理智等几个相关的基本概念。 注意到,智能是人类意识活动的表现;试想,如 果一个人连意识能力都没有,怎么可能创生智能 呢?换言之,意识是智能生长的前提;另一方面,智 能又是意识的高级表现形态。同样,人类的情感也 是智能的一种表现,也要以意识为前提。因此,为 了研究智能的生成机理,意识和情感两者都是不可 回避的概念。 以往的人工智能理论研究忽视和回避了意识和 情感的要素,这是它的“片面性与失真性”的突出表 现,是重大的失误。为了回到智能研究的正确轨 道,我们必须正视意识和情感的研究以及意识、情 感、理智集成融通的研究。 定义 5 意识 (哲学范畴的含义)。意识,是人 的头脑对于客观物质世界的反映,是感觉、思维等 各种心理过程的总和。存在决定意识,意识又反作 用于存在。 哲学范畴的意识概念几乎是说:意识是物质以 外的全部精神现象,非常宽泛,非常笼统,非常难以 精准描述和模拟。因此,需要聚焦更具体更基础的 意识定义。 定义 6 意识 (临床医学的含义)。一个人的意 识主要指他对周围环境、自身状况、周围环境事物 之间的关系以及自身与环境之间相互关系的觉察、 理解与反应的能力。 显然,与哲学范畴的意识概念相比,医学范畴 的意识概念就具体明确多了,不但比较容易理解和 把握,而且容易检验和测试。不过,医学意义上的 意识概念过于局限,而且几乎是一种纯粹现象学层 面的定义,没有涉及意识的生成机制。因此,需要 建立一种更合理更有用的意识定义——基础意识的 定义。 定义 7 基础意识 (智能科学的含义)。基础意 识是指主体在本能知识和常识知识支持下,在主体 目标引导下,对来自外部环境和自身内部的刺激信 息所产生的觉察、理解并做出合乎本能知识和常识 知识及合乎目标的反应能力。 概言之,意识是指在一定的知识支持下和在目 标牵引下对来自外部和内部的刺激信息所产生的觉 察、理解和反应能力。由此可以确信:意识是智能 的基础,智能则是意识的高级形态。 基础意识的定义规定:支持基础意识的知识范 畴是本能知识和常识知识。虽然这样定义的“基础 意识”没有覆盖全部的 (宽泛而笼统的) 意识概念, 但它把意识的基础部分定义得明确而具体,不但给 出了基础意识的概念内涵,而且揭示了基础意识的 生成机理,即由“代表主体对问题的感性认识的语义 信息 Isem、本能知识和常识知识组成的知识体系 Ka 以及主体目标 G 组成的联合空间”到基础意识反 应 Ra 的复杂映射 Ca: Ca : (Isem ×Ka ×G) → Ra (5) 需要注意,正如语义信息 Isem 要由“语法信息和 语用信息的联合”表示一样,这里生成的基础意识反 应 Ra 也要由“基础意识反应的形态和效果的联合” 来表示,这样才能把基础意识反应 Ra 的含义明确表 达出来。 定义 8 情感。情感是指主体在本能知识、常 识知识和经验知识支持下,在目标引导下,对外来 的和内部的刺激信息所产生的觉察、理解并做出合 乎本能知识、常识知识和经验知识及合乎目标的反 应能力。 可以看出,情感与基础意识之间存在密切联 系,它们都是主体对客体信息所做出的觉察、理解 和反应。但是,情感比基础意识利用了更多的知识 (经验知识),情感只有在基础意识的基础之上才能 发生,两者之间直接相通。因此,情感生成的机制 也可以表示为由“代表主体对问题的感性认识的语 义信息 Isem、本能知识、常识知识和经验知识三者的 知识集合 Kb 以及主体目标 G 组成的联合空间”到 情感反应 Rb 的复杂映射: Cb : (Isem × Kb ×G) → Rb (6) 同样,系统所生成的情感反应 Rb 也要由“情感 反应 Rb 的形态和情感反应 Rb 的效果的联合”来 表示,只有这样才能把情感反应 Rb 的含义明确表达 出来。 定义 9 理智。理智是指主体在本能知识、常 识知识、经验知识和规范知识支持下,在目标的引 导下,对外来的刺激信息所产生的觉察、理解并做 出合乎本能知识、常识知识、经验知识和规范知识 及合乎目标的反应能力。 同样可以看出,理智与基础意识之间存在密切 的联系,它们都是主体对客体信息所做出的觉察、 理解和反应。但是,理智比基础意识利用了更多的 知识 (经验知识和规范知识),理智只有在基础意识 的基础之上才能发生,且两者之间直接相通。于是 也有 Cc : (Isem × Kc ×G) → Rc (7) 式中:Kc 表示本能知识、常识知识、经验知识和规范 知识四者的集合;Rc 表示理智反应;Isem 为语义信 息,G 为目的。这里生成的理智反应 Rc 同样也要由 第 1 期 钟义信:机制主义人工智能理论——一种通用的人工智能理论 ·11·