第15卷第3期 智能系统学报 Vol.15 No.3 2020年5月 CAAI Transactions on Intelligent Systems May 2020 D0:10.1992tis.201903031 因素空间理论下基点分类算法研究 蒲凌杰2,曾繁慧2,汪培庄2 (1.辽宁工程技术大学理学院,辽宁阜新123000;2.辽宁工程技术大学智能工程与数学研究院,辽宁阜新 123000) 摘要:目前.基于因素空间理论的背景基提取算法计算过程复杂,初始化必须依赖各因素极值,基点数量提取 冗余等原因,未能在应用中取得很好效果。为此,结合内点判别法和知识可继承、可扩展的思想,提出一种计 算简单、初始化独立、基点数量小的改进的背景基提取算法。然后,利用改进的背景基提取算法构造出一种全 新的数据分类算法一基点分类算法,基点分类算法以提取每一类样本的背景基为预测模型,再通过新定义 的-背景基,优化预测模型。数值实验表明:基点分类算法原理简单、构造难度小、分类模型泛化能力强,预测 能力准确率高,同时严格的模型限定区域又能为识别新类别提供新方法。 关键词:因素空间:背景基:背景基提取;-背景基:基点分类算法:识别新类别:数据分类:背景分布:背景关系 中图分类号:TP18文献标志码:A 文章编号:1673-4785(2020)03-0528-09 中文引用格式:蒲凌杰,曾繁慧,汪培庄.因素空间理论下基点分类算法研究.智能系统学报,2020,15(3):528-536. 英文引用格式:PU Lingjic,,ZENG Fanhui,WANG Peizhuang.Base point classification algorithm based on factor space theory, CAAI transactions on intelligent systems,2020,15(3):528-536. Base point classification algorithm based on factor space theory PU Lingjie2,ZENG Fanhui2,WANG Peizhuang2 (1.College of Science,Liaoning Technical University,Fuxin 123000,China;2.College of Intelligent Engineering and Mathematics, Liaoning Technical University,Fuxin 123000,China) Abstract:At present,the background-based extraction algorithm based on factor space theory has not achieved good results when used in applications.Reasons for its inefficiency are the calculation process is complicated,initialization depends on the extreme values of each factor,and redundancy of the number of base points extracted.Therefore,com- bining the inner point judgment method and a novel idea,an improved background-based extraction algorithm with simple calculation,independent initialization,and a few number of base points is proposed.Using the improved back- ground-based extraction algorithm,a new data classification algorithm,i.e.,base point classification algorithm,is con- structed.The algorithm extracts the background base of each type of sample as the prediction model and optimizes the prediction model through the newly defined A-background base.Finally,numerical experiments show that the base point classification algorithm is simple in principle,easy in construction,strong in generalizing the ability of classification model,and high in accuracy of prediction ability.Moreover,strict-utility model can provide new methods for identify- ing new classes Keywords:factor space;background base;background base extraction;-background base;base point classification al- gorithm;identify new classes;data classification;background distribution;background relationship 机制主义人工智能理论框架包括:机制主义论。因素空间理论是机制主义人工智能的数学 人工智能理论、泛逻辑学理论)和因素空间理 基础。背景基理论是因素空间理论框架下的一个 收稿日期:2019-03-23 重要分支。因素空间理论是现有人工智能数学理 基金项目:国家自然科学基金委主任基金项目(61350003)辽 论的进一步提升,该理论从形成事物的本质出 宁省教育厅科学技术研究经费项目(LJ2019L019). 通信作者:蒲凌杰.E-mail:1901676469@qq.com. 发,以构成事物的“基因”为维度,形成一个描述
DOI: 10.11992/tis.201903031 因素空间理论下基点分类算法研究 蒲凌杰1,2,曾繁慧1,2,汪培庄1,2 (1. 辽宁工程技术大学 理学院,辽宁 阜新 123000; 2. 辽宁工程技术大学 智能工程与数学研究院,辽宁 阜新 123000) 摘 要:目前,基于因素空间理论的背景基提取算法计算过程复杂,初始化必须依赖各因素极值,基点数量提取 冗余等原因,未能在应用中取得很好效果。为此,结合内点判别法和知识可继承、可扩展的思想,提出一种计 算简单、初始化独立、基点数量小的改进的背景基提取算法。然后,利用改进的背景基提取算法构造出一种全 新的数据分类算法−基点分类算法,基点分类算法以提取每一类样本的背景基为预测模型,再通过新定义 的 λ-背景基,优化预测模型。数值实验表明:基点分类算法原理简单、构造难度小、分类模型泛化能力强,预测 能力准确率高,同时严格的模型限定区域又能为识别新类别提供新方法。 关键词:因素空间;背景基;背景基提取;λ-背景基;基点分类算法;识别新类别;数据分类;背景分布;背景关系 中图分类号:TP18 文献标志码:A 文章编号:1673−4785(2020)03−0528−09 中文引用格式:蒲凌杰, 曾繁慧, 汪培庄. 因素空间理论下基点分类算法研究 [J]. 智能系统学报, 2020, 15(3): 528–536. 英文引用格式:PU Lingjie, ZENG Fanhui, WANG Peizhuang. Base point classification algorithm based on factor space theory[J]. CAAI transactions on intelligent systems, 2020, 15(3): 528–536. Base point classification algorithm based on factor space theory PU Lingjie1,2 ,ZENG Fanhui1,2 ,WANG Peizhuang1,2 (1. College of Science, Liaoning Technical University, Fuxin 123000, China; 2. College of Intelligent Engineering and Mathematics, Liaoning Technical University, Fuxin 123000, China) Abstract: At present, the background-based extraction algorithm based on factor space theory has not achieved good results when used in applications. Reasons for its inefficiency are the calculation process is complicated, initialization depends on the extreme values of each factor, and redundancy of the number of base points extracted. Therefore, combining the inner point judgment method and a novel idea, an improved background-based extraction algorithm with simple calculation, independent initialization, and a few number of base points is proposed. Using the improved background-based extraction algorithm, a new data classification algorithm, i.e., base point classification algorithm, is constructed. The algorithm extracts the background base of each type of sample as the prediction model and optimizes the prediction model through the newly defined λ-background base. Finally, numerical experiments show that the base point classification algorithm is simple in principle, easy in construction, strong in generalizing the ability of classification model, and high in accuracy of prediction ability. Moreover, strict-utility model can provide new methods for identifying new classes. Keywords: factor space; background base; background base extraction; λ-background base; base point classification algorithm; identify new classes; data classification; background distribution; background relationship 机制主义人工智能理论框架包括:机制主义 人工智能理论[1] 、泛逻辑学理论[2] 和因素空间理 论 [3]。因素空间理论是机制主义人工智能的数学 基础。背景基理论是因素空间理论框架下的一个 重要分支。因素空间理论是现有人工智能数学理 论的进一步提升,该理论从形成事物的本质出 发,以构成事物的“基因”为维度,形成一个描述 收稿日期:2019−03−23. 基金项目:国家自然科学基金委主任基金项目 (61350003);辽 宁省教育厅科学技术研究经费项目 (LJ2019JL019). 通信作者:蒲凌杰. E-mail:1901676469@qq.com. 第 15 卷第 3 期 智 能 系 统 学 报 Vol.15 No.3 2020 年 5 月 CAAI Transactions on Intelligent Systems May 2020
第3期 蒲凌杰,等:因素空间理论下基点分类算法研究 ·529· 事物的“基因空间”。基因最早的英文名称是 U→X(F),其性状空间是 Factor,因素就是广义的基因,所以用“因素空间 X(F)=X(f)×…×X(f) (1) 描述事物更具有普适价值。背景分布是因素空间 理论下的一个重要概念。2013年,汪培庄在讨 记为F=fUUf。式(1)的含义是:合成 论因素空间与因素库的关系时提出背景分布概 因素F的性状空间X(F)被定义成一个笛卡尔乘 念。2014一2015年,汪培庄6-1在因素空间与数 积X(f)×…×X(f). 据科学一文中讨论了数据科学与因素背景关系的 定义3因素空间。记Xr=(X(F)Fr~w,称 深刻联系。“背景分布-背景关系-背景基”模型是 Φ=(U,X)为U上的一个因素空间。 人对客观事物从观察到认识事物,再到知识形成的过 记Xx=X(f)×X()X…×X(f)称为最大性状 程。背景基的提出就是为了描述因素的背景 空间。对于离散型性状空间而言,任意a=(a, 关系。曲国华等心研究了背景分布与模糊背景 a2,…,an)∈X称为一个性状颗粒。 之间的关系。与此同时,汪培庄提出了一种构造 因素空间定义的更多解释,可参考文献[3]中 背景基的判别方法:内点判别法。该算法简单、 第1章的相关内容。 高效,可以近似描述背景关系。吕金辉等2] 定义4背景关系。给定U上的定性因素空 为了弥补该算法的近似性,给出了完整的夹角判 间中=(U,Xr),对任意相a=(a,a2,…,an)∈X,记 别定理,使得内点判别法成为一种精确的算法, 其在U上的原相为 但该方法计算较复杂,且在高维空间中提取的基 [a]=F-(a)=uEU F(u)=a) (2) 点较冗余。此外,目前大数据计算复杂性理论仍 然需要时间突破。跳出时间复杂度成指数增长 [a可能是空集,若[a侧≠O,则称a是一个实 性状颗粒,否则称a是一个虚组态。全体实性状 的约束仍是专家学者们继续研究的热点。针对以 上问题,提出了一种基于背景基的数据分类算 集合记为 法:基点分类算法。该算法可以模仿人类认识事 R=F(U)={a=(a1,a2,·,an)∈X日u∈U 物的过程,把人类学习到的知识用背景基刻画, (3) fi()=a1,f(u)=a2,…,fn(u)=an}, 不同的背景基容纳不同知识体,最终实现知识的 R称为因素,,…,n之间的背景关系,也称为因 分类与预测。从机制主义人工智能理论的角度来 素F的背景集。 看,该算法不但有监督学习和预测的能力,而且 在遇到全新知识时,有自我判断和自我分类的能 机器学习中a可以视为一条样本,[表示 力,所以说,该算法从原理上可以认为是具有一 a的对应标签。如果一个a有对应标签,则a是 定的智能生长能力。本文提出可继承可扩展的 有意义的,即a是一个实性状颗粒,否则a是没有 意义的,称a是一个虚组态。背景关系可以理解 改进的背景基提取算法(improved background-base extraction,IBBE),设计基点分类算法,通过定义- 为:所有有意义的样本构成的集合S与样本的标 签之间的因果关系。若要深入讨论集合S的分布 背景基优化预测模型,数值实验验证算法有效性。 问题,则引出定义5。 1 背景基理论基本概念 定义5背景分布。设论域U=(U,A,p)是一 个概率场,Φ=(U,X)是定义在U上的一个因素 因素空间理论中,认为因素是事物的质根,强调 空间,X=(X,B)是最大性状空间上的一个可测结 事物构成的根本。背景基则强调用集合理论表达知识 构。若所有F中的f都是可测映射,记p=pF 定义1一类事物的集合称为论域,用U表示。 为p经过F·在X上所诱导出来的概率,亦即对任 定义2映射。f:U→X(f)称为一个因素,其 意BeB,都有p(B)=pP(F)(B)。B称为因素F 中X()是∫从事物所映射出来的性状的集合,称 的背景分布。 为f的性状空间。 定义6背景基。若每个性状空间X()都 对于给定论域U上的一组因素f:U→X(f分 是有序集,背景关系R是X中的凸集,记R的所 j=1,2,…,n),称集合F={fi,f2,…,f}为当前论 有顶点所构成的集合为B=B(R)F{PP是R的顶点}, 域U的一个因素集。P(F)为F的幂集,元素个 称作背景基。S表示样本集合,当S=R时,记B的 数为2F1,此处F=n,P(F)的任意元素F:= 所有顶点构成的集合为B(S)={PP是S的顶点}, {f…,fh,其中i=1,2,…,2,{fn…,f}是P(F) 称为样本背景基。 的一个子集合,定义一个U上的合成因素F: 背景基可以生成背景关系,是背景关系的无
λ 事物的“基因空间”。基因最早的英文名称是 Factor,因素就是广义的基因,所以用“因素空间” 描述事物更具有普适价值。背景分布是因素空间 理论下的一个重要概念。2013 年,汪培庄[4] 在讨 论因素空间与因素库的关系时提出背景分布概 念。2014—2015 年,汪培庄[5-6] 在因素空间与数 据科学一文中讨论了数据科学与因素背景关系的 深刻联系。“背景分布−背景关系−背景基”模型是 人对客观事物从观察到认识事物,再到知识形成的过 程 [7-9]。背景基的提出就是为了描述因素的背景 关系。曲国华等[10-11] 研究了背景分布与模糊背景 之间的关系。与此同时,汪培庄提出了一种构造 背景基的判别方法:内点判别法。该算法简单、 高效,可以近似描述背景关系。吕金辉等 [ 1 2 ] 为了弥补该算法的近似性,给出了完整的夹角判 别定理,使得内点判别法成为一种精确的算法, 但该方法计算较复杂,且在高维空间中提取的基 点较冗余。此外,目前大数据计算复杂性理论仍 然需要时间突破[13]。跳出时间复杂度成指数增长 的约束仍是专家学者们继续研究的热点。针对以 上问题,提出了一种基于背景基的数据分类算 法:基点分类算法。该算法可以模仿人类认识事 物的过程,把人类学习到的知识用背景基刻画, 不同的背景基容纳不同知识体,最终实现知识的 分类与预测。从机制主义人工智能理论的角度来 看,该算法不但有监督学习和预测的能力,而且 在遇到全新知识时,有自我判断和自我分类的能 力,所以说,该算法从原理上可以认为是具有一 定的智能生长能力[14]。本文提出可继承可扩展的 改进的背景基提取算法 (improved background-base extraction, IBBE),设计基点分类算法,通过定义 - 背景基优化预测模型,数值实验验证算法有效性。 1 背景基理论基本概念 因素空间理论中,认为因素是事物的质根,强调 事物构成的根本。背景基则强调用集合理论表达知识 定义 1 一类事物的集合称为论域,用 U 表示。 f : U → X(f) X(f) 定义 2 映射。 称为一个因素,其 中 是 f 从事物所映射出来的性状的集合,称 为 f 的性状空间。 fj : U → X(fj) (j = 1,2,··· ,n) F ∗ = {f1, f2,··· , fn} P(F ∗ ) 2 |F ∗ | |F ∗ | = n P(F ∗ ) Fi = { f(j) ,··· , f(k) } i = 1,2,··· ,2 |F ∗ | { f(j) ,··· , f(k) } P(F ∗ ) Fi : 对于给定论域 U 上的一组因素 ,称集合 为当前论 域 U 的一个因素集。 为 F *的幂集,元素个 数 为 ,此处 , 的任意元素 ,其中 , 是 的一个子集合,定义一个 U 上的合成因素 U → X(Fi) ,其性状空间是 X (Fi) = X ( f(j) ) × ··· × X ( f(k) ) (1) Fi = f(j) ∪ ··· ∪ f(k) X(Fi) X(f(j))× ··· × X(f(k)) 记为 。式 (1) 的含义是:合成 因素 Fi 的性状空间 被定义成一个笛卡尔乘 积 。 XF∗ = {X (F)}(F∈P(F∗ )) Φ = (U,XF∗ ) 定义 3 因素空间。 记 ,称 为 U 上的一个因素空间。 Xmax = X(f1)× X(f2)× ··· × X(fn) a = (a1, a2,··· ,an) ∈ X 记 称为最大性状 空间。对于离散型性状空间而言,任意 称为一个性状颗粒。 因素空间定义的更多解释,可参考文献 [3] 中 第 1 章的相关内容。 Φ = (U,XF∗ ) a = (a1,a2,··· ,an) ∈ X 定义 4 背景关系。 给定 U 上的定性因素空 间 ,对任意相 ,记 其在 U 上的原相为 [a] = F −1 (a) = {u ∈ U|F(u) = a} (2) [a] 可能是空集,若 [a] , Ø ,则称 a 是一个实 性状颗粒,否则称 a 是一个虚组态。全体实性状 集合记为 R = F ∗ (U) = {a = (a1,a2,··· ,an) ∈ X|∃u ∈ U f1(u) = a1 , f2(u) = a2 ,··· , fn(u) = an}, (3) R 称为因素 f1, f2,··· , fn 之间的背景关系,也称为因 素 F *的背景集。 机器学习中 a 可以视为一条样本,[a] 表示 a 的对应标签。如果一个 a 有对应标签,则 a 是 有意义的,即 a 是一个实性状颗粒,否则 a 是没有 意义的,称 a 是一个虚组态。背景关系可以理解 为:所有有意义的样本构成的集合 S 与样本的标 签之间的因果关系。若要深入讨论集合 S 的分布 问题,则引出定义 5。 U = (U, A, p) Φ = (U,XF∗ ) X = (X,B) F ∗ fj p = pF∗ F ∗ B ∈ B p(B) = p ( (F ∗ ) −1 (B) ) F ∗ 定义 5 背景分布。设论域 是一 个概率场, 是定义在 U 上的一个因素 空间, 是最大性状空间上的一个可测结 构。若所有 中的 都是可测映射,记 为 p 经过 在 X 上所诱导出来的概率,亦即对任 意 ,都有 。B 称为因素 的背景分布。 X(f 定义 6 背景基。 若每个性状空间 j) 都 是有序集,背景关系 R 是 X 中的凸集,记 R 的所 有顶点所构成的集合为 B=B(R)={P|P 是 R 的顶点}, 称作背景基。S 表示样本集合,当 S=R 时,记 B 的 所有顶点构成的集合为 B(S)={P|P 是 S 的顶点}, 称为样本背景基。 背景基可以生成背景关系,是背景关系的无 第 3 期 蒲凌杰,等:因素空间理论下基点分类算法研究 ·529·
·530· 智能系统学报 第15卷 信息损失的压缩,对因素库的实际应用具有重 新的样本点。它可被删除当且仅当存在一点 要的意义。 QeS,使射线PQ与射线PO形成钝角,亦即 为了更好地说明背景关系、背景分布、背景基 (Q-PO-P)n。设B为背景基,初始值B=O, 合X和集合Y之间的关联性。这里有 含义表示人对事物的认知初始处于混沌状态,随 E,RE 着对样本的学习,B0,表示人对事物开始有了一 可得逻辑推理: 定的判断力,随着样本量的增加,B的泛化能力越 Ex→R,(R表示→) 来越强,当样本足够充分时,就会形成对特定事 因此可以认为,背景关系R保证了X与Y的 物的认知包,一个认知包就是一个知识,或者一 因果关系,背景基则限定了背景关系区域,背景 个概念。 分布表示了因果关系的概率。 改进的背景基提取算法就是在模仿人学习过 程同时提取知识轮廓,保存学到的知识。下面给 2改进的背景基提取算法 出改进的背景基提取算法步骤。 集合论的诞生,使得数学与认知实现了潜在 算法改进的背景基提取算法(BBE算法)。 的融合。人类对事物的认知表现可以用数学中的 输入样本S={:=(化1,x2,…,m)川。 集合刻画,集合可以表现概念,认知的逻辑特性 初始化背景基B=O;样本个数S;计数器 被集合论充分地表现出来。因素空间的背景基理 count=-O;0为初始基点个数。 论就是力求用数学刻画人的学习过程。从技术层 1)取S中样本x,若B<0,则x∈B,否则,转 面来讲,目前由夹角判别定理实现的知识归纳算 至2)。 法有背景基提取算法,但是该算法判别条件复 2)计算B的几何中心0: 杂、时间复杂度较大,搜寻到的基点数量太多。 这些导致表达的知识不利于继承和保存。为此, b,∈B 本章对现有算法改进,使其在减少复杂度同时, 更符合人的思维逻辑。 计算内积: 2.1背景基提取原理 (a.Bj)=aB 用技术手段实现背景基的提取,是“背景关 其中:m=0-x,B=bj-x,j=1,2,…,B。 系-背景分布-背景基”从理论到实践的关键。目 若存在B,使得(a,B)<0,那么x,是背景基 前背景基提取主要用到夹角判别定理。 B的内点,舍去,并转至1);否则x,是B的一个基 夹角判别定理设S是一个样本集。S是 点,即∈B,然后转至3)。 S的一个基点集合,其中心为O。P∈xS是一个 3)在2)中加入x可能会导致一个或多个基
信息损失的压缩,对因素库[4] 的实际应用具有重 要的意义。 为了更好地说明背景关系、背景分布、背景基 三者概念之间的联系,以图 1 为例进行图示说明。 R X Ex Ey Y B 图 1 “背景分布−背景关系−背景基”关系 Fig. 1 “Background distribution-background relationship-background base” relationship 设集合 X、Y、R,其中 Ex ⊆ X,Ey ⊆ Y ,集合 R 称 为背景关系,集合 R 的“边缘”构成背景基 B,p 是 背景分布,视为集合 R 的概率密度,可以由样本 的相 a 的频率逼近来实现。背景关系 R 表示集 合 X 和集合 Y 之间的关联性。这里有 Ex R Ey 可得逻辑推理: Ex → Ry(R表示 →) 因此可以认为,背景关系 R 保证了 X 与 Y 的 因果关系,背景基则限定了背景关系区域,背景 分布表示了因果关系的概率。 2 改进的背景基提取算法 集合论的诞生,使得数学与认知实现了潜在 的融合。人类对事物的认知表现可以用数学中的 集合刻画,集合可以表现概念,认知的逻辑特性 被集合论充分地表现出来。因素空间的背景基理 论就是力求用数学刻画人的学习过程。从技术层 面来讲,目前由夹角判别定理实现的知识归纳算 法有背景基提取算法[12] ,但是该算法判别条件复 杂、时间复杂度较大,搜寻到的基点数量太多。 这些导致表达的知识不利于继承和保存。为此, 本章对现有算法改进,使其在减少复杂度同时, 更符合人的思维逻辑。 2.1 背景基提取原理 用技术手段实现背景基的提取,是“背景关 系−背景分布−背景基”从理论到实践的关键。目 前背景基提取主要用到夹角判别定理。 S ∗ P ∈ X S ∗ 夹角判别定理[12] 设 S 是一个样本集。 是 S 的一个基点集合,其中心为 O。 \ 是一个 Q ∈ S ∗ (Q− P, O− P) n。设 B 为背景基,初始值 B=Ø, 含义表示人对事物的认知初始处于混沌状态,随 着对样本的学习,B≠Ø,表示人对事物开始有了一 定的判断力,随着样本量的增加,B 的泛化能力越 来越强,当样本足够充分时,就会形成对特定事 物的认知包,一个认知包就是一个知识,或者一 个概念。 改进的背景基提取算法就是在模仿人学习过 程同时提取知识轮廓,保存学到的知识。下面给 出改进的背景基提取算法步骤。 算法 改进的背景基提取算法 (IBBE 算法)。 S = {xi = (xi1 , xi2 输入 样本 ,··· , xin)}。 B = Ø θ 初始化 背景基 ;样本个数|S|;计数器 count=0; 为初始基点个数。 1) 取 S 中样本 xi,若|B|< θ ,则 xi ∈ B ,否则,转 至 2)。 2) 计算 B 的几何中心 o: o = 1 k ∑k j=1 bj , bj ∈ B 计算内积: (α,βj) = αβT j α = o− xi βj = bj − xi 其中: , , j = 1,2,··· ,|B|。 βj (α,βj) < 0 xi ∈ B 若存在 使得 ,那么 xi 是背景基 B 的内点,舍去,并转至 1);否则 xi 是 B 的一个基 点,即 ,然后转至 3)。 3) 在 2) 中加入 xi 可能会导致一个或多个基 ·530· 智 能 系 统 学 报 第 15 卷
第3期 蒲凌杰,等:因素空间理论下基点分类算法研究 ·531· 点再次变成内点,而内点需要被别除,因此3)功 选代=1: 能是别除B中内点。具体如下: 1)从S中读取一个样本a,count=l,此时 ①取基点b,∈B视为待测点,B中剩余的基 1B=1,B0 基点,得到B,更新B:B←-B';再返回1)读取全 (0-c,b-c=(0-c(b-c)=(-1,-2)(-1,-3)-7>0 部样本后转至5)。 因为上述内积结果都为正,即交成锐角,所以 5)输出背景基B。 认为c是一个基点,即B={a,b,c}。 通常背景基B是由矩阵存储,若样本S有n 3)在2)中B的更新可能产生新的内点,需要 个因素,B的基点个数Bm,则B是一个mm的矩阵: 进一步筛选和剔除: b11b12…b1m ①将B中的a视为内点,B=B\={b,c},按照 b2b22…b2n 2)方法判断,得到a不是B中的内点: ②将B中的b视为内点,B=B\b={a,c},按照 bml bm2…bmn 2)方法判断,得到b不是B中内点:转至4)。 B的每一行表示一个基点。 4)B中没有内点,故B={a,b,c};此时 2.3算例 count=-3<S,则转至1). 图2中,样本集合S包含点=(1,3)、b=(1,1)、 选代=2: c=(2,4)、d(2,3)、e=(4,2)和f=(3,1),利用上述改进 1)从S中取样本d,count=-4,此时1B=3,IB<2, 算法生成样本集合S的背景基B。 条件不成立,转至2)。 2)4)与上述对应步骤相同,此处省略,得到 B={a,b,c,d}。 选代=3: 1)从S中取样本e,count-=5,此时1B=4,lB<2, 条件不成立,转至2)如 2)与上述对应步骤相同,此处省略,得到 B={a,b,c,de}。 h 3)①取B中a为待测点,B=B\={b,c,d,e}, 判断得到a不是B中内点; ②取B中b为待测点,B=B\b={a,c,d,e,判 (0,0) 断得到b不是B中内点; 图2背景基内点判别法 ③取B中c为待测点,B=B\b={a,b,d,e},判 Fig.2 Angle criterion for the inner points of the back- 断得到c不是B中内点; ground base ④取B中d为待测点,B=B\b={a,b,c,e},判 计算步骤如下: 断得到d是B中的内点,再根据极点公式P、P, 输入样本集合S={a,bc,d,e,乃。 判断得到d不是极点,因此标记d点为待删除点d。 初始化背景基B=O:样本个数S=6;计数 4)B中有内点存在,删除标号d1的点,所以 器count=0。 B={a,b,c,e};此时count=-5<S,则转至1)o
点再次变成内点,而内点需要被剔除,因此 3) 功 能是剔除 B 中内点。具体如下: bj ∈ B B ∗ = B bj o ′ ①取基点 视为待测点,B 中剩余的基 点 \ 视为临时背景基;然后计算 B *的几何 中心 以及内积: (α ′ ,βi ′ ) = α ′ (βi ′ ) T , α ′ = o ′ − bj , βi ′ = b ∗ i − bj , b ∗ ∈ B 其中: ∗。 (α ′ ,βi ′ ) 0 (o−c,b−c)=(o−c)(b−c) T =(−1,−2)(−1, −3)T =7>0 因为上述内积结果都为正,即交成锐角,所以 认为 c 是一个基点,即 B={a, b, c}。 3) 在 2) 中 B 的更新可能产生新的内点,需要 进一步筛选和剔除: ①将 B 中的 a 视为内点,B * =B\a={b,c},按照 2) 方法判断,得到 a 不是 B *中的内点; ②将 B 中的 b 视为内点,B * =B\b={a,c},按照 2) 方法判断,得到 b 不是 B *中内点;转至 4)。 4 ) B 中没有内点, 故 B = { a , b , c } ; 此 时 count=3<|S|,则转至 1)。 选代 t=2: 1) 从 S 中取样本 d,count=4,此时|B|=3,|B|<2, 条件不成立,转至 2)。 2)~4) 与上述对应步骤相同,此处省略,得到 B={a, b, c, d}。 选代 t=3: 1) 从 S 中取样本 e,count=5,此时|B|=4,|B|<2, 条件不成立,转至 2)。 2) 与上述对应步骤相同,此处省略,得到 B={a, b, c, d, e}。 3) ①取 B 中 a 为待测点,B * =B\a={b, c, d, e}, 判断得到 a 不是 B *中内点; ②取 B 中 b 为待测点,B * =B\b={a, c, d, e},判 断得到 b 不是 B *中内点; ③取 B 中 c 为待测点,B * =B\b={a, b, d, e},判 断得到 c 不是 B *中内点; ④取 B 中 d 为待测点,B * =B\b={a, b, c, e},判 断得到 d 是 B *中的内点,再根据极点公式 Pj + 、Pj − 判断得到 d 不是极点,因此标记 d 点为待删除点 d1。 4) B 中有内点存在,删除标号 d1 的点,所以 B={a, b, c, e};此时 count=5<|S|,则转至 1)。 第 3 期 蒲凌杰,等:因素空间理论下基点分类算法研究 ·531·
·532· 智能系统学报 第15卷 选代仁4: 3.1 基本定义 1)从S中取样本∫,count=6,此时1B=4,B0,i=1,2,…,c,使得 [B]:=A⑧[B]:=bj=1,2,…,lB]} (5) 则称B=9[Bl:为-背景基。 (0,0) 从几何学角度看,λ-背景基B,是普通背景基 图3样本S背景基和背景分布 B的放大或缩小。当A∈[0,I)时,背景基B锁定 Fig.3 Sample S background base and background distri- 的区域R(B)包含B锁定的区域R(Bu),即 bution R(B)CR(B);当A=1时,满足关系R(B)=R(B):当 结合算法和算例,总结BBE算法的优点: A∈(1,∞)时,R(B)bR(B)。综上所言,对于区域 ①BBE算法极大简化了计算难度和编程难度; R关系满足: ②算法初始化阶段不需要依赖各因素极值: R(B)cR(B),A∈[0,1) ③极大降低了基点数量,有利于高维度数据 R(B)=R(B),A=1 提取基点。 R= R(B)pR(B)A∈[1,o] 3基点分类算法 实现A-背景基具体方法见定义9。 人工智能对数据的分类其实质是对同一类 定义9设O为第i类背景基[B],的重心,其 别的数据形成概念。本文提出的基点分类算法 中m=lB]l,jem,bge[B],则 (base point classification algorithm),简称BPC算 b=0+(0-b) (6) 法,以背景基提取算法为核心。通过对不同类别 样本进行分类打包和学习,最终将给定样本归纳 这里[B=O。 成以各类别为单位的认知包,一个认知包就是一 3.2构造基点分类算法 个概念。 据第2章的IBBE算法和第3.1节中相关定
选代 t=4: 1) 从 S 中取样本 f,count=6,此时|B|=4,|B| 0 i = 1,2,··· , c 定义 8 设 B 为 c 个类别的背景基,[B]i 为类 别 i 的背景基, b j∈[B]i,向量 , , ,使得 [Bλ]i = Λ⊗[B]i = {λibj | j = 1,2,··· ,|[B]i |} (5) Bλ = n ∪ i=1 [Bλ] 则称 i 为 λ-背景基。 λ Bλ λ ∈ [0,1) Bλ Bλ Bλ ⊂ λ = 1 Bλ λ ∈ (1,∞) Bλ ⊃ 从几何学角度看, -背景基 是普通背景基 B 的放大或缩小。当 时,背景基 B 锁定 的 区 域 R (B) 包 含 锁定的区域 R ( ) , 即 R( ) R(B);当 时,满足关系 R( ) = R(B);当 时 ,R( ) R(B)。综上所言,对于区域 R 关系满足: R = R(Bλ) ⊂ R(B), λ ∈ [0,1) R(Bλ) = R(B), λ = 1 R(Bλ) ⊃ R(B), λ ∈ [1,∞] 实现 λ-背景基具体方法见定义 9。 [B]i m = |[B]i | j ∈ m [B]i 定义 9 设 O 为第 i 类背景基 的重心,其 中 , ,bij∈ ,则 b λ i j = O+λ(O−bi j) (6) [Bλ]i = m ∪ j=1 b λ 这里 i j。 3.2 构造基点分类算法 据第 2 章的 IBBE 算法和第 3.1 节中相关定 ·532· 智 能 系 统 学 报 第 15 卷
第3期 蒲凌杰,等:因素空间理论下基点分类算法研究 ·533· 义,本节设计一种新型的分类算法:基点分类算 2)利用函数IBBE(x[B]),更新B中原来的 法(BPC算法)。下面采用图示方法对BPC算法 背景基[B],具体做法为 的构造原理进行详细阐述和说明。 [B];=BBE(x,[B]) 如图4所示:图(a)为待分类的数据集,不同 B=update([B],[B]) 符号代表不同的类别,共3个类别;图(b)呈现了 由IBBE算法提取的每个类别的基点;为了形象 函数update()功能是更新B中[B]o 表示基点围成的区域,图(c)表示在图(b)基础上 3)计算每个类别的重心O。 围成凸多边形,其中该凸多边形可用来近似代替 4)对B中每个类别做A变换得到[B:。 各类别的背景分布,其中“☆”表示每个类别的重 5)输出Buo 心(由样本生成,而非由基点生成),这在一定程度 设M表示样本个数,N表示因素个数,p表示 上还原了样本背景分布的情形;图(d)表示的是 基点个数。当样本数量较少时,p2与M的数量级 λ-背景基的求解过程,其中实线段围成的凸多边 接近;当样本数量远远大于N和p2时,此时N和 形是A-背景基;图(e)就是分类器最后呈现出的 p可以忽略不计,时间复杂度为OMWp)OM0。 背景基,由00,i=1,2,…,co 图5为3个类别样本集的分布情况;图6展 初始化背景基B=O。 现由基点分类法找到的各类别样本的基点,3个 1)从S中取样本x,判定x类别i;从B中提 类的基点用不同的符号表示;图7是删除各类别 取类别为i的背景基[B。 内点保留基点的示意图
义,本节设计一种新型的分类算法:基点分类算 法 (BPC 算法)。下面采用图示方法对 BPC 算法 的构造原理进行详细阐述和说明。 λ λ 0 0 i = 1,2,··· , c 输入 c 个类别的样本集合 S,各类别用 i 表示;参数向量 , , 。 初始化 背景基 B=Ø。 1) 从 S 中取样本 xk,判定 xk 类别 i;从 B 中提 取类别为 i 的背景基 [B]i。 2) 利用函数 IBBE(xk , [B]i ),更新 B 中原来的 背景基 [B]i,具体做法为 [B] ′ i = IBBE(xk ,[B]i) B = update([B] ′ i ,[B]i) 函数 update() 功能是更新 B 中 [B]i。 3) 计算每个类别的重心 O。 4) 对 B 中每个类别做 λ 变换得到 [Bλ]i。 5) 输出 Bλ。 设 M 表示样本个数,N 表示因素个数,p 表示 基点个数。当样本数量较少时,p 2 与 M 的数量级 接近;当样本数量远远大于 N 和 p 2 时,此时 N 和 p 2 可以忽略不计,时间复杂度为 O(MNp2 )≈O(M)。 因此,BPC 算法在处理大样本数据时优势明显。 4 数值实验 λ− 采用两个实验对 BPC 算法进行测试。实验 1 采用二维数据作测试样本,用来说明 BPC 算法 在对二维数据分类时效果良好,且有发现新类别 的优点。实验 2 用三维数据作测试样本,用来说 明 BPC 算法在对三维数据分类效果同样良好,并 突出了 背景基的在预测时的优势。 4.1 二维数据 为了验证 BPC 算法的可行性以及实际分类 效果,实验 1 采用二维数据作为样本数据。数据 由 Matlab 软件仿真得到,仿真数据为均匀分布, 每类样本集均为凸集,有 2 个因素,3 个类别,每个 类别 100 个样本,共计 300 个样本。不同类别用 不同符号标记,如图 5 的图例所示。 −150 −100 −50 0 50 100 150 200 250 100 50 0 −50 −100 −150 class1 class2 class3 f2 f1 图 5 样本分布 Fig. 5 Sample distribution 图 5 为 3 个类别样本集的分布情况;图 6 展 现由基点分类法找到的各类别样本的基点,3 个 类的基点用不同的符号表示;图 7 是删除各类别 内点保留基点的示意图。 第 3 期 蒲凌杰,等:因素空间理论下基点分类算法研究 ·533·
·534· 智能系统学报 第15卷 100 据特点:每类数据集均为凸集,3个因素,3个类 别class1、class2和class3.,每一类220个样本,其 中classl与class2数据为均匀分布,class3为非均 0 匀分布,3个类别线性可分,见表1。 表1实验2数据说明 Table 1 Data description of experiment 2 -100 类别 数据分布 因素个数各类别样本数量数据特点 -15 -150-100-50050100150200250 class1 均匀分布 3 222 凸集 图6二维基点分布 class2 均匀分布 3 222 凸集 Fig.6 2D base point distribution class3非均匀分布 3 222 凸集 100 +class1 BD class2 BD 图8展示了数据集的分布情况,不同符号代 50 class3 BD 8 表不同类别。 0 -50 *classl class? -100 class3 -150 150-100-50050100150200250 图7提取样本基点 Fig.7 Get the sample base point BPC算法采用基点限定区域原理学习和预 测,由于其原理与SVM算法原理具有相似性,所 2-2 以实验结果与SVM(libsvm)算法进行比较是合理 图8样本分布视角1 的。训练数据与测试数据为同一组数据。通过 Fig.8 Samples distribution Matlab编程得到BPC算法的训练函数和预测函 BPC算法可以提取三维数据的背景基。图9 数。实验结果表明,BP℃算法准确率为98.33%,SVM 展示的是用BPC算法提取到实验2数据的背景 算法准确率为100.00%,两者结果相当。从实验 基。由于BPC算法继承了IBBE算法的优点,所 结果来看,BPC算法在开始阶段表现良好。 以提取到的基点数量少,却又能高效覆盖所要表 除此之外,通过分析实验,还能得到以下结论: 达的信息。从图10可以看出,各类别的背景基数 1)在线性可分的样本分布下,BPC算法与 量远小于样本边界的数量。 SVM算法预测结果相近,但BPC算法原理更简 单易懂、实验结果可解释性强,在一定程度上更 5 *classl BD 符合人的思维逻辑。 ·class2BD oclassi BD 2)BPC算法分类是通过构建每个类别的背景 基来限定各类别区域范围,这种划分原理比 SVM算法用超平面划分原理更加精准。当出现 oo: 新类别样本时,BPC算法可以及时发现远离它的 *.,·1 类别,并为其定义新标签,而SVM算法只会将该 能% 样本归类到已学习到的类别中,不会产生新类 * 别。所以,BPC算法的一个非常明显的优势是在 12 0 1 预测中可以发现新类别。 2-2106 4.2三维数据 图9提取样本基点 实验2数据由Matlab仿真结果得到。仿真数 Fig.9 Get the sample base point
−150 −100 −50 0 50 100 150 200 250 100 50 0 −50 −100 −150 class1 BD class2 BD class3 BD f2 f1 图 6 二维基点分布 Fig. 6 2D base point distribution −150 −100 −50 0 50 100 150 200 250 100 50 0 −50 −100 −150 class1 BD class2 BD class3 BD f2 f1 图 7 提取样本基点 Fig. 7 Get the sample base point BPC 算法采用基点限定区域原理学习和预 测,由于其原理与 SVM 算法原理具有相似性,所 以实验结果与 SVM(libsvm) 算法进行比较是合理 的。训练数据与测试数据为同一组数据。通过 Matlab 编程得到 BPC 算法的训练函数和预测函 数。实验结果表明,BPC 算法准确率为 98.33%,SVM 算法准确率为 100.00%,两者结果相当。从实验 结果来看,BPC 算法在开始阶段表现良好。 除此之外,通过分析实验,还能得到以下结论: 1) 在线性可分的样本分布下,BPC 算法与 SVM 算法预测结果相近,但 BPC 算法原理更简 单易懂、实验结果可解释性强,在一定程度上更 符合人的思维逻辑。 2)BPC 算法分类是通过构建每个类别的背景 基来限定各类别区域范围,这种划分原理 比 SVM 算法用超平面划分原理更加精准。当出现 新类别样本时,BPC 算法可以及时发现远离它的 类别,并为其定义新标签,而 SVM 算法只会将该 样本归类到已学习到的类别中,不会产生新类 别。所以,BPC 算法的一个非常明显的优势是在 预测中可以发现新类别。 4.2 三维数据 实验 2 数据由 Matlab 仿真结果得到。仿真数 据特点:每类数据集均为凸集,3 个因素,3 个类 别 class1、class2 和 class3,每一类 220 个样本,其 中 class1 与 class2 数据为均匀分布,class3 为非均 匀分布,3 个类别线性可分,见表 1。 表 1 实验 2 数据说明 Table 1 Data description of experiment 2 类别 数据分布 因素个数 各类别样本数量 数据特点 class1 均匀分布 3 222 凸集 class2 均匀分布 3 222 凸集 class3 非均匀分布 3 222 凸集 图 8 展示了数据集的分布情况,不同符号代 表不同类别。 4 2 0 −2 2 −2 −1 −1 −1 0 0 1 1 class1 class2 class3 2 5 3 1 f1 f2 f3 图 8 样本分布视角 1 Fig. 8 Samples distribution BPC 算法可以提取三维数据的背景基。图 9 展示的是用 BPC 算法提取到实验 2 数据的背景 基。由于 BPC 算法继承了 IBBE 算法的优点,所 以提取到的基点数量少,却又能高效覆盖所要表 达的信息。从图 10 可以看出,各类别的背景基数 量远小于样本边界的数量。 class1 BD class2 BD 4 class3 BD 2 0 −2 2 −2 −1 −1 −1 0 0 1 1 2 5 3 1 f1 f2 f3 图 9 提取样本基点 Fig. 9 Get the sample base point ·534· 智 能 系 统 学 报 第 15 卷
第3期 蒲凌杰,等:因素空间理论下基点分类算法研究 ·535· 算法可以发现新类别,新类别可以衍生新概念。 5+class1 BD ·class2BD 从机制主义人工智能理论出发,机器能产生新概 oclassi BD 念则具有自我学习和扩展学习的能力。据此可 得,BPC算法是具有一定智能生长机制的。 3)BPC算法使用A-背景基使得预测或决策 更灵活。分类器重复训练模型的代价很大,为了 0 减小代价、充分利用已训练模型,-背景基可以 0 在原训练模型基础上,根据需要扩大或缩小预测 1 2-2 区域,这种处理可以减少重复训练的代价,同时 图10三维样本基点分布 可以继承原有知识。 Fig.10 3D sample base point distribution 4)BPC算法原理完全由智能数学描述,其算 通过学习和预测实验2的数据,实验得出: 法和原理较传统数学更加简单高效。 BPC算法准确率为97.73%,SVM算法准确率为 5)BPC算法得到的模型不是“黑箱”,而是具 99.09%。从结果来看,BPC算法结果与SVM算法 有可解释的、符合人类逻辑思维的“白箱”。理论上, 结果相当。但是从预测模型来看,BPC算法比 该模型是决策者思维的同构映射。 SVM算法更具有灵活性,这主要体现在A-背景基 5结束语 的优势。 从图8可以看出,class.3样本集的外围数据明 本文从因素空间的背景基理论出发,首先改 显处于游离状态,其结合紧密程度远不如核心区 进了背景基提取算法,简化了计算步骤,降低了 域,采用-背景基,可以缩小区域范围,使其决策 时间复杂度,从整体上提高了算法效率。其次, 的可信度更高。 构造了基点分类算法,并通过2个实验展示了该 通过试错实验方法,最后得到当A=0.7时背 算法在线性可分数据集的独特优势。下一步工作 景基能刚好包含核心数据。图I1为class3数据 将研究非线性数据集处理、非凸数据集类别处理 集的背景基B和A-背景基B1的示意图,此时 和精准识别新类别等。主要工作思路有:1)对于 0<A<1,B,cB。通过调节A参数,改变由基点限 线性不可分数据集,采用分块链式策略。将数据 定的区域,这有利于抓取数据集核心特征。该方 按照一定规则划分成块状,然后用子背景基进行 法除了分类应用以外,也可为决策者提供决策依据。 包络,最终链式连接多个子背景基;2)对于非凸 数据集类别,可以采用因素映射方法,即通过分 析因素值变化的单调性进行相应的映射变换。 参考文献: [1]钟义信.机制主义人工智能理论- 一一种通用的人工智 能理论.智能系统学报,2018,13(1):2-18. ZHONG Yixin.Mechanism-based artificial intelligence theory:a universal theory of artificial intelligence[J]. 2-2 -106 CAAI transactions on intelligent systems,2018,13(1): 2-18. 图11 class3的背景基B与d-背景基B, [2]何华灿.泛逻辑学理论一机制主义人工智能理论的逻 Fig.11 Background base B andA-background baseB of class3 辑基础.智能系统学报,2018,13(1):19-36. HE Huacan.Universal logic theory:logical foundation of 4.3总结 mechanism-based artificial intelligence theory[J].CAAI BPC算法的特点如下: transactions on intelligent systems,2018,13(1):19-36. 1)上述实验只是针对二维、三维数据进行 [3]汪培庄,因素空间理论一机制主义人工智能理论的数学 的,实际上,BPC算法可以扩展到n维数据集上, 基础】.智能系统学报,2018,131):37-54. 且时间复杂度随着维度增加呈线性增长,避免了 WANG Peizhuang.Factor space-mathematical basis of 高维数据基点冗余的现象。 mechanism based artificial intelligence theory[J].CAAI 2)BPC算法具有智能的生长机制。由于BPC transactions on intelligent systems,2018,13(1):37-54
class1 BD class2 BD 4 class3 BD 5 3 2 2 2 1 1 0 0 0 −1−2 −2 −1 f3 f1 f2 图 10 三维样本基点分布 Fig. 10 3D sample base point distribution λ 通过学习和预测实验 2 的数据,实验得出: BPC 算法准确率为 97.73%,SVM 算法准确率为 99.09%。从结果来看,BPC 算法结果与 SVM 算法 结果相当。但是从预测模型来看,BPC 算法比 SVM 算法更具有灵活性,这主要体现在 -背景基 的优势。 λ 从图 8 可以看出,class3 样本集的外围数据明 显处于游离状态,其结合紧密程度远不如核心区 域,采用 -背景基,可以缩小区域范围,使其决策 的可信度更高。 λ λ Bλ 0 < λ < 1 Bλ ⊂ B λ 通过试错实验方法,最后得到当 =0.7 时背 景基能刚好包含核心数据。图 11 为 class 3 数据 集的背景基 B 和 -背景基 的示意图,此时 , 。 通过调节 参数,改变由基点限 定的区域,这有利于抓取数据集核心特征。该方 法除了分类应用以外,也可为决策者提供决策依据。 B Bλ 4 2 −2 −2 −1 −1 0 0 2 2 5 3 1 1 f 1 2 f1 f3 图 11 class3 的背景基 B 与 λ-背景基 Bλ Fig. 11 Background base B and λ -background base Bλ of class3 4.3 总结 BPC 算法的特点如下: 1) 上述实验只是针对二维、三维数据进行 的,实际上,BPC 算法可以扩展到 n 维数据集上, 且时间复杂度随着维度增加呈线性增长,避免了 高维数据基点冗余的现象。 2) BPC 算法具有智能的生长机制。由于 BPC 算法可以发现新类别,新类别可以衍生新概念。 从机制主义人工智能理论出发,机器能产生新概 念则具有自我学习和扩展学习的能力。据此可 得,BPC 算法是具有一定智能生长机制的。 λ λ 3) BPC 算法使用 -背景基使得预测或决策 更灵活。分类器重复训练模型的代价很大,为了 减小代价、充分利用已训练模型, -背景基可以 在原训练模型基础上,根据需要扩大或缩小预测 区域,这种处理可以减少重复训练的代价,同时 可以继承原有知识。 4) BPC 算法原理完全由智能数学描述,其算 法和原理较传统数学更加简单高效。 5) BPC 算法得到的模型不是“黑箱”,而是具 有可解释的、符合人类逻辑思维的“白箱”。理论上, 该模型是决策者思维的同构映射。 5 结束语 本文从因素空间的背景基理论出发,首先改 进了背景基提取算法,简化了计算步骤,降低了 时间复杂度,从整体上提高了算法效率。其次, 构造了基点分类算法,并通过 2 个实验展示了该 算法在线性可分数据集的独特优势。下一步工作 将研究非线性数据集处理、非凸数据集类别处理 和精准识别新类别等。主要工作思路有:1) 对于 线性不可分数据集,采用分块链式策略。将数据 按照一定规则划分成块状,然后用子背景基进行 包络,最终链式连接多个子背景基;2) 对于非凸 数据集类别,可以采用因素映射方法,即通过分 析因素值变化的单调性进行相应的映射变换。 参考文献: 钟义信. 机制主义人工智能理论−一种通用的人工智 能理论 [J]. 智能系统学报, 2018, 13(1): 2–18. ZHONG Yixin. Mechanism-based artificial intelligence theory: a universal theory of artificial intelligence[J]. CAAI transactions on intelligent systems, 2018, 13(1): 2–18. [1] 何华灿. 泛逻辑学理论−机制主义人工智能理论的逻 辑基础 [J]. 智能系统学报, 2018, 13(1): 19–36. HE Huacan. Universal logic theory: logical foundation of mechanism-based artificial intelligence theory[J]. CAAI transactions on intelligent systems, 2018, 13(1): 19–36. [2] 汪培庄. 因素空间理论—机制主义人工智能理论的数学 基础 [J]. 智能系统学报, 2018, 13(1): 37–54. WANG Peizhuang. Factor space-mathematical basis of mechanism based artificial intelligence theory[J]. CAAI transactions on intelligent systems, 2018, 13(1): 37–54. [3] 第 3 期 蒲凌杰,等:因素空间理论下基点分类算法研究 ·535·
·536· 智能系统学报 第15卷 [4]汪培庄.因素空间与因素库),辽宁工程技术大学学报 gorithm of extraction of background bases[J].Fuzzy sys- (自然科学版),2013,32(10):1297-1304. tems and mathematics,2017,31(6):82-86 WANG Peizhuang.Factor spaces and factor data-bases[J]. [13]李建中,李英姝.大数据计算的复杂性理论与算法研究 Journal of Liaoning Technical University (Natural 进展).中国科学:信息科学,2016,46(9):1255-1275 Science),2013,32(10:1297-1304. LI Jianzhong,LI Yingshu.Research progress in the com- [5]汪培庄.因素空间与数据科学).辽宁工程技术大学学 plexity theory and algorithms of big-data computation[J]. 报(自然科学版),2015,34(2:273-280. SCIENTIA SINICA informationis,2016,46(9): WANG Peizhuang.Factor spaces and data science[J]. 1255-1275 Journal of Liaoning Technical University (Natural [14]PAWLAK Z.Rough sets[J].International journal of com- Science),2015,342):273-280. puter information sciences,1982,11(5):341-356. [6]WANG Peizhuang,LIU Zengliang,SHI Yong,et al.Factor space,the theoretical base of data science[J].Annals of 作者简介: data science,2014,1(2):233-25L. 蒲凌杰.硕士研究生,主要研究方 [7]WANG Peizhuang,OUYANG He,ZHONG Yixin,et al. 向为因素空间理论、数据挖掘、智能 Cognition math based on factor space[J].Annals of data 决策。 science,2016.3(3:281-303. [8]钟义信.高等人工智能原理:观念·方法模型理论M 北京:科学出版社,2014 [9]钟义信.信息科学与技术导论M.3版.北京:北京邮电 大学出版社,2015. 曾繁慧,教授,主要研究方向为基 [10]曲国华,曾繁慧,刘增良,等.因素空间中的背景分布与 于因素空间的数据挖掘理论与应用 模糊结构元理论与应用。参与完成中 模糊背景关系.模糊系统与数学,2017,31(6):66-73. 国工程院重点项目、国家自然科学基 QU Guohua,ZENG Fanhui,LIU Zengliang,et al.Back- 金项目、辽宁省基金项日、教育部高校 ground distribution and fuzzy background relation in 博士学科点专项科研基金项目等。获 factor spaces[J].Fuzzy systems and mathematics,2017, 多项省、市级奖励。发表学术论文 31(6:66-73. 50余篇。 [11]曾繁慧,郑莉.因素分析法的样本培育.辽宁工程技 术大学学报(自然科学版),2017,36(3):320-323 汪培庄,教授,博士生导师,主要 研究方向为模糊数学及其在人工智能 ZENG Fanhui,ZHENG Li.Sample cultivation in factori- 中的应用.近期主要致力于因素空间 al analysis[J].Journal of Liaoning Technical University 在人工智能和数据科学中的应用研 (Natural Science),2017,36(3):320-323. 究。提出和创立了模糊集的随机落影 [12]吕金辉,刘海涛,郭芳芳,等.因素空间背景基的信息压 表示、真值流推理和因素空间等数学 缩算法).模糊系统与数学,2017,31(6):82-86 理论,多次获得国家级和部委级奖励, LV Jinhui,LIU Haitao,GUO Fangfang,et al.The al- 获得一次国际奖。发表学术论文200余篇,出版学术著作4部
汪培庄. 因素空间与因素库 [J]. 辽宁工程技术大学学报 (自然科学版), 2013, 32(10): 1297–1304. WANG Peizhuang. Factor spaces and factor data-bases[J]. Journal of Liaoning Technical University (Natural Science), 2013, 32(10): 1297–1304. [4] 汪培庄. 因素空间与数据科学 [J]. 辽宁工程技术大学学 报(自然科学版), 2015, 34(2): 273–280. WANG Peizhuang. Factor spaces and data science[J]. Journal of Liaoning Technical University (Natural Science), 2015, 34(2): 273–280. [5] WANG Peizhuang, LIU Zengliang, SHI Yong, et al. Factor space, the theoretical base of data science[J]. Annals of data science, 2014, 1(2): 233–251. [6] WANG Peizhuang, OUYANG He, ZHONG Yixin, et al. Cognition math based on factor space[J]. Annals of data science, 2016, 3(3): 281–303. [7] 钟义信. 高等人工智能原理: 观念·方法·模型·理论 [M]. 北京: 科学出版社, 2014. [8] 钟义信. 信息科学与技术导论 [M]. 3 版. 北京: 北京邮电 大学出版社, 2015. [9] 曲国华, 曾繁慧, 刘增良, 等. 因素空间中的背景分布与 模糊背景关系 [J]. 模糊系统与数学, 2017, 31(6): 66–73. QU Guohua, ZENG Fanhui, LIU Zengliang, et al. Background distribution and fuzzy background relation in factor spaces[J]. Fuzzy systems and mathematics, 2017, 31(6): 66–73. [10] 曾繁慧, 郑莉. 因素分析法的样本培育 [J]. 辽宁工程技 术大学学报(自然科学版), 2017, 36(3): 320–323. ZENG Fanhui, ZHENG Li. Sample cultivation in factorial analysis[J]. Journal of Liaoning Technical University (Natural Science), 2017, 36(3): 320–323. [11] 吕金辉, 刘海涛, 郭芳芳, 等. 因素空间背景基的信息压 缩算法 [J]. 模糊系统与数学, 2017, 31(6): 82–86. LV Jinhui, LIU Haitao, GUO Fangfang, et al. The al- [12] gorithm of extraction of background bases[J]. Fuzzy systems and mathematics, 2017, 31(6): 82–86. 李建中, 李英姝. 大数据计算的复杂性理论与算法研究 进展 [J]. 中国科学: 信息科学, 2016, 46(9): 1255–1275. LI Jianzhong, LI Yingshu. Research progress in the complexity theory and algorithms of big-data computation[J]. SCIENTIA SINICA informationis, 2016, 46(9): 1255–1275. [13] PAWLAK Z. Rough sets[J]. International journal of computer & information sciences, 1982, 11(5): 341–356. [14] 作者简介: 蒲凌杰,硕士研究生,主要研究方 向为因素空间理论、数据挖掘、智能 决策。 曾繁慧,教授,主要研究方向为基 于因素空间的数据挖掘理论与应用、 模糊结构元理论与应用。参与完成中 国工程院重点项目、国家自然科学基 金项目、辽宁省基金项目、教育部高校 博士学科点专项科研基金项目等。获 多项省、市级奖励。发表学术论文 50 余篇。 汪培庄,教授,博士生导师,主要 研究方向为模糊数学及其在人工智能 中的应用,近期主要致力于因素空间 在人工智能和数据科学中的应用研 究。提出和创立了模糊集的随机落影 表示、真值流推理和因素空间等数学 理论,多次获得国家级和部委级奖励, 获得一次国际奖。发表学术论文 200 余篇,出版学术著作 4 部。 ·536· 智 能 系 统 学 报 第 15 卷