D0I:10.13374/1.issm100103.2008.08.025 第30卷第8期 北京科技大学学报 Vol.30 No.8 2008年8月 Journal of University of Science and Technology Beijing Aug:2008 基于互信息的多关系朴素贝叶斯分类器 徐光美杨炳儒秦奕青张伟 北京科技大学信息工程学院,北京100083 摘要为进一步提高多关系朴素贝叶斯方法的分类准确率,分析了已有的剪枝方法,并扩展互信息标准到多关系情况下· 基于元组号传播方法和面向元组的统计计数方法,给出了基于扩展互信息标准进行属性选择的方法和步骤,并建立了一种基 于扩展互信息的多关系朴素贝叶斯分类器。标准数据集上的实验显示,基于扩展互信息标准进行属性选择,可以在不增加算 法时间复杂度的前提下,找到与分类属性最相关的属性,并在仅有极少属性参与分类时,得到较高的分类准确率.Mutagenesis 数据集上的实验则显示,这种属性选择可以使多关系问题退化为单关系问题,大大降低了分类代价 关键词朴素贝叶斯:分类器:多关系数据挖掘:归纳逻辑程序设计:互信息 分类号TP391 Multi-relational Nalve Bayesian classifier based on mutual information XU Guangmei,YA NG Bingru,QIN Yiqing,ZHANG Wei School of Information Engineering.University of Science and Technology Beijing.Beijing 100083 ABSTRACI To improve the accuracy of multi-relational Naive Bayesian classifiers.the existing pruning methods were discussed and the attribute filter criterion was upgraded based on mutual information to deal with multi-relational data directly.On the basis of the tuple ID propagation method and counting methods towards tuple.the filter method based on extended mutual information was given. and a multi-relational Naive Bayesian classifier based on mutual information(MI-MRNBC)was implemented.Experimental results show that,in a multi-relational domain,with the help of the attribute filter based on extended mutual information,the classifier can give a better accuracy without the increase of time complexity.In extraordinary instances.the multi-relational classification degener- ates into a single relational one,which extremely decreases the cost of classification. KEY WORDS Naive bayesian:classifier:multi-relational data mining (MRDM):inductive logic programming (ILP):mutual in- formation 随着多关系数据挖掘的兴起,各种各样的多关 Graph NB中使用了一种叫做“Cutting off”的剪枝 系朴素贝叶斯分类器(multi-relational Naive 策略,对表进行剪枝,以提高分类准确率。但是这种 Bayesian classifier,MRNBC)被提出,其中大多数方 方法有很多缺点:第一,对于朴素贝叶斯分类而言, 法基于归纳逻辑程序设计(inductive logic program~ 参与分类的基本单位是属性而不是表,因此直接删 ming,ILP)技术形成,这类方法通常都通过用户定 除弱连接的表是明显不合适的·第二,特征选择有 义的参数和语言偏置控制规则长度,从而降低问题 两种方法一过滤方法(filter)和打包方法(wrap 规模、提高分类准确率,例如:基于ILP一R的多关 per),“Cutting off"剪枝方法是一种打包方法,打包 系朴素贝叶斯分类方法山、1BC2]、1BC2方法[3]、 方法是与分类器绑定的剪枝策略,它选择的是与分 Mr-SBC方法可和nFOIL方法6等;基于Cross- 类器特点相匹配的最好属性,所以理论上能够得到 Mime的元组号传播方法];基于关系数据库技术 很好的准确率;但打包方法找到的好的属性仅适于 的多关系朴素贝叶斯分类方法一Graph一NB). 当前所用分类器,而且使用打包方法明显需要付出 收稿日期:2007-07-24修回日期:2007-12-17 基金项目:国家自然科学基金资助项目(N。-60675030) 作者简介:徐光美(1977-),女,博士研究生;杨炳儒(1943一),男,教授,博士生导师,E mail:bryang--kd@yahoo~com~cm
基于互信息的多关系朴素贝叶斯分类器 徐光美 杨炳儒 秦奕青 张 伟 北京科技大学信息工程学院北京100083 摘 要 为进一步提高多关系朴素贝叶斯方法的分类准确率分析了已有的剪枝方法并扩展互信息标准到多关系情况下. 基于元组号传播方法和面向元组的统计计数方法给出了基于扩展互信息标准进行属性选择的方法和步骤并建立了一种基 于扩展互信息的多关系朴素贝叶斯分类器.标准数据集上的实验显示基于扩展互信息标准进行属性选择可以在不增加算 法时间复杂度的前提下找到与分类属性最相关的属性并在仅有极少属性参与分类时得到较高的分类准确率.Mutagenesis 数据集上的实验则显示这种属性选择可以使多关系问题退化为单关系问题大大降低了分类代价. 关键词 朴素贝叶斯;分类器;多关系数据挖掘;归纳逻辑程序设计;互信息 分类号 TP391 Mult-i relational Naïve Bayesian classifier based on mutual information XU GuangmeiY A NG BingruQIN Y iqingZHA NG Wei School of Information EngineeringUniversity of Science and Technology BeijingBeijing100083 ABSTRACT To improve the accuracy of mult-i relational Naïve Bayesian classifiersthe existing pruning methods were discussed and the attribute filter criterion was upgraded based on mutual information to deal with mult-i relational data directly.On the basis of the tuple ID propagation method and counting methods towards tuplethe filter method based on extended mutual information was given and a mult-i relational Naïve Bayesian classifier based on mutual information (MI-MRNBC) was implemented.Experimental results show thatin a mult-i relational domainwith the help of the attribute filter based on extended mutual informationthe classifier can give a better accuracy without the increase of time complexity.In extraordinary instancesthe mult-i relational classification degenerates into a single relational onewhich extremely decreases the cost of classification. KEY WORDS Naïve bayesian;classifier;mult-i relational data mining (MRDM);inductive logic programming (ILP);mutual information 收稿日期:2007-07-24 修回日期:2007-12-17 基金项目:国家自然科学基金资助项目(No.60675030) 作者简介:徐光美(1977—)女博士研究生;杨炳儒(1943—)男教授博士生导师E-mail:bryang—kd@yahoo.com.cn 随着多关系数据挖掘的兴起各种各样的多关 系 朴 素 贝 叶 斯 分 类 器 ( mult-i relational Naïve Bayesian classifierMRNBC)被提出其中大多数方 法基于归纳逻辑程序设计(inductive logic programmingILP)技术形成.这类方法通常都通过用户定 义的参数和语言偏置控制规则长度从而降低问题 规模、提高分类准确率.例如:基于 ILP—R 的多关 系朴素贝叶斯分类方法[1]、1BC [2]、1BC2方法[3—4]、 Mr—SBC 方法[5] 和 nFOIL 方法[6] 等;基于 CrossMine 的元组号传播方法[7—8];基于关系数据库技术 的多关系朴素贝叶斯分类方法———Graph—NB [9]. Graph—NB 中使用了一种叫做“Cutting off ”的剪枝 策略对表进行剪枝以提高分类准确率.但是这种 方法有很多缺点:第一对于朴素贝叶斯分类而言 参与分类的基本单位是属性而不是表因此直接删 除弱连接的表是明显不合适的.第二特征选择有 两种方法———过滤方法(filter)和打包方法(wrapper)“Cutting off”剪枝方法是一种打包方法.打包 方法是与分类器绑定的剪枝策略它选择的是与分 类器特点相匹配的最好属性所以理论上能够得到 很好的准确率;但打包方法找到的好的属性仅适于 当前所用分类器而且使用打包方法明显需要付出 第30卷 第8期 2008年 8月 北 京 科 技 大 学 学 报 Journal of University of Science and Technology Beijing Vol.30No.8 Aug.2008 DOI:10.13374/j.issn1001-053x.2008.08.025
.964 北京科技大学学报 第30卷 较高的时间代价10, 基于图1,可以很容易地计算每一个属性和目 本文扩展互信息标准(它属于过滤方法)到多关 标属性间的互信息量大小,那么多关系情况下,不 系情况下,以提高多关系朴素贝叶斯分类方法的分 同关系中的属性是否应平等对待呢?文献[9]中实 类性能.基于元组号传播方法和面向元组的统计计 验证明了多关系情况下,每个关系同目标关系间的 数方法,本文给出了基于扩展互信息标准进行属性 相关程度是不相同的,基于上述考虑,为每张表指 选择的方法和步骤,并建立了一种基于扩展互信息 定一个权值心,它表示此表与目标表间的相关程 的多关系朴素贝叶斯分类器(MI一MRNBC)·标准 度,一般由领域专家指定,心取值范围为[0,1],其 数据集上的实验显示,基于扩展互信息标准进行属 中目标表的值w为1.因此基于互信息的多关系属 性选择,可以在不增加算法时间复杂度的前提下,找 性选择步骤如下, 到与分类属性最相关的属性,并在仅有极少属性参 (1)根据一定知识(如语义关系图)进行元组 与分类时,得到较高的分类准确率 号传播 (2)依据传播后的表计算每个属性x和目标属 1基于互信息的多关系朴素贝叶斯分类器 性c间的互信息值: (MI一MRNBC) Ie.x)p(p(e)p( 卫(C,x) (1) 1.1互信息标准的一阶扩展 i.j 分类是主要的数据挖掘任务之一,为获得最小 其中,p(ci,xj)为c和xj的联合概率,p(c:)为c: 的分类错误率,通常需要得到与目标c类最大统计 的概率,p(x)为x的概率. 依赖的属性集合,实现最大依赖的最流行的方法是 (③)根据加权互信息值wI(c,x)的大小对所 最大相关特征选择:选择与目标类c最大相关的属 有属性由大到小排序,然后选取前m(用户指定)个 性,相关性则通常根据自相关和互信息来衡量,互信 属性参与分类 息则是衡量变量依赖广泛使用的测度 1.2 MII-MRNBC算法 单关系(表)情况下,表内属性与目标属性间的 MI一ARNBC根据传播的类标签的数目和类别 相关性大小可以直接由相应的互信息量大小表示; 进行计数(面向元组的统计计数方法,不考虑元组号 而多关系情况下,属性分布在不同的关系中,要计算 重复问题),并用Laplace估计方法避免零概率出 与目标属性间的互信息量需要首先进行关系连接, 现,多关系分类公式见文献[9] 为降低关系间连接时的时空代价,本文采用元组号 输入:数据集,语义关系图R,交叉验证次数, 传播方法进行虚拟的连接.图1是多关系情况下, 参与分类的属性个数m, 进行元组号传播后的例子. 步骤: (1)根据用户要求选择数据集中合适元组,并 贷款表 进行类别属性取值替换等预处理操作,将目标表元 贷款号账目号 数额 借贷期 已还款金额 类别 组随机分为n组(作n次交叉验证), 1 14 1200 100 (②)根据R进行元组号传播,此时也要将元组 2 14 3000 300 + 分组标志传播,以判断非目标关系中元组是训练数 3 18 9000 品 500 据还是测试数据. 50 2000 36 200 (3)从n组中选一组数据作为测试数据,其余 50 15000 24 1000 n一1组作为训练数据,并分别进行连续属性离 散化, 账目表 (4)对传播后的训练数据进行统计计数,计算 账目号 颜率 日期 贷款号 类别 4 所需互信息值和类条件概率值 每月 95-02-11 1.2 2十,0- (5)根据加权互信息值为属性排序. 18 每周 9605—22 3 0+,1- (6)用多关系朴素贝叶斯分类公式对测试数据 50 每月 97-0-24 4.5 1+,1- 进行分类(仅取加权互信息值最大的m个属性参与 60 每周 9808-26 0十,0- 分类) 图1传播后的样例数据库 输出:分类准确率(accuracy)· Fig.1 A sample database of tuple ID propagation 其中(3)一(6)执行n次,最后取n次交叉验证
较高的时间代价[10]. 本文扩展互信息标准(它属于过滤方法)到多关 系情况下以提高多关系朴素贝叶斯分类方法的分 类性能.基于元组号传播方法和面向元组的统计计 数方法本文给出了基于扩展互信息标准进行属性 选择的方法和步骤并建立了一种基于扩展互信息 的多关系朴素贝叶斯分类器(MI—MRNBC).标准 数据集上的实验显示基于扩展互信息标准进行属 性选择可以在不增加算法时间复杂度的前提下找 到与分类属性最相关的属性并在仅有极少属性参 与分类时得到较高的分类准确率. 1 基于互信息的多关系朴素贝叶斯分类器 (MI-MRNBC) 1∙1 互信息标准的一阶扩展 分类是主要的数据挖掘任务之一为获得最小 的分类错误率通常需要得到与目标 c 类最大统计 依赖的属性集合.实现最大依赖的最流行的方法是 最大相关特征选择:选择与目标类 c 最大相关的属 性相关性则通常根据自相关和互信息来衡量互信 息则是衡量变量依赖广泛使用的测度. 单关系(表)情况下表内属性与目标属性间的 相关性大小可以直接由相应的互信息量大小表示; 而多关系情况下属性分布在不同的关系中要计算 与目标属性间的互信息量需要首先进行关系连接. 为降低关系间连接时的时空代价本文采用元组号 传播方法进行虚拟的连接.图1是多关系情况下 进行元组号传播后的例子. 贷款表 贷款号 账目号 数额 借贷期 已还款金额 类别 1 14 1200 12 100 + 2 14 3000 12 300 + 3 18 9000 24 500 — 4 50 2000 36 200 — 5 50 15000 24 1000 + 账目表 账目号 频率 日期 贷款号 类别 14 每月 95—02—11 12 2+0— 18 每周 96—05—22 3 0+1— 50 每月 97—01—24 45 1+1— 60 每周 98—08—26 — 0+0— 图1 传播后的样例数据库 Fig.1 A sample database of tuple ID propagation 基于图1可以很容易地计算每一个属性和目 标属性间的互信息量大小.那么多关系情况下不 同关系中的属性是否应平等对待呢?文献[9]中实 验证明了多关系情况下每个关系同目标关系间的 相关程度是不相同的.基于上述考虑为每张表指 定一个权值 w它表示此表与目标表间的相关程 度一般由领域专家指定w 取值范围为[01]其 中目标表的值 w 为1.因此基于互信息的多关系属 性选择步骤如下. (1) 根据一定知识(如语义关系图[5] )进行元组 号传播. (2) 依据传播后的表计算每个属性 x 和目标属 性 c 间的互信息值: I( cx)= ∑ij p( cixj)lg p( cixj) p( ci) p( xj) (1) 其中p( cixj)为 ci 和 xj 的联合概率p ( ci)为 ci 的概率p( xj)为 xj 的概率. (3) 根据加权互信息值 wI( cx )的大小对所 有属性由大到小排序然后选取前 m(用户指定)个 属性参与分类. 1∙2 MI-MRNBC 算法 MI—MRNBC 根据传播的类标签的数目和类别 进行计数(面向元组的统计计数方法不考虑元组号 重复问题)并用 Laplace 估计方法避免零概率出 现多关系分类公式见文献[9]. 输入:数据集语义关系图 R交叉验证次数 n 参与分类的属性个数 m. 步骤: (1) 根据用户要求选择数据集中合适元组并 进行类别属性取值替换等预处理操作将目标表元 组随机分为 n 组(作 n 次交叉验证). (2) 根据 R 进行元组号传播此时也要将元组 分组标志传播以判断非目标关系中元组是训练数 据还是测试数据. (3) 从 n 组中选一组数据作为测试数据其余 n—1组作为训练数据并分别进行连续属性离 散化. (4) 对传播后的训练数据进行统计计数计算 所需互信息值和类条件概率值. (5) 根据加权互信息值为属性排序. (6) 用多关系朴素贝叶斯分类公式对测试数据 进行分类(仅取加权互信息值最大的 m 个属性参与 分类). 输出:分类准确率(accuracy). 其中(3)~(6)执行 n 次最后取 n 次交叉验证 ·964· 北 京 科 技 大 学 学 报 第30卷
第8期 徐光美等:基于互信息的多关系朴素贝叶斯分类器 .965 的平均结果 可以达到最高为84.1%;而使用所有属性参与分类 由于计算互信息值不需要额外的统计计数,因 时,即m为7时分类准确率为78.1%.而且基于扩 此训练阶段仅需要增加对属性的一次快速排序时间 展的互信息标准找到的与分类属性最相关的前三个 就可以找到所需要的m个属性,这不会增加算法运 属性是lumo”、logD”、“ind”,而这三个属性都是目 行的时间复杂度(进行属性选择和不进行属性选择 标表中属性,这意味着不需要进行复杂的多关系连 算法时间复杂度都为O(max(nr·nra),其中T为 接操作,只用目标表中属性分类就可以得到最好的 数据集中的任一表,T。为表T在R中的直接前驱, 分类结果,因此多关系分类退化为单关系分类问题, nr为T中元组数目,nr为Tg中元组数目),而且 这大大降低了分类的时空代价,一定程度上也提高 当这m个属性之外的属性存在缺失值时丝毫不会 了分类器的容噪能力, 影响分类性能,所以MI一MRNBC算法具有高效性 100 和较高的容错性, 901 ·-MI-MRNBC ·-S-MRNBC 2实验 80 本文使用多关系领域常用的标准数据集: 70 PKDD CUP 1999的金融数据集和Mutagenesis数据 60 集实验,本文实验中各表权值”都默认为1. 1234567891011 属性数 (1)金融数据集,便于比较,根据文献[9]对金 融数据集进行修改,为比较基于互信息的多关系属 图3 Mutagenesis数据集上的分类准确率比较 性选择方法的有效性,本文也实现了一个随机选择 Fig.3 Accuracy on Mutagenesis database 属性进行多关系朴素贝叶斯分类的算法 S-MRNBC.图2是MI一IRNBC和S一IRNBC的 3结论 分类准确率比较(取10次交叉验证的平均结果)· 基于元组号传播方法,本文给出了基于互信息 100 的多关系属性选择方法,并在此基础上形成了基于 ◆-MI-MRNBC 90 S-MRNBC 互信息的多关系朴素贝叶斯分类器(MI一ARNBC), 实验显示使用基于互信息的属性剪枝方法可以在几 乎不增加计算时间基础上,找到与分类属性最相关 70 的属性,并在仅用极少的属性参与分类情况下,得到 601 较高的分类准确率。 11 16212631 属性数 MI一RNBC中根据传播的类标签的数目和类 别进行统计计数,计数并没有考虑传播的元组号可 图2金融数据集上的分类准确率比较 能重复的问题,将来的工作可以考虑引入合适的聚 Fig.2 Accuracy on financial database 合函数,在考虑传播的类标签个数的同时也考虑元 组号是否重复,对于一个表中元组与其他表中多个 从图2可以看出,MI一MRNBC仅使用极少的 元组相连接的情况,可以引入合适的概率分布函数 的属性(当m为6时分类准确率最高为85%)参与 定义多个元组的联合概率,改变现在的多关系朴素 分类就可以得到良好的分类效果,并且当属性个数 贝叶斯计算公式 在1~17之间变化时都比使用所有的属性参与分类 的分类效果更好(所有属性参与分类时,准确率为 参考文献 79.25%) [1]Pompe U.Kononenko 1.Naive Bayesian classifier within ILP-R// (2)Mutagenesis数据集.使用回归友好的 Proceedings of the 5th International Workshop on Inductive Log- Mut agenesis数据集的所有属性参与实验,图3是 ie Programming.Belgie:Katholieke Universiteit Leuven.1995: MI一RNBC和S-MRNBC的分类准确率比较, 417 从图3可以看出:MI一MRNBC仅使用极少的 [2]Peter A.Nicolas L.IBC:a first-order Bayesian classifier//Pro- ceedings of the 9th International Workshop on Inductive Logic 属性就可以得到良好的分类效果,其中当m为3时 Programming.Berlin:Springer-Verlag.1999.1634:92 分类准确率最高为88.9%,m为1时分类准确率就 [3]Nicolas L,Peter A.1BC2:a true first-order Bayesian classifier//
的平均结果. 由于计算互信息值不需要额外的统计计数因 此训练阶段仅需要增加对属性的一次快速排序时间 就可以找到所需要的 m 个属性这不会增加算法运 行的时间复杂度(进行属性选择和不进行属性选择 算法时间复杂度都为 O(max( nT·nTq))其中 T 为 数据集中的任一表Tq 为表 T 在 R 中的直接前驱 nT 为 T 中元组数目nTq为 Tq 中元组数目)而且 当这 m 个属性之外的属性存在缺失值时丝毫不会 影响分类性能所以 MI—MRNBC 算法具有高效性 和较高的容错性. 2 实验 本文使 用 多 关 系 领 域 常 用 的 标 准 数 据 集: PKDD CUP1999的金融数据集和 Mutagenesis 数据 集实验.本文实验中各表权值 w 都默认为1. (1) 金融数据集.便于比较根据文献[9]对金 融数据集进行修改.为比较基于互信息的多关系属 性选择方法的有效性本文也实现了一个随机选择 属 性 进 行 多 关 系 朴 素 贝 叶 斯 分 类 的 算 法 S—MRNBC.图2是 MI—MRNBC 和 S—MRNBC 的 分类准确率比较(取10次交叉验证的平均结果). 图2 金融数据集上的分类准确率比较 Fig.2 Accuracy on financial database 从图2可以看出MI—MRNBC 仅使用极少的 的属性(当 m 为6时分类准确率最高为85%)参与 分类就可以得到良好的分类效果并且当属性个数 在1~17之间变化时都比使用所有的属性参与分类 的分类效果更好(所有属性参与分类时准确率为 79∙25%). (2) Mutagenesis 数 据 集.使 用 回 归 友 好 的 Mutagenesis数据集的所有属性参与实验.图3是 MI—MRNBC和S—MRNBC的分类准确率比较. 从图3可以看出:MI—MRNBC 仅使用极少的 属性就可以得到良好的分类效果其中当 m 为3时 分类准确率最高为88∙9%m 为1时分类准确率就 可以达到最高为84∙1%;而使用所有属性参与分类 时即 m 为7时分类准确率为78∙1%.而且基于扩 展的互信息标准找到的与分类属性最相关的前三个 属性是“lumo”、“logp”、“indl”而这三个属性都是目 标表中属性这意味着不需要进行复杂的多关系连 接操作只用目标表中属性分类就可以得到最好的 分类结果因此多关系分类退化为单关系分类问题 这大大降低了分类的时空代价一定程度上也提高 了分类器的容噪能力. 图3 Mutagenesis 数据集上的分类准确率比较 Fig.3 Accuracy on Mutagenesis database 3 结论 基于元组号传播方法本文给出了基于互信息 的多关系属性选择方法并在此基础上形成了基于 互信息的多关系朴素贝叶斯分类器(MI—MRNBC). 实验显示使用基于互信息的属性剪枝方法可以在几 乎不增加计算时间基础上找到与分类属性最相关 的属性并在仅用极少的属性参与分类情况下得到 较高的分类准确率. MI—MRNBC 中根据传播的类标签的数目和类 别进行统计计数计数并没有考虑传播的元组号可 能重复的问题将来的工作可以考虑引入合适的聚 合函数在考虑传播的类标签个数的同时也考虑元 组号是否重复.对于一个表中元组与其他表中多个 元组相连接的情况可以引入合适的概率分布函数 定义多个元组的联合概率改变现在的多关系朴素 贝叶斯计算公式. 参 考 文 献 [1] Pompe UKononenko I.Naïve Bayesian classifier within ILP-R∥ Proceedings of the5th International Workshop on Inductive Logic Programming.Belgie:Katholieke Universiteit Leuven1995: 417 [2] Peter ANicolas L.1BC:a first-order Bayesian classifier∥ Proceedings of the 9th International Workshop on Inductive Logic Programming.Berlin:Springer-Verlag19991634:92 [3] Nicolas LPeter A.1BC2:a true first-order Bayesian classifier∥ 第8期 徐光美等: 基于互信息的多关系朴素贝叶斯分类器 ·965·
.966 北京科技大学学报 第30卷 Proceedings of the 12th International Conference on Inductive Knowl Data Eng:2006,18(6):770 Logic Programming-Berlin:Springer-Verlag.2002:133 [8]Yin XX.Han J W,Yang J.et al.Cross Mine:efficient classifi- [4]Peter A.Nicolas L.Naive Bayesian classification of structured da- cation across multiple database relations//Constraint-Based Min- ta.Mach Learn:2004.57(3):233 ing and Inductive Databases.Hinterzarten:Springer,2004:172 [5]Ceci M.Appice A.Malerba D.Mr SBC:a multi-relational Naive [9]Liu H,Yin XX,Han J W.An efficient multi-relational Naive Bayesian classifier Lecture Notes in Artificial Intelligence Bayesian classifier based on semantic relationship graphsPro Berlin:Springer.2003,95 ceedings of ACM-SIGKDD Workshop on Multi-Relational Data [6]Niels L.Kristian K.Luc D.nFOIL:integrating Naive Bayes and Mining.Chicago.2005:39 FOIL/Proceedings of the 20th National Conference on Artifi- [10]Peng HC,Long F H.Ding C.Feature selection based on mutu- cial Intelligence.Cambridge.2005:795 al information criteria of maxdependency,max relevance and [7]Yin XX.Han J W,Yang J,et al.Efficient classification across min-redundaney.IEEE Trans Pattern Anal Mach Intell, multiple database relations:a Cross Mine approach.IEEE Trans 2005,27(8):1226 (上接第915页) pendence of thermally activated flux flow resistance in 使得当磁场垂直于超导薄膜表面时电阻转变展宽现 Tl2BazCaCu2Os thin films.Phys C.2005.423:175 象更为明显,通过分析超导薄膜的电阻转变数据计 [5]Espinosa-Arronte B.Andersson M.Scaling of vortex-liquid resis- 算出了TBCC0/LA0的各向异性参量,Y=H隐(O)/ tivity in high-Te superconductors.Phys Rev B.2005,71: 024507 H62(0)=14.58. [6]Tinkham M.Resistive transition of high temperature supercon- ductor.Phys Rev Lett.1988.61:1658 参考文献 [7]Festin O.Svedlindh P.Vortex fluctuation in high-T thin films [1]Xu X J.FuL,Wang L B.et al.Dependence of activation energy close to the resistive transition.Phys Rev B.2004.70:024511 upon magnetic field and temperature in YBazCusO7-,epitaxial [8]Blatter G.Fegelman M V,Geshkenbein V B.et al.Vortices in thin film.Phys Rev B.1999.59:608 hightemperature superconductors.Rev Mod Phys.1994.66; [2]Yin D L.QiZ.Xu H Y,ct al.Resistive transition equation of 1125 the mixed state of superconductors.Phys Rev B.2003.67: [9]Song Y Q.Lee M.Halperin W P,Magnetie flux-lattice 092503 anisotropy of TlzBazCaCusO byTI nuclear magnetic reso [3]XuS Y,Li Q.Wertz E.et al.High critical current density and nance.Phys Rev B.1991,44:914 vortex pinning of epitaxial MgB2 thin films.Phys Rev B.2003. [10]Kim D H.Gray K E.Kampwirth R T,et al.Magnetocondue- 68,224501 tance of Tl2Ba2CaCu20,films in fluctuation regime.Phys Rev [4]Lu X F,Wang Z.Zhang YZ,et al.Field and temperature de- B,1991,43:2910
Proceedings of the 12th International Conference on Inductive Logic Programming.Berlin:Springer-Verlag2002:133 [4] Peter ANicolas L.Naïve Bayesian classification of structured data.Mach Learn200457(3):233 [5] Ceci MAppice AMalerba D.Mr-SBC:a mult-i relational Naïve Bayesian classifier ∥ Lecture Notes in A rtificial Intelligence. Berlin:Springer2003:95 [6] Niels LKristian KLuc D.nFOIL:integrating Naïve Bayes and FOIL∥ Proceedings of the 20th National Conference on A rtificial Intelligence.Cambridge2005:795 [7] Yin X XHan J WYang Jet al.Efficient classification across multiple database relations:a CrossMine approach.IEEE T rans Knowl Data Eng200618(6):770 [8] Yin X XHan J WYang Jet al.CrossMine:efficient classification across multiple database relations∥ Constraint-Based Mining and Inductive Databases.Hinterzarten:Springer2004:172 [9] Liu HYin X XHan J W.An efficient mult-i relational Naïve Bayesian classifier based on semantic relationship graphs∥ Proceedings of ACM-SIGKDD Workshop on Multi-Relational Data Mining.Chicago2005:39 [10] Peng H CLong F HDing C.Feature selection based on mutual information criteria of max-dependencymax-relevance and min-redundancy. IEEE T rans Pattern A nal Mach Intell 200527(8):1226 (上接第915页) 使得当磁场垂直于超导薄膜表面时电阻转变展宽现 象更为明显.通过分析超导薄膜的电阻转变数据计 算出了 TBCCO/LAO 的各向异性参量γ= H ab c2(0)/ H c c2(0)=14∙58. 参 考 文 献 [1] Xu X JFu LWang L Bet al.Dependence of activation energy upon magnetic field and temperature in YBa2Cu3O7— x epitaxial thin film.Phys Rev B199959:608 [2] Yin D LQi ZXu H Yet al.Resistive transition equation of the mixed state of superconductors. Phys Rev B200367: 092503 [3] Xu S YLi QWertz Eet al.High critical current density and vortex pinning of epitaxial MgB2thin films.Phys Rev B2003 68:224501 [4] Lu X FWang ZZhang Y Zet al.Field and temperature dependence of thermally activated flux flow resistance in Tl2Ba2CaCu2O8thin films.Phys C2005423:175 [5] Espinosa-Arronte BAndersson M.Scaling of vortex-liquid resistivity in high-Tc superconductors. Phys Rev B200571: 024507 [6] Tinkham M.Resistive transition of high-temperature superconductor.Phys Rev Lett198861:1658 [7] Festin OSvedlindh P.Vortex fluctuation in high-Tc thin films close to the resistive transition.Phys Rev B200470:024511 [8] Blatter GFegelman M VGeshkenbein V Bet al.Vortices in high-temperature superconductors. Rev Mod Phys199466: 1125 [9] Song Y Q Lee M Halperin W P Magnetic-flux-lattice anisotropy of Tl2Ba2CaCu3O10 by 205Tl nuclear magnetic resonance.Phys Rev B199144:914 [10] Kim D HGray K EKampwirth R Tet al.Magnetoconductance of Tl2Ba2CaCu2O x films in fluctuation regime.Phys Rev B199143:2910 ·966· 北 京 科 技 大 学 学 报 第30卷