正在加载图片...
第9卷第2期 智能系统学报 Vol.9 No.2 2014年4月 CAAI Transactions on Intelligent Systems Apr.2014 D0I:10.3969/j.issn.1673-4785.201307010 网络出版t地址:http:/www.cmki.net/kcms/doi/CNKI:23-1538/TP.20131105.1201.004.html 不完备信息系统中测试代价敏感的 可变精度分类粗糙集 鞠恒荣1,马兴斌,杨习贝12,祁云嵩,杨静宇2 (1.江苏科技大学计算机科学与工程学院,江苏镇江212003:2.南京理工大学计算机科学与技术学院,江苏南京 210094) 摘要:在不完备信息系统中,可变精度分类关系是限制容差关系的改进形式,但其并未考虑数据集中属性的测试 代价。为解决这一问题,提出了基于测试代价敏感的可变精度分类粗糙集模型。进一步地,通过分析传统启发式 算法没有考虑测试代价以及回溯算法的时间消耗等因素,提出一种新的属性重要度测量,并在此基础上设计了一 种新的启发式算法。通过实验对比分析,说明了新提出算法的有效性。 关键词:属性约简:不完备信息系统:测试代价敏感:变精度分类粗糙集 中图分类号:TP18文献标志码:A文章编号:1673-4785(2014)02-0219-05 中文引用格式:鞠恒荣,马兴斌,杨习贝,等.不完备信息系统中测试代价敏感的可变精度分类粗糙集[J].智能系统学报,2014,9 (2):219-223. 英文引用格式:JU Hengrong,MA Xingbin,YANG Xibei,etal.Test-cost-sensitive based variable precision classification rough set in incomplete information system[J].CAAI Transactions on Intelligent Systems,2014,9(2):219-223. Test-cost-sensitive based variable precision classification rough set in incomplete information system JU Hengrong',MA Xingbin',YANG Xibei2,QI Yunsong',YANG Jingyu2 (1.School of Computer Science and Engineering,Jiangsu University of Science and Technology,Zhenjiang 212003.China;2.School of Computer Science and Technology,Nanjing University of Science and Technology,Nanjing 210094,China) Abstract:In an incomplete information system,the precision-variable classification relation is an improvement of the limited tolerance relation.However,the test costs of the data concentration attributes are not taken into account. To solve this problem,a test-cost-sensitive-based precision-variable precision classification rough set is proposed. Furthermore,the traditional heuristic algorithm does not take the importance of the test costs of the attributes into account,and backtracking algorithm is very time-consuming.Therefore,not only was a new importance of the at- tribute proposed,but a new heuristic algorithm was also presented for obtaining reduction with minor test costs.The experimental results show the effectiveness of the new algorithm by comparing it with the other algorithms. Keywords:attribute reduction;incomplete information system:test cost sensitive;variable precision classification rough set 作为一种处理不精确、不确定性问题的数学工 出后便受到了广泛关注2。然而由于数据测量的误 具,粗糙集理论(rough set)由波兰学者Pawlak提 差、数据获取的限制等原因,导致了所面临的信息系 统往往是不完备的。为处理这类问题,王国胤)提出 收稿日期:2013-07-05.网络出版日期:2013-11-05. 了限制容差关系。进一步,杨习贝[提出了一种新的 基金项目:国家自然科学基金资助项目(61100116,61203024);江苏省 自然科学基金资助项目(BK2011492,BK2012700):江苏省 基于可变精度分类的拓展粗糙集模型,对限制容差 高校自然科学基金资助项目(11KJB520004,13KB520003): 高维信息智能感知与系统教育部重点实验室(南京理工大 关系进行了改进。然而,在实际工程应用中,数据的 学)基金资助项目(30920130122005):江苏省普通高校研究 获取是需要付出一些成本或代价的,称其为测试代 生科研创新计划项目资助项目(CXLX13707). 通信作者:杨习贝.E-mail:yangxibei@hotmail.com 价。针对该问题,Mi等[率先将测试代价引入到第 9 卷第 2 期 智 能 系 统 学 报 Vol.9 №.2 2014 年 4 月 CAAI Transactions on Intelligent Systems Apr. 2014 DOI:10.3969 / j.issn.1673⁃4785.201307010 网络出版地址:http: / / www.cnki.net / kcms/ doi / CNKI:23⁃1538 / TP.20131105.1201.004.html 不完备信息系统中测试代价敏感的 可变精度分类粗糙集 鞠恒荣1 ,马兴斌1 ,杨习贝1,2 ,祁云嵩1 ,杨静宇2 (1.江苏科技大学 计算机科学与工程学院,江苏 镇江 212003; 2. 南京理工大学 计算机科学与技术学院,江苏 南京 210094) 摘 要:在不完备信息系统中, 可变精度分类关系是限制容差关系的改进形式, 但其并未考虑数据集中属性的测试 代价。 为解决这一问题, 提出了基于测试代价敏感的可变精度分类粗糙集模型。 进一步地, 通过分析传统启发式 算法没有考虑测试代价以及回溯算法的时间消耗等因素, 提出一种新的属性重要度测量, 并在此基础上设计了一 种新的启发式算法。 通过实验对比分析,说明了新提出算法的有效性。 关键词:属性约简;不完备信息系统;测试代价敏感;变精度分类粗糙集 中图分类号: TP18 文献标志码:A 文章编号:1673⁃4785(2014)02⁃0219⁃05 中文引用格式:鞠恒荣,马兴斌,杨习贝,等. 不完备信息系统中测试代价敏感的可变精度分类粗糙集[ J]. 智能系统学报, 2014, 9 (2): 219⁃223. 英文引用格式:JU Hengrong,MA Xingbin, YANG Xibei, et al. Test⁃cost⁃sensitive based variable precision classification rough set in incomplete information system[J]. CAAI Transactions on Intelligent Systems, 2014, 9(2): 219⁃223. Test⁃cost⁃sensitive based variable precision classification rough set in incomplete information system JU Hengrong 1 , MA Xingbin 1 , YANG Xibei 1,2 , QI Yunsong 1 , YANG Jingyu 2 (1. School of Computer Science and Engineering, Jiangsu University of Science and Technology, Zhenjiang 212003, China; 2. School of Computer Science and Technology, Nanjing University of Science and Technology, Nanjing 210094, China) Abstract:In an incomplete information system, the precision⁃variable classification relation is an improvement of the limited tolerance relation. However, the test costs of the data concentration attributes are not taken into account. To solve this problem, a test⁃cost⁃sensitive⁃based precision⁃variable precision classification rough set is proposed. Furthermore, the traditional heuristic algorithm does not take the importance of the test costs of the attributes into account, and backtracking algorithm is very time⁃consuming. Therefore, not only was a new importance of the at⁃ tribute proposed, but a new heuristic algorithm was also presented for obtaining reduction with minor test costs. The experimental results show the effectiveness of the new algorithm by comparing it with the other algorithms. Keywords:attribute reduction; incomplete information system; test cost sensitive; variable precision classification rough set 收稿日期:2013⁃07⁃05. 网络出版日期:2013⁃11⁃05. 基金项目:国家自然科学基金资助项目(61100116, 61203024); 江苏省 自然科学基金资助项目(BK2011492, BK2012700);江苏省 高校自然科学基金资助项目(11KJB520004, 13KJB520003); 高维信息智能感知与系统教育部重点实验室(南京理工大 学)基金资助项目(30920130122005);江苏省普通高校研究 生科研创新计划项目资助项目(CXLX13_707). 通信作者:杨习贝. E⁃mail:yangxibei@ hotmail.com. 作为一种处理不精确、不确定性问题的数学工 具, 粗糙集理论[1] (rough set)由波兰学者 Pawlak 提 出后便受到了广泛关注[2⁃4] 。 然而由于数据测量的误 差、数据获取的限制等原因, 导致了所面临的信息系 统往往是不完备的。 为处理这类问题, 王国胤[5]提出 了限制容差关系。 进一步,杨习贝[6]提出了一种新的 基于可变精度分类的拓展粗糙集模型, 对限制容差 关系进行了改进。 然而, 在实际工程应用中, 数据的 获取是需要付出一些成本或代价的, 称其为测试代 价。 针对该问题, Min 等[7⁃11]率先将测试代价引入到
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有