第6期 杨小兵,等:切换回归模型的抗噪音聚类算法 ·501· Statist Ass,.1978,73:730-752. 4 [5]HOSMER D W.Maximum likelihood estimates of the pa- 3 rameters of a mixture of two regression lines[J].Communi- 2 cations in Statistics,1974,3(10):995-1005. [6]BEZDEK J C.Pattern recognition with fuzzy objective fune- tion algorithms M].New York:Plenum Press,1981:88- 0 94. -e [7]HATHAWAY R J,BEZDEK J C.Switching regression 2 models and fuzzy clustering[J].IEEE Trans on Fuzzy Sys- -3日 tems,1993,1(3):195-204. [8 ]OHTA T,YAMAKAWA A,ICHIHASHI H,et al.Projec- 0 2 3 tion pursuit switching regression[C]//Proc of 5th Interna- tional Conference on Soft Computing.lizuka,Japan,1998: 图7实例2NRC算法聚类结果 775-778. Fig.7 Clustering results of noise resistance clustering al- [9]OHTA T,YAMAKAWA A,ICHIHASHI H,et al.Projec- gorithm for example 2 tion pursuit switching regression for analysis of psychological feelings[J].Joural of Biomedical Soft Computing and Hu- man Sciences,1998,4(1):15-21. 表1无噪音算法和NRC算法得到的结果比较 [10]沈红斌,王士同,吴小俊.离群模糊核聚类算法[J] Table 1 Results comparison of no noise clustering algo- 软件学报,2004,15(7):1021-1029. rithm and NRC algorithm SHEN Hongbin,WANG Shitong,WU Xiaojun.Fuzzy ker- B11 B12B3 B21 B22 βa nel clustering with outliers[J].Journal of Software,2004, 15(7):1021-1029. 无噪音聚 2.7346-0.0437-0.5972-2.7067-0.01060.6194 [11]WANG Shitong,JIANG Haifeng,LU Hongjun.A new in- 类算法 tegrated clustering algorithm GFC and switching regression NRC算法2.9335-0.028-0.6521-2.9277-0.01130.602 [J].Intemational Journal of Pattem Recognition and Arti- ficial Intelligence,2002,16(4):433-446. 通过实验结果可以看出,NRC算法明显削弱了 [12]陆宏钧,江海峰,王士同.关于切换回归的集成模糊聚 噪音数据的影响,得到了比无噪音聚类算法更优的 类算法CF℃[J].软件学报,2002,13(10):1905-1914. 模型参数.实验中0的选择也是很重要的,0选择的 LU Hongjun,JIANG Haifeng,WANG Shitong.An inte- 太大,对噪音的抵抗能力就会减弱,0选择的太小, grated fuzzy clustering algorithm GFC for switching regres- sions[J].Joumal of Software,2002,13 (10):1905 就会将一些非噪音数据误当作噪音数据。 1914. 作者简介: 5结束语 杨小兵,男,1976年生,博士,副教 首先介绍了切换回归模型的基本概念,然后介绍 授,硕士生导师,主要研究方向为数据 了已有的切换回归模型的聚类方法,分析并指出了它 挖掘、知识工程等,发表学术论文10余 们的缺陷:即它们都没有考虑噪音数据对聚类结果的 篇,其中多篇被SCI、EI检索. 影响.在此基础上提出了具有抵抗噪音能力的NRC 算法,并通过仿真实验验证了NRC算法的优越性.实 验上来看,NRC算法是相当成功的,但是仍然有一些 何灵敏,男,1974年生,博士,副教 工作需要做更深入的研究.模型中的子模型个数如何 授,硕士生导师,主要研究方向为数据 确定的问题,距离阈值和的选择以及算法的鲁棒性问 挖掘、机器学习等 题都将是未来研究的重点」 参考文献: [1]HAN Jiawei,KAMBER M.数据挖掘概念与技术[M].范 明,孟小峰,译。北京:机械工业出版社,2001:223-261 孔繁胜,男,1946年生,教授,博士生 [2]HAMERMESH D S.Wage bargains,threshold effects,and 导师,主要研究方向为知识工程、数据挖 the Phillips curve [J].Quarterly Joural of Economics, 掘、人工智能等,获国家科技进步三等奖 1970,84(3):501-517. 1项、省部级科技进步一等奖1项、二等 [3]QUANDT R E.A new approach to estimating switching regres 奖和三等奖各2项,1993年起享受国务 sions[J].J Amer Statist Ass,1972,67(338):306-310. 4]QUANDT R E,RAMSEY J B.Estimating mixtures of nor- 院特殊津贴.在国内外重要刊物上发表 mal distributions and switching regressions[J].J Amer 学术论文30余篇,出版专著3部