正在加载图片...
第4卷第6期 智能系统学报 Vol.4 No.6 2009年12月 CAAI Transactions on Intelligent Systems Dec.2009 doi:10.3969/i.issn.1673-4785.2009.06.005 切换回归模型的抗噪音聚类算法 杨小兵,何灵敏,孔繁胜 (1.中国计量学院计算机系,浙江杭州310018;2.浙江大学计算机学院,浙江杭州310012》 摘要:对切换回归模型的聚类方法一般都没有考虑到噪音的影响,因此在含有噪音数据的情况下,用这些方法聚 类的结果就会出现一定的偏差.为了减弱聚类过程中噪音数据的影响,提出了一种新的具有抵抗噪音能力的聚类算 法,称为抗噪音聚类算法.该算法通过将已知数据集划分为非噪音数据集和噪音数据集2个子集,然后对非噪音数 据集进行聚类分析,估计出模型的各个参数.通过对噪音数据集和非噪音数据集进行不断地调整,同时不断地修正 得到的参数估计值,从而得到对聚类结果的优化.实验表明,抗噪音聚类算法能够有效地克服噪音数据对聚类结果 的影响,并估计出优质的参数. 关键词:切换回归模型:聚类:抗噪音聚类算法 中图分类号:1P301.6文献标识码:A文章编号:1673-4785(2009)060497-05 A noise-resistant clustering algorithm for switching regression models YANG Xiao-bing,HE Ling-min',KONG Fan-sheng? (1.Department of Computer Science,China Jiliang University,Hangzhou 310018,China;2.College of Computer Science,Zhejiang University,Hangzhou 310012,China) Abstract:Clustering methods for switching regression models usually neglect the effects of noise.As a result,errors usually exist if clustering is carried out in a noisy environment.In order to overcome the effects of noise,a new clustering algorithm,a noise-resistant clustering algorithm,was proposed.The algorithm partitions the dataset into two sub-datasets,a noiseless dataset and a noisy dataset,and then performs clustering analysis on the noiseless dataset to estimate parameters.By continuous simultaneous adjustment of the noisy and noiseless datasets and by continuously revising estimated parameters,the results of clustering were improved.Simulation experiments demon- strated that the algorithm efficiently clusters noisy datasets and can provide good estimates of parameters. Keywords:switching regression models;clustering;noise-resistant clustering algorithm 聚类分析是当前研究的一个热点,已经广泛地 种特殊的混合分布模型。 应用在模式识别、数据分析、图像处理等许多领域 中.混合分布模型是一种由分别满足多种不同分 1切换回归模型 布规律的数据混合在一起的模型,是统计学中最重 假设S={(x1,y1),…,(x,yn)}是一个数据 要的模型之一,这种模型也已经应用到聚类问题的 集,其中x:∈R°,y.∈R,在最简单的数据回归问题 研究中.由于参数回归往往能够很好地描述数据集 中,假设x和y满足一个简单的函数关系,即 的特征,因此参数回归模型成为对数据集进行聚类 y=fx,β)+e. (1) 分析的一种重要形式.通常要分析的数据集并不是 式中:B∈2CR为待确定的参数向量,e为随机向 满足一个简单的回归模型,而是有多个简单回归模 量,其均值向量为4=0∈R,协方差矩阵为.然 型混合而成的混合回归模型,即切换回归模型 而,在很多情况下,x和y并不是简单地满足函数关 (switching regression models),切换回归模型就是一 系式(1),而是满足一种更复杂的函数关系: y=f(x;β:)+e,1≤i≤c (2) 收稿日期:200905-11. 基金项目:国家自然科学基金资助项目(60842009). 其中每个参数向量Be2CR:,每个随机向量E:对 通信作者:杨小兵.E-mail:xyang@cjlu.eu.cm. 应的均值向量和协方差矩阵分别为:=0∈R和
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有