正在加载图片...
·480 工程科学学报,第39卷,第4期 3.2K近邻算法(K-nearest neighbor,KNN) 的推广能力. KNN分类算法是一种简单、常用的数据挖掘分 由于支持向量机算法占用的计算资源少,可以使 类技术方法,它是针对特征空间中待测样本的特征向 其在具有有限计算资源的电子鼻中得到应用,因而受 量与其相邻的k个样本特征向量间的距离关系而实现 到很多学者的重视.Yusuf等的提出了利用主成分分 待测样本分类的一种方法,该算法可以仅依靠与待分 析算法+支持向量机算法来处理电子鼻在糖尿病足感 样本特征向量距离最近邻的一个或者几个样本来判断 染病原菌诊断中采集的数据,取得了很好的效果.Yim 样本的种类.对电子鼻中传感器阵列采集的数据分类 等叨提出,针对温度敏感的电子鼻采集的信号,在温 而言,K近邻算法是一种无需训练、简单、便捷的方法, 度补偿之后采用支持向量机分类算法进行分类,能够 在电子鼻的应用中取得了不错的效果.Dai等时使用 得到比线性判别式分析算法和人工神经网络更好的分 K近邻算法对电子鼻采集的龙井茶气味信息进行了分 类效果.Wang等陶利用支持向量机分类器对人体呼 析、处理,实现了龙井茶品质分级.Thriumani等B使 吸信号的十类特征信号进行分离,准确地辨识出了人 用电子鼻采集人呼出气体,利用K近邻算法测算出呼 的十种不同的呼吸状态. 出气体中挥发性有机化合物气体的成分含量,实现了 3.5 Adaboost集成分类器 肺癌初步诊断.Jiang等可使用K近邻算法对利用电 Adaboost集成分类器针对贴有标签的训练数据 子鼻采集的固态蛋白饲料发酵过程产生的气体信息进 集,训练一组结构相同、参数差异的子分类器,将这些 行分析,实现对发酵程度、质量的监控.徐赛等侧采 子分类器按照一定的权值集成起来,构成Adaboost集 用K近邻算法对荔枝成熟阶段的荔枝进行分类识别, 成分类器.该算法以每次迭代训练后的训练误差作为 对测试集识别的正确率为96.67%. 参考,来校正当前每个子分类器和数据样本的权值,利 3.3线性判别式分析(linear discriminant analysis, 用重新构造的数据集对子分类器迭代训练,以此优化 LDA) Adaboost集成分类器内部参数.相比其他分类算法, 线性判别式分析算法是通过最大化类内散度矩阵 Adaboost集成分类器的泛化性能更好,识别率更高 与类间散度矩阵的比值来获得样本采集数据的最优投 Adaboost算法同时具有融合多个分类算法的能 影空间,进而在最优空间中寻找最佳分离性的线性判 力,因其突出的特性,使其在电子鼻的模式识别应用领 别方式.在电子鼻的数据处理中,线性判别式分析是 域得到广泛地使用.Chen等利用基于Adaboost算 种成熟快速有效的方法,Gu等9烟利用线性判别式 法处理传感器阵列采集的鸡肉散发气味的信号,成功 分析算法将电子鼻采集的白酒样本数据映射到一个最 的实现了鸡肉新鲜度的等级分类.Urmila等网将BP 佳投影空间,使得基于距离的数据信息区分度更加明 神经网络作为弱分类器,利用Adaboost算法对数据集 显.Abdullah等使用线性判别式分析算法对电子鼻 进行多轮迭代,不断调整BP神经网络的参数和弱分 采集的糖尿病人伤口气味信息进行分类实现了细菌的 类器的权值及样本的权值,最后形成集成类器,使其在 识别.Li等四在使用电子鼻评价猪肉新鲜度时,使用 挥发性有机化合物气体的识别方面取得良好的效果. 线性判别式分析算法对传感器阵列采集的数据模式进 Bansal50使用电子鼻对有害气体进行检测,基于Ada- 行了高准确率的识别.洪雪珍和王俊[网利用PEN2型 boost集成分类器模式识别系统的电子鼻检测准确率 电子鼻检测猪肉在冷冻储藏过程中散发的气味,通过 可以达到99%, 线性判别式分析算法比对数据库已有数据信息进行检 3.6人工神经网络(artificial neural network,ANN) 测,达到了较高的识别准确率.Belhumeur等提出采 人工神经网络是一种通过模拟人类大脑神经元信 用一种主成分分析算法+线性判别式分析算法的组合 息处理方式进行数据分析的网络模型,其由大量相似 算法,优化了线性判别式分析算法在处理电子鼻采集 的感知节点互相连接,并形成一个复杂的网络.人工 的较高维度数据时难以计算数据投影向量的问题,既 神经网络拥有常规模式识别算法无法比拟的非线性运 能解决主成分分析算法对不同的训练样本数据不敏感 算优势,对于高维非线性问题,该算法表现出较高的容 的问题,又利用线性判别式分析的简单高效的优点,获 错性.随着计算机硬件技术的不断进步,它已经成为 得了很好的分类效果 模式识别及机器学习领域的研究热点.目前,许多人 3.4支持向量机(support vector machine,SVM) 工神经网络算法已经在电子鼻的模式识别系统中得到 支持向量机算法的核心思想是把输入向量映射到 应用:BP神经网络B网、模糊神经网络(FNN)B阅、自组 高维特征空间,将在低维空间中原本线性不可分的问 织神经网络(SOM)网、学习向量量化(LVQ)B阿、概率 题转化为在高维空间中线性可分的问题,同时避免 神经网络(PNN)陶等. 出现“维数灾难”的现象.作为一种通用的学习方法, 将人工神经网络算法应用到电子鼻模式识别系统 支持向量机算法对小样本进行学习与分类具有比较好 时,关键问题是在考虑电子鼻硬件资源基础上正确的工程科学学报,第 39 卷,第 4 期 3. 2 K 近邻算法( K-nearest neighbor,K-NN) K-NN 分类算法是一种简单、常用的数据挖掘分 类技术方法,它是针对特征空间中待测样本的特征向 量与其相邻的 k 个样本特征向量间的距离关系而实现 待测样本分类的一种方法,该算法可以仅依靠与待分 样本特征向量距离最近邻的一个或者几个样本来判断 样本的种类. 对电子鼻中传感器阵列采集的数据分类 而言,K 近邻算法是一种无需训练、简单、便捷的方法, 在电子鼻的应用中取得了不错的效果. Dai 等[35]使用 K 近邻算法对电子鼻采集的龙井茶气味信息进行了分 析、处理,实现了龙井茶品质分级. Thriumani 等[36]使 用电子鼻采集人呼出气体,利用 K 近邻算法测算出呼 出气体中挥发性有机化合物气体的成分含量,实现了 肺癌初步诊断. Jiang 等[37]使用 K 近邻算法对利用电 子鼻采集的固态蛋白饲料发酵过程产生的气体信息进 行分析,实现对发酵程度、质量的监控. 徐赛等[38]采 用 K 近邻算法对荔枝成熟阶段的荔枝进行分类识别, 对测试集识别的正确率为 96. 67% . 3. 3 线性判别式分析( linear discriminant analysis, LDA) 线性判别式分析算法是通过最大化类内散度矩阵 与类间散度矩阵的比值来获得样本采集数据的最优投 影空间,进而在最优空间中寻找最佳分离性的线性判 别方式. 在电子鼻的数据处理中,线性判别式分析是 一种成熟快速有效的方法,Gu 等[39--40]利用线性判别式 分析算法将电子鼻采集的白酒样本数据映射到一个最 佳投影空间,使得基于距离的数据信息区分度更加明 显. Abdullah 等[41]使用线性判别式分析算法对电子鼻 采集的糖尿病人伤口气味信息进行分类实现了细菌的 识别. Li 等[42]在使用电子鼻评价猪肉新鲜度时,使用 线性判别式分析算法对传感器阵列采集的数据模式进 行了高准确率的识别. 洪雪珍和王俊[43]利用 PEN2 型 电子鼻检测猪肉在冷冻储藏过程中散发的气味,通过 线性判别式分析算法比对数据库已有数据信息进行检 测,达到了较高的识别准确率. Belhumeur 等[44]提出采 用一种主成分分析算法 + 线性判别式分析算法的组合 算法,优化了线性判别式分析算法在处理电子鼻采集 的较高维度数据时难以计算数据投影向量的问题,既 能解决主成分分析算法对不同的训练样本数据不敏感 的问题,又利用线性判别式分析的简单高效的优点,获 得了很好的分类效果. 3. 4 支持向量机( support vector machine,SVM) 支持向量机算法的核心思想是把输入向量映射到 高维特征空间,将在低维空间中原本线性不可分的问 题转化为在高维空间中线性可分的问题[45],同时避免 出现“维数灾难”的现象. 作为一种通用的学习方法, 支持向量机算法对小样本进行学习与分类具有比较好 的推广能力. 由于支持向量机算法占用的计算资源少,可以使 其在具有有限计算资源的电子鼻中得到应用,因而受 到很多学者的重视. Yusuf 等[46]提出了利用主成分分 析算法 + 支持向量机算法来处理电子鼻在糖尿病足感 染病原菌诊断中采集的数据,取得了很好的效果. Yin 等[47]提出,针对温度敏感的电子鼻采集的信号,在温 度补偿之后采用支持向量机分类算法进行分类,能够 得到比线性判别式分析算法和人工神经网络更好的分 类效果. Wang 等[48]利用支持向量机分类器对人体呼 吸信号的十类特征信号进行分离,准确地辨识出了人 的十种不同的呼吸状态. 3. 5 Adaboost 集成分类器 Adaboost 集成分类器针对贴有标签的训练数据 集,训练一组结构相同、参数差异的子分类器,将这些 子分类器按照一定的权值集成起来,构成 Adaboost 集 成分类器. 该算法以每次迭代训练后的训练误差作为 参考,来校正当前每个子分类器和数据样本的权值,利 用重新构造的数据集对子分类器迭代训练,以此优化 Adaboost 集成分类器内部参数. 相比其他分类算法, Adaboost 集成分类器的泛化性能更好,识别率更高. Adaboost 算法同时具有融合多个分类算法的能 力,因其突出的特性,使其在电子鼻的模式识别应用领 域得到广泛地使用. Chen 等[49]利用基于 Adaboost 算 法处理传感器阵列采集的鸡肉散发气味的信号,成功 的实现了鸡肉新鲜度的等级分类. Urmila 等[50]将 BP 神经网络作为弱分类器,利用 Adaboost 算法对数据集 进行多轮迭代,不断调整 BP 神经网络的参数和弱分 类器的权值及样本的权值,最后形成集成类器,使其在 挥发性有机化合物气体的识别方面取得良好的效果. Bansal[51]使用电子鼻对有害气体进行检测,基于 Ada￾boost 集成分类器模式识别系统的电子鼻检测准确率 可以达到 99% . 3. 6 人工神经网络( artificial neural network,ANN) 人工神经网络是一种通过模拟人类大脑神经元信 息处理方式进行数据分析的网络模型,其由大量相似 的感知节点互相连接,并形成一个复杂的网络. 人工 神经网络拥有常规模式识别算法无法比拟的非线性运 算优势,对于高维非线性问题,该算法表现出较高的容 错性. 随着计算机硬件技术的不断进步,它已经成为 模式识别及机器学习领域的研究热点. 目前,许多人 工神经网络算法已经在电子鼻的模式识别系统中得到 应用: BP 神经网络[52]、模糊神经网络( FNN) [53]、自组 织神经网络( SOM) [54]、学习向量量化( LVQ) [55]、概率 神经网络( PNN) [56]等. 将人工神经网络算法应用到电子鼻模式识别系统 时,关键问题是在考虑电子鼻硬件资源基础上正确的 · 084 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有