第8卷第2期 智能系统学报 Vol.8 No.2 2013年4月 CAAI Transactions on Intelligent Systems Apr.2013 D0I:10.3969/i.issn.16734785.201209026 网络出版t地址:htp://www.cnki.net/kcma/detail/23.1538.TP.20130326.0906.003.html 自适应概率神经网络及其在白酒电子鼻中的应用 周红标,张宇林,丁友威,刘佳佳2 (1.淮阴工学院电子与电气工程学院,江苏淮安223003;2.南京师范大学电气与自动化工程学院,江苏南京210042) 摘要:为了探索电子鼻对白酒品质鉴别的可能性,利用自制的新型无线白酒电子鼻对洋河海之蓝、今世缘省接待、 安徽迎驾大曲和牛栏山陈酿进行了分析.对所采集的数据进行平滑处理后提取稳态响应值和斜率值,利用主成分分 析对特征向量进行降维处理,并将获得的前2个主元得分作为概率神经网络识别模型的输入参量.针对传统概率神 经网络平滑因子σ单一易导致分类错误的缺陷,利用差异演化算法优化σ参数集,建立了自适应概率神经网络识别 模型.实验结果表明,DE-PNN相比BP-PWNN、PSO-PNN和SVM等,识别精度更高,抗噪性能更好,同时也证明了电子 鼻能有效地检出不同品牌的白酒。 关键词:差异演化算法;自适应概率神经网络;电子鼻;白酒识别 中图分类号:TP183:1TS262.3文献标志码:A文章编号:16734785(2013)02-017706 Application of adaptive probabilistic neural network in Chinese liquor E-Nose ZHOU Hongbiao',ZHANG Yulin',DING Youwei',LIU Jiajia2 (1.Faculty of Electronic and Electrical Engineering,Huaiyin Institute of Technology,Huai'an 223003,China;2.School of Electrical and Automation Engineering,Nanjing Normal University,Nanjing 210042,China) Abstract:In order to explore the possibility of hard liquor quality recognition by an electronic nose,the Chinese liquor of Yanghe Haizhilan,Jinshiyuan Shengjiedai,Anhui Yingjiadaqu,and Niulanshan Chenniang were analyzed by using self-made new wireless electronic nose for recognition of hard liquor quality.Firstly,the steady-state re- sponse and slope values were extracted after smoothing the collected data.Secondly,principal component analysis PCA was used to reduce the dimension of the eigenvector,and the obtained first two principal components scores were then used as the input parameters of the probabilistic neural network recognition model.Next,the aim was to overcome defect of traditional probabilistic neural network smoothing factor which would cause classification error easily.The method of adaptive probabilistic neural network identification model was presented,utilizing differential evolution algorithm to optimize the set of parameters.The results show that differential evolution-probabilistic neural network obtained a high recognition accuracy and noise immunity compared to back propagation,particle swarm op- timization-probabilistic neural network and support vector machine.The experiment also proved that the electronic nose can effectively detect different liquor brands in China. Keywords:differential evolution algorithm;adaptive probabilistic neural network;electronic nose;hard liquor quality recognition 白酒电子鼻最主要的应用场合是对白酒生产过别.目前,白酒品质识别主要是使用电子鼻对不同品 程进行质量监控,以保证白酒的品质,其核心要 牌、不同酒精度和不同香型的白酒进行识别23],期 求就是要实现基于计算机技术的白酒品质智能鉴 望能够通过气味数据的处理将它们区分开来.传感 器所测量的信号与被测量的气体之间并没有直接对 收稿日期:201209-12.网络出版日期:201303-26. 基金项目:国家自然科学基金资助项目(61203056):准安市科技公共 应关系,因而需要通过模式识别算法对其进行处理. 服务平台资助项目(HAP201107). 目前,电子鼻数据分析中的模式识别算法主要 通信作者:周红标.E-mail:bihb@163.com
·178 智能系统学报 第8卷 有k-近邻法(k-nearest neighbor,k-NN)、聚类分析 各层的功能如下78): (clustering analysis,CA)、判别分析(discriminant a 1)输入层:输人样本为 nalysis,DA)、主成分分析(principal component analy- X1=(1,x2,…,x,…,xa),YL=XI sis,PCA)、反传人工神经网络(back-propagation arti- 式中:江:和Y1:分别为输入层第(i=1,2,…,d)个 ficial neural network,BP-ANN)、概率神经网络(prob- 神经元的输入和输出. abilistic neural network,PNN)、学习向量量化(leam- 2)模式层:X迎,=”j=1,2,…,d,第i类模式的第 ing vector quantization,LVQ)、自组织映射(sef-or j个模式层神经元所确定的输入输出关系定义为 ganizing maps,SOM)和支持向量机4(support vector YP(XP)= machine,SVM)等.上述模式识别算法按输入输出之 间的关系可分为线性算法和非线性算法2类.线性 2non(”-(p-凸 算法只能实现输入到输出的线性映射,它们都是基 (1) 于统计理论而发展起来的.非线性算法,顾名思义, 式中:d为输入样本的维数;o为平滑因子;i=1,2, 可实现输入到输出的非线性映射,与神经网络理论 ,M=1,2“,G,N=宫G,M为训练样本集总 有关,由于这类算法能实现更复杂的映射关系,所以 类别数,G:为第i类训练样本数;XP,为第i类训练 通常其识别效果要优于线性算法例 样本第j个数据,XP为模式层的输入,YP,(XP)为 本文提出的自适应概率神经网络电子鼻白酒识 模式层第i类模式的第j个神经元输出. 别模型的主要步骤是:首先求取传感器阵列的稳态 响应值、响应阶段斜率、恢复阶段斜率及温湿度值作 0求和层:x灯,=P,(XP),T=名含X灯,式中 为原始特征向量;然后利用主成分分析法对输入量 XT,和YT:为求和层的第i类神经元的输入和输出. 进行降维,获取2个主元作为识别模型的输入;再进 4)输出层:XE:=YT,由基于最小误分率的 ·步利用遗传算法和粒子群算法优化概率神经网络 叶斯决策规则可知 的σ参数集;最后运用优化的自适应概率神经网络 YE arg max [XE. 进行白酒品牌的鉴别.本文以不同品牌、不同酒精度 式中:XE:和YE分别为输出层神经元的输入和输 的4种白酒电子鼻气味数据为样本,进行电子鼻的 出,YE为样本的类别号 模式识别算法研究, 1.2自适应概率神经网络 1自适应概率神经网络 模式层中采用径向基函数作为输入输出的传递 函数,平滑因子σ决定了高斯曲线的宽度,由于在 1.1概率神经网络 传统的概率神经网络中其值固定不变,影响了网络 概率神经网络(probabilistic neural network, 识别性能].因此,采用自适应的平滑参数将能提 PNN)是一种前馈型神经网络,是D.F.Specht博士 升网络的性能0.即式(1)变为 于1989年根据贝叶斯决策理论(即贝叶斯最小风 YP(XP)= 险准则)首先提出的6.PNN由输入层、模式层、求 1 (XP-XP (XP -XP) 和层和输出层组成,如图1所示. (2)ozexp j=1,2,…,d 差异演化算法(DE)与遗传算法(GA)、粒子群 算法(PS0)一样,都是一种优化算法,不同的是DE 是基于群体差异的演化算法,具有稳定性高、算法简 单、收敛速度快的优点,能克服GA、PSO等优化算法 的早熟现象].利用差异演化算法对径向基传递函 数进行优化的主要步骤如下: 1)种群初始化在D维空间随机产生V。个个体 输入层 求和层 输出层 (0)=+rand(0,1)() 模式层 式中:rand(0,1)是[0,1]上服从均匀分布的随机数 图1PNN拓朴结构 2)变异操作.其主要是生成扰动矢量,从当前代中 Fig.1 The topology of PNN 随机选择3个互不相同的个体,,,则
第2期 周红标,等:自适应概率神经网络及其在白酒电子鼻中的应用 ·179 hg(g+1)=v+F(x-),变异因子Fe[0,2], 白酒作为实验样品.实验时,每次准确取量样本 3)交叉操作,其主要是用来增加种群的多样 2mL,注人样本池中.每个样本的检测时间为60s, 性.其对变异后的扰动量和父代个体按式(2)进行 为了消除测量数据的漂移现象,每次检测前后,传感 交叉 器阵列都需要清洗和标淮准化(即加热处理),时间不 0(g+1)= 少于1008,这将能有效保证测量数据的准确性和稳 rh,(g+1),rand(0,l)≤Cg或j=rand(i); 定性.每种样品重复检测20次,4种不同白酒总计 Lxg(g),rand(0,l)>Cg或j≠rand(i). 得80个样本,建立一个小型的白酒气味指纹图谱 (2) 库.图3所示为洋河海之蓝的传感器阵列信号响应 式中:CR为交叉概率,rand(i)是[1,D]之间随机整数 强度图(取自编号haizhilan_6),其中横坐标是数据 4)选择操作对新矢量和预定矢量进行比较选择 采集点数(3000点,1808),纵坐标是响应强度,每 x:(g+1)= 条曲线代表一个传感器在采样时间内的响应值变 :(g+1),f:(g+1)2.5 TGS2600 D转换、无线通信、数据传输、人机对话等功能,主要 2.0 TGS2620 TGS2602 包括气敏传感器阵列(TGS2600、TGS2602 竖1.5引 TGS2610号 TGS2610、TGS2611、TGS2620)、AM2302温湿度传感 1.0 TGS261H 器模块、信号调理模块、STM32F103控制器模块、电 10 10 15202530 源模块、键盘模块、液晶显示模块、CC2430 Zigbee无 点数 线通信模块、RS232转USB通讯模块等.在上位机 图3传感器阵列信号响应强度 采用虚拟仪器软件Labview设计一套能对数据进行 Fig.3 Signal response intensity of sensor array 实时显示、存储、回放和分析等操作的平台.算法采 用数据处理能力更强的Matlab平台实现,并通过 3.5 ActiveX技术将预处理、特征提取和模式识别算法集 3.0l 成到Labview当中.硬件实物图如图2所示 >2.5 g2.0 JGS2602 要1.5 TGS2611 10202方3610 点数 图4数据平滑后信号响应强度 Fig.4 Signal response intensity after smoothing 2.2气味数据特征提取 图2电子鼻硬件实物 目前电子鼻中使用的数据特征提取方法主要有 Fig.2 The diagram of electronic nose hardware 稳态响应值、响应和恢复阶段的斜率、对数法、一阶 在超市购置了洋河海之蓝42480mL、牛栏山陈 差分法、二阶差分法等.目前大都数都只采用稳态响 酿36°400mL、今世缘省接待40°500mL和安徽迎 应值.本文在选择稳态响应值的基础上,还计算出响 驾大曲45°500mL共4种不同酒精度不同品牌的 应阶段和恢复阶段的斜率作为特征值,其计算公式
·180 智能系统学报 第8卷 如下: 限度地表征原变量的数据信息,是原变量的线性组 斥=y-b 合.从每种白酒中随机选择5个样本组成20组样本 %-d' 进行主成分分析,样本前2个主成分得分图如图6 ba-yh kn=Gh - 所示,前5个主成分的贡献率分别为70.73%、 12.39%、8.23%、6.76%和1.04%,累计贡献率为 式中:k,和k分别是响应阶段斜率和恢复阶段斜 70.73%、83.12%、91.35%、98.11%和99.15%. 率,(a,b)和(x,y)分别是曲线响应阶段起始点 表1部分特征值数据 和响应稳定点,(,ya)和(a6,b.)分别是曲线恢复 Table 1 Some of the eigenvalue data 阶段稳定点和恢复阶段起始点,可通过ime= 斜率 温度湿度 (180s/3000)×dianshu公式将点数转换成时间.斜 编号 稳态值 响应 恢复 /℃ /RH 率计算中各点坐标采用差值法自动获取.稳态响应 值及斜率特征自动计算示意图如图5所示. 2.497 0.046 -0.027 H1 24.471.6 TGS2611 TGS2611 TGS2600 3.5 w,3.1069 3.107 0.045 -0.059 H6 25.457.7 TGS2620 TGS2610 TGS2611 k=-0.028 >2.5 2.585 0.061 -0.061 2.0H =0.0724 N5 25.258.2 TGS2610 TGS2602 TGS2611 1.5 1.0 3.152 0.048 -0.034 N17 25.459.3 0.20 2023010 TGS2600 TGS2611 TGS2600 1015 点数 2.454 0.096 -0.027 S8 25.556.3 图5稳态响应值及斜率特征值提取 TGS2611 TGS2620 TGS2620 Fig.5 The steady state response values and feature ex- 2.404 0.082 -0.031 traction of gradient S20 25.459.2 TGS2602 TGS2610 TGS2620 从图5可以发现,由于横、纵坐标的不对应,斜 率值很小,比如k.=0.0724与0.=3.1069相差40 2.835 0.110 -0.053 Y_18 25.467.6 多倍;如果不对其进行处理,直接将它们作为识别模 TGS2602 TGS2600 TGS2611 型的输入数据,必定影响识别结果的准确性.因此, 3.120 0.110 -0.024 Y_19 25.567.6 对斜率值扩大100倍,并将负值取正,如:0.0724调 TGS2620 TGS2600 TGS2600 整后为7.24,-0.0281调整后为2.81. 此外,系统显示的温湿度值数值较大.如H_1 样本分别为24.4℃和71.6RH,与稳态值和处理后 的斜率值不匹配,因此,对它们进行单独归一化处 理.对80个样本数据采取前述的预处理和特征提取 方法进行处理,每个样本获得5个稳态响应值、10 -1 个斜率值2个温湿度数值,总共形成17个输入参 +牛栏山 尔 -2 量.从4种白酒中每种随机选择2个样本,每个样本 *省接行 ?迎驾人曲 列出阵列中某一个传感器的稳态值、响应阶段斜率 210】234 和恢复阶段斜率及温湿度共5个数据,如表1所示 第一主成分(贡献*70.7307%) (H编号代表海之蓝、N_编号代表牛栏山、S_编号代 图6P℃1和PC2主成分得分 表省接待、Y编号代表迎驾,为了显示的直观性,表 Fig.6 The chart of principal component score 1数据未处理,均为原始数据) 由图6可见,前2个主成分累计贡献率达 2.3气味数据主成分分析 83.12%,已能达到分类要求.而这之后,随着主成分 17个输人量之间存在一定的相关性,可以利用 数量的增加,累计贡献率增加相当缓慢,所以每个白 主成分分析实现降维,即通过对数目较多的特征向 酒样本的电子鼻气味数据可以用前2个主成分代替. 量进行变换得到数目较少的新变量,新变量能最大
第2期 周红标,等:自适应概率神经网络及其在白酒电子鼻中的应用 181 从表3可以看出,3种PNN算法的留一交叉分 3 实验结果分析 类准确率要远高于BP和RBF神经网络;参数集经 在建立识别模型之前,首先给特征数据集中的 过DE优化后的PNN识别模型得到的准确率最高 每个样本附上标签,其中海之蓝定义为1号标签,牛 (训练集为100%、测试集为97.5%),优于PS0、GA 栏山陈酿定义为2号标签,省接待定义为3号标签, 优化的和未经优化的PNN;未经优化的PNN耗时较 迎驾大曲定义为4号标签.从白酒气味指纹图谱库 短,远低于BP,能够满足在线分析的要求,但由于优 中随机选择40个作为训练集,剩余40个作为测试 化算法寻求过程复杂,GA-PNN和PSO-PNN耗时较 集,先进行PCA处理,然后将每个样本的前2个主 长;本文还对SVM模型进行测试,发现其在白酒识 成分得分输入到DE-PNN模型进行识别,识别结果 别中的效果并不理想(经过简单分析,可能的原因 如表2所示. 是SVM需要整体归一化,而本文数据集特征值采取 表2DE-PNN识别结果 的是分属性归一化) Table 2 The recognition results of DE-PNN 4 预测结果 H 特异度/% 结束语 N 识别出H 10 1 0 0 90.9 电子鼻技术融合了传感器技术、嵌入式技术、信 识别出N 0 9 0 1 90.0 息处理技术和模式识别技术等,目前在农学、工学、 医学和生物学等多个领域都有着广泛应用.利用电 识别出S 1 0 8 80.0 子鼻技术识别白酒种类、检测白酒品质、监控白酒生 识别出Y 1 0 0 P 80.9 产质量是目前研究的主要方向,本文正是针对白酒 灵敏度/%83.390100 80 87.5/92.1 分类提出一种基于APNN的识别模型,其利用DE、 从表2可见,DE-PNN识别算法的总体敏感度 GA、PSO优化PNN的σ参数集.实验结果表明,与 和特异度分别为87.5%和92.1%,证实了模型具有 其他神经网络以及未优化的PNN相比,基于DE 较好的分类性能.径向基函数的扩展速度SPREAD PNN的方法具有较好的分类效果和较快的收敛速 对网络有影响,当SPREAD在0.002~0.007之间取 度 值时,模型的分类和泛化能力较好。 表2只是一次随机性的测试,可能存在误差.为 参考文献: 了全面评价分类器的性能,本文采取了留一交叉验 [1]杨国强,张淑娟.电子鼻技术在酒类识别应用中的研究 证法(leave-one-out cross-validation,LOOCV).该方 进展[J].山西农业大学学报:自然科学版,2010,30 法能够弥补样本不足的缺陷,其原理是:每次从样本 (1):92-96. 集中随机抽取1个作为测试样本,剩余的n-1个作 YANG Guogiang,ZHANG Shujuan.Development of the e- 为训练样本;然后,再轮流提取另一个样本,直到所 lectronic nose technology on the identification of spirit]. Journal of Shanxi Agric ultural University:Natural Science 有样本都轮完,最终由准确分类的样本与样本总数 Edition,2010,30(1):92-96. 之比来决定分类器的分类准确率.表3给出了在不 [2]YU Huichun,WANG Jun.Discrimination of longjing green- 同的分类方法下,全部80个样本采用L00CV进行 tea grade by electronic nose[J].Sensors and Actuators B, 验证对应的识别结果。 2007,122:134-140. 表3各种分类方法的识别结果 [3]ALEIXANDRE M,LOZANO J,GUITERREZ J,et al. Table 3 The recognition results of different methods Portable e-nose to classify different kinds of wine[J].Sen- 分类准确率 建模时间/ sors and Actuators B,2008,131:71-76. 算法 训练样本 测试样本 (8·次-1) [4]刘红秀,李洪波,李卫东,等.基于电子鼻的鱼类新鲜度 估计研究[J].中山大学学报:自然科学版,2010,49 BP 4578/6320 62/80 125.4 (2):2830. RBF 4895/6320 68/80 5.8 LIU Hongxiu,LI Hongbo,LI Weidong,et al.Research on PNN 6125/6320 71/80 2.6 the fish freshness assessment based on electronic nose[J]. GA-PNN 6288/6320 75/80 12.5 Acta Scientiarum Natralium Universitatis Sunyatseni,2010, 49(2):28-30. PSO-PNN 6320/6320 76/80 8.5 [5]李纯,卢志茂,杨朋.基于快速谱聚类的图像分割算法 DE-PNN 6320/6320 78/80 3.7 [J].应用科技,2012,39(2):26-30
·182. 智能系统学报 第8卷 LI Chun,LU Zhimao,YANG Peng.Image segmentation LI Peng,WANG Lexin,ZHAO Zhimin.Hypertriglyceri- based on fast spectral clustering algorithm[J].Applied Sci- demia serum recognition using fluorescence spectroscopic ence and Technology,2012,39(2):26-30. analysis based on probabilistic neural networks[J].Chi- [6]姬东朝,宋笔锋,易华辉.基于概率神经网络的设备故障 nese Journal of Luminescence,2011,32(11):1192- 诊断及仿真分析[J].火力与指挥控制,2009,34(1): 1196. 82-85. [11]卢青波,张学良,温淑花,等.差异演化算法改进与应 JI Dongchao,SONG Bifeng,YI Huahui.Equipment fault 用[J].农业机械学报,2010,41(2):193-197. diagnosis based on probabilistic neural networks and simula- LU Qingbo,ZHANG Xueliang,WEN Shuhua,et al.Mod- tion analysis[J].Fire Control and Command Control, ified differential evolution and its application[J].Transac- 2009,34(1):8285. tions of the Chinese Society for Agricultural Machinery, [7]明利特,蒋芸,王勇,等.基于邻域粗糙集和概率神经网 2010,41(2):193-197. 络集成的基因表达谱分类方法[J].计算机应用研究, [12]蒋鼎国,周红标,耿忠华.基于S0-SVM的白酒品质 2011,28(12):44404444. 鉴别电子鼻[J].中国酿造,2011(11):149152. MING Lite,JIANG Yun,WANG Yong,et al.Gene expres- JIANG Dingguo,ZHOU Hongbiao,GENG Zhonghua.Lig- sion profiles classification method based on neighborhood uor recognition electronic nose based on PSO-SVM[J]. rough set and probabilistic neural networks ensemble[J]. China Brewing,2011(11):149-152. Application Research of Computers,2011,28(12):4440- 作者简介: 4444. 周红标,男,1980年生,讲师,主要 [8]KIM D,KIM D H,CHANG S.Application of probabilistic 研究方向为模式识别. neural network to design breakwater armor blocks[]].O- cean Engineering,2008,35:294-300. [9]严文娟,林凌,赵静.概率神经网络用于舌诊的近红外 光谱分类[J].激光与红外,2010,40(11):1201-1204. YAN Wenjuan,LIN Ling,ZHAO Jing.Probability neural network for the classification of tongue diagnosis by near in- 张宇林,男,1970年生,教授,博士, frared spectroscopy [J].Laser and Infrared,2010,40 主要研究方向为智能信息处理。 (11):1201-1204. [10]李鹏,王乐新,赵志敏.基于概率神经网络的荧光光谱 法识别高甘油三脂血清[J].发光学报,2011,32(11): 1192-1196 第2届物流装备绿色与智能技术发展研讨会 由中国机械工程学会、英国工程师学会、美国工程师学会、德国机械设备制造业联合会等共同主办的“2013 年智能制造国际会议”将于2013年6月26一27日在北京召开.中国机械工程学会物流工程分会主办的“第2届 物流装备绿色与智能技术发展研讨会一现代企业物流智能与自动化”专题会议同期在北京召开,会议主题:“创 新驱动、智能实现”,会议将对如何通过广泛应用现代信息技术、控制技术、网络技术以及驱动、定位、识别等新技 术,实现企业物流的智能化、自动化,以满足现代企业在创新驱动模式下对物流系统不断提出的新要求进行研讨 与交流.会议将邀请中国工程院周济院长、工信部领导、熊有伦院士、英国和美国机械工程师学会、德国机械设备 制造业联合会、行业相关专家学者、知名企业作相关的专题报告及成功案例分享. 征文主要议题(包括但不限于): 1.物流智能技术 7.智能物流装备关键技术、智能设计方法 2.自动化控制技术 8.企业物流系统的创新 3.物流信息技术 9.物流系统及装备的绿色运营 4.网络技术 10.节能与环保新技术、新材料 5.智能化车间物料搬运系统 11.物流人才培养 6.智能化的起重机、输送系统、仓储系统 会议网站:htp:/www.cmes.org/fle/c2i6t2013115132045.html