第5卷第5期 智能系统学报 Vol.5 No.5 2010年10月 CAAI Transactions on Intelligent Systems 0ct.2010 doi:10.3969/j.issn.16734785.2010.05.014 基于PCA特征和融合特征的ECG身份识别方法 杨向林,严洪,任兆瑞,宋晋忠,姚宇华,李延军 (中国航天员科研训练中心,北京100193) 摘要:ECG作为一种活体生物特征用于身份识别在国际上引起了广泛重视.针对基于解析特征的ECG身份识别方 法对特征点检测精度要求较高的缺点,提出一种仅需R波峰值点检测的ECG身份识别方法,该方法通过有针对性的 设定相应阙值,将PCA特征和小波融合特征方法相结合.实验结果表明该方法优于PCA特征方法、波形特征方法和 小波特征方法,既减少了特征点检测的复杂性和特征点检测不准确带来的误差,又可获得较高的识别率,是一种实 时、高效算法 关键词:主成分分析;小波分解;融合特征;心电图;身份识别 中图分类号:TP301.6文献标识码:A文章编号:1673-4785(2010)05045806 A method based on the PCA feature and fusion feature for ECG human identification YANG Xiang-lin,YAN Hong,REN Zhao-rui,SONG Jin-zhong,YAO Yu-hua,LI Yan-jun (China Astronaut Research and Training Center,Beijing 100193,China) Abstract:As a new biometric for identification,ECG attracted widespread attention in the international communi- ty.The method was based on the analytic feature for ECG identification and required high precision for fiducial points detection.To overcome this disadvantage,a method,in which only the peak point of the R-wave detection is needed,was proposed.As for setting the relevant threshold,this method combined the PCA feature method and fu- sion feature method based on wavelet decomposition.The experiment demonstrates that the method proposed in this paper is better than the PCA feature method,waveform feature method,and wavelet feature method.This method, which not only reduces the complexity and error of the fiducial points detection but also achieves high accuracy,is a realistic and efficient algorithm. Keywords:principal component analysis PCA )wavelet decomposition;fusion feature;electrocardiogram (ECG);identification 1903年荷兰医学家Einthoven发明心电图仪以 明ECG满足生物特征识别的惟一性和稳定性要求, 来,心电图(electrocardiogram,ECG)的发展已有l00 并成功识别6000例个体身份23].2001年Irvine等 多年,但应用范围仍局限于医学诊断和治疗.2001 在读书、驾驶等7种状态下进行实验,研究表明多生 年瑞典学者I.Bil等拓宽了ECG的应用范围,提出 理状态下(心率明显变化情况下)ECG身份识别是 利用ECG作为生物特征进行身份识别,该技术得到 可行的。 国际社会广泛关注,相关学者对其进行了研究1. ECG是心肌细胞动作电位在体表的综合效应, 其中李中建等从医学角度选用6000例样本对ECG 波形变化具有很强的规律性,为一种准周期信号.典 身份识别的可行性进行了系统研究,通过不同环境 型ECG每一周期由P波、QRS波、T波和U波组成. 季节(温暖和寒冷环境)、心率、时间(1年以上)、药 P波反映心房肌的除极过程,QRS波和T波分别反 物(心得安等影响心率的药物)等分组实验,研究表 映了心室肌的除极和复极过程,U波产生机理不明, 心房肌复极过程被QRS波掩盖而无法观测] 收稿日期:2009-1212. 基金项目:中国航天医学工程预先研究项目(S200903) ECG身份识别技术假设PQRST波形在一定的时 通信作者:严洪.E-mail:hholden@sina.com 期内保持相对稳定,对于正常人该假设成立,即使在
第5期 杨向林,等:基于PCA特征和融合特征的ECG身份识别方法 ·459· 焦虑、压力、运动等心率变化情况下QS波形仍然保 文方法流程如图1所示,先将输人ECG信号进行预 持稳定,即ECG满足生物身份识别特征稳定性的要 处理,然后采用基于PCA的特征提取方法进行ECG 求.同时受体型(例如肥胖)、年龄、体重、情绪、性别、 身份识别粗分类,找出被试者的所有可能候选模板, 心脏位置、大小、心脏几何形状、胸部构造、心脏生理 减小模板库,然后采用基于小波分解的特征融合方 特征等影响,个体ECG差异较大5],因此ECG满足 法在减小的模板库中进行分类识别. 生物身份识别特征惟一性的要求.即同一人ECG波 ECG 形变化的内部差异小于不同人ECG波形间个体差 PCA特征 融合特征 预处理 ID 身份识别 身份识别 异,因此ECG可作为一种生物身份识别特征. ECG作为一种活体身份识别特征,有着较高的 图1ECG身份识别流程框图 防伪性,既可单独用于身份识别,也可以和指纹等其 Fig.1 Flow chart for the ECG identification 他生物特征相结合开发多生物特征识别系统,它避 ECG身份识别系统的主要评价指标除了识别 免了指纹等其他身份识别技术被模仿或窃取的隐 正确率之外,还有误拒率(false reject rate,FRR,指 患.ECG为一维信号、数据量小、处理简单,减少了 拒绝接受应该接受的身份的概率)和误识率(false 计算存储等资源消耗,而且ECG采集方便,甚至可 accept rata,FAR,指接受不该接受的身份的概率). 以直接在2个指尖采集5] 这二者之间存在一定矛盾,FRR降低,则FAR升高, 国内外诸多研究人员对ECG身份识别进行了 反之FRR升高,FAR降低,因此需要根据现实情况 大量研究,提出了诸多算法.2001年L.Biel利用 寻求某种折衷.本文为克服RR和FAR之间的矛 ECG信号的30个幅度和间期为特征,通过特征矩 盾,在基于P℃A特征的身份识别方法中设置较低的 阵的相关运算减少冗余特征,最后选择10个间期和 FRR,避免可能的候选者被拒绝,在基于小波分解的 幅度特征,采用有监督的模式识别方法进行ECG身 融合特征身份识别方法中设置较高的FRR,这样避 份识别,2004年Palaniappan除了采用ECG信号 免接受非法的候选者.将2种方法相结合,使FRR 时域波形的间期和幅度特征外,还采用了波形因数 和FAR同时降低,提高ECG身份识别的正确率 特征,利用多层感知器一后向传播神经网络和简 ECG信号的消噪和特征点检测采用参考文献 化模糊ARTMAP(fuzzy adaptive resonance theory [10]中的方法.其中特征点检测算法仅用参考文献 map)进行分类识别6.2006年Wang除了利用时域 [10]中的三样条小波检测R波峰值,避免了检测Q 波形的幅度和间期特征外,还利用了主成分分析 波、S波峰值点等问题 (principal component analysis,PCA)方法降维提取 1.1基于PCA的ECG身份识别方法 特征,利用K阶邻接距进行身份识别7,以上基于 PCA方法是一种考察多个数值变量间相关性 解析特征的ECG身份识别方法在实验中取得了较 的多元统计方法,它通过少数几个主成分来解释多 好效果],但对特征点定位精度要求较高,要求检 变量的协方差结构,即将高维数据降为低维数据,保 测P波、QRS波和T波中的多个特征点.然而实际 留原始变量信息的同时,去掉数据间的冗余信息,既 中很多人的ECG波形和理想ECG波形差异较大, 减小了数据量,又突出了数据特征.图2为模板库中 例如无P波、双峰值T波和P波、T波倒置等情况, 30个试验者ECG信号的PCA特征(横坐标为PCA 设计一种多个特征点定位的普遍算法一直是ECG 特征向量序列,纵坐标为PCA特征向量值),30个 信号处理中的难点和热点.本文提出了一种仅需R 试验者的PCA特征差异较大.同时ECG信号的 波峰值点检测的ECG身份识别方法,将基于PCA P℃A特征稳定,如图3所示,图中带方框的实线和 特征方法和基于小波分解融合特征的方法相结合, 带圆圈的虚线分别表示模板库中试验者A和另外4 这样既保证了识别正确率,又可同时降低误拒率和 个试验者的PCA特征,虚线为试验者A不同时刻的 误识率 P℃A特征.从图3中可以看出,试验者不同时刻的 1基于PCA特征和融合特征的识别方法 PCA特征与模板库中试验者A的PCA特征基本重 合,并且与模板库中其他PCA特征差异较大,因此 ECG身份识别属于模式识别范畴,ECG身份识 ECG信号的PCA特征可用于身份识别89, 别包括ECG预处理、特征提取、分类识别等过程.本
·460 智能系统学报 第5卷 所含信息量保留的多少,通过实验,η取值为85% 即可. 5)令业=[中1中2A中u]为变换矩阵,ECG信号 的PCA特征为 yg=中(zg-2), 6)构建ECG身份识别模板数据库为Y=[y1y2 Ly.]. 4 68 10 12 7)识别过程,通过验证ECG构建心拍阵列X= PCA特征向量序列 {x}1,利用=(x-z)从ECG心拍中提取 图2模板库中30个试验者的PCA特征 PCA特征,将提取的PCA特征和模板库中的PCA Fig.2 PCA features of 30 subjects in template database 特征进行比较,选择模板库中欧式距离最小的模板 为识别结果 s受试者A心拍的CA特征 e-受试者B、C、D、E心拍的PA特征 8)将X:中的所有心拍采用上述方法进行分类 受试者A不同时刻5个心拍的PCA特征 识别,将C:次分类识别结果的所有模板作为候选模 板.再采用基于融合特征的ECG识别方法在候选模 板库中进行最终分类识别. 1.2基于小波分解融合特征的ECG身份识别方法 不同试验者ECG的波形和小波特征差异较大, 并且特征稳定,对波形特征和小波特征进行融合,融 4 6 1012 PCA特征向量序列 合特征向量的差异显著增强,如图4所示.采用该特 图3ECG的PCA特征 征向量进行身份识别抗噪声能力增强,并且在心率 Fig.3 PCA features of ECG 变异性下仍保持较高的识别率0 8 算法过程如下所述: .试验者A不同时刻4个心拍融合特征 …试险者B心护合特征模板 1)假设训练集Z={Z:,包含C类,每一类 乙=g品中包含C个心拍,总共含有N=2C:心 拍,z为一个心拍,所有心拍都是以R波峰值点为基 准点对齐,心拍长度为N,小于长度N的填零补齐 2)计算训练集的协方差矩阵: 46810 73*10 触合特征向量序列 s=8公4-4-0 CC (a)ECG的融合特征总体图 式中及为NxN方阵,区艺疗5是训练袋样本 0 心拍的平均心拍。 3)计算协方差矩阵S的特征值和特征向量, 并按从大到小顺序对特征值进行排序,得到特征值 序列入:和对应的特征向量序列少,i=1,2,…,N. 4)出于降维目的,取M个主成分,且M<N,定 义前M个主成分的累计贡献率为 2001210 12201230L2401250 融合特征向量序列 (b)(a)中局部放大图 通过设定的累计贡献率选择主成分个数M的取值. 图4ECG的融合特征图 累计贡献率的大小反映了前M个主成分对原数据 Fig.4 Fusion features of ECG
第5期 杨向林,等:基于PCA特征和融合特征的ECG身份识别方法 ·461 算法流程如下: 式中:t为一可变常数,根据实验调整参数t训练获 1)将每一个试验者的ECG波形构造一个心拍阵 取相关系数阈值P仙: 列Z={Zg1,其中Z为波形特征,其长度为L 7)将每一个试验者的ECG信号与模板库中C 2)对每个试验者的心拍阵列Z:={Z,}1进行 个模板ECG信号进行相关系数运算,求取最大相关 6级小波分解,选用db3作为小波基,并且取分解系 系数Pam=巴{p(i) 数的cA6、cD6、cD5、cD4、cD3后4级的系数构造小 8)如果pmm≥ph,则认为该试验者为模板库中 波特征W={Wg1j=1,2,…,C,W长度为L 的第i个人并输出第i个人的信息,否则拒绝该人或 3)将波形特征和小波特征采用组合特征方法 根据需要将该人信息加入模板库。 进行数据融合,构造融合特征阵列F:=Fg了= 1,2,…,C:,F的长度为Ly=L+Lo 2实验结果与分析 4)将构造的特征向量矩阵F:={F,}采用相 为验证算法有效性,采用35名受试者的正常 关系数法计算相邻心拍融合特征的相关系数: ECG信号(采样率为1024Hz,量化为16bit)进行实 Cov(F,F+i) 验.每名受试者采集2段ECG信号,每段ECG信号持 p=DFg·VDF 续2min,2段ECG信号采集间隔1d以上,以验证该 i=1,2,…,C,j=1,2,…,C-1. 方法在心率变异性下的健壮性.取30段不同受试者 式中:D(Fg)为Fg方差,Cov(Fg,Fg+i)为Fg和Fg+i 的ECG建立ECG身份识别模板库,另外40段ECG 的协方差, 用于测试身份识别的正确率、拒识率和误识率, Cov(Fg,F+i)=E{[Fg-E(Fg)]· 基于P℃A特征的ECG身份识别方法对每个试 [F1-E(F)]. 验者l00多个心拍(随机抽取2min的ECG信号为 以此得到一个相关系数序列. 样本)进行粗分类,部分实验结果如表1所示.每个 5)求相关序列的平均值: 试验者ECG的PCA特征识别结果并非惟一,而是 Ci-1 1 Pa=C() 集中为某几个候选者,其中这几个候选者包括正确 的识别模板.因此,利用该方法可以缩小试验者的识 6)通过训练学习获取相关系数阈值: 别模板库 Pu t x pag' 表1基于PCA特征ECG身份识别方法的粗分类结果 Table 1 The results of rough classification for identification based on PCA feature using ECG 样本 库模板序号 序列 12345 6 7 81012131415171819202122 1 28 > 44 50 2 107 3 26 3 293 18 9 39 4 106 163 5 102 8 20 6 33 7338 7 25 2110 68 336 30 6049 16
462 智能系统学报 第5卷 基于小波分解融合特征的ECG身份识别方法 快速,对噪声干忧影响较小,自适应性更强 在缩小后的候选模板库中进行最终分类识别,通过 对30名受试者ECG模板信号的融合特征向量进行 1.00 相关系数阈值训练.融合特征向量的相关系数如图 刻 0.95 5所示,融合特征的相关系数阈值通过有监督学习 0.90 设为0.80.对35名受试者的另外40段数据在缩小 好 】85 后的候选模板库中进行身份识别验证,正确率为 0.80 10 152025 97.5%.将本文方法和Irvinea所提的P℃A特征方 样本序列 法、波形特征方法以及Chan所提的小波特征等方法 图5 30个模板基于小波分解的融合特征的相关系数 进行比较21,如表2所示,可以看出该方法优于 Fig.5 The correlation coefficients of fusion feature based 其他3种方法,识别率进一步提高,并且算法简单 wavelet decomposition for 30 templates 表235个试验者的40段ECG信号身份识别实验结果(n=35) Table 2 The experiment results of the identification for 40 sessions from 35 persons (n =35) 身份识别方法 阚值 拒识率/% 误识率/% 识别率/% PCA特征 7.5 25.0 67.5 波形特征 0.78 5.0 12.5 82.5 小波特征 0.85 2.5 10.0 87.5 本文方法 0.80 0.0 2.5 97.5 3 结束语 参考文献: 本文提出了一种仅需检测R波峰值点的ECG [1]BIEL L,PETTERSSON O,PHILIPSON L,et al.ECG a- 身份识别方法,该方法首先采用基于PCA特征身份 nalysis:a new approach in human identification[J].IEEE 识别方法进行粗分类,选出模板库中所有可能的候 Transactions on Instrumentation and Measurement,2001, 50(3):808-812. 选模板,然后针对少量的候选模板采用基于融合特 [2]李中健,王庚勤,贾耀勤,等.应用心电图检查技术在活 征的ECG身份识别方法进一步识别分类.由于有针 体个人识别中的研究[J].中国实用医刊,2008,35(4): 对性设定相应阈值,该方法既避免了多个特征点检 23-25. 测带来的繁琐和误差,又同时降低了FAR和FRR. LI Zhongjian,WANG Gengqin,JIA Yaoqin,et al.Investi- 将本文方法与基于PCA特征、波形特征和小波特征 gation on the possibility of electrocardiography in the identi- 的ECG识别方法相比较,该方法优于其他3种方 fication of individuals[J].Chinese Joural of Practical 法,准确性高,实时性好. Medicine,2008,35(4):23-25. ECG作为一种生物特征用于身份识别有着广 [3]李中健,井艳,张巧玲,等.活体个人心电波形唯一性探 讨[J].医药论坛杂志,2008,29(4):4546 阔的应用前景.本文算法取得了较好的实验效果,但 LI Zhongjian,JING Yan,ZHANG Qiaoling,et al.The dis- 只是在小样本量条件下进行的.ECG身份识别技术 cussion of the uniqueness of ECG wave[J].Medicament 的研究还处于起步阶段,还有诸多问题需要进一步 Forum Magazine,2008,29(4):45-46. 研究.如:研究方便、有效的用于ECG身份识别的信 [4]IRVINE J M,WIEDERHOLD B K.GAVSHON L W,et 号采集方法;研究ECG信号的变化(如心率变化、波 al.Heart rate variability:a new biometric for human identi- 幅变化)、电极位置偏差以及心脏突发等对ECG身 fication[C]//Interational Conference on Artificial Intelli- 份识别的影响及相应的有效ECG身份识别方法;另 gence.Las Vegas,USA,2001:1106-1111. 外普及ECG身份识别在实际中的应用,评价ECG [5]杨向林,严洪.基于心电图身份识别技术综述[J].仪器 仪表学报,2009,29(增刊):695699 身份识别算法的有效性,建立有效、科学的ECG身 YANG Xianglin,YAN Hong.Survey on ECG based huam i- 份识别标准数据库也是亟待解决且具有重大意义的 dentification technique[J].Chinese Joural of Scientific In- 研究工作 strument,2009,29(Suppl):695699
第5期 杨向林,等:基于PCA特征和融合特征的ECG身份识别方法 ·463· [6]WANG Y,PLATANIOTIS K N,HATZINAKOS D.Integra- pulse:robust human identification from cardiovascular ting analytic and appearance attributes for human identifica- function[J].Pattern Recognition,2008,41:3427-3435. tion from ECG signal[C]//Proceedings of Biometrics Sym- [12]CHAN A D C,HAMDY MM,BADRE A,et al.Wavelet posiums.Baltimore,USA,2006:1-6. distance measure for person identification using electrocar- [7]PALANIAPPAN R,KRISHNUN S M.Identifying individu- diograms[J].IEEE Transactions on Instrumentation and als using ECG beats[C]//International Conference on Sig- Measurement,2008,57(2):248-253, nal Processing and Communications (SPCOM).Bangalore, 作者简介: ndia,2004:569-572. 杨向林,男,1984年生,研究实习 [8]CASTELLS F,LAGUNA P,BOLLMANN A,et al.Princi- 员,主要研究方向为生物医学信息处理 pal component analysis in ECG signal processing:Article ID 和模式识别.负责承担中国航天医学工 74 580[J].EURASIP Journal on Advances in Signal Pro- 程预先研究项目1项,申请国家发明专 cessing,2007(1):98. 利1项,发表学术论文13篇. [9]张敏,李陶深,钟淑瑛.基于MATLAB的主成分分析方法 (PCA)的实现[J].广西大学学报:自然科学版,2005, 30(S2):74-77 严洪,男,1962年生,研究员,主 ZHANG Min,LI Taoshen,ZHONG Shuying.Implementa- 要研究方向为生物医学信号处理和图 tion of principal components analysis method based on Mat- 像处理。 lab[J].Joumal of Guangxi University:Natural Science E- dition,2005,30(S2):74-77. [10]杨向林,严洪,李延军,等.基于小波分解和数据融合方 法的ECG身份识别[J].航天医学与医学工程,2009 22(4):296-301. 任兆瑞,男,1978年生,助理研究 YANG Xianglin,YAN Hong,LI Yanjun,et al.Human i- 员,主要研究方向为科研管理 dentification based on ECG with wavelet decomposition and data fusion method[J].Space Medicine Medical Engi- neering,2009,22(4):296-301. [11]IRVINE J M,ISRAEL S A,SCRUGGS W T,et al.Eigen 中文核心期刊一《计算机工程与应用》2011年征订启事 《计算机工程与应用》杂志是由信息产业部华北计算技术研究所主办的、面向中高级计算机专业工作者的学术刊物, 系中国计算机学会会刊、中国电子学会一级会刊,计算机工程与应用学会学报,计算机类中文核心期刊,中国期刊方阵双 效期刊,被列为“中国科学引文数据库来源期刊”、“中国学术期刊综合评价数据库来源期刊”,《中国期刊网》、《中国学术 期刊(光盘版)》、英国Inspec,/SA、俄罗斯《文摘杂志》、美国剑桥科学文摘(CSA)及《乌利希期刊指南》、波兰《哥白尼索 引》、《日本科学技术社中国文献数据库》收录期刊. 本刊是一本面向计算机全行业的综合性学术刊物,覆盖面宽、信息量大、报道及时是本刊的服务宗旨.主要栏目:博 士论坛;理论研究;产品、研发、测试;网络、通信与安全;数据库、信号与信息处理;图形图像、模式识别;工程与应用. 多年来,本刊坚持走学术与实践相结合的道路,在内容上既注重理论的先进性又兼顾实用技术的广泛性,在促进学 术交流的同时,推进了科技成果的转化.计算机科技工作者的良师益友,计算机工程技术人员的必备手册. 读者对象:计算机相关专业科研人员,工程项目决策、开发、设计及应用人员,大专院校师生. 订阅方式:本刊为旬刊,大16开,每期信息量60余万字,每月1日、11日、21日出版,邮局订阅代号:82605,每期定 价27.5元,全年36期总订价990元,全国各地邮局均可订阅. 通讯地址:北京市619信箱26分箱邮编:100083 联系电话:010-51615542 咨询信箱:lit@public2.bta.net.cn 主 页:http://www.ceaj.org 户 名:《计算机工程与应用》杂志社 账 号:805903228608094001 开户银行:中国银行北京北极寺支行