工程科学学报,第41卷,第6期:817-823,2019年6月 Chinese Journal of Engineering,Vol.41,No.6:817-823,June 2019 D0:10.13374/j.issn2095-9389.2019.06.014;http:/journals..usth.edu.cn 基于深度学习的人体低氧状态识别 于露,金龙哲区,王梦飞,徐明伟 北京科技大学土木与资源工程学院,北京100083 ☒通信作者,E-mail:in@ustb.edu.cn 摘要通过低氧实验提出一种快速识别人体低氧状态的方法.通过搭建深层神经网络训练实验数据识别氧气体积分数 (16%-21%)与人体可耐受极端低氧气体积分数(15.5%-16%)条件下光电容积脉搏波(photoplethysmography,PPG)信号, 获得人体生理状态的模式识别网络.经测试该网络的识别正确率可达92.8%.利用混淆矩阵及接受者操作性能(receiver op- erating characteristic,R0C)曲线分析,混淆矩阵的训练集、验证集、测试集、全集识别正确率分别达到97.9%、94.8%、92.8%和 96.3%,AUC(area under curve)值接近1,认为该网络分类性能优良,并且可在4s内完成整个识别过程. 关键词有限空间:低氧伤害:光电容积脉搏波:深度学习:状态识别 分类号X912 Recognition of human hypoxic state based on deep learning YU Lu,JIN Long-zhe,WANG Meng fei,XU Ming-wei School of Civil and Resource Engineering,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:lzjinz@ustb.edu.cn ABSTRACT Due to the development of industrialization,low-oxygen environment has become common in the confined spaces of con- struction industries,chemical industries,military,urban underground spaces,and poorly ventilated crowed areas and caused a large number of hypoxic injuries.The traditional method of preventing hypoxic injuries is to monitor the oxygen concentration in the environ- ment without considering the difference in oxygen tolerance limits when the human body is in different physiological states.Photople- thysmography (PPG)can comprehensively reflect physiological information,including heart rate,blood pressure,blood oxygen satura- tion,cardiovascular blood flow parameters,and respiratory rate.When the human body enters a hypoxic environment,the physiological parameters change rapidly,resulting in a change in the PPG signal.By measuring the PPG signal of the human body,the physiological state is considered to determine whether the human body reaches the oxygen tolerance limit.This study proposed a method for quickly identifying the hypoxic state of the human body using hypoxia experiment.According to the latest research on aviation medicine,moun- tain medicine and naval submarine medicine,15.5%oxygen volume fraction can guarantee the basic life safety of personnel.Through the training experimental data of a constructed deep neural network,the PPG signal of a human in normal oxygen volume fraction (16%-21%)and extremely low-oxygen volume fraction (15.5%-16%)was determined to obtain the pattern recognition network of human physiological state.After testing,the recognition accuracy of the network could reach 92.8%.Using the confusion matrix and receiver operating characteristic curve analysis,the accuracy rate of training set,verification set,test set,and ensemble recognition of the confusion matrix reached 97.9%,94.8%,92.8%,and 96.3%,respectively.The area under the curve value is close to 1,the network classification performance is excellent,and the entire identification process could be completed within 4 s. KEY WORDS confined space;hypoxic injury:photoplethysmography:deep learning:state recognition 收稿日期:20190306 基金项目:国家“十三五”重点科技支撑资助项目(2016YFC0801700)
工程科学学报,第 41 卷,第 6 期: 817--823,2019 年 6 月 Chinese Journal of Engineering,Vol. 41,No. 6: 817--823,June 2019 DOI: 10. 13374 /j. issn2095--9389. 2019. 06. 014; http: / /journals. ustb. edu. cn 基于深度学习的人体低氧状态识别 于 露,金龙哲,王梦飞,徐明伟 北京科技大学土木与资源工程学院,北京 100083 通信作者,E-mail: lzjin@ ustb. edu. cn 摘 要 通过低氧实验提出一种快速识别人体低氧状态的方法. 通过搭建深层神经网络训练实验数据识别氧气体积分数 ( 16% ~ 21% ) 与人体可耐受极端低氧气体积分数( 15. 5% ~ 16% ) 条件下光电容积脉搏波( photoplethysmography,PPG) 信号, 获得人体生理状态的模式识别网络. 经测试该网络的识别正确率可达 92. 8% . 利用混淆矩阵及接受者操作性能( receiver operating characteristic,ROC) 曲线分析,混淆矩阵的训练集、验证集、测试集、全集识别正确率分别达到 97. 9% 、94. 8% 、92. 8% 和 96. 3% ,AUC ( area under curve) 值接近 1,认为该网络分类性能优良,并且可在 4 s 内完成整个识别过程. 关键词 有限空间; 低氧伤害; 光电容积脉搏波; 深度学习; 状态识别 分类号 X912 收稿日期: 2019--03--06 基金项目: 国家“十三五”重点科技支撑资助项目( 2016YFC0801700) Recognition of human hypoxic state based on deep learning YU Lu,JIN Long-zhe ,WANG Meng-fei,XU Ming-wei School of Civil and Resource Engineering,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail: lzjinz@ ustb. edu. cn ABSTRACT Due to the development of industrialization,low-oxygen environment has become common in the confined spaces of construction industries,chemical industries,military,urban underground spaces,and poorly ventilated crowed areas and caused a large number of hypoxic injuries. The traditional method of preventing hypoxic injuries is to monitor the oxygen concentration in the environment without considering the difference in oxygen tolerance limits when the human body is in different physiological states. Photoplethysmography ( PPG) can comprehensively reflect physiological information,including heart rate,blood pressure,blood oxygen saturation,cardiovascular blood flow parameters,and respiratory rate. When the human body enters a hypoxic environment,the physiological parameters change rapidly,resulting in a change in the PPG signal. By measuring the PPG signal of the human body,the physiological state is considered to determine whether the human body reaches the oxygen tolerance limit. This study proposed a method for quickly identifying the hypoxic state of the human body using hypoxia experiment. According to the latest research on aviation medicine,mountain medicine and naval submarine medicine,15. 5% oxygen volume fraction can guarantee the basic life safety of personnel. Through the training experimental data of a constructed deep neural network,the PPG signal of a human in normal oxygen volume fraction ( 16% --21% ) and extremely low-oxygen volume fraction ( 15. 5% --16% ) was determined to obtain the pattern recognition network of human physiological state. After testing,the recognition accuracy of the network could reach 92. 8% . Using the confusion matrix and receiver operating characteristic curve analysis,the accuracy rate of training set,verification set,test set,and ensemble recognition of the confusion matrix reached 97. 9% ,94. 8% ,92. 8% ,and 96. 3% ,respectively. The area under the curve value is close to 1,the network classification performance is excellent,and the entire identification process could be completed within 4 s. KEY WORDS confined space; hypoxic injury; photoplethysmography; deep learning; state recognition
·818 工程科学学报,第41卷,第6期 随着工业化进程的发展,低氧环境常见于建筑、 状态下PPG信号,并对不同的PPG信号进行标记标 化工、军事等的有限空间四、城市地下空间回以及 签.本文主要针对人体低氧状态的识别,因而分别 通风不良的人群聚集区域同.人在进入低氧环境时 测量氧气体积分数15.5%~16%和氧气体积分数 会受到低氧伤害.近年来,由于环境氧气浓度过低 16%~21%的人体PPG信号用于PPG信号的分类 导致的室息死亡事故频繁发生.据2014一2015年 1.1实验设计及流程 全国有限空间作业较大以上事故调查及报告数据显 实验人员为北京科技大学的15名大学生,其中 示,中毒与室息事故达47起0.然而,当前缺乏一 男生7名(平均年龄22岁),女生8名(平均年龄23 种快速有效的低氧识别技术,在作业人员进入低氧 岁).共进行15组实验(15×1).15名实验人员身 环境时及时预警 体健康,生理状态良好,且在实验前无吸烟、饮酒、饮 一般认为氧气体积分数的安全范围是19.5%~ 用咖啡等.实验场所为北京科技大学自主研发的刊 23.5%.然而根据最新的海军潜艇,航空和高原山 用可移动式救生舱,经密闭性检验实验验证救生舱 地医学的研究证据显示,15.5%的氧气体积分数 密闭性良好,舱内可营造氧气体积分数15.5%~ 也能保证人员的基本生命安全因,李国建)的研究 16%环境.实验时间为每天的14:00~16:00,该时 也得到了相似结果,因此氧气体积分数15.5%~ 间段内人体氧摄取最为活跃如.实验方案经北京 16%为健康人体的耐受极限.但作业过程中人员存 大学生物医学伦理委员会批准(批准号为 在不同的生理状态,如处于亚健康或疲劳,此时耐受 IRB00001052-18077). 极限可能发生改变.传统的预防低氧伤害的方法主 实验人员进入救生舱后,关闭舱门,形成全密闭 要是监测环境中的氧气浓度,此方法在使用时忽略 有限空间,通过救生舱中放置的氮气瓶缓慢释放氮 了人体生理状态的差异性,即不同生理状态个体所 气置换救生舱内的氧气,使救生舱内的氧气体积分 能耐受的最低氧气浓度不同.人员在进入低氧环境 数由20%缓慢降至15.5%~16%.在此过程中,每 后,为适应环境的变化,心率、血压、脉搏、呼吸等生 隔30min测量一次人体PPG信号,每次测量时间约 理参数迅速变化.PPG信号能够反映综合的生理信 为5min. 测量情景如图1所示 息包括心率W、血压四、血氧饱和度0、心血管血流 参数m、呼吸频率☒等.因此通过监测人体的PPG 信号,可以对人体是否处于氧气耐受极限状态进行 识别. 近年来智能穿戴设备迅速发展,使PPG信号的 实时快速测量成为可能),然而PPG信号信息量 巨大,传统的统计学方法对数据进行处理分析存在 速度慢、特征提取不完全、可靠性低等问题.深度学 习4的的动机在于建立模拟人脑进行分析学习的 网络,深度学习在图像识别、自然语言处理7、 模式识别阁、聚类阿等方面都有重要应用.深度学 图1PPG信号测量 习相较于传统的统计学分析或机器学习方法,不需 Fig.I PPG signal measurement 要对数据进行人工的特征提取,且能够保证学习到 1.2数据获取及处理 更多的数据特征,因而极大的简化了学习流程,可以 PPG信号采样器为透射式商用采样器,型号为 快速的完成低氧状态的识别.通过对所采集到的数 DHD6000,采样频率为500Hz,测量得到45组数 据进行训练,建立深层神经网络,当人体进入到 据.利用MATLAB编程,使用小波变换及smooth函 低氧环境时,PPG信号在深层神经网络中被快速识 数对原始信号进行降噪处理.利用小波分解将原始 别,可以有效预防低氧伤害事故的发生 信号分解为10层,利用第8级近似分量重构信号获 得信号的基线趋势,并用原始信号减去基线趋势即 PPG信号获取及处理 可去除基线漂移;利用移动平均滤波器去除信号的 环境氧气体积分数低于15.5%时会对人体造 高频噪声,经测试,当滤波器的窗宽设置为10时可 成伤害甚至导致室息死亡事故,为了对人体低氧状 以有效的去除高频噪声并保留大部分有效信息.通 态进行识别,建立深层神经网络,需要获取人在不同 过降噪处理获得高信噪比的信号
工程科学学报,第 41 卷,第 6 期 随着工业化进程的发展,低氧环境常见于建筑、 化工、军事等的有限空间[1]、城市地下空间[2]以及 通风不良的人群聚集区域[3]. 人在进入低氧环境时 会受到低氧伤害. 近年来,由于环境氧气浓度过低 导致的窒息死亡事故频繁发生. 据 2014—2015 年 全国有限空间作业较大以上事故调查及报告数据显 示,中毒与窒息事故达 47 起[4]. 然而,当前缺乏一 种快速有效的低氧识别技术,在作业人员进入低氧 环境时及时预警. 一般认为氧气体积分数的安全范围是 19. 5% ~ 23. 5% . 然而根据最新的海军潜艇,航空和高原山 地医学[5]的研究证据显示,15. 5% 的氧气体积分数 也能保证人员的基本生命安全[6],李国建[7]的研究 也得到了相似结果,因此氧气体积分数 15. 5% ~ 16% 为健康人体的耐受极限. 但作业过程中人员存 在不同的生理状态,如处于亚健康或疲劳,此时耐受 极限可能发生改变. 传统的预防低氧伤害的方法主 要是监测环境中的氧气浓度,此方法在使用时忽略 了人体生理状态的差异性,即不同生理状态个体所 能耐受的最低氧气浓度不同. 人员在进入低氧环境 后,为适应环境的变化,心率、血压、脉搏、呼吸等生 理参数迅速变化. PPG 信号能够反映综合的生理信 息包括心率[8]、血压[9]、血氧饱和度[10]、心血管血流 参数[11]、呼吸频率[12]等. 因此通过监测人体的 PPG 信号,可以对人体是否处于氧气耐受极限状态进行 识别. 近年来智能穿戴设备迅速发展,使 PPG 信号的 实时快速测量成为可能[13],然而 PPG 信号信息量 巨大,传统的统计学方法对数据进行处理分析存在 速度慢、特征提取不完全、可靠性低等问题. 深度学 习[14--15]的动机在于建立模拟人脑进行分析学习的 网络,深度学习在图像识别[16]、自然语言处理[17]、 模式识别[18]、聚类[19]等方面都有重要应用. 深度学 习相较于传统的统计学分析或机器学习方法,不需 要对数据进行人工的特征提取,且能够保证学习到 更多的数据特征,因而极大的简化了学习流程,可以 快速的完成低氧状态的识别. 通过对所采集到的数 据进行训练,建立深层神经网络[20],当人体进入到 低氧环境时,PPG 信号在深层神经网络中被快速识 别,可以有效预防低氧伤害事故的发生. 1 PPG 信号获取及处理 环境氧气体积分数低于 15. 5% 时会对人体造 成伤害甚至导致窒息死亡事故,为了对人体低氧状 态进行识别,建立深层神经网络,需要获取人在不同 状态下 PPG 信号,并对不同的 PPG 信号进行标记标 签. 本文主要针对人体低氧状态的识别,因而分别 测量氧气体积分数 15. 5% ~ 16% 和氧气体积分数 16% ~ 21% 的人体 PPG 信号用于 PPG 信号的分类. 1. 1 实验设计及流程 实验人员为北京科技大学的 15 名大学生,其中 男生 7 名( 平均年龄 22 岁) ,女生 8 名( 平均年龄 23 岁) . 共进行 15 组实验( 15 × 1) . 15 名实验人员身 体健康,生理状态良好,且在实验前无吸烟、饮酒、饮 用咖啡等. 实验场所为北京科技大学自主研发的矿 用可移动式救生舱,经密闭性检验实验验证救生舱 密闭性良好,舱内可营造氧气体积分数 15. 5% ~ 16% 环境. 实验时间为每天的 14: 00 ~ 16: 00,该时 间段内人体氧摄取最为活跃[21]. 实验方案经北京 大 学生物医学伦理委员会批准 ( 批 准 号 为 IRB00001052--18077) . 实验人员进入救生舱后,关闭舱门,形成全密闭 有限空间,通过救生舱中放置的氮气瓶缓慢释放氮 气置换救生舱内的氧气,使救生舱内的氧气体积分 数由 20% 缓慢降至 15. 5% ~ 16% . 在此过程中,每 隔 30 min 测量一次人体 PPG 信号,每次测量时间约 为 5 min. 测量情景如图 1 所示. 图 1 PPG 信号测量 Fig. 1 PPG signal measurement 1. 2 数据获取及处理 PPG 信号采样器为透射式商用采样器,型号为 DHD--6000,采样频率为 500 Hz,测量得到 45 组数 据. 利用 MATLAB 编程,使用小波变换及 smooth 函 数对原始信号进行降噪处理. 利用小波分解将原始 信号分解为 10 层,利用第 8 级近似分量重构信号获 得信号的基线趋势,并用原始信号减去基线趋势即 可去除基线漂移; 利用移动平均滤波器去除信号的 高频噪声,经测试,当滤波器的窗宽设置为 10 时可 以有效的去除高频噪声并保留大部分有效信息. 通 过降噪处理获得高信噪比的信号. · 818 ·
于露等:基于深度学习的人体低氧状态识别 ·819· 将降噪处理之后的信号利用reshape函数进行 围有限,优化稳定.本文所进行的分析是二分类问 分段处理,每2000个离散点为一组数据,一段数据 题,因而输出函数使用logsig函数,使得输出在0和 内存在5个以上完整的波形,包含足够的用于分析 1之间进行相关判断 处理的信息,经处理后随机抽取共获得1530组数 2.1.2训练函数 据.处理后数据如图2所示. 不同的训练函数具有不同的特点,Trainlm函数 04 对于中等的神经网络有较快的收敛速度,其训练过 程中所需的计算量较小但所占内存较大;Traingd函 数收敛速度较慢;traincgb所需存储量较大,但收敛 速度较快:trainrp函数具有收敛速度快和占用内存 小的优点但训练效果较差.为保证本文所提供方法 的实用性,所需的训练函数需使得大部分计算机能 够训练且效果良好,综合考虑后选择trainscg函数. 所使用trainscg(scaled conjugate gradient back- 0.51.01.52.0253.03.54.0 propagation)函数根据比例共轭梯度法更新权重和 时间s 偏置值四.共轭梯度法是介于最速下降法和牛顿 图2预处理后PPCG信号 Fig.2 PPG signal after pretreatment 法之间的方法,它克服了最速下降法收敛慢的缺点, 又避免了牛顿法需要存储和计算Hsse矩阵并求逆 将分段后的数据利用mapminmax函数归一化 的缺点,对计算机性能要求较低 到[-1,1],分别将每段数据根据已知情况进行标 2.1.3损失函数 记,氧气体积分数为16%~21%所测得的PPG信号 所使用的损失函数为Cross--Entropy(交叉熵) 标记为1,氧气体积分数为15.5%~16%所测得的 函数,表达式为 PPG信号标记为0. pg)=∑ph(ga) (3) 2深度学习网络构建及训练 式中,p表示真实标签的分布,g为训练后的模型预 2.1函数设置 测标签分布. 2.1.1激活函数 Cross-Entropy(交叉熵)函数用于度量两个概率 激活函数是将神经元输入映射到输出的函数, 分布间的差异性信息,可以衡量p和q的相似性,能 激活函数的使用能够保证神经网络模型的非线性, 够解决在梯度下降时学习速率降低的问题. 从而使得模型能够学习、理解和处理复杂的非线性 2.2深度神经网络设置 问题 利用MATLAB搭建模式识别网络,包含一个输 本文设计神经网络所使用的激活函数为sg- 入层,多个隐藏层,一个输出层.通过试验法设置不 moid函数,在输入层与隐藏层之间使用logsig函数, 同隐藏层数和神经元个数,考察神经网络的复杂程 该函数的表达式为 度及准确率.不同的隐藏层数及神经元数目下神经 F(x)=1 Ite (1) 网络的正确率如表1所示.由表1可以看出,隐藏 层数为3,每个隐藏层神经元数目为9时神经网络 函数的输入范围是实数范围,映射范围为(0, 的正确率与隐藏层数为5,每个隐藏层神经元数目 1),单调连续. 表1神经网络正确率 隐藏层与隐藏层之间使用tansig函数,该函数 Table 1 Neural network correct rates % 的表达式为 2 神经元 网络层数 F(a)-1te-1 (2) 数目 2 3 5 6 函数的输入范围是实数范围,映射范围为 1 92.20 90.50 86.60 91.8088.60 (-1,1),单调连续. 8 83.35 87.30 90.80 92.80 87.30 Sigmoid激活函数在物理意义上最为接近生物 9 91.50 92.80 91.80 88.90 83.70 神经元模拟人脑进行分析,且函数单调连续,输出范 10 88.90 91.20 90.5091.20 92.20
于 露等: 基于深度学习的人体低氧状态识别 将降噪处理之后的信号利用 reshape 函数进行 分段处理,每 2000 个离散点为一组数据,一段数据 内存在 5 个以上完整的波形,包含足够的用于分析 处理的信息,经处理后随机抽取共获得 1530 组数 据. 处理后数据如图 2 所示. 图 2 预处理后 PPG 信号 Fig. 2 PPG signal after pretreatment 将分段后的数据利用 mapminmax 函数归一化 到[- 1,1],分别将每段数据根据已知情况进行标 记,氧气体积分数为 16% ~ 21% 所测得的 PPG 信号 标记为 1,氧气体积分数为 15. 5% ~ 16% 所测得的 PPG 信号标记为 0. 2 深度学习网络构建及训练 2. 1 函数设置 2. 1. 1 激活函数 激活函数是将神经元输入映射到输出的函数, 激活函数的使用能够保证神经网络模型的非线性, 从而使得模型能够学习、理解和处理复杂的非线性 问题. 本文设计神经网络所使用的激活函数为 sigmoid 函数,在输入层与隐藏层之间使用 logsig 函数, 该函数的表达式为 F( x) = 1 1 + e - x ( 1) 函数的输入范围是实数范围,映射范围为( 0, 1) ,单调连续. 隐藏层与隐藏层之间使用 tansig 函数,该函数 的表达式为 F( x) = 2 1 + e - 2x - 1 ( 2) 函数的输入范围是实数范围,映 射 范 围 为 ( - 1,1) ,单调连续. Sigmoid 激活函数在物理意义上最为接近生物 神经元模拟人脑进行分析,且函数单调连续,输出范 围有限,优化稳定. 本文所进行的分析是二分类问 题,因而输出函数使用 logsig 函数,使得输出在 0 和 1 之间进行相关判断. 2. 1. 2 训练函数 不同的训练函数具有不同的特点,Trainlm 函数 对于中等的神经网络有较快的收敛速度,其训练过 程中所需的计算量较小但所占内存较大; Traingd 函 数收敛速度较慢; traincgb 所需存储量较大,但收敛 速度较快; trainrp 函数具有收敛速度快和占用内存 小的优点但训练效果较差. 为保证本文所提供方法 的实用性,所需的训练函数需使得大部分计算机能 够训练且效果良好,综合考虑后选择 trainscg 函数. 所使用 trainscg ( scaled conjugate gradient backpropagation) 函数根据比例共轭梯度法更新权重和 偏置值[22]. 共轭梯度法是介于最速下降法和牛顿 法之间的方法,它克服了最速下降法收敛慢的缺点, 又避免了牛顿法需要存储和计算 Hesse 矩阵并求逆 的缺点,对计算机性能要求较低. 2. 1. 3 损失函数 所使用的损失函数为 Cross--Entropy( 交叉熵) 函数,表达式为 H( p,q) = ∑x p( x) ( ln 1 q( x ) ) ( 3) 式中,p 表示真实标签的分布,q 为训练后的模型预 测标签分布. Cross--Entropy( 交叉熵) 函数用于度量两个概率 分布间的差异性信息,可以衡量 p 和 q 的相似性,能 够解决在梯度下降时学习速率降低的问题. 2. 2 深度神经网络设置 利用 MATLAB 搭建模式识别网络,包含一个输 入层,多个隐藏层,一个输出层. 通过试验法设置不 同隐藏层数和神经元个数,考察神经网络的复杂程 度及准确率. 不同的隐藏层数及神经元数目下神经 网络的正确率如表 1 所示. 由表 1 可以看出,隐藏 层数为 3,每个隐藏层神经元数目为 9 时神经网络 的正确率与隐藏层数为 5,每个隐藏层神经元数目 表 1 神经网络正确率 Table 1 Neural network correct rates % 神经元 数目 网络层数 2 3 4 5 6 7 92. 20 90. 50 86. 60 91. 80 88. 60 8 83. 35 87. 30 90. 80 92. 80 87. 30 9 91. 50 92. 80 91. 80 88. 90 83. 70 10 88. 90 91. 20 90. 50 91. 20 92. 20 · 918 ·
·820 工程科学学报,第41卷,第6期 为8时神经网络的正确率相同,但明显,前者结构更 PPG信号为简单一维信号,因而3个及以上隐 简单,复杂度更低,训练更快,效率更高.因此,最终 藏层即为深层,具体深层神经网络设置如图3所示, 确定隐藏层数设置为3,每个隐藏层神经元个数为 其中表示参数权重,b表示偏执项 9,此设置能够保证神经网络快速完成训练。 隐含层1 隐含层2 隐含层3 输出 2000 图3神经网络设置 Fig.3 Neural network settings 2.3深度神经网络训练 传统机器学习需要输入从PPG信号中提取的 10 特征,然而特征提取既无法保证提取的所有特征有 效,也无法保证所有对于分类有效的特征完全被提 10 取.而深度学习在进行训练时不进行特征提取,是 (b) 将处理之后的数据全部输入到神经网络中进行训 练,以保证信息的完备性,通过深层神经网络寻找信 2 息特征,完成训练 将获取到的数据划分为训练集、验证集和测试 0000◆◆◆★◆◆◆个4◆0小个◆◆◆个◆◆0◆◆0◆0个◆★ 5 10 15 2025 30 35 40 集,分别占总数据集的60%、20%和20%.训练时 迭代次数 设置最大的迭代次数为1000次,为防止神经网络陷 图4迭代过程图.(a)迭代梯度值图:(b)迭代检验图 入过拟合状态,设置最大验证失败次数为6,即神经 Fig.4 Iterative process diagram:(a)iterative gradient value dia- gram:(b)iterative test diagram 网络在训练时,验证集误差在连续6次检验后不下 降或上升,认为训练误差己经达到最小值,训练 0 ,训练集 停止. 验证集 测试集 3深度神经网络训练结果及分析 最佳点 109 3.1训练结果及迭代过程 神经网络的训练过程是在内部完成的,通过训 练获得所需要的模式识别网络.深度神经网络训练 10 完成后,将作业人员的PPG信号输入即可对作业人 员的生理状态进行识别 在深层神经网络模型训练过程中,迭代至42次 10-2 停止,验证误差连续6次迭代没有下降,最终下降梯 0 510152025303540 迭代次数 度为0.066451.迭代过程如图4所示.验证集交叉 图5交叉熵 熵在36次迭代时达到最小值,最小值为0.16761, Fig.5 Cross entropy 交叉熵的值如图5所示. 3.2分类器性能分析 态的识别 3.2.1混淆矩阵分析 混淆矩阵的FN(false negative)值表示判定为负 混淆矩阵是判断分类器好坏的重要标准,通过 样本,实际为正样本,FP(false positive)值表示判定 对神经网络训练并测试获得结果的混淆矩阵,混淆 为正样本,实际为负样本.本文中认为标记1为正 矩阵见图6.训练集、验证集、测试集的分类准确率 样本,标记0为负样本.在测试集中,FN和FP的值 分别为97.9%、94.8%、92.8%,准确率差异性在较 分别为14和8,分别占比4.6%和2.6%,比例相差 小范围之内,由于样本数量足够多,因此认为分类性 较小. 能优良,有较高的准确性能够完成氧气耐受极限状 通过对比神经网络的训练集和测试集的分类准
工程科学学报,第 41 卷,第 6 期 为 8 时神经网络的正确率相同,但明显,前者结构更 简单,复杂度更低,训练更快,效率更高. 因此,最终 确定隐藏层数设置为 3,每个隐藏层神经元个数为 9,此设置能够保证神经网络快速完成训练. PPG 信号为简单一维信号,因而 3 个及以上隐 藏层即为深层,具体深层神经网络设置如图 3 所示, 其中 w 表示参数权重,b 表示偏执项. 图 3 神经网络设置 Fig. 3 Neural network settings 2. 3 深度神经网络训练 传统机器学习需要输入从 PPG 信号中提取的 特征,然而特征提取既无法保证提取的所有特征有 效,也无法保证所有对于分类有效的特征完全被提 取. 而深度学习在进行训练时不进行特征提取,是 将处理之后的数据全部输入到神经网络中进行训 练,以保证信息的完备性,通过深层神经网络寻找信 息特征,完成训练. 将获取到的数据划分为训练集、验证集和测试 集,分别占总数据集的 60% 、20% 和 20% . 训练时 设置最大的迭代次数为 1000 次,为防止神经网络陷 入过拟合状态,设置最大验证失败次数为 6,即神经 网络在训练时,验证集误差在连续 6 次检验后不下 降或 上 升,认为训练误差已经达到最小值,训 练 停止. 3 深度神经网络训练结果及分析 3. 1 训练结果及迭代过程 神经网络的训练过程是在内部完成的,通过训 练获得所需要的模式识别网络. 深度神经网络训练 完成后,将作业人员的 PPG 信号输入即可对作业人 员的生理状态进行识别. 在深层神经网络模型训练过程中,迭代至 42 次 停止,验证误差连续 6 次迭代没有下降,最终下降梯 度为 0. 066451. 迭代过程如图 4 所示. 验证集交叉 熵在 36 次迭代时达到最小值,最小值为 0. 16761, 交叉熵的值如图 5 所示. 3. 2 分类器性能分析 3. 2. 1 混淆矩阵分析 混淆矩阵是判断分类器好坏的重要标准,通过 对神经网络训练并测试获得结果的混淆矩阵,混淆 矩阵见图 6. 训练集、验证集、测试集的分类准确率 分别为 97. 9% 、94. 8% 、92. 8% ,准确率差异性在较 小范围之内,由于样本数量足够多,因此认为分类性 能优良,有较高的准确性能够完成氧气耐受极限状 图 4 迭代过程图 . ( a) 迭代梯度值图; ( b) 迭代检验图 Fig. 4 Iterative process diagram: ( a) iterative gradient value diagram; ( b) iterative test diagram 图 5 交叉熵 Fig. 5 Cross entropy 态的识别. 混淆矩阵的 FN( false negative) 值表示判定为负 样本,实际为正样本,FP( false positive) 值表示判定 为正样本,实际为负样本. 本文中认为标记 1 为正 样本,标记 0 为负样本. 在测试集中,FN 和 FP 的值 分别为 14 和 8,分别占比 4. 6% 和 2. 6% ,比例相差 较小. 通过对比神经网络的训练集和测试集的分类准 · 028 ·
于 露等:基于深度学习的人体低氧状态识别 ·821· 97.8% 四 确率发现,两者的准确率相差5.1%,由于两者的差 362 8 0 0 118 93.7% 394% 0.9% 2.2% 38.6% 2.6% 6.3% 值较小,因而认为该神经网络模型未出现过拟合现 象,有较为良好的泛化能力,能够应用于实际生产生 气37 98.0% 12 58.5% 20% 1 8 172 95.6% 2.6% 562% 4.4% 活中. 3.2.2R0C曲线分析 97.1% 98.5% 97.9% 93.7% 95.6% 94.8呢 2.9% 1.5% 2.1% 6.3% 4.4% 5.2% 深度神经网络分类的接受者操作性能(receiver d operating characteristic,ROC)曲线如图7所示.根 0 123 89.8% 0 603 30 95.3% 40.2% 4.69% 10.2% 39.49% 205 4.7% 据图中可知,ROC曲线下的面积(AUC值),在1.0 和0.5之间.AUC与准确性的关系如表2所示. 161 95.3% 27 870 97.0% 2.6% 52.6% 4.7% 1.8% 56.9% 3.0% 由图7可知,训练集、验证集、测试集的AUC值 均大于0.9且接近于1.0,因而认为该方法能够准 93.9% 92.0% 92.8绿 95.7% 96.7% 96.3% 6.1% 8.0% 72% 4.3% 3.3% 3.7% 确的进行分类. 3.3误差分析 图6分类结果混淆矩阵.(a)训练集:(b)验证集:(c)测试集 (d)全集 训练结果误差直方图见图8.通过误差直方图 Fig.6 Classification result confusion matrix:(a)training set:(b) 可知,目标值与输出结果差值范围主要集中在 verification set;(c)test set;(d)complete set (-0.04733,0.05142),误差处于此范围外的情况 1.0 1.0 b) 0.8 0.8 卧0.6 0.6 0.4 0.2 0.2 0.2 0.40.6 0.8 1.0 0 0.20.40.6 0.81.0 假阳性率 假阳性率 1.0 1.0 d 0.8 0.8 0.6 0.6 0.4 0.2 0.2 00 0.20.40.6 0.81.0 0.2 0.40.60.81.0 假阳性率 假阳性率 图7ROC曲线.(a)训练集:(b)验证集:(c)测试集:(d)全集 Fig.7 Receiver operating characteristic curve:(a)training set:(b)verification set:(c)test set:(d)complete set 表2AUC与准确性表 差.对同一个体进行多次测量时,由于较小的概率 Table 2 AUC and accuracy 出现较大的误差,因而能够准确识别该个体的生理 AUC值 准确性 状态且准确率更高 0.5-0.7 较低准确性 0.7-0.9 准确性一般 4结论 0.9w1.0 较高准确性 (I)人在不同氧气浓度下的PPG信号存在差 较少,此误差在进行二分类(标签分别为0和1)中 异,通过搭建深层神经网络并进行相应的训练能够 对结果判断影响较小,有较小的概率出现较大的误 识别这种差异从而对不同氧气浓度下的PPG信号
于 露等: 基于深度学习的人体低氧状态识别 图 6 分类结果混淆矩阵 . ( a) 训练集; ( b) 验证集; ( c) 测试集; ( d) 全集 Fig. 6 Classification result confusion matrix: ( a) training set; ( b) verification set; ( c) test set; ( d) complete set 确率发现,两者的准确率相差 5. 1% ,由于两者的差 值较小,因而认为该神经网络模型未出现过拟合现 象,有较为良好的泛化能力,能够应用于实际生产生 活中. 3. 2. 2 ROC 曲线分析 深度神经网络分类的接受者操作性能( receiver operating characteristic,ROC) 曲线如图 7 所示. 根 据图中可知,ROC 曲线下的面积( AUC 值) ,在 1. 0 和 0. 5 之间. AUC 与准确性的关系如表 2 所示. 由图 7 可知,训练集、验证集、测试集的 AUC 值 均大于 0. 9 且接近于 1. 0,因而认为该方法能够准 确的进行分类. 3. 3 误差分析 训练结果误差直方图见图 8. 通过误差直方图 可知,目标值与输出结果差值范围主要集中在 ( - 0. 04733,0. 05142) ,误差处于此范围外的情况 图 7 ROC 曲线 . ( a) 训练集; ( b) 验证集; ( c) 测试集; ( d) 全集 Fig. 7 Receiver operating characteristic curve: ( a) training set; ( b) verification set; ( c) test set; ( d) complete set 表 2 AUC 与准确性表 Table 2 AUC and accuracy AUC 值 准确性 0. 5 ~ 0. 7 较低准确性 0. 7 ~ 0. 9 准确性一般 0. 9 ~ 1. 0 较高准确性 较少,此误差在进行二分类( 标签分别为 0 和 1) 中 对结果判断影响较小,有较小的概率出现较大的误 差. 对同一个体进行多次测量时,由于较小的概率 出现较大的误差,因而能够准确识别该个体的生理 状态且准确率更高. 4 结论 ( 1) 人在不同氧气浓度下的 PPG 信号存在差 异,通过搭建深层神经网络并进行相应的训练能够 识别这种差异从而对不同氧气浓度下的 PPG 信号 · 128 ·
·822· 工程科学学报,第41卷,第6期 900 [4]Zhou X F,Yang F,Guo L,et al.Analysis and preventive recom- 训练集 800 验证集 mendation of national confined space accidents due to asphyxiation 700 口测试集 and poisoning from 2014 to 2015.J Eniviron Occup Med,2018, 600 0误差 35(8):735 500 (周兴藩,杨凤,郭玲,等.2014一2015年全国有限空间作业 400 中毒与室息事故分析及预防建议.环境与职业医学,2018,35 300 (8):735) 200 I00 5]Mejias C,Jimenez D.Munoz A,et al.Clinical response of 20 people in a mining refuge:study and analysis of functional parame- ters.Safety Sci,2014,63:204 [6]Selman J,Spickett J,Jansz J,et al.An investigation into the rate 误差值 and mechanism of incident of work-related confined space fatali- 图8误差直方图 ties.Safety Sci,2018,109:333 Fig.8 Error histogram ]Li GJ.Research on Human Heat Tolerance under Extreme Hot, Humid and Lou-xygen Entironment [Dissertaion].Tianjin 进行分类,相较于其他的机器学习方法,深度学习无 Tianjin University,2008 需人工进行特征提取且学习特征更加全面,保证了 (李国建.高温高湿低氧环境下人体热耐受性研究[学位论 识别的准确性. 文].天津:天津大学,2008) (2)通过多次试验得出深层神经网络在具有3 Kamshilin AA,Nippolainen E,Sidorov I S,et al.A new look at 个隐藏层,且每层有9个神经元的情况下分类效果 the essence of the imaging photoplethysmography.Sci Rep,2015, 5:10494 较好,且能保证较快的训练速度. 9) Shin H,Min S D.Feasibility study for the non-invasive blood (3)通过混淆矩阵分析和ROC曲线分析可知 pressure estimation based on ppg morphology:normotensive sub- 深层神经网络对不同氧气浓度的PPG信号分类性 jeet study.Biomed Eng Online,2017,16(1):10 能优良,在训练集中分类准确率可达97.9%,在验 [10]Zhou Q,Tu H,Zuo J X.Blood oxygen saturation real-time moni- 证集中分类准确率可达94.8%,在测试集中的分类 toring system research based on PPG.Inform Res,2017,43(3): 准确率为92.8%.在全部的数据中准确率为 75 96.3%,认为能够准确的识别人体是否处于氧气耐 (张强,涂浩,左佳鑫.基于PPG的血氧饱和度实时监测系 受极限状态 统研究.信息化研究,2017,43(3):75) (4)所搭建的深层神经网络进行低氧状态评估 [11]Njoum H,Kyriacou P A.Photoplethysmography for the assess- ment of haemorheology.Sci Rep,2017,7(1):1406 只需采集2000个离散点(4s采集完成),因而能够 [12]Ma J L,Wang C,Li Z J,et al.Study of measuring heart rate 保证整个评估过程在4s内完成,从而使得作业人员 and respiration rate based on PPG.Opt Tech,2011,37(3):309 暴露在低氧环境中的时间减少,保证了作业人员的 (马俊领,王成,李章俊,等.基于PPG的心率和呼吸频率 安全 的测量研究.光学技术,2011,37(3):309) 03] Tamura T,Maeda Y,Sekine M,et al.Wearable photoplethys- 参考文献 mographic sensors-past and present.Electronics,2014,3(2): [Burlet-Vienney D,Chinniah Y,Bahloul A,et al.Occupational 282 safety during interventions in confined spaces.Safety Sci,2015, [14]Khadse C B,Chaudhari M A,Borghate V B.Electromagnetic 79:19 compatibility estimator using scaled conjugate gradient back-prop- B]ZangTZ,Zhang L J,Zhang L,et al.Causes and countermeas- agation based artificial neural network.IEEE Trans Ind Inform, ures of casualty accident induced by unexpected factors in limited 2017,13(3):1036 job space.J Nanjing Univ Technol Nat Sci Ed,2015,27(3): [15]Akhtar N,Mian A.Threat of adversarial attacks on deep learning 103 in computer vision:a survey.IEEE Access,2018,6:14410 (臧铁柱,张礼敬,张丽,等.有限空间作业意外伤亡事故的 06]Razzak M I,Naz S,Zaib A.Deep learning for medical image 成因及其对策.南京工业大学学报(自然科学版),2005,27 processing:overview,challenges and the future /Classification (3):103) in Bioapps:Automation of Decision Making.Springer,2018 [3]Sun Y J,Shen HG.Industrial Ventilation.4th Ed.Beijing:Chi- [17]Wang H,Zhao Y,Xu Y M,et al.Cross-anguage speech attrib- na Architecture Building Press,2010 ute detection and phone recognition for Tibetan using deep learn- (孙一坚,沈恒根.工业通风.4版.北京:中国建筑工业出版 ing /The 9th International Symposium on Chinese Spoken Lan- 社,2010) guage Processing.Singapore,2014:474
工程科学学报,第 41 卷,第 6 期 图 8 误差直方图 Fig. 8 Error histogram 进行分类,相较于其他的机器学习方法,深度学习无 需人工进行特征提取且学习特征更加全面,保证了 识别的准确性. ( 2) 通过多次试验得出深层神经网络在具有 3 个隐藏层,且每层有 9 个神经元的情况下分类效果 较好,且能保证较快的训练速度. ( 3) 通过混淆矩阵分析和 ROC 曲线分析可知 深层神经网络对不同氧气浓度的 PPG 信号分类性 能优良,在训练集中分类准确率可达 97. 9% ,在验 证集中分类准确率可达 94. 8% ,在测试集中的分类 准确 率 为 92. 8% . 在全部的数据中准确率为 96. 3% ,认为能够准确的识别人体是否处于氧气耐 受极限状态. ( 4) 所搭建的深层神经网络进行低氧状态评估 只需采集 2000 个离散点( 4 s 采集完成) ,因而能够 保证整个评估过程在 4 s 内完成,从而使得作业人员 暴露在低氧环境中的时间减少,保证了作业人员的 安全. 参 考 文 献 [1] Burlet-Vienney D,Chinniah Y,Bahloul A,et al. Occupational safety during interventions in confined spaces. Safety Sci,2015, 79: 19 [2] Zang T Z,Zhang L J,Zhang L,et al. Causes and countermeasures of casualty accident induced by unexpected factors in limited job space. J Nanjing Univ Technol Nat Sci Ed,2015,27 ( 3) : 103 ( 臧铁柱,张礼敬,张丽,等. 有限空间作业意外伤亡事故的 成因及其对策. 南京工业大学学报( 自然科学版) ,2005,27 ( 3) : 103) [3] Sun Y J,Shen H G. Industrial Ventilation. 4th Ed. Beijing: China Architecture & Building Press,2010 ( 孙一坚,沈恒根. 工业通风. 4 版. 北京: 中国建筑工业出版 社,2010) [4] Zhou X F,Yang F,Guo L,et al. Analysis and preventive recommendation of national confined space accidents due to asphyxiation and poisoning from 2014 to 2015. J Eniviron Occup Med,2018, 35( 8) : 735 ( 周兴藩,杨凤,郭玲,等. 2014—2015 年全国有限空间作业 中毒与窒息事故分析及预防建议. 环境与职业医学,2018,35 ( 8) : 735) [5] Mejías C,Jiménez D,Muoz A,et al. Clinical response of 20 people in a mining refuge: study and analysis of functional parameters. Safety Sci,2014,63: 204 [6] Selman J,Spickett J,Jansz J,et al. An investigation into the rate and mechanism of incident of work-related confined space fatalities. Safety Sci,2018,109: 333 [7] Li G J. Research on Human Heat Tolerance under Extreme Hot, Humid and Low-oxygen Environment [Dissertaion]. Tianjin: Tianjin University,2008 ( 李国建. 高温高湿低氧环境下人体热耐受性研究[学位论 文]. 天津: 天津大学,2008) [8] Kamshilin A A,Nippolainen E,Sidorov I S,et al. A new look at the essence of the imaging photoplethysmography. Sci Rep,2015, 5: 10494 [9] Shin H,Min S D. Feasibility study for the non-invasive blood pressure estimation based on ppg morphology: normotensive subject study. Biomed Eng Online,2017,16( 1) : 10 [10] Zhou Q,Tu H,Zuo J X. Blood oxygen saturation real-time monitoring system research based on PPG. Inform Res,2017,43( 3) : 75 ( 张强,涂浩,左佳鑫. 基于 PPG 的血氧饱和度实时监测系 统研究. 信息化研究,2017,43( 3) : 75) [11] Njoum H,Kyriacou P A. Photoplethysmography for the assessment of haemorheology. Sci Rep,2017,7( 1) : 1406 [12] Ma J L,Wang C,Li Z J,et al. Study of measuring heart rate and respiration rate based on PPG. Opt Tech,2011,37( 3) : 309 ( 马俊领,王成,李章俊,等. 基于 PPG 的心率和呼吸频率 的测量研究. 光学技术,2011,37( 3) : 309) [13] Tamura T,Maeda Y,Sekine M,et al. Wearable photoplethysmographic sensors-past and present. Electronics,2014,3 ( 2) : 282 [14] Khadse C B,Chaudhari M A,Borghate V B. Electromagnetic compatibility estimator using scaled conjugate gradient back-propagation based artificial neural network. IEEE Trans Ind Inform, 2017,13( 3) : 1036 [15] Akhtar N,Mian A. Threat of adversarial attacks on deep learning in computer vision: a survey. IEEE Access,2018,6: 14410 [16] Razzak M I,Naz S,Zaib A. Deep learning for medical image processing: overview,challenges and the future / / Classification in Bioapps: Automation of Decision Making. Springer,2018 [17] Wang H,Zhao Y,Xu Y M,et al. Cross-language speech attribute detection and phone recognition for Tibetan using deep learning / / The 9th International Symposium on Chinese Spoken Language Processing. Singapore,2014: 474 · 228 ·
于露等:基于深度学习的人体低氧状态识别 ·823· [18]Hoffman J,Pathak D,Tzeng E,et al.Large scale visual recog- 21]Craig A,Tran Y,Wijesuriya N,et al.A controlled investigation nition through adaptation using joint representation and multiple into the psychological determinants of fatigue.Biol Psychol, instance learning.J Mach Learn Res,2016,17(1):1 2006,72(1):78 [19]LeCun Y,Bengio Y,Hinton G.Deep learning.Nature,2015, B22]Wang Q.Multi Objective Learning and Ensembling for Deep Neura 521(7553):436 Netcork Based Speech Enhancement [Dissertation].Hefei:Uni- 20]Bronstein MM,Bruna J,LeCun Y,et al.Geometric deep learn- versity of Science and Technology China,2018 ing:going beyond euclidean data.IEEE Signal Process Mag, (王青.基于深层神经网络的多目标学习和融合的语言增强 2017,34(4):18 研究[学位论文].合肥:中国科学技术大学,2018)
于 露等: 基于深度学习的人体低氧状态识别 [18] Hoffman J,Pathak D,Tzeng E,et al. Large scale visual recognition through adaptation using joint representation and multiple instance learning. J Mach Learn Res,2016,17( 1) : 1 [19] LeCun Y,Bengio Y,Hinton G. Deep learning. Nature,2015, 521( 7553) : 436 [20] Bronstein M M,Bruna J,LeCun Y,et al. Geometric deep learning: going beyond euclidean data. IEEE Signal Process Mag, 2017,34( 4) : 18 [21] Craig A,Tran Y,Wijesuriya N,et al. A controlled investigation into the psychological determinants of fatigue. Biol Psychol, 2006,72( 1) : 78 [22] Wang Q. Multi Objective Learning and Ensembling for Deep Neura Network Based Speech Enhancement [Dissertation]. Hefei: University of Science and Technology China,2018 ( 王青. 基于深层神经网络的多目标学习和融合的语言增强 研究[学位论文]. 合肥: 中国科学技术大学,2018) · 328 ·