正在加载图片...
·1186 工程科学学报,第43卷,第9期 样本属于某一类别的概率;y是样本在某一类别下 的真实标签.区别于Softmax交叉嫡损失,Sigmoid CRU CRU CRU 函数使样本属于各类别的概率分布在(0,1)之间. 在训练阶段结束使用模型进行预测推理时, CRU CRU CRU 设定一个阈值,将概率大于阈值的所有标签输出, 作为多标签分类的预测结果.如输入症状“胸闷, T- T T: 气短,头晕,头痛,夜寐不宁,舌暗,苔薄,苔白,苔 图4双向GRU模型示意图 腻,脉弦,脉细,脉沉”后,输出各个标签概率为 Fig.4 Bi-GRU model diagram [0.64240265,0.6062219,0.04209191,,0.17620572] 短,头晕,头痛,夜寐不宁,舌暗,苔薄,苔白,苔腻, 分别对应[心’,肾,‘肺,,脾],通过网格调 脉弦,脉细,脉沉”同时发生在“心,肾”两个病位, 参的方法,最终设定阈值为0.5,即大于等于0.5均 即同时属于“心”,“肾”两个类别,所以该问题为 为相关病位,在上述例子中,即“心”,“肾”为输入 多标签分类问题 症状的对应病位标签. 基于脏腑定位模型具有多标签分类的特点, 3实验及结果分析 在输出层使用Sigmoid函数作为激活函数预测各 3.1实验数据 个标签的概率,区别于单标签模型常用的Softmax 函数.Sigmoid函数是一类S型曲线函数,为两端 实验数据来源于名老中医医案库,在经过专 饱和函数.可以看成是一个“挤压”函数,把一个实 家指导后共筛选出14821份医案,本文中需要用到 数域的输入“挤压”到(0,1)之间.当输入值在0附 其中的“症状”和“病位”信息.其中“症状”指疾病 近时,Sigmoid函数近似为线性函数;当输入值靠 过程中机体内的一系列机能、代谢和形态结构异 常变化所引起的病人主观上的异常感觉或某些客 近两端时,对输入进行抑制.输人越小,越接近于 观病态改变;“病位”指与表现出的症状相关的部 0,输入越大,越接近于1. 位,即脏腑标签,在这些医案中存在症状信息不 在模型训练过程中,损失函数调整为带有Sigmoid 全、症状文本中存在无意义字符的情况,通过专家 函数的二元交叉熵损失函数,样本损失计算方式 指导和设置相应规则,对症状文本中去噪处理和 如式(5)所示: 筛选后,得到最终有效医案数据.将这些医案中 Loss=1+(y)-In(1) (5) “症状”信息和“病位”信息进行提取,得到本实验 n 中所用到的全部数据,共计12735份.所得数据格 式中,n为类别总数,是模型的输出值,表示预测 式如表1所示 表1脏腑定位数据格式 Table 1 Zang-fu location data format No Symptoms Tag Legs ache,and wake up unable to sleep,along with hemoptysis and a sore throat spleen,kidney,heart 2 The patient had high blood pressure,weakness in the right limb,and pain in the left upper arm liver,kidney 3.2实验参数设置 例的概率 具体实验参数设置如表2所示 F1值:指精确值和召回率的调和均值 3.3评价标准 计算表达式如下: 为了综合考虑模型的性能,本文采用了精确 P= ∑iTP: (6) 率(Precision)、召回率(Recall)、F1值(Fl-Value)作 ∑,TP:+FP 为模型评价指标 R=- ∑:TP: (7) 精确率,P:指在被所有预测为正例中实际为 TP,+FN 正例的概率 (8) 召回率,R:指在所有实际为正例中被预测为正 FI=2P-R P+R短,头晕,头痛,夜寐不宁,舌暗,苔薄,苔白,苔腻, 脉弦,脉细,脉沉”同时发生在“心,肾”两个病位, 即同时属于“心”,“肾”两个类别,所以该问题为 多标签分类问题. 基于脏腑定位模型具有多标签分类的特点, 在输出层使用 Sigmoid 函数作为激活函数预测各 个标签的概率,区别于单标签模型常用的 Softmax 函数. Sigmoid 函数是一类 S 型曲线函数,为两端 饱和函数. 可以看成是一个“挤压”函数,把一个实 数域的输入“挤压”到 (0, 1) 之间. 当输入值在 0 附 近时,Sigmoid 函数近似为线性函数;当输入值靠 近两端时,对输入进行抑制. 输入越小,越接近于 0,输入越大,越接近于 1. 在模型训练过程中,损失函数调整为带有Sigmoid 函数的二元交叉熵损失函数,样本损失计算方式 如式(5)所示: Loss = − 1 n ∑n i=1 yi ·lnbyi +(1−yi)·ln( 1−byi ) (5) 式中,n 为类别总数,byi 是模型的输出值,表示预测 样本属于某一类别的概率; yi 是样本在某一类别下 的真实标签. 区别于 Softmax 交叉熵损失,Sigmoid 函数使样本属于各类别的概率分布在 (0, 1) 之间. , ··· 在训练阶段结束使用模型进行预测推理时, 设定一个阈值,将概率大于阈值的所有标签输出, 作为多标签分类的预测结果. 如输入症状“胸闷, 气短,头晕,头痛,夜寐不宁,舌暗,苔薄,苔白,苔 腻,脉弦,脉细,脉沉”后,输出各个标签概率为 [0.64240265, 0.6062219, 0.04209191 , 0.17620572], 分别对应 [‘心’, ’肾’, ‘肺’, …, ‘脾’],通过网格调 参的方法,最终设定阈值为 0.5,即大于等于 0.5 均 为相关病位,在上述例子中,即“心”,“肾”为输入 症状的对应病位标签. 3    实验及结果分析 3.1    实验数据 实验数据来源于名老中医医案库,在经过专 家指导后共筛选出 14821 份医案,本文中需要用到 其中的“症状”和“病位”信息. 其中“症状”指疾病 过程中机体内的一系列机能、代谢和形态结构异 常变化所引起的病人主观上的异常感觉或某些客 观病态改变;“病位”指与表现出的症状相关的部 位,即脏腑标签. 在这些医案中存在症状信息不 全、症状文本中存在无意义字符的情况,通过专家 指导和设置相应规则,对症状文本中去噪处理和 筛选后,得到最终有效医案数据. 将这些医案中 “症状”信息和“病位”信息进行提取,得到本实验 中所用到的全部数据,共计 12735 份. 所得数据格 式如表 1 所示. 表 1 脏腑定位数据格式 Table 1   Zang-fu location data format No. Symptoms Tag 1 Legs ache, and wake up unable to sleep, along with hemoptysis and a sore throat spleen, kidney, heart 2 The patient had high blood pressure, weakness in the right limb, and pain in the left upper arm liver, kidney 3.2    实验参数设置 具体实验参数设置如表 2 所示. 3.3    评价标准 为了综合考虑模型的性能,本文采用了精确 率(Precision)、召回率(Recall)、F1 值(F1-Value)作 为模型评价指标. 精确率,P:指在被所有预测为正例中实际为 正例的概率. 召回率,R:指在所有实际为正例中被预测为正 例的概率. F1 值:指精确值和召回率的调和均值. 计算表达式如下: P = ∑ i TPi ∑ i TPi +FPi (6) R = ∑ i TPi ∑ i TPi +FNi (7) F1 = 2 P·R P+R (8) CRU CRU CRU CRU CRU CRU Tt−1 Tt Tt+1 图 4    双向 GRU 模型示意图 Fig.4    Bi-GRU model diagram · 1186 · 工程科学学报,第 43 卷,第 9 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有