3.1.3 实验结果与分析评价指标采用准确率、召回率和 F 值。这 3

正在加载图片...

·826· 智能系统学报第14卷 3.1.3实验结果与分析类的数目；FN(false negative)表示正类被预测为评价指标采用准确率、召回率和F值。这负数的数目。 3个指标广泛用于信息检索和统计学分类领域，本文将包装标注语料按照6：2：2的比例切分用于评估结果质量。准确率、召回率和F值定义如下：为训练集、验证集和测试集，分别使用LSTM TP CRF模型、BiLSTM-CRF模型和BiLSTM-CNN P= ×100% (TP+FP) CRFs模型对迁移和非迁移方法进行对比实验。 TP R= ×100% (5) 1)反馈值K的选取实验 (TP+FN) 2xPXR 分别使用LSTM-CRF、BiLSTM-CRF和BiL F= P+R STM-CNN-CRFs3组模型进行语义迁移学习，识式中：TP(true positive)表示正类且被预测为正类别包装领域实体，所获得的识别效果随K值的变的数目；FP(false positive)表示负类且被预测为正化情况如表8所示。表8识别结果随K值的变化情况 Table 8 The experimental results changed with K 参数 K=0 K=100 K=200 K=300 K=400 K=500 K=600 K=700 59.36 60.01 61.94 64.34 65.16 65.34 64.74 64.45 LSTM-CRF R 43.19 52.45 52.15 57.20 58.34 57.81 57.10 56.39 R 50.00 55.98 56.61 60.56 61.56 61.34 60.68 60.15 60.51 60.55 61.12 67.69 68.15 67.41 67.53 66.97 BiLSTM-CRF R 45.28 55.78 56.59 59.28 59.28 59.00 58.22 59.07 51.80 58.07 58.77 63.21 63.41 62.92 62.53 62.78 P 65.28 68.27 71.96 71.03 71.42 70.96 71.43 70.28 BiLSTM-CNN-CRFs R 46.37 75.06 70.27 71.57 72.20 72.99 71.57 70.96 54.22 71.50 71.11 71.30 71.81 71.96 71.50 70.62 各模型识别结果如图5~图7所示。 0.8 P 实验结果表明，3组模型的P、R和F值，均先 R F 随着K值的增大呈上升趋势，当达到某一特定值 0.7 时反而呈下降趋势，LSTM-CRF和BiLSTM- 0.6 CRF模型在K=400时F值达到最大，而BiLSTM- CNN-CRFs模型在K=500时F值达到最大。证明 0.5 了随着迁移语义知识的增加，提高了模型的识别率。但随着领域新闻数据与通用新闻数据样本语 0.4 00 200300400500600700 义距离的增大，准确率、召回率和F值反而开始下降。这是由于随着语义距离的增大，通用新闻图6LSTM-CRF识别结果数据与领域新闻数据语义相关性降低，此时引入 Fig.6 LSTM-CRF results 0.8 0.8r P +R 0.7 是一F 0.7 P 0.6 0.6 晋R F 0.5 0.5 0.4 00200300400500600700 “100200300400500600700 K 图5 BiLSTM-CNN-CRFs识别结果图7 BiLSTM-CRF识别结果 Fig.5 BiLSTM-CNN-CRFs results Fig.7 BiLSTM-CRF results3.1.3 实验结果与分析评价指标采用准确率、召回率和 F 值。这 3 个指标广泛用于信息检索和统计学分类领域，用于评估结果质量。准确率、召回率和F值定义如下：    P = TP (TP+FP) ×100% R = TP (TP+FN) ×100% F = 2×P×R P+R (5) 式中：TP（true positive）表示正类且被预测为正类的数目；FP（false positive）表示负类且被预测为正类的数目；FN（false negative）表示正类被预测为负数的数目。本文将包装标注语料按照 6:2:2 的比例切分为训练集、验证集和测试集，分别使用 LSTMCRF 模型、BiLSTM-CRF 模型和 BiLSTM-CNNCRFs 模型对迁移和非迁移方法进行对比实验。 1) 反馈值 K 的选取实验分别使用 LSTM-CRF、BiLSTM-CRF 和 BiLSTM-CNN-CRFs 3 组模型进行语义迁移学习，识别包装领域实体，所获得的识别效果随 K 值的变化情况如表 8 所示。表 8 识别结果随 K 值的变化情况 Table 8 The experimental results changed with K 参数 K=0 K=100 K=200 K=300 K=400 K=500 K=600 K=700 LSTM-CRF P 59.36 60.01 61.94 64.34 65.16 65.34 64.74 64.45 R 43.19 52.45 52.15 57.20 58.34 57.81 57.10 56.39 F 50.00 55.98 56.61 60.56 61.56 61.34 60.68 60.15 BiLSTM-CRF P 60.51 60.55 61.12 67.69 68.15 67.41 67.53 66.97 R 45.28 55.78 56.59 59.28 59.28 59.00 58.22 59.07 F 51.80 58.07 58.77 63.21 63.41 62.92 62.53 62.78 BiLSTM-CNN-CRFs P 65.28 68.27 71.96 71.03 71.42 70.96 71.43 70.28 R 46.37 75.06 70.27 71.57 72.20 72.99 71.57 70.96 F 54.22 71.50 71.11 71.30 71.81 71.96 71.50 70.62 各模型识别结果如图 5~图 7 所示。实验结果表明，3 组模型的 P、R 和 F 值，均先随着 K 值的增大呈上升趋势，当达到某一特定值时反而呈下降趋势， LSTM-CRF 和 BiLSTMCRF 模型在 K=400 时 F 值达到最大，而 BiLSTMCNN-CRFs 模型在 K=500 时 F 值达到最大。证明了随着迁移语义知识的增加，提高了模型的识别率。但随着领域新闻数据与通用新闻数据样本语义距离的增大，准确率、召回率和 F 值反而开始下降。这是由于随着语义距离的增大，通用新闻数据与领域新闻数据语义相关性降低，此时引入 0.8 0.7 0.6 0.5 0.4 100 K 200 300 400 500 600 700 P R F 图 5 BiLSTM-CNN-CRFs 识别结果 Fig. 5 BiLSTM-CNN-CRFs results 0.8 0.7 0.6 0.5 0.4 100 K 200 300 400 500 600 700 P R F 图 6 LSTM-CRF 识别结果 Fig. 6 LSTM-CRF results 0.8 0.7 0.6 0.5 0.4 100 200 300 400 500 600 700 K P R F 图 7 BiLSTM-CRF 识别结果 Fig. 7 BiLSTM-CRF results ·826· 智能系统学报第 14 卷

<<向上翻页向下翻页>>

点击下载：【自然语言处理与理解】反馈式iKi近邻语义迁移学习的领域命名实体识别