正在加载图片...
第2期 刘杰,等:基于双语对抗学习的半监督情感分类 61 另外,实验使用Adam(9作为优化函数,在整个神经网络中所有的矩阵和向量被初始化为统一的格式, 即[-√6/(r+c),√6/(r+c)],其中:r和c表示矩阵的行和列的大小。 1.2双语对抗学习的半监督情感分类 双语对抗神经网络的半监督情感分类方法包括中文对抗神经网络和英文对抗神经网络两部分。图2显 示了双语对抗神经网络的半监督情感分类方法的模型图。在本文提出的模型中,通过中文对抗神经网络和 英文对抗神经网络的联合学习有效提高了中文样本的情感分类结果。 具体联合学习的损失函数为 J=J. +J 其中:J。是同J。训练方法相同的英文对抗神经网络的损失函数。 在基于双语对抗学习的半监督情感分类方法中,实验通过融合每条文本的中英文标签概率决定测试样 本的标签类别。 2实验结果与分析 2.1实验设置 本文采用了wan0提供的中国m产品网站m168的中文评论语料,其中包括886条标注样本(451条 正面评论样本和435条负面评论样本)和2000条未标注样本,评论内容主要集中在mp3播放器、手机、数码 相机和笔记本电脑等产品上。对于2.2节使用的英文语料,实验使用中文评论语料对应的谷歌翻译结果。 具体实验中分别使用3组不同的训练样本数量对相同的测试样本进行测试,其中训练样本数量分别为正负 各10条标注样本、正负各20条标注样本、正负各50条标注样本,测试样本数量为正负各300条标注样本, 实验中采用所有未标注样本2000条。 (标注未标注 正面/负面 (正面负面 (标注未标注) 判别器D 分类器C 分类器C 判别器D 编码器 编码器E 编码器E 编码器E 未标注样本 标注样本x 标注样本x 未标注样本x 中文对抗神经网络 英文对抗神经网络 图2基于双语对抗学习的丰监督情感分类模型图 Figure 2 Semi-supervised sentiment classification with bilingual adversarial learning 本文采用 jieba工具进行分词,并且釆用word2vec训练词向量。实验结果采用准确率作为衡量情感分 类性能的评价指标。 2.2实验结 为了验证本文提出方法的有效性,本文实现了以下几种半监督情感分类方法。 baseline(LSTM):本实验使用了标准的LSTM模型进行全监督情感分类方法。 LP(CN):Zhu等提出了一种基于图形的半监督学习方法,即标签传播( label propagation,LP),实验中第 2 期 刘 杰,等:基于双语对抗学习的半监督情感分类 另外,实验使用 Adam [ 9] 作为优化函数,在整个神经网络中所有的矩阵和向量被初始化为统一的格式, 即 [ - 6 / ( r + c) , 6 / ( r + c) ] , 其中: r 和 c 表示矩阵的行和列的大小。 1. 2 双语对抗学习的半监督情感分类 双语对抗神经网络的半监督情感分类方法包括中文对抗神经网络和英文对抗神经网络两部分。 图 2 显 示了双语对抗神经网络的半监督情感分类方法的模型图。 在本文提出的模型中,通过中文对抗神经网络和 英文对抗神经网络的联合学习有效提高了中文样本的情感分类结果。 具体联合学习的损失函数为 J = Jcn + Jen , 其中:Jen 是同 Jcn 训练方法相同的英文对抗神经网络的损失函数。 在基于双语对抗学习的半监督情感分类方法中,实验通过融合每条文本的中英文标签概率决定测试样 本的标签类别。 2 实验结果与分析 2. 1 实验设置 本文采用了 Wan [ 10] 提供的中国 IT 产品网站 IT168 的中文评论语料,其中包括 886 条标注样本( 451 条 正面评论样本和 435 条负面评论样本)和 2 000 条未标注样本,评论内容主要集中在 mp3 播放器、手机、数码 相机和笔记本电脑等产品上。 对于 2. 2 节使用的英文语料,实验使用中文评论语料对应的谷歌翻译结果。 具体实验中分别使用 3 组不同的训练样本数量对相同的测试样本进行测试,其中训练样本数量分别为正负 各 10 条标注样本、正负各 20 条标注样本、正负各 50 条标注样本,测试样本数量为正负各 300 条标注样本, 实验中采用所有未标注样本 2 000 条。 图 2 基于双语对抗学习的半监督情感分类模型图 Figure 2 Semi-supervised sentiment classification with bilingual adversarial learning 本文采用 jieba 工具进行分词,并且采用 word2vec 训练词向量。 实验结果采用准确率作为衡量情感分 类性能的评价指标。 2. 2 实验结果 为了验证本文提出方法的有效性,本文实现了以下几种半监督情感分类方法。 baseline( LSTM) :本实验使用了标准的 LSTM 模型进行全监督情感分类方法。 LP(CN) :Zhu [ 5] 等提出了一种基于图形的半监督学习方法,即标签传播( label propagation,LP ) ,实验中 61
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有