正在加载图片...
第4期 郝洁,等:基于词加权DA算法的无监督情感分类 .543. 情感倾向。但具体到刻画各个文档的情感,其精度 1.0 远低于WLDA,可见这类广义停用词对模型性能的 影响。 0.8 表4WIDA和LSM模型情感分类精度 Table 4 Sentiment classification accuracy of WLDA 0.6 一语料1WLDA and LSM % 语料2WLDA 8一语料1JST 日一语料2JST 模型 正面 负面 总 .4 0 20 4060 80 100 WLDA 86.8 92.6 89.7 主题数目 LSM 80.4 70.0 75.2 图3WLDA和JST模型分类精度对比 此处以LSM为对比,说明了词汇加权对吉布斯 Fig.3 Sentiment classification accuracy of WLDA and JST 采样结果的影响,但由于LSM模型只能将文档划分 对于语料1和语料2,WLDA不仅在情感分类 为正面、负面两类或正面、负面、中性三类,无法提取 上均有良好表现,受主题数目选取的影响也比JST 更细粒度的主题和情感信息,后文的实验均采用 模型更小。 WLDA与JST两个模型的对比。 3.5WLDA和JST模型的关键词对比 3.4WLDA和JST模型的情感分类精度对比 在语料1中,当K=6时,两种算法的分类精度 图3为WLDA和JST模型选取不同主题数目 达到最高。表5列举了K=6时,WLDA和JST模型 时,在语料1和语料2下的情感分类精度。 得到的关键词,并归纳了关键词的主要内容。 表5WLDA和JST关键词 Table 5 Keywords of WLDA and JST 编号 情感倾向 主题归纳 WLDA 主题归纳 JST 不错免费满意舒适周到 酒店房间房不错人住 舒服特色享受总体 携程大床服务感觉 褒义 房间舒适 房间舒适 温馨房间酒店宽敞 免费豪华价格行政 推荐安静 大堂设施 热情感动酒店不错 房间 酒店服务入住服务员 帮小姐打电话服务员 褒义 服务热情 服务 行李房间客人大堂帮吃 安排工作人员员工花园 餐饮 免费热情朋友安排早餐 下次很快感谢 不错方便总体酒店 酒店不错房间感觉 房间 褒义 交通方便 干净香港房间交通满意 方便入住小干净环境吃 餐饮 步行太安静位置齐全免费 早餐价格设施晚上服务 房间酒店早餐服务员 洗澡差水根本太毛巾 晚上空调感觉不好差 贬义 卫生设施差 地毯只能床单门最差 房间设施差 卫生间宾馆装修不能 如家不如酒店卫生间 太不知道 携程电话告诉不能 酒店前台房间入住携程 贬义 投诉交涉 前台打电话不知道酒店 投诉交涉 服务员电话客人服务退房 投诉退房收经理根本结帐 打电话告诉发现经理 差空调房间不好太失望 房间 酒店房间携程服务 贬义 房间设施差 不知道吵实在不能根本 服务 价格感觉前台朋友小这家 很差声音只好打电话 交通 入住机场四星补充出租车 可以看到,WLDA得到的关键词多为单一方面 中,部分主题由多个方面的评价组成,如主题2,在 评价,一致性较强,易于人的理解。而在ST模型 15个关键词中,同时涉及到房间、服务、餐饮三方面情感倾向。 但具体到刻画各个文档的情感,其精度 远低于 WLDA,可见这类广义停用词对模型性能的 影响。 表 4 WLDA 和 LSM 模型情感分类精度 Table 4 Sentiment classification accuracy of WLDA and LSM % 模型 正面 负面 总 WLDA 86.8 92.6 89.7 LSM 80.4 70.0 75.2 此处以 LSM 为对比,说明了词汇加权对吉布斯 采样结果的影响,但由于 LSM 模型只能将文档划分 为正面、负面两类或正面、负面、中性三类,无法提取 更细粒度的主题和情感信息,后文的实验均采用 WLDA 与 JST 两个模型的对比。 3.4 WLDA 和 JST 模型的情感分类精度对比 图 3 为 WLDA 和 JST 模型选取不同主题数目 时,在语料 1 和语料 2 下的情感分类精度。 图 3 WLDA 和 JST 模型分类精度对比 Fig.3 Sentiment classification accuracy of WLDA and JST 对于语料 1 和语料 2,WLDA 不仅在情感分类 上均有良好表现,受主题数目选取的影响也比 JST 模型更小。 3.5 WLDA 和 JST 模型的关键词对比 在语料 1 中,当 K = 6 时,两种算法的分类精度 达到最高。 表 5 列举了 K = 6 时,WLDA 和 JST 模型 得到的关键词,并归纳了关键词的主要内容。 表 5 WLDA 和 JST 关键词 Table 5 Keywords of WLDA and JST 编号 情感倾向 主题归纳 WLDA 主题归纳 JST 1 褒义 房间舒适 不错 免费 满意 舒适 周到 舒服 特色 享受 总体 温馨 房间 酒店 宽敞 推荐 安静 房间舒适 酒店 房间 房 不错 入住 携程 大床 服务 感觉 免费 豪华 价格 行政 大堂 设施 2 褒义 服务热情 热情 感动 酒店 不错 帮 小姐 打电话 服务员 安排 工作人员 员工 花园 下次 很快 感谢 房间 服务 餐饮 酒店 服务 入住 服务员 行李 房间 客人 大堂 帮 吃 免费 热情 朋友 安排 早餐 3 褒义 交通方便 不错 方便 总体 酒店 干净 香港 房间 交通 满意 步行太 安静 位置 齐全 免费 房间 餐饮 酒店 不错 房间 感觉 方便 入住 小 干净 环境 吃 早餐 价格 设施 晚上 服务 4 贬义 卫生设施差 洗澡 差 水 根本 太 毛巾 地毯 只能 床单 门 最差 如家 不如 酒店 卫生间 房间设施差 房间 酒店 早餐 服务员 晚上 空调 感觉 不好 差 卫生间 宾馆 装修 不能 太 不知道 5 贬义 投诉交涉 携程 电话 告诉 不能 前台 打电话 不知道 酒店 投诉 退房 收 经理 根本 结帐 投诉交涉 酒店 前台 房间 入住 携程 服务员 电话 客人 服务 退房 打电话 告诉 发现 经理 6 贬义 房间设施差 差 空调 房间 不好 太 失望 不知道 吵 实在 不能 根本 很差 声音 只好 打电话 房间 服务 交通 酒店 房间 携程 服务 价格 感觉 前台 朋友 小 这家 入住 机场 四星 补充 出租车 可以看到,WLDA 得到的关键词多为单一方面 评价,一致性较强,易于人的理解。 而在 JST 模型 中,部分主题由多个方面的评价组成,如主题 2,在 15 个关键词中,同时涉及到房间、服务、餐饮三方面 第 4 期 郝洁,等:基于词加权 LDA 算法的无监督情感分类 ·543·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有