正在加载图片...
·356· 智能系统学报 第13卷 表21000种疾病时辅助诊断结果 纬度数值随机生成,只要将其限制在上述的矩形区 Table 2 The results of auxiliary diagnoses on 1 000 dis- 域即可,医院和疾病的等级信息也随机生成。 eases ②医院的诊疗效果(effect)、收费水平(charge)、 位置 初步 优化 位置 初步 优化 服务态度(attitude)都是医院的固有属性,因此事先 105 116 7 2 2 生成医院擅长治疗的疾病与医院之间的对应集合 2 43 39 8 3 1 S,、收费较低的医院集合S2、服务态度好的医院集 3 14 22 9 3 0 合S 4 7 8 10 1 1 ③对每条评价记录,effect、charge、attitude初始 5 2 其他 > 的评价都是5分。 ④按式(8)~(1O)更新effect、charge、attitude的 6 0 值。 实验结果表明,所选测试数据在此统计策略 (1+)effect, (disease,hospital)ES effect (8) 下,当数据库中疾病种类为100时,召回率为95%, (1-41)effect, (disease,hospital) 准确率为85%,在优化诊断之后,准确率达到95%, charge (1+42)charge,hospital eS2 召回率达到100%;当数据库中疾病种类为1000 (1-42)charge, hospital (9) 时,召回率为91.5%,准确率为81%,在优化诊断之 (1+42)attitude, attitude hospital∈S3 (1-2)attitude,hospitalS3 (10) 后,准确率达到88.5%,召回率达到96%。 5.2推荐技术实验 ⑤给每一项再加一个小的正负随机的扰动4, 推荐算法的质量衡量方法一直是存在争议的, 以模拟评分时的噪音。 甚至有人认为推荐系统的质量根本就不可能直接衡 5.2.2实验方案 量,因为有太多的目标函数。目前最主流的评估方 使用上面生成的模拟数据作为训练数据,再随 案是根据电影领域用户历史评分来估计不同算法的 机选择100名用户,每人2种疾病,距离用户=15km 实验方法,EachMovie数据集和Netfliⅸ数据集是其 的医院作为候选医院,在该测试数据集上运行推荐 中的典型代表,但是很显然,这些数据不可能应用 算法,并记录推荐结果中前3位。 到本文中的推荐算法上,因为文中提出的推荐算法 前面已经说过,就诊时的关注点主要有距离和 是和医疗与导诊密切相关的。基于以上原因,本文 医院的质量,因此,一方面对距离用户范围R内的 中使用合成的数据集,并采用定量和定性结合的方 医院按照距离和治疗对应疾病的综合评分分别排 式评估算法质量。 序,统计推荐的医院在两个序列中的具体分布情 5.2.1生成实验数据 况:另一方面查看并统计推荐的医院在上述S、S2 1)合理性分析 S?这3个集合中分布情况,以此来定性地确定推荐 经过查阅相关医学资料以及调查问卷的方式, 的医院的质量。最终,通过对以上两个指标分布的 得出在选择医院时人们主要关注的有两点:医院与 分析,来半定量地评估推荐算法。 自己的距离,一般对于常见疾病人们倾向于选择距 5.2.3实验结果 离自己近的医院就诊:在医院质量方面,患者主要 推荐结果中排前三的医院在按照评分距离和评 关心的因素是诊疗效果、收费水平、服务态度,对这 分排序的两个序列中的具体分布情况如图2所示。 三者的关注度权重接近于5:3:2。既然人们在就诊 60 口第一次推荐 选择时有这样的倾向性,实际的数据分布也会体现 50 ▣第二次推荐 40 口第三次推着 出这样的特点,那么我们就能按照上面的原则模拟 30 生成实验数据,并且这样的数据具有一定的合理性。 2)数据规模 假定地域范围是44×44km2的一个矩形,有 1...0oo 4 5678910其他 50家医院,医院的等级共有10级,有50种疾病,疾 推荐排名 病的严重等级共有10级,有5000个病人,每人有 图2推荐结果在两个序列中的分布 10条就诊评价记录,共有50000条记录。 Fig.2 The distribution of recommended results in two lists 3)生成数据 由统计结果可得:排名第一的推荐结果两个序 ①医院和用户的地域信息使用经纬度表示,经 列中前6位出现的概率是87%,在前3位出现的概表 2 1 000 种疾病时辅助诊断结果 Table 2 The results of auxiliary diagnoses on 1 000 dis￾eases 位置 初步 优化 位置 初步 优化 1 105 116 7 2 3 2 43 39 8 3 1 3 14 22 9 3 0 4 7 8 10 1 1 5 1 2 其他 17 8 6 4 0 实验结果表明,所选测试数据在此统计策略 下,当数据库中疾病种类为 100 时,召回率为 95%, 准确率为 85%,在优化诊断之后,准确率达到 95%, 召回率达到 100%;当数据库中疾病种类为 1 000 时,召回率为 91.5%,准确率为 81%,在优化诊断之 后,准确率达到 88.5%,召回率达到 96%。 5.2 推荐技术实验 推荐算法的质量衡量方法一直是存在争议的, 甚至有人认为推荐系统的质量根本就不可能直接衡 量,因为有太多的目标函数。目前最主流的评估方 案是根据电影领域用户历史评分来估计不同算法的 实验方法,EachMovie 数据集和 Netflix 数据集是其 中的典型代表,但是很显然,这些数据不可能应用 到本文中的推荐算法上,因为文中提出的推荐算法 是和医疗与导诊密切相关的。基于以上原因,本文 中使用合成的数据集,并采用定量和定性结合的方 式评估算法质量。 5.2.1 生成实验数据 1) 合理性分析 经过查阅相关医学资料以及调查问卷的方式, 得出在选择医院时人们主要关注的有两点:医院与 自己的距离,一般对于常见疾病人们倾向于选择距 离自己近的医院就诊;在医院质量方面,患者主要 关心的因素是诊疗效果、收费水平、服务态度,对这 三者的关注度权重接近于 5:3:2。既然人们在就诊 选择时有这样的倾向性,实际的数据分布也会体现 出这样的特点,那么我们就能按照上面的原则模拟 生成实验数据,并且这样的数据具有一定的合理性。 2) 数据规模 假定地域范围是 44×44 km2 的一个矩形,有 50 家医院,医院的等级共有 10 级,有 50 种疾病,疾 病的严重等级共有 10 级,有 5 000 个病人,每人有 10 条就诊评价记录,共有 50 000 条记录。 3) 生成数据 ① 医院和用户的地域信息使用经纬度表示,经 纬度数值随机生成,只要将其限制在上述的矩形区 域即可,医院和疾病的等级信息也随机生成。 ② 医院的诊疗效果 (effect)、收费水平 (charge)、 服务态度 (attitude) 都是医院的固有属性,因此事先 生成医院擅长治疗的疾病与医院之间的对应集合 S1、收费较低的医院集合 S2、服务态度好的医院集 合 S3。 ③对每条评价记录,effect、charge、attitude 初始 的评价都是 5 分。 ④按式 (8)~(10) 更新 effect、charge、attitude 的 值。 effect = { (1+∆1)effect, ⟨ disease,hospital⟩ ∈ S 1 (1−∆1)effect, ⟨ disease,hospital⟩ < S 1 (8) charge = { (1+∆2)charge, hospital ∈ S 2 (1−∆2)charge, hospital < S 2 (9) attitude = { (1+∆2)attitude, hospital ∈ S 3 (1−∆2)attitude, hospital < S 3 (10) ⑤ 给每一项再加一个小的正负随机的扰动 Δ0, 以模拟评分时的噪音。 5.2.2 实验方案 使用上面生成的模拟数据作为训练数据,再随 机选择 100 名用户,每人 2 种疾病,距离用户 R=15 km 的医院作为候选医院,在该测试数据集上运行推荐 算法,并记录推荐结果中前 3 位。 前面已经说过,就诊时的关注点主要有距离和 医院的质量,因此,一方面对距离用户范围 R 内的 医院按照距离和治疗对应疾病的综合评分分别排 序,统计推荐的医院在两个序列中的具体分布情 况;另一方面查看并统计推荐的医院在上述 S1、S2、 S3 这 3 个集合中分布情况,以此来定性地确定推荐 的医院的质量。最终,通过对以上两个指标分布的 分析,来半定量地评估推荐算法。 5.2.3 实验结果 推荐结果中排前三的医院在按照评分距离和评 分排序的两个序列中的具体分布情况如图 2 所示。 0 10 20 30 40 50 60 1 2 3 4 5 6 7 8 9 10 ڢЂ じ̬⁍ᣔ㡼 じθ⁍ᣔ㡼 じ̵⁍ᣔ㡼 Ắ⢳/% ᣔ㡼ᢾह 图 2 推荐结果在两个序列中的分布 Fig. 2 The distribution of recommended results in two lists 由统计结果可得:排名第一的推荐结果两个序 列中前 6 位出现的概率是 87%,在前 3 位出现的概 ·356· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有