多，M. López-Nores 等 [1]引入了一种新的过滤策

正在加载图片...

第3期马钰，等：面对智能导诊的个性化推荐算法 ·353· 多，M.Lopez-Nores等四引入了一种新的过滤策略，在图1中，虚线将框架图分为两大部分：第1 对于有特定疾病的患者，这种推荐方法的效率较部分是获取用户偏好的过程，首先根据用户的症状高。P.Pattaraintakorn等提出了一种使用粗糙表现，使用辅助诊疗算法给出初步诊断结果，再利集和规则分析的医疗推荐系统，主要目标是将病人用反馈信息和症状联想机制进一步确定所患疾病，的自身的身体数据作为条件属性，推荐临床检查从而完成症状到用户偏好的转化过程：第2部分是方式。宫继兵等提出了一种医疗社交网络中的多生成推荐结果的过程，由用户的偏好结合其地理位层混合医生推荐结构，通过挖掘网络中医生与病人置信息，采用改进的Skyline查询算法，找出一定范之间的关系为患者推荐医生。徐守坤等提出过一围内符合要求的医院作为候选集合，最后在局部范种医生资源均衡推荐算法，使用最佳结果优先的推围内由基于协同过滤的评分方式对候选集合中的医荐算法，解决了医疗资源的使用过度集中而产生的院进行评分、排序，从而生成最终的推荐结果。问题。由上述分析可以看出，现行系统主要有两方面 3基于医疗知识库的辅助诊疗技术的问题：)没有考虑现在医疗推荐方面最迫切需要在本节中，我们主要介绍辅助诊疗技术的具体解决的问题；2)没有考虑导诊与医疗推荐和传统的细节，用以解决医疗导诊与推荐时用户偏好未知的推荐在本质上的不同。问题，通过辅助诊疗帮助用户根据症状表现确定其针对这些问题，本文提出了一种面向智能导诊所患疾病，从而明确用户偏好。的个性化推荐算法，其主要有3个特点： 3.1分词与症状索引表的建立 1)算法提出了辅助诊疗机制，通过辅助诊疗能为了提高分词速度，本文通过对《同义词林》根据用户的症状表现，帮助用户大致确定其所患疾进行适当的改造，构建了一个新的字典。首先，部病，从而明确用户偏好，提升推荐结果的满意度。分无用词汇被剔除：其次，按照词语的字数，字典被 2)算法获得用户评分及反馈信息的方式以显分为5个部分，这样每次匹配时词典最多被扫描一式方法为主，并且在辅助诊疗时根据用户的反馈信次。使用改造后的词典，诊断时症状描述中遇到的息对诊断结果进行优化，从而提高诊断结果的准同义词和相关词等问题得到了一定程度的缓解。为确性。了提高分词准确度，本文选用了逆向最大匹配法。 3)提出了一种在有地域约束时的推荐算法。为了加快诊断速度，本文采取了在症状信息上建立对Skyline-o查询进行改进，并将其结果作为推荐倒排索引的方法。该索引包含3个属性，分别保存的候选集合，之后在局部范围内使用基于协同过滤症状分词结果对应的同义词林中的编码、疾病ICD 的评分算法，对候选集合进行评分并排序。编码和疾病中症状出现的次数，以及症状对应的疾 2 整体框架病类型数。后两个属性在进行诊断时使用。 3.2辅助诊断技术为了对本文所述系统有一个全局性的了解进而 3.2.1辅助诊疗思路更好地了解算法细节，本部分将以框架图为基础，辅助诊疗技术采用的核心思想是计算用户输入阐述算法中各部分的作用及大致思路。本文的整体的症状信息与医疗知识库中疾病症状信息之间的相框架如图1所示。似度，从而确诊疾病类型，具体实现过程包括：用户 1)对录入的症状信息进行分词，使用分词结果在索引表中进行查询，记录所有匹配项，将对应的症状表现疾病作为候选集，并将其中的疾病总数记为N。 2)利用症状索引表计算输入与候选集中每种位置信息反馈辅助诊疗疾病症状的相似度，并依据相似度进行排序。用户信息特征诊断结果 3.2.2相似度计算用户相似度计算公式借鉴了TF-IDF计算相似度的改进的偏好 Skyline查询思路，其公式为基于协同 N 候选集合过滤的评分排序推荐结果 S=) num一log2 (1) numsymptom 图1整体框架式中：S为输入q与疾病症状之间的相似度；num,表 Fig.1 The overall framework 示q中的某一症状i在该疾病中出现的次数，当多，M. López-Nores 等 [1]引入了一种新的过滤策略，对于有特定疾病的患者，这种推荐方法的效率较高。P. Pattaraintakorn 等 [2]提出了一种使用粗糙集和规则分析的医疗推荐系统，主要目标是将病人的自身的身体数据作为条件属性，推荐临床检查方式。宫继兵等[3]提出了一种医疗社交网络中的多层混合医生推荐结构，通过挖掘网络中医生与病人之间的关系为患者推荐医生。徐守坤等[4]提出过一种医生资源均衡推荐算法，使用最佳结果优先的推荐算法，解决了医疗资源的使用过度集中而产生的问题。由上述分析可以看出，现行系统主要有两方面的问题：1) 没有考虑现在医疗推荐方面最迫切需要解决的问题；2) 没有考虑导诊与医疗推荐和传统的推荐在本质上的不同。针对这些问题，本文提出了一种面向智能导诊的个性化推荐算法，其主要有 3 个特点： 1) 算法提出了辅助诊疗机制，通过辅助诊疗能根据用户的症状表现，帮助用户大致确定其所患疾病，从而明确用户偏好，提升推荐结果的满意度。 2) 算法获得用户评分及反馈信息的方式以显式方法为主，并且在辅助诊疗时根据用户的反馈信息对诊断结果进行优化，从而提高诊断结果的准确性。 3) 提出了一种在有地域约束时的推荐算法。对 Skyline[5-10]查询进行改进，并将其结果作为推荐的候选集合，之后在局部范围内使用基于协同过滤的评分算法，对候选集合进行评分并排序。 2 整体框架为了对本文所述系统有一个全局性的了解进而更好地了解算法细节，本部分将以框架图为基础，阐述算法中各部分的作用及大致思路。本文的整体框架如图 1 所示。用户症状表现辅助诊疗诊断结果反馈信息用户偏好推荐结果排序基于协同过滤的评分候选集合改进的 Skyline查询用户特征位置信息图 1 整体框架 Fig. 1 The overall framework 在图 1 中，虚线将框架图分为两大部分：第 1 部分是获取用户偏好的过程，首先根据用户的症状表现，使用辅助诊疗算法给出初步诊断结果，再利用反馈信息和症状联想机制进一步确定所患疾病，从而完成症状到用户偏好的转化过程；第 2 部分是生成推荐结果的过程，由用户的偏好结合其地理位置信息，采用改进的 Skyline 查询算法，找出一定范围内符合要求的医院作为候选集合，最后在局部范围内由基于协同过滤的评分方式对候选集合中的医院进行评分、排序，从而生成最终的推荐结果。 3 基于医疗知识库的辅助诊疗技术在本节中，我们主要介绍辅助诊疗技术的具体细节，用以解决医疗导诊与推荐时用户偏好未知的问题，通过辅助诊疗帮助用户根据症状表现确定其所患疾病，从而明确用户偏好。 3.1 分词与症状索引表的建立为了提高分词速度，本文通过对《同义词林》进行适当的改造，构建了一个新的字典。首先，部分无用词汇被剔除；其次，按照词语的字数，字典被分为 5 个部分，这样每次匹配时词典最多被扫描一次。使用改造后的词典，诊断时症状描述中遇到的同义词和相关词等问题得到了一定程度的缓解。为了提高分词准确度，本文选用了逆向最大匹配法。为了加快诊断速度，本文采取了在症状信息上建立倒排索引的方法。该索引包含 3 个属性，分别保存症状分词结果对应的同义词林中的编码、疾病 ICD 编码和疾病中症状出现的次数，以及症状对应的疾病类型数。后两个属性在进行诊断时使用。 3.2 辅助诊断技术 3.2.1 辅助诊疗思路辅助诊疗技术采用的核心思想是计算用户输入的症状信息与医疗知识库中疾病症状信息之间的相似度，从而确诊疾病类型，具体实现过程包括： 1) 对录入的症状信息进行分词，使用分词结果在索引表中进行查询，记录所有匹配项，将对应的疾病作为候选集，并将其中的疾病总数记为 N。 2) 利用症状索引表计算输入与候选集中每种疾病症状的相似度，并依据相似度进行排序。 3.2.2 相似度计算相似度计算公式借鉴了 TF-IDF 计算相似度的思路[11] ，其公式为 S = ∑ i∈q ( numi numsymptom log2 ( N typedisease +1 )) (1) 式中：S 为输入 q 与疾病症状之间的相似度；numi 表示 q 中的某一症状 i 在该疾病中出现的次数，当第 3 期马钰，等：面对智能导诊的个性化推荐算法 ·353·

<<向上翻页向下翻页>>

点击下载：【智能系统】面对智能导诊的个性化推荐算法