第3期 马钰,等:面对智能导诊的个性化推荐算法 ·357· 率是62%;排名第二的推荐结果在前6位出现的概 health-aware recommender systems[C]//Proceedings of 率是84%,在前3位出现的概率是51.5%:推荐结果 2011 IEEE International Conference on Consumer Electron- 排在前6位出现的概率是81.5%,在前3位出现的 ics.Las Vegas,NV.USA.2011. [2]PATTARAINTAKORN P,ZAVERUCHA G M,CER- 概率是54%。可以看出,推荐的医院主要出现在上 CONE N.Web based health recommender system using 述两个列表中的前6位,其概率大于81%,出现在 rough sets,survival analysis and rule-based expert systems 前3位的概率大于51%,而且出现在前6位的概率 [C]//Proceedings of the 11th International Conference on 随着推荐结果的次序依次从高到低线性排列,这符 Rough Sets,Fuzzy Sets,Data Mining and Granular Comput- 合预期的结果,推荐的医院至少在距离和质量两方 ing.Toronto,Canada,2007:491-499. [3]GONG Jibing,WANG Lili,SUN Shengtao,et al.iBole:a 面之一有优势,而且越处于推荐结果前列的医院其 hybrid multi-layer architecture for doctor recommendation 占优的可能性应该越大。 in medical social networks[J].Journal of computer science 推荐结果中前3的医院在上述S1、S2、S,这 and technology,2015,30(5):1073-1081. 3个集合中分布情况如图3所示。 [4徐守坤,吴伟伟.基于语义的医疗资源均衡推荐算法[ 计算机工程,2015,41(9):74-79 120[口第一次推荐 100 口第二次推荐 XU Shoukun,WU Weiwei.Balance recommendation al- 80 口第三次推荐 gorthm for medical resources based on semantic[J].Com- 60 puter engineering,2015,41(9):74-79 [5]PAPADIAS D,TAO Yufei,FU G,et al.An optimal and 20 0 progressive algorithm for skyline queries[Cl//Proceedings of 2 集合编号 2003 ACM SIGMOD International Conference on Manage- ment of Data.San Diego,USA,2003:467-478 图3推荐结果在3个集合中的分布 [6]CHAN C Y,JAGADISH H V,TAN K L,et al.Finding k- Fig.3 The distribution of recommended results in three dominant skylines in high dimensional space[C]//Proceed- sets ings of 2006 ACM SIGMOD International Conference on 推荐的医院在诊疗效果、收费水平、服务态度 Management of Date.Chicago,IL,USA,2006:503-514. 这3项中至少有2项占优的概率:结果一为82.5%, [7]VLACHOU A,DOULKERIDIS C,KOTIDIS Y.Angle- 结果二为73.5%,结果三为66%,至少有一项占优的 based space partitioning for efficient parallel skyline compu- 概率大于95%。这就说明,推荐的医院从一定程度 tation[C]//Proceedings of 2008 ACM SIGMOD Internation- al Conference on Management of Data.Vancouver,Canada, 上来看是较优的,而且推荐结果中位置越靠前的就 2008:227-238 越优,推荐结果具有一定的合理性。 [8]SARKAS N.DAS G,KOUDAS N.et al.Categorical sky- lines for streaming data[Cl//Proceedings of 2008 ACM SIG- 6结束语 MOD International Conference on Management of Data. 本文通过对医疗与导诊领域的深人研究,发现 Vancouver.Canada.2008:239-250. [9]BORZSONYI S,KOSSMANN D.STOCKER K.The sky- 了医疗领域的推荐与传统推荐在本质上的区别,提 line operator[C]//Proceedings of the 17th International Con- 出了一种面向智能导诊的个性化推荐算法,以辅助 ference on Data Engineering.Washington,DC,USA,2001: 诊疗结果为基础,将Skyline查询和局部范围内基 421-430. 于协同过滤的评分方式相结合。算法能根据用户的 [10]CHAN CY,ENG P K,TAN K L.Efficient processing of 症状表现与地理位置等个人信息,为用户提供个性 skyline queries with partially-ordered domains[Cl//Pro- ceedings of the 21st International Conference on Data En- 化的推荐结果。并且通过模拟生成实验数据,半定 gineering.Tokoyo,Japan,2005:190-191. 量地验证了推荐算法的合理性和有效性。本文中提 [11]GUO Qinglin.The similarity computing of documents 出的算法和思路对于有效地利用电子医疗数据,合 based on VSM[C]//Proceedings of the 32nd Annual IEEE 理分配和使用现有的医疗资源,缓解就诊压力,提 International Computer Software and Applications.Turku, 升就医质量意义重大,有着很大的实用价值与社会 Finland,.2008:585-586. [12]ROBINSON J T.A search structure for large mul-tidimen 意义。 tional dynamic indexes[Cl//Proceedings of 1981 Interna- 参考文献: tional Conference on Management of Data.Ann Arbor, Michigan,1981:10-18. [1]LOPEZ-NORES M,BLANCO-FERNANDEZ Y,PAZOS- [13]HERLOCKER JL.KONSTAN J A,RIEDL J.Explaining ARIAS JJ,et al.Property-based collaborative filtering for collaborative filtering recommendations[Cl/Proceedings of率是 62%;排名第二的推荐结果在前 6 位出现的概 率是 84%,在前 3 位出现的概率是 51.5%;推荐结果 排在前 6 位出现的概率是 81.5%,在前 3 位出现的 概率是 54%。可以看出,推荐的医院主要出现在上 述两个列表中的前 6 位,其概率大于 81%,出现在 前 3 位的概率大于 51%,而且出现在前 6 位的概率 随着推荐结果的次序依次从高到低线性排列,这符 合预期的结果,推荐的医院至少在距离和质量两方 面之一有优势,而且越处于推荐结果前列的医院其 占优的可能性应该越大。 推荐结果中前 3 的医院在上述 S1、S2、S3 这 3 个集合中分布情况如图 3 所示。 0 20 40 60 80 100 120 0 1 2 3 䯲ऴ㑂ण じ̬⁍ᣔ㡼 じθ⁍ᣔ㡼 じ̵⁍ᣔ㡼 䛻 图 3 推荐结果在 3 个集合中的分布 Fig. 3 The distribution of recommended results in three sets 推荐的医院在诊疗效果、收费水平、服务态度 这 3 项中至少有 2 项占优的概率:结果一为 82.5%, 结果二为 73.5%,结果三为 66%,至少有一项占优的 概率大于 95%。这就说明,推荐的医院从一定程度 上来看是较优的,而且推荐结果中位置越靠前的就 越优,推荐结果具有一定的合理性。 6 结束语 本文通过对医疗与导诊领域的深入研究,发现 了医疗领域的推荐与传统推荐在本质上的区别,提 出了一种面向智能导诊的个性化推荐算法,以辅助 诊疗结果为基础,将 Skyline 查询和局部范围内基 于协同过滤的评分方式相结合。算法能根据用户的 症状表现与地理位置等个人信息,为用户提供个性 化的推荐结果。并且通过模拟生成实验数据,半定 量地验证了推荐算法的合理性和有效性。本文中提 出的算法和思路对于有效地利用电子医疗数据,合 理分配和使用现有的医疗资源,缓解就诊压力,提 升就医质量意义重大,有着很大的实用价值与社会 意义。 参考文献: LOPEZ-NORES M, BLANCO-FERNÁNDEZ Y, PAZOSARIAS J J, et al. Property-based collaborative filtering for [1] health-aware recommender systems[C]//Proceedings of 2011 IEEE International Conference on Consumer Electronics. Las Vegas, NV, USA, 2011. PATTARAINTAKORN P, ZAVERUCHA G M, CERCONE N. Web based health recommender system using rough sets, survival analysis and rule-based expert systems [C]//Proceedings of the 11th International Conference on Rough Sets, Fuzzy Sets, Data Mining and Granular Computing. Toronto, Canada, 2007: 491–499. [2] GONG Jibing, WANG Lili, SUN Shengtao, et al. iBole: a hybrid multi-layer architecture for doctor recommendation in medical social networks[J]. Journal of computer science and technology, 2015, 30(5): 1073–1081. [3] 徐守坤, 吴伟伟. 基于语义的医疗资源均衡推荐算法[J]. 计算机工程, 2015, 41(9): 74–79. XU Shoukun, WU Weiwei. Balance recommendation algorthm for medical resources based on semantic[J]. Computer engineering, 2015, 41(9): 74–79. [4] PAPADIAS D, TAO Yufei, FU G, et al. An optimal and progressive algorithm for skyline queries[C]//Proceedings of 2003 ACM SIGMOD International Conference on Management of Data. San Diego, USA, 2003: 467–478. [5] CHAN C Y, JAGADISH H V, TAN K L, et al. Finding kdominant skylines in high dimensional space[C]//Proceedings of 2006 ACM SIGMOD International Conference on Management of Date. Chicago, IL, USA, 2006: 503–514. [6] VLACHOU A, DOULKERIDIS C, KOTIDIS Y. Anglebased space partitioning for efficient parallel skyline computation[C]//Proceedings of 2008 ACM SIGMOD International Conference on Management of Data. Vancouver, Canada, 2008: 227–238. [7] SARKAS N, DAS G, KOUDAS N, et al. Categorical skylines for streaming data[C]//Proceedings of 2008 ACM SIGMOD International Conference on Management of Data. Vancouver, Canada, 2008: 239–250. [8] BÖRZSÖNYI S, KOSSMANN D, STOCKER K. The skyline operator[C]//Proceedings of the 17th International Conference on Data Engineering. Washington, DC, USA, 2001: 421–430. [9] CHAN C Y, ENG P K, TAN K L. Efficient processing of skyline queries with partially-ordered domains[C]//Proceedings of the 21st International Conference on Data Engineering. Tokoyo, Japan, 2005: 190–191. [10] GUO Qinglin. The similarity computing of documents based on VSM[C]//Proceedings of the 32nd Annual IEEE International Computer Software and Applications. Turku, Finland, 2008: 585–586. [11] ROBINSON J T. A search structure for large mul-tidimentional dynamic indexes[C]//Proceedings of 1981 International Conference on Management of Data. Ann Arbor, Michigan, 1981: 10-18. [12] HERLOCKER J L, KONSTAN J A, RIEDL J. Explaining collaborative filtering recommendations[C]//Proceedings of [13] 第 3 期 马钰,等:面对智能导诊的个性化推荐算法 ·357·