·116. 智能系统学报 第5卷 过用户对页面的访问历史事件构造用户特征树,基 and storing web archive based on page block[J].Journal of 于用户特征树挖掘用户的浏览行为特征,主动产生 Software,2008,19(2):275-290 针对特定用户的兴趣信息集,以该信息集作为检索 [6]CHRISTOPHER D.Introduction to information retrieval 条件,检索信息树达到检索页面信息的目的.该技术 M].England:Cambridge University Press,2009:25-28. [7]CHEN K J,MA Weiyun.Unknown word extraction for Chi- 的发展应用将减少用户从大量繁杂的页面信息中挑 nese documents C]//19th International Conference on 选自己感兴趣的数条或数十条信息的劳累,尤其解 Computational Linguistics.Taipei,China,2002:169-175. 决了手机用户中,页面信息容量大和显示屏幕极其 [8]HOBBS J R.Information extraction from biomedical text 有限的矛盾.该技术的成熟发展需要良好的文本分 [J].Journal of Biomedical Informatics,2002,35(4):260- 类及其文本主题提取技术、页面Blok主题信息的 264. 提取等技术.用户特征树为Wb用户行为特征挖掘 [9]KONGACHANDRA R,KIMPANT C,SUWANAPONG T,et 提供良好的技术支持。 al.Newly-born keyword extraction under limited knowledge resources based on sentence similarity verification J.IEEE 参考文献: International Symposium on Communications and Information [1 ]CAI D,YUS,WEN J R,MA W Y.VIPS:a version-based Technology,2004,21(3):1183-1187. page segmentation algorithm MSR-TR-2003-79 R ] [10]GAO Junbo,LUAN Cuiju,WANG Xiaofeng.New key- [s.1.],2003. word extraction research[J].Computer Engineering and [2]SONG Ruihua,LIU Haifeng,WEN Jirong,et al.Leaming Design,2008,29(3):765-767 block improtance models for web pages[C]//The 13th In- 作者简介: ternational Conference on World Wide Web.New York, 袁鼎荣,男,1967年生,副教授,主 USA,2004:203-211. 要研究方向为文本信息处理、网络智 [3]CAI D,YU S,WEN J R,et al.Block-based Web search 能、机器学习、数据挖掘等.主持或主要 [C]//27th Annual Interational ACM SIGIR Conference on 参与国家或省部级项目4项,发表学术 Information Retrival.Sheffield,UK,2004:456-463. 论文20余篇。 [4]CAI D,YU S,WEN J R,et al.Block-based link analysis [C]//27th Annual Interational ACM SIGIR Conference on Information Retrival.Sheffield,UK,2004:440-447. 钟宁,男,1956年生,教授,博 [5]宋杰,王大玲,鲍玉斌,等.基于页面Blok的Web档 导,主要研究方向为网络智能、知识发 案采集和存储[J].软件学报,2008,19(2):275-290. 现与数据挖掘、粗糙集(Rough Set)与软 SONG Jie,WANG Daling,BAO Yubin,et al.Collecting 计算、智能Agent技术与应用、脑信息学 等,发表学要论文多篇