正在加载图片...
(2)读取日志中关于请求页面的编码abe,截取后两位,在b行c列单元格中加1。 (3)PS1中记录结束,终止,否则转步骤(2)。 (4)寻找表T中的最大值Max,次大值 Sub max与第三大值 Th max。它们处于的行代 表了该用户最感兴趣的三个一级项目,而每一行中数字的最大值与次大值表示了该用户对于 该子项目感兴趣的二级项目的程度。 例如用户i的兴趣度如表1所示 表1用户i的兴趣度矩阵 第一个二级项目第二个二级项目第三个二级项目 新闻 3215 5897 体育 3598 娱乐 4831 4 在表1中,最大值是5897,次大值是4831,第三大值是4325,表明用户i兴趣度由大 到小的顺序是新闻>娱乐>体育,而在体育项目中兴趣度的顺序分别为足球>篮球>排球。 23用户分类与实施方案 根据用户的兴趣度,可以将用户进行多层次的分类,比如依据用户的最大兴趣度,使用 判定树进行分类,判定树与图3的网站内容层次结构相似,称该判定树为最大兴趣度判定树, 同理,可以依据每个用户的第二兴趣度建立第二兴趣度判定树;根据系统的具体情况可以适 当决定用户分类层次的深度 根据用户浏览网站的Web日志和自定义的日志,经过数据清洗,依据网站内容的层次 结构计算用户兴趣度,进而对用户进行分类,整个过程在网站的后台离线进行。当一个用户 登录网站后,根据最大兴趣度判定树判定该用户所属的最大兴趣类别,同理也可以根据用户 的第二兴趣度判定树得到该用户的第二兴趣类别。比如用户UA根据最大兴趣度属于体育/ 篮球类,而根据第二兴趣度该用户属于娱乐/电视类,那么该用户一旦登录网站,网站主页 应将体育、娱乐模块放在网页的主要位置,而且在关于体育的模块中应该将籃球放在首要位 置,而在娱乐模块中,将电视放在首要位置,让用户更加方便的浏览自己最感兴趣的内容 对网页布局控制的方法有多种,使用表格对网页进行布局缺乏灵活性,使用 DIV+CSS的方法目前比较流行,但是该技术缺乏定制性,文献[0采用了JSP标签库技术 此技术缺乏通用性,文献([使用的XML技术比较灵活且具有通用性 3.结论 为更好的服务网络用户,吸引用户对网站的浏览与访问,应根据用户的行为模式实现对 网站的个性化设置,即不同的用户登录同一网站时因用户兴趣度的不同,网站的页面布局应 有所不同,使用本文提出的方法计算每个用户的兴趣度,并对用户分类,根据用户不同的类 别动态调整网站的布局,该方法具有一定的创新性、实用性。但也存在不足,就是要求用户 浏览网站时应登录网站,否则,本文中的方法将退化为使用IP地址来识别用户 参考文献 l]杨风雷,阎保平web用户行为模式挖掘研究门微电子学与计算机.2008, 25(11)146-149 [2]杨风雷,阎保平新的web用户行为统计分析系统研究和实现计算机应用研 究,2008,25(9)2758-2761 3]潘莹,梁京章,黎慧娟基于K- means算法的校园网用户行为聚类分析卩计算技术 与自动化2007,26(1)669 [4]周爱武,程博,李孙长等Web日志挖掘中的会话识别方法计算机工程与设 计2010,31(5):936-938(2)读取日志中关于请求页面的编码 abc,截取后两位,在 b 行 c 列单元格中加 1。 (3)PSi中记录结束,终止,否则转步骤(2)。 (4)寻找表 Ti中的最大值 Max,次大值 Sub_max 与第三大值 Th_max。它们处于的行代 表了该用户最感兴趣的三个一级项目,而每一行中数字的最大值与次大值表示了该用户对于 该子项目感兴趣的二级项目的程度。 例如用户 i 的兴趣度如表 1 所示。 表 1 用户 i 的兴趣度矩阵 第一个二级项目 第二个二级项目 第三个二级项目 新闻 3215 5897 2 体育 4325 3 3598 娱乐 7 4831 4 … … … … 在表 1 中,最大值是 5897,次大值是 4831,第三大值是 4325,表明用户 i 兴趣度由大 到小的顺序是新闻>娱乐>体育,而在体育项目中兴趣度的顺序分别为足球>篮球>排球。 2.3 用户分类与实施方案 根据用户的兴趣度,可以将用户进行多层次的分类,比如依据用户的最大兴趣度,使用 判定树进行分类,判定树与图 3 的网站内容层次结构相似,称该判定树为最大兴趣度判定树, 同理,可以依据每个用户的第二兴趣度建立第二兴趣度判定树;根据系统的具体情况可以适 当决定用户分类层次的深度。 根据用户浏览网站的 Web 日志和自定义的日志,经过数据清洗,依据网站内容的层次 结构计算用户兴趣度,进而对用户进行分类,整个过程在网站的后台离线进行。当一个用户 登录网站后,根据最大兴趣度判定树判定该用户所属的最大兴趣类别,同理也可以根据用户 的第二兴趣度判定树得到该用户的第二兴趣类别。比如用户 UA 根据最大兴趣度属于体育/ 篮球类,而根据第二兴趣度该用户属于娱乐/电视类,那么该用户一旦登录网站,网站主页 应将体育、娱乐模块放在网页的主要位置,而且在关于体育的模块中应该将篮球放在首要位 置,而在娱乐模块中,将电视放在首要位置,让用户更加方便的浏览自己最感兴趣的内容。 对网页布局控制的方法有多种 [9,10],使用表格对网页进行布局缺乏灵活性,使用 DIV+CSS 的方法目前比较流行,但是该技术缺乏定制性,文献[10]采用了 JSP 标签库技术, 此技术缺乏通用性,文献[11]使用的 XML 技术比较灵活且具有通用性。 3.结论 为更好的服务网络用户,吸引用户对网站的浏览与访问,应根据用户的行为模式实现对 网站的个性化设置,即不同的用户登录同一网站时因用户兴趣度的不同,网站的页面布局应 有所不同,使用本文提出的方法计算每个用户的兴趣度,并对用户分类,根据用户不同的类 别动态调整网站的布局,该方法具有一定的创新性、实用性。但也存在不足,就是要求用户 浏览网站时应登录网站,否则,本文中的方法将退化为使用 IP 地址来识别用户。 参考文献 [1] 杨风雷,阎保平.Web 用户行为模式挖掘研究[J].微电子学与计算机.2008, 25(11):146-149. [2] 杨风雷,阎保平.新的 Web 用户行为统计分析系统研究和实现[J].计算机应用研 究.2008, 25(9):2758-2761. [3] 潘莹,梁京章,黎慧娟.基于 K-means 算法的校园网用户行为聚类分析[J].计算技术 与自动化.2007, 26(1):66-69. [4] 周爱武,程博,李孙长等.Web 日志挖掘中的会话识别方法[J].计算机工程与设 计.2010, 31(5):936-938
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有