正在加载图片...
·120 智能系统学报 第4卷 求各个指标的权重也不相同.比如Dgg网站,主要 使用此算法后,得票数相同的内容,不一定得分 提供新闻,因此对时间因素考虑的更为重要,与此相 相同.如图3中(a)和(b)内容都得4票,并且都是 反,Done主要以科学技术内容为主,因此对于投票 一个用户所提交,但是因为(a)的得分比(b)高,所 者的经验值要求最高.为了选择更加合理的权重,这 以(a)被置首页,而(b)没有.究其原因,主要是内容 里使用了属性论方法,它的基本思路是抛出几个样 (a)在30mim获得4票,而内容(b)是240min才获 本点,由专家来进行评判,学习得出专家的心理曲 得4票 线,从而得出各个指标的权重 如何让你的博客远离垃圾评论|三两饭 设soe为临界总分,在(soe,1)中,根据曲 类别牌客@论运1标签博客s0留言垃掇评论 线拟合要求,均匀选取若干个点:T、T、…、T1,在 总分为T,(i=1,23,,n-1)的每个点上选取若干 h迎ww sanliangfan.com一写博客我们都希望能够看到很多 个样本让专家进行评分,按照式(7)就可以找到总 对博客的一种肯定。但是,这仅限于评论而不是垃圾,垃圾评引 分为T,(i=1,2,3,n-1)的重心坐标,而重心坐 感,另一方面上我们在SE0方面处于不利的局面。如何杜绝 标反映了不同专家对各个投票因素的偏好 垃圾评论?阅读全文” 6引用回分享且作者a0tu3ku21小时以前 b(f()) (a)使用来客掘客的投票算法 4)计算内容G的综合得分sc0 生宝宝早选月嫂的好处 4 THUMRSHOTSrom sco,=sco,+sco+sco;)/3 MAGE COMNG SOON 类别生活⊙健康1标签月嫂 (8) 已投票 5)设置一个阈值s0,当内容C,的综合得分大 于或等于so,就把该内容置于首页」 http://www.beifule.cn- 最近老婆要生了,我们: 3实验分析 同事,基本上全部劝我去找一个月煜,有个同事因 身体不是阅读全文》 使用提出的投票算法,对来客掘客的投票算法 。引用回分享?作者h198206022天以前 进行了改进.因为来客掘客更注重于新闻事件,所以 首先给出样本数据,然后请几个新闻专家对样本数 (b)未使用来客掘客的投票算法 图3被投票的内容 据进行打分,从而求出专家的心理重心曲线,最后得 Fig 3 Voted contents 出各个指标所占的权重.在使用此算法以后,关于新 闻的内容虽然得票数和其他内容一样,但是它的得 4 结束语 分更高,被置首页的概率更高.图2是使用此算法和 本文给出了一套投票算法的指标体系和基于属 没有使用此算法的被置首页内容比例分析图,从图 性论方法的投票算法.该算法即能够体现网站的偏 2可以看到,使用此算法以后,属于新闻事件的内容 好,又能合理的反映投票者的经验值,为掘客类网站 被置首页的比例从22%提升到36%. 和其他带有投票功能的网站提供了一种新的方法 100r ◆改进算法前 80 同时给出的实际例子的投票结果也更加合理和公 ■改进算法后 是 60A 正,从而论证了本方法的合理性.本文方法在考虑时 40 间趋势值时使用的函数相对比较简单,下一步将尝 20 试对多种势函数进行比较,从中择优 新闻事件 T数码情感爱情 其他 被置首页内容 参考文献: 图2算法改进前与改进后被置首页比例 [1]LEVY Collective intelligence:mankind's emerging world Fig 2 The results comparison table before and after algo in cyberspace plenum [M ]New York:Plenum Trade, rithm mproved 1997:37-39 [2]SM IH J B.Collective intelligence in computer-based col- 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net求各个指标的权重也不相同. 比如 D igg网站 ,主要 提供新闻 ,因此对时间因素考虑的更为重要 ,与此相 反 , Dzone主要以科学技术内容为主 ,因此对于投票 者的经验值要求最高. 为了选择更加合理的权重 ,这 里使用了属性论方法 ,它的基本思路是抛出几个样 本点 ,由专家来进行评判 ,学习得出专家的心理曲 线 ,从而得出各个指标的权重. 设 score0 为临界总分 ,在 ( score0 , 1)中 ,根据曲 线拟合要求 ,均匀选取若干个点 : T1、T2、…、Tn - 1 ,在 总分为 Ti ( i = 1, 2, 3, …, n - 1)的每个点上选取若干 个样本让专家进行评分 ,按照式 ( 7)就可以找到总 分为 Ti ( i = 1, 2, 3, …, n - 1)的重心坐标 ,而重心坐 标反映了不同专家对各个投票因素的偏好. b ({ c h (z) } ) = ∑ t h =1 v h 1 c h 1 ∑ t h =1 v h 1 , …, ∑ t h =1 v h m c h m ∑ t h =1 v h m . (7) 4)计算内容 ci 的综合得分 scoi . scoi = (ξ1 sco ce i +ξ2 sco ve i +ξ3 sco t i ) /3. (8) 5)设置一个阈值 scot ,当内容 Ci 的综合得分大 于或等于 scot ,就把该内容置于首页. 3 实验分析 使用提出的投票算法 ,对来客掘客的投票算法 进行了改进. 因为来客掘客更注重于新闻事件 ,所以 首先给出样本数据 ,然后请几个新闻专家对样本数 据进行打分 ,从而求出专家的心理重心曲线 ,最后得 出各个指标所占的权重. 在使用此算法以后 ,关于新 闻的内容虽然得票数和其他内容一样 ,但是它的得 分更高 ,被置首页的概率更高. 图 2是使用此算法和 没有使用此算法的被置首页内容比例分析图 ,从图 2可以看到 ,使用此算法以后 ,属于新闻事件的内容 被置首页的比例从 22%提升到 36%. 图 2 算法改进前与改进后被置首页比例 Fig. 2 The results comparison table before and after algo2 rithm imp roved 使用此算法后 ,得票数相同的内容 ,不一定得分 相同. 如图 3中 ( a)和 ( b)内容都得 4票 ,并且都是 一个用户所提交 ;但是因为 ( a)的得分比 ( b)高 ,所 以 ( a)被置首页 ,而 ( b)没有. 究其原因 ,主要是内容 ( a)在 30 m in获得 4票 ,而内容 ( b)是 240 m in才获 得 4票. ( a)使用来客掘客的投票算法 ( b)未使用来客掘客的投票算法 图 3 被投票的内容 Fig. 3 Voted contents 4 结束语 本文给出了一套投票算法的指标体系和基于属 性论方法的投票算法. 该算法即能够体现网站的偏 好 ,又能合理的反映投票者的经验值 ,为掘客类网站 和其他带有投票功能的网站提供了一种新的方法. 同时给出的实际例子的投票结果也更加合理和公 正 ,从而论证了本方法的合理性. 本文方法在考虑时 间趋势值时使用的函数相对比较简单 ,下一步将尝 试对多种势函数进行比较 ,从中择优. 参考文献 : [ 1 ]L∗VY. Collective intelligence: mankind’s emerging world in cyberspace p lenum [ M ]. New York: Plenum Trade, 1997: 37239. [ 2 ] SM ITH J B. Collective intelligence in computer2based col2 ·120· 智 能 系 统 学 报 第 4卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有