正在加载图片...
第6期 王超,等搜索引擎点击模型综述 .715. 图6左侧为不含垂直结果的页面,右侧为包含 检验顺序是顺着搜索结果列表的结果序列自上而下 多媒体垂直结果的页面,热度图越暖色表示用户的 浏览搜索结果并在浏览每个搜索结果的同时决定是 视觉注视越多。可以看到,当多媒体垂直结果加入 否点击。而宽度优先策略则是另一种类型,它描述 页面后,用户的视线被很大程度吸引,从而不再像左 用户在点击搜索结果之前会预先检验一系列的搜索 图一样自上而下递减分布。 结果,然后再在其中选择自己最中意的若干结果点 Wang等]针对用户的浏览行为变化进行了深 击。由于根据深度优先假设,用户点击时受到的很 入的分析,最终总结了4个用户行为偏置假设: 重要的位置偏执影响能够很容易被模型所考虑进 1)吸引力偏置假设:如果有一个垂直结果在搜 去,因此大多数的点击模型3-1]都遵从深度优先假 索结果页面中出现,那么用户有一定的概率首先检 设,也就是用户自上而下浏览一遍搜索结果列表。 验该垂直结果。 2)全局影响偏置假设:如果有一个垂直结果在 开始 搜索结果页面中出现,并且用户首先检验了该垂直 N 结果,那么用户会对整个页面有一个全局印象,该印 包含垂直结果? 象会使得用户对普通搜索结果的检验和点击偏好产 Y 生影响。 直接检验垂直结果? 3)首位偏置影响假设:如果有一个垂直结果在 (吸引力俯置) 1-o1.I 搜索结果页面中出现,并且该垂直结果被排在了第 Y ,叫4 1位,那么用户就可能会更多地点击该垂直结果而 设置0,和B 较少点击其他结果。 (全局影响偏置和首位偏置)》 4)浏览顺序偏置影响假设:如果有一个垂直结 果在搜索结果页面中出现,并且用户首先检验了该 之前的结果检验是从 N 垂直结果,那么用户会在接下来回看垂直结果之前 底至上?(浏览顺序 偏置) 1-ot1 的搜索结果,回看的路径或者回到顶端自上而下浏 Y at1 览,或者沿着自下而上的顺序反序浏览。 改变检验顺序 相应的点击模型描述为 P(C:=11E:=0)=0 参数估计 P(C,=1IE=1)=P(A:=1IE=1) P(F=1)=94 图7VCM模型流程 P(E:=1lF=0,C1i-i)=y,i-4 Fig.7 Graphical representation of the vertical click model P(E=11F=1,C1-1)=Y,i-4+8 然而,眼动视线追踪实验研究表明,仅有 P(A=11E:=1,F=0)=ag.i 34%的搜索用户的浏览序列是顺序(自上而下)的, P(4,=11E:=1,F=1)=a.i+B 而有50%以上的查询会话中用户会发生回访行为 P(B=1IF=0)=0 (自下而上的浏览搜索结果)或者略过的行为。因 P(B=11F=1)=04 此研究人员有必要对用户的非顺序浏览(点击和检 其描述的用户浏览行为决策过程可以用图7表 验)行为进行研究。 示。用户在开始浏览时,他会有一定的机率决定是 3.1TCM模型 否首先去检验垂直结果,如果首先检验了垂直结果, Xu等最先提出了名为temporal click model 那么用户会继续约定是否回到页面顶端自上而下浏 (TCM)[20]的模型在广告搜索中描述用户的点击行 览,亦或是自下而上反序浏览。 为。这个模型尝试将所有可能的检验序列全部计算 3基于点击顺序的点击模型 出现概率,因此只能描述仅包含两个结果(广告)的 页面,所描述的非顺序点击行为为:用户首先点击了 已有的眼动追踪实验研究工作1)表明,搜索引 第2个搜索结果,然后再点击了第1个搜索结果。 擎用户的浏览习惯可以分为两种类型:深度优先策 因此这个工作很难像其他点击模型一样扩展到描述 略和宽度优先策略。其中深度优先策略描述用户的 整个搜索结果列表。图 6 左侧为不含垂直结果的页面,右侧为包含 多媒体垂直结果的页面,热度图越暖色表示用户的 视觉注视越多。 可以看到,当多媒体垂直结果加入 页面后,用户的视线被很大程度吸引,从而不再像左 图一样自上而下递减分布。 Wang 等[11]针对用户的浏览行为变化进行了深 入的分析,最终总结了 4 个用户行为偏置假设: 1)吸引力偏置假设:如果有一个垂直结果在搜 索结果页面中出现,那么用户有一定的概率首先检 验该垂直结果。 2)全局影响偏置假设:如果有一个垂直结果在 搜索结果页面中出现,并且用户首先检验了该垂直 结果,那么用户会对整个页面有一个全局印象,该印 象会使得用户对普通搜索结果的检验和点击偏好产 生影响。 3)首位偏置影响假设:如果有一个垂直结果在 搜索结果页面中出现,并且该垂直结果被排在了第 1 位,那么用户就可能会更多地点击该垂直结果而 较少点击其他结果。 4)浏览顺序偏置影响假设:如果有一个垂直结 果在搜索结果页面中出现,并且用户首先检验了该 垂直结果,那么用户会在接下来回看垂直结果之前 的搜索结果,回看的路径或者回到顶端自上而下浏 览,或者沿着自下而上的顺序反序浏览。 相应的点击模型描述为 P Ci = 1 | Ei ( = 0) = 0 P Ci = 1 | Ei ( = 1) = P(Ai = 1 | Ei = 1) P(F = 1) = φtv ,lv P Ei = 1 | F = 0,C1:i-1 ( ) = γi,i-l i P Ei = 1 | F = 1,C1:i-1 ( ) = γi,i-l i + θq,i P Ai = 1 | Ei ( = 1,F = 0) = αq,i P Ai = 1 | Ei ( = 1,F = 1) = αq,i + βq,i P(B = 1 | F = 0) = 0 P(B = 1 | F = 1) = σtv ,lv 其描述的用户浏览行为决策过程可以用图 7 表 示。 用户在开始浏览时,他会有一定的机率决定是 否首先去检验垂直结果,如果首先检验了垂直结果, 那么用户会继续约定是否回到页面顶端自上而下浏 览,亦或是自下而上反序浏览。 3 基于点击顺序的点击模型 已有的眼动追踪实验研究工作[18] 表明,搜索引 擎用户的浏览习惯可以分为两种类型:深度优先策 略和宽度优先策略。 其中深度优先策略描述用户的 检验顺序是顺着搜索结果列表的结果序列自上而下 浏览搜索结果并在浏览每个搜索结果的同时决定是 否点击。 而宽度优先策略则是另一种类型,它描述 用户在点击搜索结果之前会预先检验一系列的搜索 结果,然后再在其中选择自己最中意的若干结果点 击。 由于根据深度优先假设,用户点击时受到的很 重要的位置偏执影响能够很容易被模型所考虑进 去,因此大多数的点击模型[13-15]都遵从深度优先假 设,也就是用户自上而下浏览一遍搜索结果列表。 图 7 VCM 模型流程 Fig.7 Graphical representation of the vertical click model 然而,眼动视线追踪实验研究[19] 表明,仅有 34%的搜索用户的浏览序列是顺序(自上而下)的, 而有 50%以上的查询会话中用户会发生回访行为 (自下而上的浏览搜索结果)或者略过的行为。 因 此研究人员有必要对用户的非顺序浏览(点击和检 验)行为进行研究。 3.1 TCM 模型 Xu 等 最 先 提 出 了 名 为 temporal click model (TCM) [20]的模型在广告搜索中描述用户的点击行 为。 这个模型尝试将所有可能的检验序列全部计算 出现概率,因此只能描述仅包含两个结果(广告)的 页面,所描述的非顺序点击行为为:用户首先点击了 第 2 个搜索结果,然后再点击了第 1 个搜索结果。 因此这个工作很难像其他点击模型一样扩展到描述 整个搜索结果列表。 第 6 期 王超,等 搜索引擎点击模型综述 ·715·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有