正在加载图片...
第6期 王超,等搜索引擎点击模型综述 ·713 除结果相关性影响之后这些结果对于用户的行为不 构成影响。 结果 结果4 上述两条假设成为了主流点击模型的基础假设, 因此本部分的相关工作介绍主要介绍这些点击模型 相关内容,其他的与之有所区别的点击模型会在本工 作与这些工作相关的章节进行介绍。 大多数的点击模型利用名为检验假设(examina- 图2级联模型示意图 tion hypothesis)[的用户行为假设来对用户的点击 Fig.2 Graphical representation of the cascade model 行为和其中蕴含的结果反馈之间的关联进行建模,其 (fragment)】 具体描述为给定一个查询词g和对应的搜索结果列 1.2DCM模型 表D=<d1,d2,…,d,…,du>通常为10,即页面中包 由级联模型的假设可知,该模型只能描述用户 含10条搜索结果。对于其中第i个结果d,该结果 仅有一次点击的搜索情况,而实际的用户行为中,用 是否被点击(C,=1)当且仅当这个结果被用户检验 户可能会发生多次点击,因此Guo等[]提出了de (E,=1),并且这个结果是一个相关的结果(A,=1), pendency click model(DCM)模型,该模型沿用了用 而相关与检验则是两个独立的变量。 户顺次向下检验的行为假设,同时假设当用户点击 C:=1→E=1,A=1 之后仍然有一定的概率继续下一步的浏览行为,其 E:=0→C:=0 浏览行为描述公式为 A,=0→C=0 P(E+1=11E:=1,C:=0)=1 根据以上假设,一个搜索结果被点击的概率可 P(E41=1IE:=1,C:=1)=入: 以用式(1)表示: 1.3UBM模型 P(C,=1)=P(E:=1)P(A.=1) (1) 接下来,Dupret等a提出了user browsing model 这样我们在知道用户的点击信息之后,通过推 (UBM)模型,如图3所示。他们通过实验研究发现 断用户的检验信息,就能推断出每个结果的真实相 用户检验某个位置的结果的概率不仅和当前该结果 关性信息。图1为检验假设的模型示意图。 所处的位置相关,同时还和该结果与用户上一次点 a 击的结果的距离有着非常重要的关联,因此他们的 模型假设: P(E:=1lC1t-1)=入,d Eu Au 式中::表示当前该结果的位置,而d:表示当前结 果和上次点击的结果的位置距离。 Cu Go-d 结果“ 结果u 图1检验假设示意图 Fig.1 Graphical representation of the examination hy- pothesis 图3UBM模型示意图 1.1级联模型 Fig.3 Graphical representation of the user browsing 级联模型[假设用户的浏览行为是沿着搜索 model (fragment) 结果列表从上到下依次检验的,当且仅当用户检验 1.4DBN模型 了某个结果并且该用户没有做出点击该结果的行 Chapelle等s提出了dynamic Bayesian network 为,该用户才会继续检验排在该结果后一位的搜索 (DBN)模型,如图4。该模型首次将用户的浏览过 结果。其模型的示意图如图2所示。针对该结果的 程中的满意度行为引入模型描述中。该模型假设用 公式为 户每点击一条结果之后都会有一定的满意度改变, P(E)=1 而一旦用户在某次点击之后达到了满意的程度,那 P(Et1=1IE:=1,C:)=1-C 么他/她就会停止检验后续的结果并结束这次查询: P(S:=11C:=1)=su除结果相关性影响之后这些结果对于用户的行为不 构成影响。 上述两条假设成为了主流点击模型的基础假设, 因此本部分的相关工作介绍主要介绍这些点击模型 相关内容,其他的与之有所区别的点击模型会在本工 作与这些工作相关的章节进行介绍。 大多数的点击模型利用名为检验假设(examina⁃ tion hypothesis) [9]的用户行为假设来对用户的点击 行为和其中蕴含的结果反馈之间的关联进行建模,其 具体描述为给定一个查询词 q 和对应的搜索结果列 表 D= <d1 ,d2 ,…,di,…,dM >通常为 10,即页面中包 含 10 条搜索结果。 对于其中第 i 个结果 di,该结果 是否被点击(Ci = 1)当且仅当这个结果被用户检验 (Ei = 1),并且这个结果是一个相关的结果(Ai = 1), 而相关与检验则是两个独立的变量。 Ci = 1 → Ei = 1,Ai = 1 Ei = 0 → Ci = 0 Ai = 0 → Ci = 0 根据以上假设,一个搜索结果被点击的概率可 以用式(1)表示: P(Ci = 1) = P Ei ( = 1) P Ai ( = 1) (1) 这样我们在知道用户的点击信息之后,通过推 断用户的检验信息,就能推断出每个结果的真实相 关性信息。 图 1 为检验假设的模型示意图。 图 1 检验假设示意图 Fig.1 Graphical representation of the examination hy⁃ pothesis 1.1 级联模型 级联模型[9] 假设用户的浏览行为是沿着搜索 结果列表从上到下依次检验的,当且仅当用户检验 了某个结果并且该用户没有做出点击该结果的行 为,该用户才会继续检验排在该结果后一位的搜索 结果。 其模型的示意图如图 2 所示。 针对该结果的 公式为 P E1 ( ) = 1 P(Ei+1 = 1 | Ei = 1,Ci) = 1 - Ci 图 2 级联模型示意图 Fig.2 Graphical representation of the cascade model (fragment) 1.2 DCM 模型 由级联模型的假设可知,该模型只能描述用户 仅有一次点击的搜索情况,而实际的用户行为中,用 户可能会发生多次点击,因此 Guo 等[13] 提出了 de⁃ pendency click model (DCM)模型,该模型沿用了用 户顺次向下检验的行为假设,同时假设当用户点击 之后仍然有一定的概率继续下一步的浏览行为,其 浏览行为描述公式为 P Ei+1 = 1 | Ei = 1,Ci ( = 0) = 1 P(Ei+1 = 1 | Ei = 1,Ci = 1) = λi 1.3 UBM 模型 接下来,Dupret 等[14]提出了 user browsing model (UBM)模型,如图 3 所示。 他们通过实验研究发现 用户检验某个位置的结果的概率不仅和当前该结果 所处的位置相关,同时还和该结果与用户上一次点 击的结果的距离有着非常重要的关联,因此他们的 模型假设: P(Ei = 1 | C1…i-1 ) = λr i ,di 式中: ri 表示当前该结果的位置,而 di 表示当前结 果和上次点击的结果的位置距离。 图 3 UBM 模型示意图 Fig.3 Graphical representation of the user browsing model (fragment) 1.4 DBN 模型 Chapelle 等[15]提出了 dynamic Bayesian network (DBN)模型,如图 4。 该模型首次将用户的浏览过 程中的满意度行为引入模型描述中。 该模型假设用 户每点击一条结果之后都会有一定的满意度改变, 而一旦用户在某次点击之后达到了满意的程度,那 么他/ 她就会停止检验后续的结果并结束这次查询: P(Si = 1 | Ci = 1) = su 第 6 期 王超,等 搜索引擎点击模型综述 ·713·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有