正在加载图片...
.716 智能系统学报 第11卷 3.2P0M模型 相应的模型示意图如图9所示,点击行为首先 Wang等提出了名为partially observable Markov 根据时间信息记录为时间序列,接下来对于每一个 model(POM)[2的点击模型来描述用户的任意浏 点击对,根据局部检验线性假设,用户在点击对之间 览行为。POM模型将用户的检验事件当做一个部 是线性的浏览行为,因此可以用一个基于位置点击 分可观测的随机过程来进行描述。其流程示意图如 模型的子模块来描述这个点击对之间的用户浏览行 图8所示,对于一个可以观测的点击行为序列,该模 为。而由于用户可能会略过一些结果,因此点击对 型会试图寻找所有可能的检验序列并分别计算各种 之间的所有搜索结果并不是都被用户检验,而是需 检验序列的可能性。 要模型推断用户检验了哪些搜索结果。 观测O e 0 基于点击位置 (a)观测序列0 V:e 假设QVe, Vi-e S=0 S,=0 V=? S=0 基于点击序列 S=1 iS=1 2 4 图9PSCM模型流程示意图 (b)假设序列Q Fig.9 Graphical representation of the partially sequen- tial click model V=e V=e, 假设Qy,=e ,=e, s0=?s-0-? S0'=?1 S=0 4点击模型开源工具及数据集 52=1 S=1 3 由于点击模型具有很强的实用性,因此很多搜索 (c)假设序列Q2) 引擎公司都有部分模型的内部实现方案,而研究人员 图8POM模型流程示意图 也针对点击模型开发了一系列的开源工具实现: Fig.8 Graphical representation of the vertical click model 1)ClickModelProject https://github.com/varep- 尽管这个模型能够描述用户的非顺序检验行 silon/clickmodels)是一个基于Python的开源点击模 为,但模型仅考虑了用户在不同位置之间的检验跳 型项目,本文中介绍的DCM、UBM、DBN等模型在该 转概率(也就是说,不同用户,不同查询,不同搜索 开源项目中均有实现。 结果下用户的检验跳转行为是一致的),因此该模 2)PyClick https://github.com/markovi/Py- 型并不能针对具体的查询和结果给出点击概率预测 Click)是一个基于Python的开源点击模型项目,本 和结果相关性预测,并且难以在实际环境中应用,并 文中介绍的FCM、VCM等模型在该开源项目中均有 和已有的点击模型进行比较。 实现。 3.3PSCM模型 3)THUIRClick https://github.com/THUIR/ Wang等2]利用眼动视线追踪设备对用户的非 PSCMModel)是一个基于Python的开源点击模型项 顺序浏览行为进行了深入的分析,在总结了用户浏 目,本文中介绍的TCM、POM、PSCM等模型在该开 览行为的一般规律后提出了如下两个用户非顺序浏 源项目中均有实现。 览行为假设。 除了开源工具之外,业界搜索引擎公司也公布 1)局部检验线性假设:在两次点击之间,用户 了一批公开的搜索日志资源: 倾向于沿着点击方向检验结果而不再改变检验方 1)Yandex https://www.kaggle.com/c/yandex- 向,无论用户的点击方向是向上还是向下。 personalized--web-search-challenge)是一家俄文和英 2)非一阶检验假设:尽管用户在两次点击之间 文搜索引擎公司,其公布了2012年某一个月的搜索 的检验行为是局部线性有序的,但用户并不是一个 日志。 挨着一个检验搜索结果,而是会略过一些搜索结果。 2)Sogou (http://www.sogou.com/labs/dl/q-e3.2 POM 模型 Wang 等提出了名为 partially observable Markov model (POM) [21]的点击模型来描述用户的任意浏 览行为。 POM 模型将用户的检验事件当做一个部 分可观测的随机过程来进行描述。 其流程示意图如 图 8 所示,对于一个可以观测的点击行为序列,该模 型会试图寻找所有可能的检验序列并分别计算各种 检验序列的可能性。 (a) 观测序列 O (b)假设序列 Q1 (c)假设序列 Q2 ) 图 8 POM 模型流程示意图 Fig.8 Graphical representation of the vertical click model 尽管这个模型能够描述用户的非顺序检验行 为,但模型仅考虑了用户在不同位置之间的检验跳 转概率(也就是说,不同用户,不同查询,不同搜索 结果下用户的检验跳转行为是一致的),因此该模 型并不能针对具体的查询和结果给出点击概率预测 和结果相关性预测,并且难以在实际环境中应用,并 和已有的点击模型进行比较。 3.3 PSCM 模型 Wang 等[22]利用眼动视线追踪设备对用户的非 顺序浏览行为进行了深入的分析,在总结了用户浏 览行为的一般规律后提出了如下两个用户非顺序浏 览行为假设。 1)局部检验线性假设:在两次点击之间,用户 倾向于沿着点击方向检验结果而不再改变检验方 向,无论用户的点击方向是向上还是向下。 2)非一阶检验假设:尽管用户在两次点击之间 的检验行为是局部线性有序的,但用户并不是一个 挨着一个检验搜索结果,而是会略过一些搜索结果。 相应的模型示意图如图 9 所示,点击行为首先 根据时间信息记录为时间序列,接下来对于每一个 点击对,根据局部检验线性假设,用户在点击对之间 是线性的浏览行为,因此可以用一个基于位置点击 模型的子模块来描述这个点击对之间的用户浏览行 为。 而由于用户可能会略过一些结果,因此点击对 之间的所有搜索结果并不是都被用户检验,而是需 要模型推断用户检验了哪些搜索结果。 图 9 PSCM 模型流程示意图 Fig.9 Graphical representation of the partially sequen⁃ tial click model 4 点击模型开源工具及数据集 由于点击模型具有很强的实用性,因此很多搜索 引擎公司都有部分模型的内部实现方案,而研究人员 也针对点击模型开发了一系列的开源工具实现: 1)ClickModelProject (https: / / github.com / varep⁃ silon / clickmodels)是一个基于 Python 的开源点击模 型项目,本文中介绍的 DCM、UBM、DBN 等模型在该 开源项目中均有实现。 2 ) PyClick ( https: / / github. com / markovi / Py⁃ Click)是一个基于 Python 的开源点击模型项目,本 文中介绍的 FCM、VCM 等模型在该开源项目中均有 实现。 3 ) THUIRClick ( https: / / github. com / THUIR/ PSCMModel)是一个基于 Python 的开源点击模型项 目,本文中介绍的 TCM、POM、PSCM 等模型在该开 源项目中均有实现。 除了开源工具之外,业界搜索引擎公司也公布 了一批公开的搜索日志资源: 1) Yandex ( https: / / www. kaggle. com / c / yandex⁃ personalized⁃web⁃search⁃challenge) 是一家俄文和英 文搜索引擎公司,其公布了 2012 年某一个月的搜索 日志。 2) Sogou ( http: / / www.sogou. com / labs/ dl / q -e. ·716· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有