正在加载图片...
第2期 孟祥福,等:用户-兴趣点耦合关系的兴趣点推荐方法 ·231· 3兴趣点推荐模型 将转移到2)。 5)输出兴趣点聚类结果。 3.1基于K-means算法的兴趣点聚类 表1给出了兴趣点y、2、V3、v4、的位置信 基于K-means算法的兴趣点聚类的基本思想 息以及文本信息。假设需要将这5个兴趣点聚 是:首先,从兴趣点集合中随机选取k个兴趣点作 为3类,首先随机选取1、2、”作为聚类中心,通 为初始的聚类中心;然后,计算每个兴趣点与各 过计算得到",到v1、v2、v;的欧氏距离分别为 个聚类中心之间的距离,把每个兴趣点分配给距 17227.7813458、3553977.1449、13387365.1776m, 离它最近的聚类中心,聚类中心以及分配给它们 4到y、2、的欧氏距离分别为3385341.32216 的兴趣点就代表一个聚类,每个聚类的聚类中心 153131.43474、10085102.6055m,所以将1、 根据聚类中现有的兴趣点被重新计算;上述过程 聚为一类,2、4聚为一类,单独成为一类。然 将不断重复直到满足K-means聚类的终止条件。 后选取每个类的中心点为新的聚类中心,即 基于K-means算法的兴趣点聚类的处理过程 (33.42779653,-112.0469545)、(40.70560995, 如下: -80.79029485)、y5,计算得到y1到这3个新的聚 1)从兴趣点集合中随机选择k个兴趣点作为 类中心的距离为8611.09374163、3461882.26176、 初始聚类中心。 13370426.0996m,v2为3546225.50702、 2)计算剩余兴趣点到聚类中心的欧式距离 76593.7902972、9936164.7972m,为8616.70478923、 P,将最接近的兴趣点放入类别中,形成新的类,p 3477389.38685、13387365.1776m,4为3393095.48784 的计算方法为 76541.5024509、10085102.6055m,得到新的聚 p=Vlat-lat)》'+on,-lon)月 (1) 类,即、v聚为一类,2、y4聚为一类,单独成 其中,,a=(lat.lon)和ya=(lat,lon)是兴趣点数据 为一类,可以看出聚类没有发生变化,则聚类中心 集={y,y2,vn}中的两个兴趣点。 还为(33.42779653,-112.0469545)、(40.70560995, 3)取当前聚类中所有兴趣点经纬度的均值作 -80.79029485)、,由于聚类中心未发生变化,则 为新的中心点,更新距离聚类中心最近的兴趣点。 聚类过程终止。根据聚类情况,每个兴趣点都可 4)直到目标函数收敛或聚类中心不变,否则 以分配一个所属聚类的类标签。 表1兴趣点信息 Table 1 The information of POIs 兴趣点 地理信息 文本信息 (33.3306902,-111.9785992) City:Ahwatukee:State:AZ (40.2916853,-80.1048999) City:McMcrray;State:PA (33.5249025,-112.1153098) City:Phoenix;State:AZ V4 (41.1195346,-81.4756898) City:Cuyahoga Falls:State:OH Vs (48.7272000,9.14795000) City:Stuttgart:State:BW 3.2兴趣点推荐模型的构建 不同类型的用户/兴趣点的属性信息通常采用不 3.2.1用户-兴趣,点的显式关联关系评估 同的嵌入方式。 基于用户-兴趣点耦合关系的兴趣点推荐模 用户或兴趣点属性信息的嵌入方式如图1所 型由局部和全局的用户-兴趣点显式关联关系以 示。对于兴趣点,需要将其位置信息和文本信息 及用户-兴趣点隐式关联关系集成到一个全连接 进行集成嵌人,位置信息是基于K-means算法的 网络构成。 兴趣点聚类结果,兴趣点属于聚类结果中的哪一 用户的文本信息和兴趣点的位置信息、文本 类则该位置为1,其余位置为0。文本信息做同样 信息分别作为各自的属性信息,通过一个卷积神 处理,例如,对于表1中的兴趣点y1,使用3.1节 经网络模型学习用户-兴趣点的显式关联关系。 中的兴趣点聚类结果,结合表1中的文本信息, 首先,将用户和兴趣点的属性信息分别嵌入到向 则y1的嵌入向量为[1,0,0,1,0,0,0,0,1,0,0,01,此向量 量ue={ue1,uc2,…,4em}和ve={vel,Ve2,…,yen}中, 的前3维为地理信息的聚类结果;依据顺序嵌入 u(ve)是u(v)中的第i个元素。在实际应用中, 向量中的第一维为聚类结果中的第一类,第二维3 兴趣点推荐模型 3.1 基于 K-means 算法的兴趣点聚类 基于 K-means 算法的兴趣点聚类的基本思想 是:首先,从兴趣点集合中随机选取 k 个兴趣点作 为初始的聚类中心;然后,计算每个兴趣点与各 个聚类中心之间的距离,把每个兴趣点分配给距 离它最近的聚类中心,聚类中心以及分配给它们 的兴趣点就代表一个聚类,每个聚类的聚类中心 根据聚类中现有的兴趣点被重新计算;上述过程 将不断重复直到满足 K-means 聚类的终止条件。 基于 K-means 算法的兴趣点聚类的处理过程 如下: 1) 从兴趣点集合中随机选择 k 个兴趣点作为 初始聚类中心。 ρ ρ 2) 计算剩余兴趣点到聚类中心的欧式距离 ,将最接近的兴趣点放入类别中,形成新的类, 的计算方法为 ρ = √( lati −latj )2 + ( loni −lonj )2 (1) 其中,vi.λ=(lati ,loni ) 和 vj.λ=(latj ,lonj ) 是兴趣点数据 集 V={v1 ,v2 ,…,vn}中的两个兴趣点。 3) 取当前聚类中所有兴趣点经纬度的均值作 为新的中心点,更新距离聚类中心最近的兴趣点。 4) 直到目标函数收敛或聚类中心不变,否则 将转移到 2)。 5) 输出兴趣点聚类结果。 表 1 给出了兴趣点 v1、v2、v3、v4、v5 的位置信 息以及文本信息。假设需要将这 5 个兴趣点聚 为 3 类,首先随机选取 v1、v2、v5 作为聚类中心,通 过计算得到 v 3 到 v 1、v 2、v 5 的欧氏距离分别为 17 227.781 345 8、3 553 977.144 9、13 387 365.177 6 m, v4 到 v1、v2、v5 的欧氏距离分别为 3 385 341.322 16、 153 131.434 74、10 085 102.605 5 m,所以将 v1、v3 聚为一类,v2、v4 聚为一类,v5 单独成为一类。然 后选取每个类的中心点为新的聚类中心,即 (33.427 796 53,−112.046 954 5)、(40.705 609 95, −80.790 294 85)、v5,计算得到 v1 到这 3 个新的聚 类中心的距离为 8 611.093 741 63、3 461 882.261 76、 13 370 426.099 6 m, v 2 为 3 546 225.507 02、 76 593.790 297 2、9 936 164.797 2 m,v3为 8 616.704 789 23、 3 477 389.386 85、13 387 365.177 6 m,v4 为 3 393 095.487 84、 76 541.502 450 9、10 085 102.605 5 m,得到新的聚 类,即 v1、v3 聚为一类,v2、v4 聚为一类,v5 单独成 为一类,可以看出聚类没有发生变化,则聚类中心 还为 (33.427 796 53,−112.046 954 5)、(40.705 609 95, −80.790 294 85)、v5,由于聚类中心未发生变化,则 聚类过程终止。根据聚类情况,每个兴趣点都可 以分配一个所属聚类的类标签。 表 1 兴趣点信息 Table 1 The information of POIs 兴趣点 地理信息 文本信息 v1 (33.330 6902,−111.978 5992) City:Ahwatukee;State:AZ v2 (40.291 6853,−80.104 8999) City:McMcrray;State:PA v3 (33.524 9025,−112.115 3098) City:Phoenix;State:AZ v4 (41.119 5346,−81.475 6898) City:Cuyahoga Falls;State:OH v5 (48.727200 0,9.147950 00) City:Stuttgart;State:BW 3.2 兴趣点推荐模型的构建 3.2.1 用户−兴趣点的显式关联关系评估 基于用户−兴趣点耦合关系的兴趣点推荐模 型由局部和全局的用户−兴趣点显式关联关系以 及用户−兴趣点隐式关联关系集成到一个全连接 网络构成。 用户的文本信息和兴趣点的位置信息、文本 信息分别作为各自的属性信息,通过一个卷积神 经网络模型学习用户−兴趣点的显式关联关系。 首先,将用户和兴趣点的属性信息分别嵌入到向 量 uc={uc 1 ,uc 2 ,…,uc m }和 vc={vc 1 ,vc 2 ,…,vc n }中 , uci(vci) 是 uc (vc ) 中的第 i 个元素。在实际应用中, 不同类型的用户/兴趣点的属性信息通常采用不 同的嵌入方式。 用户或兴趣点属性信息的嵌入方式如图 1 所 示。对于兴趣点,需要将其位置信息和文本信息 进行集成嵌入,位置信息是基于 K-means 算法的 兴趣点聚类结果,兴趣点属于聚类结果中的哪一 类则该位置为 1,其余位置为 0。文本信息做同样 处理,例如,对于表 1 中的兴趣点 v1,使用 3.1 节 中的兴趣点聚类结果,结合表 1 中的文本信息, 则 v1 的嵌入向量为 [1,0,0,1,0,0,0,0,1,0,0,0],此向量 的前 3 维为地理信息的聚类结果;依据顺序嵌入 向量中的第一维为聚类结果中的第一类,第二维 第 2 期 孟祥福,等:用户−兴趣点耦合关系的兴趣点推荐方法 ·231·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有