3 兴趣点推荐模型 3.1 基于 K-means 算法的兴趣点聚类基于

正在加载图片...

第2期孟祥福，等：用户-兴趣点耦合关系的兴趣点推荐方法 ·231· 3兴趣点推荐模型将转移到2)。 5)输出兴趣点聚类结果。 3.1基于K-means算法的兴趣点聚类表1给出了兴趣点y、2、V3、v4、的位置信基于K-means算法的兴趣点聚类的基本思想息以及文本信息。假设需要将这5个兴趣点聚是：首先，从兴趣点集合中随机选取k个兴趣点作为3类，首先随机选取1、2、”作为聚类中心，通为初始的聚类中心；然后，计算每个兴趣点与各过计算得到"，到v1、v2、v;的欧氏距离分别为个聚类中心之间的距离，把每个兴趣点分配给距 17227.7813458、3553977.1449、13387365.1776m, 离它最近的聚类中心，聚类中心以及分配给它们 4到y、2、的欧氏距离分别为3385341.32216 的兴趣点就代表一个聚类，每个聚类的聚类中心 153131.43474、10085102.6055m,所以将1、根据聚类中现有的兴趣点被重新计算；上述过程聚为一类，2、4聚为一类，单独成为一类。然将不断重复直到满足K-means聚类的终止条件。后选取每个类的中心点为新的聚类中心，即基于K-means算法的兴趣点聚类的处理过程 (33.42779653,-112.0469545)、(40.70560995, 如下： -80.79029485)、y5,计算得到y1到这3个新的聚 1)从兴趣点集合中随机选择k个兴趣点作为类中心的距离为8611.09374163、3461882.26176、初始聚类中心。 13370426.0996m,v2为3546225.50702、 2)计算剩余兴趣点到聚类中心的欧式距离 76593.7902972、9936164.7972m,为8616.70478923、 P,将最接近的兴趣点放入类别中，形成新的类，p 3477389.38685、13387365.1776m,4为3393095.48784 的计算方法为 76541.5024509、10085102.6055m,得到新的聚 p=Vlat-lat)》'+on,-lon)月 (1) 类，即、v聚为一类，2、y4聚为一类，单独成其中，，a=(lat.lon)和ya=(lat,lon)是兴趣点数据为一类，可以看出聚类没有发生变化，则聚类中心集={y,y2,vn}中的两个兴趣点。还为(33.42779653，-112.0469545)、(40.70560995， 3)取当前聚类中所有兴趣点经纬度的均值作 -80.79029485)、,由于聚类中心未发生变化，则为新的中心点，更新距离聚类中心最近的兴趣点。聚类过程终止。根据聚类情况，每个兴趣点都可 4)直到目标函数收敛或聚类中心不变，否则以分配一个所属聚类的类标签。表1兴趣点信息 Table 1 The information of POIs 兴趣点地理信息文本信息 (33.3306902,-111.9785992) City:Ahwatukee:State:AZ (40.2916853,-80.1048999) City:McMcrray;State:PA (33.5249025,-112.1153098) City:Phoenix;State:AZ V4 (41.1195346,-81.4756898) City:Cuyahoga Falls:State:OH Vs (48.7272000,9.14795000) City:Stuttgart:State:BW 3.2兴趣点推荐模型的构建不同类型的用户/兴趣点的属性信息通常采用不 3.2.1用户-兴趣，点的显式关联关系评估同的嵌入方式。基于用户-兴趣点耦合关系的兴趣点推荐模用户或兴趣点属性信息的嵌入方式如图1所型由局部和全局的用户-兴趣点显式关联关系以示。对于兴趣点，需要将其位置信息和文本信息及用户-兴趣点隐式关联关系集成到一个全连接进行集成嵌人，位置信息是基于K-means算法的网络构成。兴趣点聚类结果，兴趣点属于聚类结果中的哪一用户的文本信息和兴趣点的位置信息、文本类则该位置为1，其余位置为0。文本信息做同样信息分别作为各自的属性信息，通过一个卷积神处理，例如，对于表1中的兴趣点y1,使用3.1节经网络模型学习用户-兴趣点的显式关联关系。中的兴趣点聚类结果，结合表1中的文本信息，首先，将用户和兴趣点的属性信息分别嵌入到向则y1的嵌入向量为[1,0,0,1,0,0,0,0,1,0,0,01，此向量量ue={ue1,uc2,…,4em}和ve={vel,Ve2,…,yen}中，的前3维为地理信息的聚类结果；依据顺序嵌入 u(ve)是u(v)中的第i个元素。在实际应用中，向量中的第一维为聚类结果中的第一类，第二维3 兴趣点推荐模型 3.1 基于 K-means 算法的兴趣点聚类基于 K-means 算法的兴趣点聚类的基本思想是：首先，从兴趣点集合中随机选取 k 个兴趣点作为初始的聚类中心；然后，计算每个兴趣点与各个聚类中心之间的距离，把每个兴趣点分配给距离它最近的聚类中心，聚类中心以及分配给它们的兴趣点就代表一个聚类，每个聚类的聚类中心根据聚类中现有的兴趣点被重新计算；上述过程将不断重复直到满足 K-means 聚类的终止条件。基于 K-means 算法的兴趣点聚类的处理过程如下: 1) 从兴趣点集合中随机选择 k 个兴趣点作为初始聚类中心。 ρ ρ 2) 计算剩余兴趣点到聚类中心的欧式距离，将最接近的兴趣点放入类别中，形成新的类，的计算方法为 ρ = √( lati −latj )2 + ( loni −lonj )2 (1) 其中，vi.λ=(lati ,loni ) 和 vj.λ=(latj ,lonj ) 是兴趣点数据集 V={v1 ,v2 ,…,vn}中的两个兴趣点。 3) 取当前聚类中所有兴趣点经纬度的均值作为新的中心点，更新距离聚类中心最近的兴趣点。 4) 直到目标函数收敛或聚类中心不变，否则将转移到 2)。 5) 输出兴趣点聚类结果。表 1 给出了兴趣点 v1、v2、v3、v4、v5 的位置信息以及文本信息。假设需要将这 5 个兴趣点聚为 3 类，首先随机选取 v1、v2、v5 作为聚类中心，通过计算得到 v 3 到 v 1、v 2、v 5 的欧氏距离分别为 17 227.781 345 8、3 553 977.144 9、13 387 365.177 6 m， v4 到 v1、v2、v5 的欧氏距离分别为 3 385 341.322 16、 153 131.434 74、10 085 102.605 5 m，所以将 v1、v3 聚为一类，v2、v4 聚为一类，v5 单独成为一类。然后选取每个类的中心点为新的聚类中心，即 (33.427 796 53，−112.046 954 5)、(40.705 609 95， −80.790 294 85)、v5，计算得到 v1 到这 3 个新的聚类中心的距离为 8 611.093 741 63、3 461 882.261 76、 13 370 426.099 6 m， v 2 为 3 546 225.507 02、 76 593.790 297 2、9 936 164.797 2 m，v3为 8 616.704 789 23、 3 477 389.386 85、13 387 365.177 6 m，v4 为 3 393 095.487 84、 76 541.502 450 9、10 085 102.605 5 m，得到新的聚类，即 v1、v3 聚为一类，v2、v4 聚为一类，v5 单独成为一类，可以看出聚类没有发生变化，则聚类中心还为 (33.427 796 53，−112.046 954 5)、(40.705 609 95， −80.790 294 85)、v5，由于聚类中心未发生变化，则聚类过程终止。根据聚类情况，每个兴趣点都可以分配一个所属聚类的类标签。表 1 兴趣点信息 Table 1 The information of POIs 兴趣点地理信息文本信息 v1 (33.330 6902,−111.978 5992) City:Ahwatukee;State:AZ v2 (40.291 6853,−80.104 8999) City:McMcrray;State:PA v3 (33.524 9025,−112.115 3098) City:Phoenix;State:AZ v4 (41.119 5346,−81.475 6898) City:Cuyahoga Falls;State:OH v5 (48.727200 0,9.147950 00) City:Stuttgart;State:BW 3.2 兴趣点推荐模型的构建 3.2.1 用户−兴趣点的显式关联关系评估基于用户−兴趣点耦合关系的兴趣点推荐模型由局部和全局的用户−兴趣点显式关联关系以及用户−兴趣点隐式关联关系集成到一个全连接网络构成。用户的文本信息和兴趣点的位置信息、文本信息分别作为各自的属性信息，通过一个卷积神经网络模型学习用户−兴趣点的显式关联关系。首先，将用户和兴趣点的属性信息分别嵌入到向量 uc={uc 1 ,uc 2 ,…,uc m }和 vc={vc 1 ,vc 2 ,…,vc n }中， uci(vci) 是 uc (vc ) 中的第 i 个元素。在实际应用中，不同类型的用户/兴趣点的属性信息通常采用不同的嵌入方式。用户或兴趣点属性信息的嵌入方式如图 1 所示。对于兴趣点，需要将其位置信息和文本信息进行集成嵌入，位置信息是基于 K-means 算法的兴趣点聚类结果，兴趣点属于聚类结果中的哪一类则该位置为 1，其余位置为 0。文本信息做同样处理，例如，对于表 1 中的兴趣点 v1，使用 3.1 节中的兴趣点聚类结果，结合表 1 中的文本信息，则 v1 的嵌入向量为 [1,0,0,1,0,0,0,0,1,0,0,0]，此向量的前 3 维为地理信息的聚类结果；依据顺序嵌入向量中的第一维为聚类结果中的第一类，第二维第 2 期孟祥福，等：用户−兴趣点耦合关系的兴趣点推荐方法 ·231·

<<向上翻页向下翻页>>

点击下载：【机器学习】用户-兴趣点耦合关系的兴趣点推荐方法