正在加载图片...
·268· 智能系统学报 第11卷 的。在判断某些相似驻点区域是否为用户工作区域 通过式(3)~(6)可线性的将用户所在城市和 的主要依据是用户进入到达该驻点的时间序列是否 所选通勤工具映射为用户经济条件指数,依据通勤 可以收敛到一个或几个时间点上,若可以找到进入 工具类型可将用户的收入分为3个等级并核算成数 驻点时间一定或偏差不大且驻点特征向量相似的驻 值,并采用各地平均收入作为区域计算的因子更恰 点,则此驻点区域可认为是用户工作区域,此驻点特 当地表明不同城市间的收入差。用户经济条件指数 征向量包含用户的工作信息。 相关信息的实例关系如表1所示。 表1城市收入与通勤工具 2用户社会行为数据的相似度比较 Table 1 Urban income and vehicle 基于用户社会行为数据的相似度用于衡量用户 城市 平均收入/ 通勤工具 对应城市或地区 工作职业和工作环境等与用户职场活动相关的信 等级 元/月 比例系数 息,包含用户工作时间、城市、工作类型、通勤工具使 一线城市,如北京、上海、 6000左右 18:39:43 用情况等,通过对这些信息的处理从用户经济条件 广州、深圳、南京等 工作类型、工作压力等方面对用户进行建模,进而通 二线城市,如宁波、福州、 4000左右 27:36:37 过相似度比较方法实现相似用户聚类。 厦门、长沙、大连等 1)用户经济条件 三线城市,如海口、佛山、 3000左右 24:40:36 用户经济条件主要依赖于用户的收入和支 泉州、东莞、南宁等 出,可以间接通过用户所在城市和用户乘坐通勤 4 四线城市,如唐山,素皇岛、2000左右 16:45:39 工具的情况进行分析,通过城市的平均收入可以 邯郸、保定、廊坊等 简单区分用户的收入等级:文献[13-14]指出在 5 其他城市 1200左右 8:52:40 城市中若弱化用户住所与用单位间距离影响,用 2)用户工作类型 户的平均收入情况与用户通勤所选用的交通工 用户工作类型可由用户工作区域驻点的特征向 具情况服从线性分布,因此考察用户乘坐通勤工 量中处理得到。由于城市建设规划时常将功能相近 具可以进一步地划分用户收入的等级,使得用户 的建筑建于相近区域中,如商业区、居民区、工业区 收入等级明确化。通过国内近5年的国内城市 等,因此实际处理而得的特征向量所包含的具有信 收入排名统计,将用户按照所在城市的不同进行 息点较多的POI类型,其功能类型往往是相同或相 收入的划分,进而使得不同城市间用户的收入情 互辅助的关系,其反映到现实生活中的结果就是在 况得以比较。通过城市中乘坐不同通勤工具的 此工作的人群具有相似的工作习惯和作息时间,即 人口比例进一步对收入进行划分,并最终计算出 同一工作类型。用户驻点区域特征向量的趋势向量 用户的经济条件指数。其计算公式为 POI类型总体概括如表2所示。 表2工作类型与平均工作时长 Ueci=100 -x Vrype (3) Table 2 Type of work and average hours worked 工作类型 式中:A,为平均收入,通勤工具比例系数根据 POI类型 平均工作时长/h 医疗,维修服务 应急服务业 9 用户乘坐通勤工具可分为以下3种类型: ①私家车或公务轿车: 餐饮、汽车服务、生活服务、 普通服务业 8.5 购物、休闲娱乐、旅游景点 Vr 2 +r2+r3 行政地标、政府机构 政府机关 8 :=听,+2+V 公司企业、金融 企业 10 ②单位通勤车: 工厂 工厂 Vr2 教育 教育 7 2 +Vr3 3)用户加班时长 Vrow:=Vr+Vr2 Vrs (5) 用户加班时长等于平均工作时长除以城市平均 ③公共交通工具或步行: 工作时长,将用户的工作时长与该城市的平均工作 Vr 时长或该用户所在工作类型的平均工作时长作比 2 较,可计算出用户每天加班情况,这在一定程度上反 Vror =Vr Vr2 Vrs (6 映出用户的工作压力。用户加班时长与用户加班指的。 在判断某些相似驻点区域是否为用户工作区域 的主要依据是用户进入到达该驻点的时间序列是否 可以收敛到一个或几个时间点上,若可以找到进入 驻点时间一定或偏差不大且驻点特征向量相似的驻 点,则此驻点区域可认为是用户工作区域,此驻点特 征向量包含用户的工作信息。 2 用户社会行为数据的相似度比较 基于用户社会行为数据的相似度用于衡量用户 工作职业和工作环境等与用户职场活动相关的信 息,包含用户工作时间、城市、工作类型、通勤工具使 用情况等,通过对这些信息的处理从用户经济条件、 工作类型、工作压力等方面对用户进行建模,进而通 过相似度比较方法实现相似用户聚类。 1)用户经济条件 用户经济条件主要依赖于用户的收入和支 出,可以间接通过用户所在城市和用户乘坐通勤 工具的情况进行分析,通过城市的平均收入可以 简单区分用户的收入等级;文献[ 13⁃14] 指出在 城市中若弱化用户住所与用单位间距离影响,用 户的平均收入情况与用户通勤所选用的交通工 具情况服从线性分布,因此考察用户乘坐通勤工 具可以进一步地划分用户收入的等级,使得用户 收入等级明确化。 通过国内近 5 年的国内城市 收入排名统计,将用户按照所在城市的不同进行 收入的划分,进而使得不同城市间用户的收入情 况得以比较。 通过城市中乘坐不同通勤工具的 人口比例进一步对收入进行划分,并最终计算出 用户的经济条件指数。 其计算公式为 Ueci = Ai 1 000 × Vrtypei (3) 式中:Ai为平均收入, 通勤工具比例系数 Vrtypei 根据 用户乘坐通勤工具可分为以下 3 种类型: ①私家车或公务轿车: Vrtype1 = Vr1 2 + Vr2 + Vr3 Vr1 + Vr2 + Vr3 (4) ②单位通勤车: Vrtype2 = Vr2 2 + Vr3 Vr1 + Vr2 + Vr3 (5) ③公共交通工具或步行: Vrtype3 = Vr3 2 Vr1 + Vr2 + Vr3 (6) 通过式(3) ~ (6) 可线性的将用户所在城市和 所选通勤工具映射为用户经济条件指数,依据通勤 工具类型可将用户的收入分为 3 个等级并核算成数 值,并采用各地平均收入作为区域计算的因子更恰 当地表明不同城市间的收入差。 用户经济条件指数 相关信息的实例关系如表 1 所示。 表 1 城市收入与通勤工具 Table 1 Urban income and vehicle 城市 等级 对应城市或地区 平均收入/ 元/ 月 通勤工具 比例系数 1 一线城市,如北京、上海、 广州、深圳、南京等 6 000 左右 18 ∶ 39 ∶ 43 2 二线城市,如宁波、福州、 厦门、长沙、大连等 4 000 左右 27 ∶ 36 ∶ 37 3 三线城市,如海口、佛山、 泉州、东莞、南宁等 3 000 左右 24 ∶ 40 ∶ 36 4 四线城市,如唐山、秦皇岛、 邯郸、保定、廊坊等 2 000 左右 16 ∶ 45 ∶ 39 5 其他城市 1 200 左右 8 ∶ 52 ∶ 40 2)用户工作类型 用户工作类型可由用户工作区域驻点的特征向 量中处理得到。 由于城市建设规划时常将功能相近 的建筑建于相近区域中,如商业区、居民区、工业区 等,因此实际处理而得的特征向量所包含的具有信 息点较多的 POI 类型,其功能类型往往是相同或相 互辅助的关系,其反映到现实生活中的结果就是在 此工作的人群具有相似的工作习惯和作息时间,即 同一工作类型。 用户驻点区域特征向量的趋势向量 POI 类型总体概括如表 2 所示。 表 2 工作类型与平均工作时长 Table 2 Type of work and average hours worked POI 类型 工作类型 平均工作时长/ h 医疗、维修服务 应急服务业 9 餐饮、汽车服务、生活服务、 购物、休闲娱乐、旅游景点 普通服务业 8.5 行政地标、政府机构 政府机关 8 公司企业、金融 企业 10 工厂 工厂 8 教育 教育 7 3)用户加班时长 用户加班时长等于平均工作时长除以城市平均 工作时长,将用户的工作时长与该城市的平均工作 时长或该用户所在工作类型的平均工作时长作比 较,可计算出用户每天加班情况,这在一定程度上反 映出用户的工作压力。 用户加班时长与用户加班指 ·268· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有