移动社交大数据 之 微信朋友圈数据集、 网络应用以及未来展望 姓名:李真晶 学号:SA19006031 参考论文:Zhang Y,LiZ,GaoC,etal.Mobile Social Big Data:WeChat Moments Dataset,Network Applications,and Opportunities[J].IEEE Network,2017,PP(99)
移动社交大数据 之 微信朋友圈数据集、 网络应用以及未来展望 参考论文:Zhang Y , Li Z , Gao C , et al. Mobile Social Big Data: WeChat Moments Dataset, Network Applications, and Opportunities[J]. IEEE Network, 2017, PP(99). 姓名:李真晶 学号:SA19006031
介绍 随着各种各样移动技术的高速发展,人们每时每刻都在产生大量新的社交 数据。无论是对政府、企业还是研究机构而言,利用好这些数据都是非常 重要的。 相比于基于web的社交网络,移动社交网络(MSN)有着更好的潜力与功 能。如MSN能够提供基于位置的服务、移动通信和增强现实等功能。 本文作者收集了一个微信朋友圈数据集一一WeChatNet,并分析了三个基 于WeChatNet的网络应用以及对未来的展望
介绍 随着各种各样移动技术的高速发展,人们每时每刻都在产生大量新的社交 数据。无论是对政府、企业还是研究机构而言,利用好这些数据都是非常 重要的。 相比于基于web的社交网络,移动社交网络(MSN)有着更好的潜力与功 能。如MSN能够提供基于位置的服务、移动通信和增强现实等功能。 本文作者收集了一个微信朋友圈数据集——WeChatNet,并分析了三个基 于WeChatNet的网络应用以及对未来的展望
主要内容 ·一、微信朋友圈数据集的收集 ·二、移动社交网络应用的分类 ·三、微信的新特性 ·四、基于数据分析下的网络应用 ·1、移动蜂窝网络下的信息传播 ·2、骨干网络流量预测 ·3、流动人口分布预测 ·五、未来展望
主要内容 • 一、微信朋友圈数据集的收集 • 二、移动社交网络应用的分类 • 三、微信的新特性 • 四、基于数据分析下的网络应用 • 1、移动蜂窝网络下的信息传播 • 2、骨干网络流量预测 • 3、流动人口分布预测 • 五、未来展望
微信朋友圈数据集的收集 使用FIBODATA获取微信页面的扩散轨迹。 2 18.3% 题 内容 分学 第3西 机 初始投放率道 达维人国送 暖童达到 19098 20234x 15层 1234 人过 3022 传播生命力 传播海发力
微信朋友圈数据集的收集 使用 FIBODATA 获取微信页面的扩散轨迹
·从2016年1月14号到2016年2月17号,总共收集了320,000个页面 传播轨迹,总共涉及到25,133,330名用户,246,369,415条转发记 录。 ·收集到的数据的格式为五元组(5-tuple)
• 从2016年1月14号到2016年2月17号,总共收集了 320,000 个页面 传播轨迹,总共涉及到 25,133,330 名用户,246,369,415 条转发记 录。 • 收集到的数据的格式为五元组(5-tuple)
U, 该用户的的帖子被看到 U2 该用户看了U1的帖子 PID 帖子的1D IP U2的1P地址 t 这个“浏览帖子”事件的发生时间
U1 ,U2 ,PID,IP,t U1 U2 PID IPt 该用户的的帖子被看到 该用户看了U1的帖子 帖子的ID U2的IP地址 这个“浏览帖子”事件的发生时间
Service category Service name Twitter Weibo Facebook WeChat WhatsApp Video sharing Twitter、weibo 主要作为社交 移动社交网络 Personal page Social networking 网络 Post search services Favorite post save × WhatsApp主要 Access to pages of non-friends n/a 是即时通信 Limit on of followers/friends No limit No limit 5000 5000 No limit (MSN )1 Facebook、 Video/audio chat WeChat Messenger services Group messaging 结合了 Sending location 社交网络和 应用的对比 Voice messaging 即时通信 Mobile payment Video games Miscellaneous services Offline services(taxi,ticket,etc) Shopping
移动社交网络(MSN )应用的对比 Twitter 、weibo 主要作为社交 网络 WhatsApp 主要 是即时通信 Facebook 、 WeChat 结合了 社交网络和 即时通信
微信朋友圈(WM)的新特性 ·1、拥有强社交关系一在朋友圈中禁止进入陌生人的主页 ·2、选定内容显示一一私密内容只会展示给选中的朋友 ·3、群聊一一一种接触陌生人的方法
微信朋友圈(WM)的新特性 • 1、拥有强社交关系——在朋友圈中禁止进入陌生人的主页 • 2、选定内容显示——私密内容只会展示给选中的朋友 • 3、群聊——一种接触陌生人的方法
移动蜂窝网络下的信息传播 ·1、移动蜂窝网络中影响力最大的用户 =》移动社交网络中关键的意见领袖(KOLs, 拥有大量的朋 友或跟随者),他们能够有效地促进网络营销/广告传播等。 ·2、在WM中,选取KOL面临的挑战 ·有最大朋友数量的限制,一个名人或许在微信中也只有几百个朋 友
移动蜂窝网络下的信息传播 • 1、移动蜂窝网络中影响力最大的用户 • =》 移动社交网络中关键的意见领袖(KOLs,拥有大量的朋 友或跟随者),他们能够有效地促进网络营销/广告传播等。 • 2、在WM中,选取KOL面临的挑战 • 有最大朋友数量的限制,一个名人或许在微信中也只有几百个朋 友
基于投票的策略(voting-based strategy) ·通过分析用户对信息扩散过程中的局部贡献来选择关键的结点 (KOLs) (1)确定信息扩散过程中关键的扩散树 (2)在每一个扩散树中,后代结点可以为其父节点投票(微信 网页是从父节点传播到子节点) ·通过吉布斯采样(Gibbs Sampling)解决在WM中树的个数、结点 很多的情况
基于投票的策略(voting-based strategy) • 通过分析用户对信息扩散过程中的局部贡献来选择关键的结点 (KOLs) • (1)确定信息扩散过程中关键的扩散树 • (2)在每一个扩散树中,后代结点可以为其父节点投票(微信 网页是从父节点传播到子节点) • 通过吉布斯采样(Gibbs Sampling)解决在WM中树的个数、结点 很多的情况