2011年08月20日 T经理世界·CEOC·第322期 14 及最佳的相关可用性 大数据能收变什么 刘琪/文 大数据也强调商业智能的重要性,但 此时的水晶石正站在一个临界点上,个大型的高清图像,别人需要100个小时, 它呈现出来的新特性,正试图超越商业营业额将由8亿元继续攀升,员工近3300水晶石却可以调动3倍以上的计算资源和 智能的范畴,从而开辟企业进行商业优人,经常要承接其他公司所无法拿下的大人员储备,在10个小时内完成。 化的新疆界 型订单。同时,一些新的业务模式也正被 “大数据融入企业越深,就越考验企 创造出来。比如,水晶石为万科、SOHO业的投资和储备能力,企业的级别将立判 时过年中,方凡对“幸福的烦恼”体中国等房地产企业打造在线房产服务,顾高下。”方凡甚至表示,视觉展示行业已经 会逾深。他是北京水晶石数字科技有限公客在网上浏览时,可以从各个角度考察房源,进入一个为大数据不断烧钱的阶段 司(下简称水晶石)的CO,重要的职责甚至可以自己动手进行DY模拟装修。 麦肯锡全球研究院对这样的趋势做了 就是为这个庞大的“视觉展示制造器”提 在方凡看来,水晶石能够成为行业翘专门研究,其发布的《大数据:创新、竟 供源源不断的计算支持。公司自2008年楚,多年来在大数据( Big Data)上积累争和生产率提高的前沿领域》报告称,大 北京奥运会一举成名后,包括上海世博会、的雄厚实力十分关键。视觉展示行业极度数据将大幅提升传统行业的运营效率,并 深圳大运会和伦敦奥运会在内的大型订单依赖数据,水晶石每年的数据量都要增长催生更多的新型业务应用和商业模式,而 相继而至,“生意最近好的不得了”,他也上百个PB,背后需要庞大的计算、存储和有效投资和利用大数据,已经成为了行业 成为了公司最忙碌的人之一。 网络能力的支撑。简单一点来说,渲染一领军者的制胜法宝 o1994-2012ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
T经理世界· CEOCIO·第322期 商业科技 BIZ TECH 多年来,有关海量数据的讨论已让人 审美疲劳,现在又提出大数据,究竟有何 不同?是否有炒作的嫌疑?一个有趣的现 象是,包括IBM、EMC、 Oracle、SAP 等跨国ⅣT巨头,咨询公司以及欧美企业 对大数据的讨论趋于热烈,剔除其中的炒 作成分,不乏有价值的技术解决方案和最 佳实践,而多位国内CO坦称也正在关注 大数据,但兴趣度不高,还远未到足以改 变企业商业形态的地步。 有不少人正在尝试勾勒大数据的面 貌,让其由模糊走向凊晰。IDC全球存储 及大数据硏究项目副总裁 Benjamin S Woo 直在研究大数据,他总结了大数据呈现 出来的4“V”特性,即 Volume(容量) Variety多样性) Velocity速度)Vale价结果的数据,比如可以将一个企业近 统利用SPSS统计分析软件建模的方式已 值简单一点说,大数据不仅仅是海量数的几乎所有财务、营销、市场等方面的数据经有些力不从心,而如果采用抽样统计分 据,它更为复杂,更追求数据处理的速度,一次性地保存在内存里,当企业需要做快析的方式,有些新的用户行为特征或业务 速的账务分析,或要对市场进行分析时,内趋势就会被忽略。 甲骨文大中华区技术总经理喻思成表存计算就能够快速地按照需求完成。”SAP 更重要的是,随着银行信用卡竞争已 甲骨文在应对“大数据”难题的时候,解决方案和架构部总经理张志琦认为,内经从初期“跑马圈地”进人精细化耕作的 不仅仅是简单的产品堆砌,而是加入工程存计算将改变过去企业处理大数据分析时新阶段,用户使用行为的数据量增长已经 化的过程,通过对产品技术的整合与优依靠“数据仓库+B工具”的定模式。快过新增用户的增速,原先宽松和粗犷的 化,使得集成系统能够做到1+1大于2甚EMC卓越研发集团技术官陶波从另大笔投资已不可能,银行需要将更多的精 至远远大于2的效果。在甲骨文看来,凭外的角度做了解读:以前,海量数据多是力放在维护客户和挖掘客户价值上面,以 借其在数据库领域原有的绝对优势,不断存储I厂商在谈论,而大数据则融合了获得更多的收益。 推出新的 Exadata数据仓库产品,包括对存储、数据挖掘和商业决策等手段,业务 多年前,中信银行率先将信用卡用户 目前流行的技术 NoSOL、 Hadoop以及应用也更为丰富。 分析数据应用于电话销售业务中,坐席人 MapReduce的支持,就可以通过集成优 华尔街老兵、 IA Ventures投 员不再是大海捞针式的忙碌,中信银行 化的系统帮助企业解决问题。 司创始人罗杰·依伦伯格( Roger电话保险业务购买率一年内就实现了30% SAP显然不愿意这样看问题。“将数据 Ehrenberg)最近也撰文畅谈所看到的大的增长。现在,顾小波正推动信用卡数据 保存在内存中直接读取,比传统的从磁盘数据投资前景:“我们还处在这场由数据仓库部门与更多的业务部门进行对接 上访问可以极大地提高应用的性能。内存驱动的革命的初始阶段。现今,这些机遇 比如,现在中信银行的用户只需刷卡 计算非常适合大数据,以及需要实时获得已让人兴奋不已,未来,这些机遇所能带三笔,立刻就能享受到9元购买电影票的 来的变革必将超乎我的想象。 优惠。在以前,中信银行的核心业务系统 些判断似乎都能自圆其说,但对于在处理完当天的交易信息后,再过几天 大数据的4“V”特性 讲求实际效益的商业世界而言,大数据究才能被识别出满足促销条件的用户 竟能带来多大的改变 同时,顾小波还在对中信信用卡网站 ome(容量) 的用户使用行为进行分析,这些非结构化 超越商业智能? 数据以前是被忽略的,现在中信已可以及 variety(多样性) 作为中信银行信用卡中心数据仓库时了解用户在哪一步放弃了哪项业务, oty(速度) 室项目总监,顾小波明显感觉到新的挑战而改正网站业务设计中的不足。 Vae(价值) 正在来临。随着中信银行信用卡用户突破 中信银行信用卡部门在大数据中面临 1100万,需要挖掘的数据量正在膨胀,传的挑战与机遇,几乎大部分的企业都会遇 o1994-2012chinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
「经理世界 CEOCIO·第322期 有超过36万用户,每年有超过60亿美元 的收入,占到了彭博社总收入的85%,而 纯新闻收入仅占10%。 为了用户可以随时随地获取服务, 彭博社还提供了“彭博自由行”软件 ( Bloomberg anywhere),并大力在iPad 等智能终端上大力推广相关应用。实时在 线、实时提供数据分析服务,凭借数据整 合和处理速度夺取优势,这是崛起中的“实 时企业”的制胜法宝,彭博社可谓是最早 在水品石制作的精美 的受益者之 是庞大的数据 在中国的互联网广告界,北京艾德思 计算、存储和网络能 力的支撑 奇科技有限公司(下简称 adage)正是这 样的一匹黑马。2003年, adAge的前身 迈思奇公司还只是专注于企业商业智能领 到,这也是大数据与以往所提的数据挖掘业务部门可以通过利用支付宝数据库的分域的业务,而随着搜索引擎营销(SEM) 商业智能的不同之处:一是数据量快速析数据,监控营销活动的效果,一旦不为行业的崛起, adAge在2005年果断决 攀升,传统的数据挖掘工具已经无法应对用户接受,就立刻做出调整,而网站UI定转战该领域,凭借在数据挖掘和商业智 量分析的需求;二是对于数据处理速度设计师也可以从用户访问轨迹中,探寻到能方面的优势,迅速成为中国SEM领域 要求越来越高,更快的速度意味着更好导致用户放弃购买行为的设计缺陷,从而最大的服务商。同时,它还跻身 facebook 的用户体验和更迅即的商业决策;三是非进行设计优化 全球十大广告推广合作伙伴之列,通过与 构化数据的挑哉日增,有效的收集和处 支付宝已经成为数据化运营的公司, facebook网站的AP对接,它在全球拥 认CO到业务人员以及数据挖掘分析师,有超过2000家的广告主,其推出的广告 在支付宝( alipay),大数据正影响都有利用数据挖掘的场所,可以说是全员数投放优化列表工具用户数据全球第 着公司从上到下的决策和业务运作。目前,据化,大数据已经成为支付宝最大的财富 “我们帮助广告主找到最符合其品牌 通过利用“PC服务器集群+开源软件”、目前,支付宝的用户已超6亿,预计今年年诉求的用户,这就必须对海量的互联网 采用 Greenplum数据库软件等手段,支底数据量会增至18B,蒋杰总结出一个定用户及其行为特征,进行实时和准确的 宝每天可以对仅300亿条用户交易数律:支付宝的交易量每年会翻倍,而数据量分析。 adage首席分析师付增学说,客 据进行查询,结果可以在20毫秒内返回。增长则会增长四倍左右。对于支付宝而言,户在网站上产生的每个点击或购买行为, 这带来了两大好处:一是可以有效控这将是企业数据化生存的重要机遇。 sAge会立刻抓取并作出反应,并对用 制风险,一旦用户在超乎常规的地点登陆 某种程度上说,大数据也强调商业智户后期的行为进行针对性的推广,“如果他 或者进行超过2000元以上的大额转账,能的重要性,但它呈现出来的新特性,正点击了手机类的广告,我们后期会推送给 支付宝会根据对用户使用行为的历史分析,试图超越商业智能的范畴,从而开辟企业他更多的手机广告”。 行主动的风险拦截;二是可以进行实时进行商业优化的新疆界。 前, adage每天需要处理的日志 的营销业务推送,比如用户一旦购买了珠 数量就有1亿行记录,这是传统的人工 宝等高价商品,支付宝会立刻向其推送一“实时企业”受宠 优化SEM无法处理的,而凭借针对大数 个消费红包,马上就可以进行二次消费 老牌新闻集团彭博社为何能够在全球据的分析工具, adAge可以为广告主提 传媒格局中屹立不倒?核心的关键在于它供每天、每半天、每小时乃至每分钟的实 蒋杰认为,做到这一切的秘诀在于支所提供的 Bloomberg Professional(彭博时分析数据,并作出优化搜索的调整。以 付宝正实现 online与 offline数据挖掘的终端服务),用户缴纳1590美元后,就可前,新东方在线进行课程的SEM推广时 融合,这使得商业智能已不仅仅是针对历以通过 Dashboard应用或者AP直接接每投入300元,只能获取200元的回报 史数据的分析和报表呈现,而是可以做一人服务平台,从而获取彭博社搜集和实时而通过 adage的实时优化策略,新东方 些针对大数据的实时处理结果,实现对业处理的大量信息,这为很多用户提供了+在线每天的回报率已经稳定在10万元 务应用的可伸缩性调整。例如,广告营销分强大的分析工具。彭博终端服务在全球投入和产出比髙达1:6 C1994-2012ChinaAcademicJournalElectronicPublishingHouse.alLrightsreservedhttp://www.cnki.net
2011年08月20日 经理世界· CEOCIO·第322期 商业科技 BIZ TECH 今年年初, adAge又瞄准了移动互联 Oliver Ratzesberger称,他要做的事电行为,将为制定阶梯电价,以及达到输 网终端的应用广告市场,推出了 mobisage情就是在用户每天百万次的査询中,给出电与用电的平衡,提供重要的决策支持。 广告平台,这个新型的移动广告联盟最快的回馈速度,相关结果的可用性要达吴凯峰称,相关解决方案还在测试当中 ( mobiSage)专为应用开发者和企业广告主到99.98%,井让eBay保持24×7×365但有效应对大数据的挑战,将是实现电网 而设计,目前覆盖的移动终端已突破3000的始终在线状态 互动的关键之一。 万,包括国内90%的iad终端。它可以 不过,国网公司的智能互动尝试并不 记录移动终端APP用户的使用行为,比如行业变革的可能性 仅限在电力行业,它正试图推动相关行业 使用时间段、使用频率和使用地点等,实去年10月,北京海淀区稻香湖金融的产业变革。在国网对于未来智能电风的 时传送给开发者,以进行及时的广告调整。服务区的200亩地被“圈走”,这里将筹蓝图中,已经将版图扩张至电动汽车与充 互联网广告营销面对的是 建证券行业的行业数据中心,电设施、家庭新能源利用、智能家居和电 庞杂的个体,用户的购买 届时,各大券商将把自家力光线到户等领域。 行为也是稍纵即逝,大 数据共享至此,一方面 为此,国网今年将大力建设67座智 数据的最核心作用就 省去了自建灾备中心能变电站,推广应用5000万具智能电表 是实时处理海量数 的投入,另一方面并新建173座充换电站和9211个充电桩 据,做出迅速的调 这个数据中心将为完成25个智能小区/楼宇建设。 整,从而实现对于 整个行业提供全新 据业内人士分析,智能电网相关产业 广告诉求需求的精 的增值服务。 要从试点走向快速发展,它们与电网公司 确满足。”付增学说。 民族证券总工的智能对接将是关键,需要实现无缝和实 在电子商务领 程师马光悌参与了该时的数据传输,而这无疑将考验着国网应 域,电商们也面临类似 项目的认证和筹划,并将对大数据的能力。 的难题:大量网购消费者每 其视为“影响整个行业的大 而在麦肯锡的报告中,仔细分析了 天进行的浏览和购买等行为,带 事件”。在他看来,行业数据中心是美国医疗行业、欧洲政府公共服务、美国 来了巨大的非结构化数据的挑战,电商不证券行业应对大数据的有益尝试,凭借其零售业、全球制造业以及个人位置信息行 仅要对其进行分析,还要据此实现实时反计算能力,证券公司可以对当天的交易数业—它们在2010年占据了全球GDP约 应,以促成订单,增强用户粘性 据进行更为迅速的分析,响应速度将获得40%的份额,据称,它们均可借助大数据 Bwy每一天的分析工作量,85%提升。同时,共享的行业数据可以使得券实现新的行业增值转型。例如,麦肯锡预 以上都是全新而未知的”eBay分析平商拿到更为全面和准确的行业分析结果,计,美国医疗健康行业每年可以从海量数 台高级总监 Oliver Ratzesberger说,每这是券商自建数据中心所不能获得的增值据中实现超过3000亿美元的价值,而善 天他要面临5OB的新增数据,处理约服务。 于利用大数据的零售商可以提升约60% 100TB的数据量,分析近10万个数据元 在不久的将来,大数据或许能呈现出的利润空间。 素。 Oliver Ratzesberger拥有着全球企改变整个行业的力量。 不过,在水晶石CIO方凡看来,摆在 业最大的存储系统之一,但他需要更新的 国家电网公司去年建成了电力云仿真大数据面前的依然有很多难题。比如在技 析工具,为此,他把Hadp这种开源实验室,其中一个重要课题就是如何解术层面,企业需要提升计算、存储和网络 分析技术整合进 Teradata的数据存储系决海量数据存储与运算的难题。国网信通交换等方面的能力,三者不可偏废。此外, 统中,协助分析海量数据,并将这种新方公司云计算与信息资源中心主任吴凯峰表一且针对大数据的业务需求呈现波峰波谷 式命名为“极限分析方法”。 示,大数据是国网实现智能电网必须要面的巨大落差,企业将面临两难的选择 现在,eBy已经可以每秒处理超过临的挑战,一方面,国网在输电线路上布不投资r基础设施,将无法应对挑战 5万个商品类别的访问和购买信息。同时,设了大量的监控点,每秒都要传回海量数而如果做了投资,业务量一且下滑,前期 eBaw还在搜索栏的纵向设计中进行更准据,同时,智能电表实现规模推广后,电的投资会打了水漂,这是一个需要仔细拿 确的细分,比如用户输入 disney(迪斯网公司需要缩短用电数据的收集时间,数捏权衡的难题 尼),eBay会在搜索栏下拉选择项中给出据量也将激增。 大数据不是一夜之间产生的,CIO disney的门票、汽车、DVD、乐园、玩具 “这就出现一个难题,就是如何在下的最大任务就是贴近业务的发展需求,用 等细分选项,按照访问量排名,并给出直一个数据采集高峰期来临之前,将上一次最少的投资满足企业最大限度的发展需 接访问 disney在eBay的专区链接。 采样结果计算出来。而准确分析用户的用求。”方凡称。 o1994-2012ChinaAcademicJournalElectronicpUblishingHouse.Allrightsreservedhttp:/www.cnki.net