大数据处理的基本流程 大数据处理模型 大数据关键技术 大数据处理工具 大数据时代面临的新挑战 WordCount 关联规则基本模型 聚类 本章内容首先介绍了大数据处理的基本流程和大数据处理模型,接着介绍了大数据的关键技术,其中,云计算是大数据的基础平台和支撑技术,本章以Google 的相关技术为主线,详细介绍Google 以及其他众多学者和研究机构在大数据技术方面已有的一些工作,包括文件系统、数据库系统、索引和查询技术、数据分析技术等;接下来,介绍了大数据处理平台和工具,就目前技术发展现状而言,Hadoop 已经成为了大数据处理工具事实上的标准。最后,介绍大数据时代面临的新挑战,包括大数据集成、大数据分析、大数据隐私问题、大数据能耗问题、大数据处理与硬件的协同、大数据管理易用性问题以及性能测试基准。 大数据采集架构 预测模型