《大数据技术原理与应用（第2版）》厦门大学计算机科学系林子雨 ziyu

点击下载：厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，2017）第9章 Spark

正在加载图片...

●9:2sa生态系统在实际应用中,大数据处理主要包括以下三个类型 ·复杂的批量数据处理:通常时间跨度在数十分钟到数小时之间基于历史数据的交互式查询:通常时间跨度在数十秒到数分钟之间基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间当同时存在以上三种场景时,就需要同时部署三种不同的软件比如: MapReduce/mpaa/ Storm 这样做难免会带来一些问题 ·不同场景之间输入输出数据无法做到无缝共享,通常需要进行数据格式的转换不同的软件需要不同的开发和维护团队,带来了较高的使用成本比较难以对同一个集群中的各个系统进行统一的资源协调和分配《大数据技术原理与应用(第2版厦门大学计算机科学系林子雨 ziyulin@xmu. edu《大数据技术原理与应用（第2版）》厦门大学计算机科学系林子雨 ziyulin@xmu.edu.cn 9.2 Spark生态系统在实际应用中，大数据处理主要包括以下三个类型： •复杂的批量数据处理：通常时间跨度在数十分钟到数小时之间 •基于历史数据的交互式查询：通常时间跨度在数十秒到数分钟之间 •基于实时数据流的数据处理：通常时间跨度在数百毫秒到数秒之间当同时存在以上三种场景时，就需要同时部署三种不同的软件 •比如: MapReduce / Impala / Storm 这样做难免会带来一些问题： •不同场景之间输入输出数据无法做到无缝共享，通常需要进行数据格式的转换 •不同的软件需要不同的开发和维护团队，带来了较高的使用成本 •比较难以对同一个集群中的各个系统进行统一的资源协调和分配

<<向上翻页向下翻页>>

点击下载：厦门大学：《大数据技术原理与应用》课程教学资源（PPT课件讲稿，2017）第9章 Spark