正在加载图片...
11.2.2键值对与输入格式 文件分片一一定义 ·把大数据文件进行分片,生成一个个InputSplit (简称为split) ·一个InputSplit对应一个计算任务(task),分配 到计算节点,由map/reduce进程执行计算处理 ·split是我们对数据文件出于计算需要的逻辑划分 单位,但一个HDFS文件在集群中实际是以块 (block)的物理形式存储的 --Split vs block? Big Data Computing Technology,2017 Fall11.2.2 键值对与输入格式 Big Data Computing Technology, 2017 Fall 9 文件分片——定义 • 把大数据文件进行分片,生成一个个InputSplit (简称为split) • 一个InputSplit对应一个计算任务(task),分配 到计算节点,由map/reduce进程执行计算处理 • split是我们对数据文件出于计算需要的逻辑划分 单位,但一个HDFS文件在集群中实际是以块 (block)的物理形式存储的 ——Split vs block?
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有