正在加载图片...
Map和 Reduce函数 MapReduce计算模型的核心是map和 reduce两个函数,这两个函数 由用户负责实现,功能是按一定的映射规则将输入的<key, value>对 转换成另一个或一批<key, value>对输出 函数 输入 输出 说明 <k1. v1> Lis(<k2,V2>)1.将小数据集进一步解析成一批<key, value>对, 输入Map函数中进行处理 2.每一个输入的<k1,v1>会输出一批<k2,v2>。 <k2,Ⅴ2>是计算的中间结果 Reduce <k2,List(v2)><k3,v3> 输入的中间结果<k2,Ls(v2)中的LisV2)表示是 批属于同一个k2的vaue 以计算文本文件中每个单词出现次数的程序为例,则<k1,v1>可以是 <行在文件中的偏移位置,文件中的一行>,经Map函数映射之后, 形成一批中间结果<单词,出现次数>,而 Reduce函数则可以对中 间结果进行处理,将相同单词的出现次数进行累加,得到每个单词的 总的出现次数。 《大数据技术基础》《大数据技术基础》 Map和Reduce函数 • MapReduce计算模型的核心是map和reduce两个函数,这两个函数 由用户负责实现,功能是按一定的映射规则将输入的<key,value>对 转换成另一个或一批<key,value>对输出。 函数 Map 输入 <k1, v1> 输出 List(<k2, v2>) 说明 1. 将小数据集进一步解析成一批<key, value>对, 输入Map函数中进行处理。 2. 每一个输入的<k1, v1>会输出一批<k2, v2>。 <k2, v2>是计算的中间结果 Reduce <k2, List(v2)> <k3, v3> 输入的中间结果<k2, List(v2)>中的List(v2)表示是 一批属于同一个k2的value • 以计算文本文件中每个单词出现次数的程序为例,则<k1,v1>可以是 <行在文件中的偏移位置,文件中的一行>,经 Map 函数映射之后, 形成一批中间结果 <单词,出现次数>, 而 Reduce 函数则可以对中 间结果进行处理,将相同单词的出现次数进行累加,得到每个单词的 总的出现次数
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有