《大数据技术基础》 Map和Reduce函数 • MapReduce计算模

点击下载：重庆大学：《大数据技术基础》课程教学资源（课件讲稿）02 大数据关键技术与挑战

正在加载图片...

Map和 Reduce函数 MapReduce计算模型的核心是map和 reduce两个函数,这两个函数由用户负责实现,功能是按一定的映射规则将输入的<key, value>对转换成另一个或一批<key, value>对输出函数输入输出说明 <k1. v1> Lis(<k2,V2>)1.将小数据集进一步解析成一批<key, value>对, 输入Map函数中进行处理 2.每一个输入的<k1,v1>会输出一批<k2,v2>。 <k2,Ⅴ2>是计算的中间结果 Reduce <k2,List(v2)><k3,v3> 输入的中间结果<k2,Ls(v2)中的LisV2)表示是批属于同一个k2的vaue 以计算文本文件中每个单词出现次数的程序为例,则<k1,v1>可以是 <行在文件中的偏移位置,文件中的一行>,经Map函数映射之后, 形成一批中间结果<单词,出现次数>,而 Reduce函数则可以对中间结果进行处理,将相同单词的出现次数进行累加,得到每个单词的总的出现次数。《大数据技术基础》《大数据技术基础》 Map和Reduce函数 • MapReduce计算模型的核心是map和reduce两个函数，这两个函数由用户负责实现，功能是按一定的映射规则将输入的<key，value>对转换成另一个或一批<key，value>对输出。函数 Map 输入 <k1, v1> 输出 List(<k2, v2>) 说明 1. 将小数据集进一步解析成一批<key, value>对，输入Map函数中进行处理。 2. 每一个输入的<k1, v1>会输出一批<k2, v2>。 <k2, v2>是计算的中间结果 Reduce <k2, List(v2)> <k3, v3> 输入的中间结果<k2, List(v2)>中的List(v2)表示是一批属于同一个k2的value • 以计算文本文件中每个单词出现次数的程序为例，则<k1，v1>可以是 <行在文件中的偏移位置，文件中的一行>，经 Map 函数映射之后，形成一批中间结果 <单词，出现次数>，而 Reduce 函数则可以对中间结果进行处理，将相同单词的出现次数进行累加，得到每个单词的总的出现次数

<<向上翻页向下翻页>>

点击下载：重庆大学：《大数据技术基础》课程教学资源（课件讲稿）02 大数据关键技术与挑战