Hadoop MapReduce WordCount如何将输入视为<key,value =“”>对?

时间:2015-08-03 16:48:59

标签: hadoop dictionary mapreduce

WordCount MapReduce应用程序如何将输入作为一组&lt; key,value&gt;对?看起来它需要输入一组单词。

来自the Apache Hadoop MapReduce Tutorial

  1. “MapReduce框架仅在&lt; key,value&gt;对上运行,也就是说,框架将输入作为一组&lt;键查看作业,值&gt;对 ...“

  2. “(输入)&lt; k1,v1&gt; - &gt; map”

1 个答案:

答案 0 :(得分:2)

本教程还没有详细介绍。每个MapReduce程序都定义了InputFormatOutputFormat

InputFormat定义给定记录的键和值。

RecordReader定义来自给定输入文件的记录是什么。(还有更多内容)

WordCount计划中,默认InputFormatTextInputFormat,其中LongWritable为关键字,Text为每条记录的值;此程序中的每条记录都是一行(默认情况下)。这里的关键是行的字节偏移量,值是文本行。我认为你已经错过了教程中的this部分。