WordCount
MapReduce应用程序如何将输入作为一组< key,value>对?看起来它需要输入一组单词。
来自the Apache Hadoop MapReduce Tutorial:
“MapReduce框架仅在< key,value>对上运行,也就是说,框架将输入作为一组<键查看作业,值>对 ...“
“(输入)< k1,v1> - > map”
答案 0 :(得分:2)
本教程还没有详细介绍。每个MapReduce程序都定义了InputFormat
和OutputFormat
。
InputFormat
定义给定记录的键和值。
RecordReader
定义来自给定输入文件的记录是什么。(还有更多内容)
在WordCount
计划中,默认InputFormat
为TextInputFormat,其中LongWritable
为关键字,Text
为每条记录的值;此程序中的每条记录都是一行(默认情况下)。这里的关键是行的字节偏移量,值是文本行。我认为你已经错过了教程中的this部分。