Hadoop中的顺序文件

时间:2011-09-14 14:19:54

标签: hadoop

如何读取/解析先前Map Reduce作业写入的顺序文件。 prev MR Job的keyOut和ValueOut是Text和ByteWritable。应该是我下一个MR Job的映射器的keyin和valuein。我希望记录具有键和值为Text。

1 个答案:

答案 0 :(得分:0)

如果您之前运行的M / R作业具有Text和ByteWritable的输出k / v,则后续作业的输入将为Text和ByteWritable。

因此,关注者作业的Mapper定义应该与此类似:

xyz extends Mapper<Text, ByteWritable, KEYOUT,VALUEOUT>