Question

如何读取/解析先前Map Reduce作业写入的顺序文件。 prev MR Job的keyOut和ValueOut是Text和ByteWritable。应该是我下一个MR Job的映射器的keyin和valuein。我希望记录具有键和值为Text。

Answer 1

如果您之前运行的M / R作业具有Text和ByteWritable的输出k / v，则后续作业的输入将为Text和ByteWritable。

因此，关注者作业的Mapper定义应该与此类似：

xyz extends Mapper<Text, ByteWritable, KEYOUT,VALUEOUT>