什么是Hadoop输入文件格式的行偏移和字节偏移?如何在Key-Value Pairs的Map-Reduce程序中考虑偏移量?

时间:2015-06-01 07:06:17

标签: hadoop

文本格式,键值格式,序列文件格式是Map-Reduce程序中考虑的三种标准文件格式。我需要解决在这三种情况下如何考虑行偏移和字节偏移来决定键值对的问题。

1 个答案:

答案 0 :(得分:0)

KeyValueTextInputFormatSequenceFileInputFormat没有偏移。

Offset仅在TextInputFormat中使用,其中它表示从文件开头的字节偏移