标签: hadoop
文本格式,键值格式,序列文件格式是Map-Reduce程序中考虑的三种标准文件格式。我需要解决在这三种情况下如何考虑行偏移和字节偏移来决定键值对的问题。
答案 0 :(得分:0)
KeyValueTextInputFormat和SequenceFileInputFormat没有偏移。
KeyValueTextInputFormat
SequenceFileInputFormat
Offset仅在TextInputFormat中使用,其中它表示从文件开头的字节偏移。
TextInputFormat