hadoop输出文件无法识别的字符

时间:2013-05-14 02:55:48

标签: map hadoop reducers

我不知道它是怎么发生的,但突然我的hadoop reducer输出文件中包含了一堆我从未输入的字符。前几行如下:

SEQ^F!org.apache.hadoop.io.LongWritable^Yorg.apache.hadoop.io.Text^@^@^@^@^@^@
<99><F1>a^O)(|7me<EB><C0><FB><E0><B2><E2>^@^@^@f^@^@^@^H^@^@^@^@^@^@^@^@]0 1.4593640091648059E-6 30 303761 30 303747 33 341837 30 303746 30 303743 30 312703 30 303759^@^@^@<8B>^@^@^@^H^@^@^@^@^@^@^@^@<8F><81>1

有人可以帮忙吗?

提前致谢

1 个答案:

答案 0 :(得分:1)

这是一个二进制序列文件,您将其解释为文本。前3个字符是“幻数”,表示它是一个序列文件。然后你可以看到键和值类型(LongWritable和Text),然后是序列文件块头,然后是键/值对的块(所有二进制编码)。