Question

我不知道它是怎么发生的，但突然我的hadoop reducer输出文件中包含了一堆我从未输入的字符。前几行如下：

SEQ^F!org.apache.hadoop.io.LongWritable^Yorg.apache.hadoop.io.Text^@^@^@^@^@^@
<99><F1>a^O)(|7me<EB><C0><FB><E0><B2><E2>^@^@^@f^@^@^@^H^@^@^@^@^@^@^@^@]0 1.4593640091648059E-6 30 303761 30 303747 33 341837 30 303746 30 303743 30 312703 30 303759^@^@^@<8B>^@^@^@^H^@^@^@^@^@^@^@^@<8F><81>1

有人可以帮忙吗？

提前致谢

Answer 1

这是一个二进制序列文件，您将其解释为文本。前3个字符是“幻数”，表示它是一个序列文件。然后你可以看到键和值类型（LongWritable和Text），然后是序列文件块头，然后是键/值对的块（所有二进制编码）。

hadoop输出文件无法识别的字符

1 个答案: