使用MapReduce读取/写入二进制输入/输出文件的最佳方法是什么?

时间:2011-09-12 17:57:36

标签: serialization hadoop mapreduce binaryfiles binary-data

在我到目前为止看到的所有样本中,mapreduce应用程序将文本文件作为输入并将文本写为输出。

我喜欢我的应用程序从二进制文件中读取对象并将对象写回输出文件。

MapReduce中最好的方法是什么?

我在java中编写应用程序

1 个答案:

答案 0 :(得分:1)

SequenceFile为二进制键值对提供持久数据结构。您可以在以下网址中找到更多信息。

http://wiki.apache.org/hadoop/SequenceFile

http://hadoop.apache.org/common/docs/current/api/org/apache/hadoop/io/SequenceFile.html