Mahout:为什么我们将输入数据转换为序列文件?

时间:2015-04-11 16:28:11

标签: hadoop mahout

我在mahout中看到了很多需要将输入数据转换为序列文件的例子。 这是什么目的?。

1 个答案:

答案 0 :(得分:0)

如果您正在操作许多小文件,几乎不可能并且浪费资源将它们放入HDFS中,则更容易的选择是创建一个序列文件并以这种方式对它们进行操作。请参阅:The Small Files Problem