标签: hadoop mahout
我在mahout中看到了很多需要将输入数据转换为序列文件的例子。 这是什么目的?。
答案 0 :(得分:0)
如果您正在操作许多小文件,几乎不可能并且浪费资源将它们放入HDFS中,则更容易的选择是创建一个序列文件并以这种方式对它们进行操作。请参阅:The Small Files Problem